JP7633563B2 - Feature extraction device, feature extraction method, and feature extraction program - Google Patents
Feature extraction device, feature extraction method, and feature extraction program Download PDFInfo
- Publication number
- JP7633563B2 JP7633563B2 JP2023539450A JP2023539450A JP7633563B2 JP 7633563 B2 JP7633563 B2 JP 7633563B2 JP 2023539450 A JP2023539450 A JP 2023539450A JP 2023539450 A JP2023539450 A JP 2023539450A JP 7633563 B2 JP7633563 B2 JP 7633563B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- unit
- analysis
- feature extraction
- time series
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Educational Administration (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、特徴抽出装置および特徴抽出方法ならびに特徴抽出プログラムに関する。 The present invention relates to a feature extraction device, a feature extraction method, and a feature extraction program.
時系列データを分析するデータ分析装置として、特許文献1に開示されたものが知られている。特許文献1には、分析対象となる各データの時間的な変化量を示す指標値を算出し、指標値に基づく順番で複数の時系列データをグラフ化したものを並べて表示することが記載されている。特許文献1では、例えば特定の時期に大きく変化しているデータに注目することができるので、データ分析を支援することが可能になる。
A data analysis device for analyzing time-series data is disclosed in
しかし、上述した特許文献1では、時系列データを分析する分析方法が複数存在するときに、この時系列データを分析するために、複数の分析方法のうちどの分析方法が適しているかを判定することについて言及されていない。However, the above-mentioned
このため、対象となる時系列データを分析する際に、適切な分析方法を選択することが難しいという問題があった。 This made it difficult to select an appropriate analysis method when analyzing the time series data in question.
本発明は、上記事情に鑑みてなされたものであり、その目的とするところは、時系列データを分析する分析方法の特徴を抽出することが可能な特徴抽出装置および特徴抽出方法ならびに特徴抽出プログラムを提供することにある。The present invention has been made in consideration of the above circumstances, and its purpose is to provide a feature extraction device, a feature extraction method, and a feature extraction program capable of extracting features of an analysis method for analyzing time series data.
本発明の一態様の特徴抽出装置は、2つの時系列データを組み合わせたデータ対を複数生成する組み合わせ部と、複数の分析方法を用いて、各データ対に含まれる2つの時系列データの類似度を分析する分析部と、前記分析部による分析結果に基づいて、各データ対の類似度の出現確率を分析方法ごとに算出する出現確率算出部と、各データ対について、分析方法ごとに算出される前記出現確率の乖離度を算出する乖離度算出部と、データ対に含まれる各時系列データ、及び前記乖離度を可視化してユーザに提示する可視化部と、前記ユーザによる、類似、非類似の判定入力を受け付ける入力部と、前記判定入力及び前記乖離度に基づいて、前記分析方法の特徴を抽出する特徴抽出部と、を備える。A feature extraction device according to one embodiment of the present invention includes a combination unit that generates a plurality of data pairs by combining two time series data; an analysis unit that uses a plurality of analysis methods to analyze the similarity between the two time series data included in each data pair; an occurrence probability calculation unit that calculates the occurrence probability of the similarity of each data pair for each analysis method based on the analysis results by the analysis unit; a deviation calculation unit that calculates the deviation of the occurrence probability calculated for each analysis method for each data pair; a visualization unit that visualizes each time series data included in the data pair and the deviation and presents it to a user; an input unit that accepts a judgment input of similarity or dissimilarity from the user; and a feature extraction unit that extracts features of the analysis method based on the judgment input and the deviation.
本発明の一態様の特徴抽出方法は、2つの時系列データを組み合わせたデータ対を複数生成するステップと、複数の分析方法を用いて、各データ対に含まれる2つの時系列データの類似度を分析するステップと、分析された類似度に基づいて、各データ対の類似度の出現確率を分析方法ごとに算出するステップと、各データ対について、分析方法ごとに算出される前記出現確率の乖離度を算出するステップと、データ対に含まれる各時系列データ、及び前記乖離度を可視化してユーザに提示するステップと、前記ユーザによる、類似、非類似の判定入力を受け付けるステップと、前記判定入力及び前記乖離度に基づいて、前記分析方法の特徴を抽出するステップと、を備える。A feature extraction method according to one embodiment of the present invention includes the steps of generating a plurality of data pairs by combining two time series data, analyzing the similarity of the two time series data included in each data pair using a plurality of analysis methods, calculating the occurrence probability of the similarity of each data pair for each analysis method based on the analyzed similarity, calculating the deviation of the occurrence probability calculated for each analysis method for each data pair, visualizing each time series data included in the data pair and the deviation and presenting it to a user, accepting a judgment input of similarity or dissimilarity from the user, and extracting features of the analysis method based on the judgment input and the deviation.
本発明の一態様は、上記特徴抽出装置としてコンピュータを機能させるための特徴抽出プログラムである。 One aspect of the present invention is a feature extraction program for causing a computer to function as the above-mentioned feature extraction device.
本発明によれば、時系列データを分析する分析方法の特徴を抽出することが可能になる。 According to the present invention, it becomes possible to extract characteristics of an analytical method for analyzing time series data.
以下、本発明の実施形態について図面を参照して説明する。 Below, an embodiment of the present invention is described with reference to the drawings.
[第1実施形態]
図1は、第1実施形態に係る特徴抽出装置の構成を示すブロック図である。
[First embodiment]
FIG. 1 is a block diagram showing the configuration of a feature extraction device according to the first embodiment.
図1に示すように、第1実施形態に係る特徴抽出装置1は、データベース2(図では、「DB」と表記)に接続されている。特徴抽出装置1は、組み合わせ部11と、データ分析部12(分析部)と、出現確率算出部13と、乖離度算出部14と、可視化部15と、入力部16と、特徴抽出部17と、記録部18と、を備えている。As shown in FIG. 1, the
データベース2は、複数(m個)の時系列データqi(i=1~m)を記憶する。時系列データqiは、例えば、総務省統計局が提供している消費者物価指数である。
組み合わせ部11は、2つの時系列データを組み合わせたデータ対を生成する。具体的には、組み合わせ部11は、データベース2に記憶されている各時系列データqiから、2つを選択して組み合わせたデータ対aj(j=1~n)を設定する。図2は、2つの時系列データを組み合わせてデータ対ajを設定する例を示す説明図である。図2に示すように、時系列データq1とq2を組み合わせてデータ対a1を生成する。時系列データq2とq3を組み合わせてデータ対a2を生成する。時系列データq1とq4を組み合わせてデータ対a3を生成する。時系列データq3とq4を組み合わせてデータ対a4を生成する。The
時系列データがm個の場合には、「m*(m-1)/2」個のデータ対が設定される。即ち、「n=m*(m-1)/2」である。例えば、時系列データが380個ある場合には、(380*379)/2=72010個のデータ対が設定される。 If there are m pieces of time series data, "m*(m-1)/2" data pairs are set. In other words, "n = m*(m-1)/2". For example, if there are 380 pieces of time series data, (380*379)/2 = 72,010 data pairs are set.
データ分析部12は、複数の分析方法を用いて各データ対に含まれる2つの時系列データの類似度を分析する。具体的には、データ分析部12は、組み合わせ部11で設定されたデータ対ajを分析するための複数の分析方法の演算プログラムを備える。データ分析部12は、第1の分析方法によりデータ対を分析する第1分析部21と、第2の分析方法によりデータ対を分析する第2分析部22と、第3の分析方法によりデータ対を分析する第3分析部23と、第4の分析方法によりデータ対を分析する第4分析部24を備えている。The
データ分析部12は、第1~第4の分析方法により、データ対ajを構成する2つの時系列データの類似度を分析し、分析した結果を分析値として出力する。なお、本実施形態では、4つの分析方法を用いる例について示すが、4つ以外の分析方法を用いてもよい。以下、図3を参照して、第1分析方法~第4の分析方法の具体的な処理について説明する。The
第1の分析方法は、図3(a)に示すように、2つの時系列データ間の絶対値の差分を積算する。具体的には、所定の時間間隔ごとに得られる一方の時系列データと他方の時系列データの差分の絶対値を算出し、一定の期間内において差分の絶対値を積算する。積算した数値を分析値として出力する。2つの時系列データの類似度が高いほど、分析値は小さい数値となる。 As shown in Figure 3(a), the first analysis method accumulates the absolute difference between two time series data. Specifically, the absolute value of the difference between one time series data and the other time series data obtained at a specified time interval is calculated, and the absolute value of the difference is accumulated within a certain period of time. The accumulated value is output as the analysis value. The higher the similarity between the two time series data, the smaller the analysis value will be.
第2の分析方法は、図3(b)に示すように、それぞれの時系列データの時間経過に対する変化量を算出し、算出した変化量の差分を積算する。具体的には、所定の時間間隔ごとに得られる一方の時系列データと他方の時系列データの変化量の差分を算出し、一定の期間内において差分を積算する。例えば、一方の変化量が「+1」、他方の変化量が「-1」である場合には、差分は「2」である。一方の変化量が「+1」、他方の変化量も同様に「+1」である場合には、差分は「0」である。一方の変化量が「-2」、他方の変化量が「+1」である場合には、差分は「3」である。第2の分析方法は、これらの差分を積算し、積算した数値を分析値として出力する。2つの時系列データの類似度が高いほど、分析値は小さい数値となる。 As shown in FIG. 3(b), the second analysis method calculates the amount of change over time for each piece of time series data, and integrates the difference between the calculated amounts of change. Specifically, the difference between the amount of change between one piece of time series data and the other piece of time series data obtained at a predetermined time interval is calculated, and the difference is integrated over a certain period of time. For example, if the amount of change in one piece is "+1" and the amount of change in the other piece is "-1", the difference is "2". If the amount of change in one piece is "+1" and the amount of change in the other piece is also "+1", the difference is "0". If the amount of change in one piece is "-2" and the amount of change in the other piece is "+1", the difference is "3". The second analysis method integrates these differences, and outputs the integrated value as the analysis value. The higher the similarity between the two pieces of time series data, the smaller the analysis value.
第3の分析方法は、図3(c)に示すように、それぞれの時系列データの時間経過に対する変化率を算出し、算出した変化率の差分を積算する。具体的には、所定の時間間隔ごとに得られる一方の時系列データと他方の時系列データの変化量の差分を算出し、一定の期間内において差分を積算する。例えば、一方の時系列データが「+3%」、他方の時系列データが「-1%」である場合には、差分は「4」である。一方が「+1%」、他方も同様に「+1%」である場合には、差分は「0」である。第3の分析方法は、一定の期間内においてこれらの差分を積算し、積算した数値を分析値として出力する。2つの時系列データの類似度が高いほど、分析値は小さい数値となる。 As shown in FIG. 3(c), the third analysis method calculates the rate of change over time for each piece of time series data, and integrates the difference between the calculated rates of change. Specifically, the difference between the amount of change between one piece of time series data and the other piece of time series data obtained at a predetermined time interval is calculated, and the difference is integrated over a certain period of time. For example, if one piece of time series data is "+3%" and the other piece of time series data is "-1%, " the difference is "4". If one piece of time series data is "+1%" and the other piece of time series data is also "+1%, " the difference is "0". The third analysis method integrates these differences over a certain period of time, and outputs the integrated value as the analysis value. The higher the similarity between the two pieces of time series data, the smaller the analysis value will be.
第4の分析方法は、図3(d)に示すように、それぞれの時系列データについて、所定の時間間隔ごとに平均値を算出する。更に、前述した第3の分析方法と同様に、一定の期間内において平均値の差分を積算し、積算した数値を分析値として出力する。2つの時系列データの類似度が高いほど、分析値は小さい数値となる。 As shown in Figure 3(d), the fourth analysis method calculates the average value for each time series data at a predetermined time interval. Furthermore, similar to the third analysis method described above, the difference in the average values is integrated over a certain period of time, and the integrated value is output as the analysis value. The higher the similarity between the two time series data, the smaller the analysis value will be.
第1分析部21~第4分析部24は、第1~第4の分析方法により算出した分析値に基づき、各データ対ajの分析値をプロットした分布曲線を作成する。以下、図4A、図4Bを参照してデータ分析部12の処理について詳細に説明する。The
図4Aは、複数のデータ対に対して、第1~第4の分析方法で算出した分析値を示す説明図である。データ分析部12は、図1に示すデータベース2に記憶されている各データ対aj(j=1~n)対して、第1~第4の分析方法により演算した分析値「bk-j」を算出する。なお、「k」は分析方法の番号を示し、「j」はデータ対の番号を示す。即ち、「k」は1~4の整数であり、「j」は1~nの整数である。
Figure 4A is an explanatory diagram showing analytical values calculated for multiple data pairs using the first to fourth analysis methods. The
例えば、2つの時系列データ「野菜・海藻」及び「すし(外食)」のデータ対a1に対して、第1の分析方法を用いて算出した分析値を分析値「b1-1」とする。図4Aでは、分析値「b1-1」は「0.05」とされている。データ対a1に対して、第2の分析方法を用いて算出した分析値を分析値「b2-1」とする。図4Aでは、分析値「b2-1」は「0.21」とされている。For example, for data pair a1 of two time series data "Vegetables/Seaweed" and "Sushi (eating out)", the analysis value calculated using the first analysis method is set to analysis value "b1-1". In FIG. 4A, the analysis value "b1-1" is set to "0.05". For data pair a1, the analysis value calculated using the second analysis method is set to analysis value "b2-1". In FIG. 4A, the analysis value "b2-1" is set to "0.21".
同様に、データ対a2に対して、第3の分析方法を用いて算出した分析値を分析値「b3-2」とする。図4Aでは、分析値「b3-2」は「0.33」とされている。データ対a3に対して、第4の分析方法を用いて算出した分析値を分析値「b4-3」とする。図4Aでは、分析値「b4-3」は「0.64」とされている。これらと同様に、各分析値「bk-j」を算出する。 Similarly, the analytical value calculated for data pair a2 using the third analysis method is set to analysis value "b3-2". In FIG. 4A, the analytical value "b3-2" is set to "0.33". The analytical value calculated for data pair a3 using the fourth analysis method is set to analysis value "b4-3". In FIG. 4A, the analytical value "b4-3" is set to "0.64". Similarly, each analytical value "bk-j" is calculated.
データ分析部12は、第1~第4の分析方法で算出したデータ対ajの分析値の分布曲線を生成する。具体的には、データ対aj(j=1~n)に対して、第1~第4の分析方法を用いて算出した分析値「bk-1~bk-n」(k=1~4)の分布曲線s1~s4を生成する。例えば、図4B(a)~(d)に示すように、「b1-j」、「b2-j」、「b3-j」、「b4-j」(但し、j=1~n)の分布曲線s1~s4を生成する。図4B(a)~(d)は、第1~第4の分析方法による分析値をプロットしたグラフであり、横軸は分析値、縦軸は度数を示している。The
図4B(a)では、第1の分析方法によりn個のデータ対a1~anを分析した分析値b1-jをプロットしており、各分析値に沿った曲線を分布曲線s1としている。In Figure 4B (a), analytical values b1-j obtained by analyzing n data pairs a1 to an using the first analysis method are plotted, and the curve along each analytical value is the distribution curve s1.
図4B(b)では、第2の分析方法によりn個のデータ対a1~anを分析した分析値b2-jをプロットしており、各分析値に沿った曲線を分布曲線s2としている。In Figure 4B (b), the analysis values b2-j obtained by analyzing n data pairs a1 to an using the second analysis method are plotted, and the curve along each analysis value is the distribution curve s2.
図4B(c)では、第3の分析方法によりn個のデータ対a1~anを分析した分析値b3-jをプロットしており、各分析値に沿った曲線を分布曲線s3としている。In Figure 4B (c), the analytical values b3-j obtained by analyzing n data pairs a1 to an using the third analysis method are plotted, and the curve along each analytical value is the distribution curve s3.
図4B(d)では、第4の分析方法によりn個のデータ対a1~anを分析した分析値b4-jをプロットしており、各分析値に沿った曲線を分布曲線s4としている。In Figure 4B (d), the analysis values b4-j obtained by analyzing n data pairs a1 to an using the fourth analysis method are plotted, and the curve along each analysis value is the distribution curve s4.
図1に戻って、出現確率算出部13は、複数の分析方法で作成された分布曲線s1~s4を正規化する。即ち、図4B(a)~(d)に示した各分布曲線s1~s4は、それぞれを直接比較することはできない。従って、各分布曲線s1~s4を正規化する。例えば、分布曲線s1を正規化することにより、図5に示す正規化曲線s11が得られる。即ち、出現確率算出部13は、データ分析部12の分析結果を正規化して出現確率を算出する。Returning to Figure 1, the occurrence
出現確率算出部13は、データ分析部12による分析結果に基づいて、各データ対の類似度の出現確率を分析方法ごとに算出する。具体的には、出現確率算出部13は、各データ対aj(j=1~n)に対して、第1~第4の分析方法による分析値(即ち、類似度)の出現確率を算出する。出現確率は、分析値の順位を「0~1」の範囲で示す指標である。出現確率が「0」に近いほど、2つの時系列データの類似度が高いことを示す。出現確率が「1」に近いほど2つの時系列データの類似度が低いことを示す。k番目の分析方法によるデータ対ajの分析値「bk-j」の出現確率を「pk-j」で示す。第1の分析方法によるデータ対a1の分析値「b1-1」の出現確率は、「p1-1」である。例えば、第1の分析方法によるデータ対a1の分析値「b1-1」が上位30%に属している場合には、出現確率「p1-1」は「0.3」である。The occurrence
図5に示す正規化曲線s11において、データ対ajの分析値の出現確率が上位であるほど、データ対ajに含まれる2つの時系列データは類似度が高いことを示している。In the normalized curve s11 shown in Figure 5, the higher the occurrence probability of the analysis value of data pair aj, the higher the similarity between the two time series data included in data pair aj.
乖離度算出部14は、各データ対ajについて、分析方法ごとに算出される出現確率の乖離度を算出する。具体的には、乖離度算出部14は、対象となるデータ対ajに対して、4つの分析方法による、出現確率の乖離度を算出する。k番目の分析方法によるデータ対ajの乖離度を「dk-j」で示す。例えば、第1の分析方法によるデータ対a1の乖離度は「d1-1」である。The
乖離度dk-jを、出現確率「p1-j」~「p4-j」を用いて、下記(1)~(4)式のように定義する。The deviation dk-j is defined as follows using the occurrence probabilities "p1-j" to "p4-j" as shown in equations (1) to (4).
d1-j={(p2-j)+(p3-j)+(p4-j)}/3-(p1-j)…(1)
d2-j={(p1-j)+(p3-j)+(p4-j)}/3-(p2-j)…(2)
d3-j={(p1-j)+(p2-j)+(p4-j)}/3-(p3-j)…(3)
d4-j={(p1-j)+(p2-j)+(p3-j)}/3-(p4-j)…(4)
上記(1)~(4)式から理解されるように、k番目の分析方法による出現確率pk-jの乖離度とは、k番目の分析方法による出現確率と、k番目の分析方法以外の3つの分析方法による出現確率の平均との差分を示す数値である。従って、一の分析方法により算出した出現確率と、他の3つの分析方法により算出した出現確率の平均との差分が大きいほど、一の分析方法により算出した出現確率の乖離度は大きい数値となる。
d1-j={(p2-j)+(p3-j)+(p4-j)}/3-(p1-j)...(1)
d2-j={(p1-j)+(p3-j)+(p4-j)}/3-(p2-j)...(2)
d3-j={(p1-j)+(p2-j)+(p4-j)}/3-(p3-j)...(3)
d4-j={(p1-j)+(p2-j)+(p3-j)}/3-(p4-j)...(4)
As can be understood from the above formulas (1) to (4), the deviation of the occurrence probability pk-j by the kth analysis method is a numerical value indicating the difference between the occurrence probability by the kth analysis method and the average of the occurrence probabilities by the three analysis methods other than the kth analysis method. Therefore, the greater the difference between the occurrence probability calculated by one analysis method and the average of the occurrence probabilities calculated by the other three analysis methods, the greater the numerical value of the deviation of the occurrence probability calculated by the one analysis method.
乖離度算出部14は、分析方法ごとに、上記(1)~(4)式で算出した乖離度dk-jの絶対値が大きい順にデータ対ajを並べ替える処理を実行する。図6は、第1の分析方法を用いて算出した出現確率p1-jの乖離度d1-jを、大きい順に並べ替えたデータを示す説明図である。例えば、「野菜・海藻」及び「すし(外食)」の時系列データのデータ対、「カップ麺」及び「生鮮食品」の時系列データのデータ対、・・の順にデータ対(品目1と品目2の組み合わせ)が並べ替えられている。The
可視化部15は、データ対ajに含まれる各時系列データ、及び乖離度を可視化してユーザに提示する。具体的には、可視化部15は、ディスプレイなどの表示部(図示省略)を有しており、乖離度算出部14で算出された乖離度dk-jが一定値よりも大きいもの(例えば、0.6を超えるもの)のデータ対のグラフを、表示部に画面表示する。例えば、図7A、図7Bに示すグラフ及び出現確率のデータを表示部に画面表示する。即ち、可視化部15は、乖離度算出部14で算出される乖離度が大きい所定数の分析結果のみを可視化する。The
図7A(a)は、時系列データq11(例えば、家庭用耐久財)、及び時系列データq12(例えば、家具・家事用品)のデータ対a11のグラフを示し、図7A(b)は第1~第4の分析方法を用いて算出したデータ対a11の出現確率を示している。図7B(a)は、時系列データq13(例えば、野菜・海藻)、及び時系列データq14(例えば、すし(外食))のデータ対a12のグラフを示し、図7B(b)は第1~第4の分析方法を用いて算出したデータ対a12の出現確率を示している。 Figure 7A(a) shows a graph of data pair a11 of time series data q11 (e.g., household durable goods) and time series data q12 (e.g., furniture and household goods), and Figure 7A(b) shows the occurrence probability of data pair a11 calculated using the first to fourth analysis methods. Figure 7B(a) shows a graph of data pair a12 of time series data q13 (e.g., vegetables and seaweed) and time series data q14 (e.g., sushi (eating out)), and Figure 7B(b) shows the occurrence probability of data pair a12 calculated using the first to fourth analysis methods.
可視化部15は、図7A、図7Bに示すデータを表示部に表示する。ユーザは、表示部を見ることにより、表示された情報を認識することができる。The
入力部16は、ユーザによる類似または非類似の判定入力を受け付ける。具体的には、入力部16は、キーボード等の操作機器を備えており、可視化部15に表示されている情報に対する類似または非類似の判定入力を受け付ける。例えば、図7Aに示したように時系列データq11、q12は乖離しているので、ユーザにより非類似の判定結果が入力される。他方、図7Bに示したように時系列データq13、q14は接近しているので、ユーザにより類似の判定結果が入力される。The
特徴抽出部17は、判定入力及び乖離度に基づいて分析方法の特徴を抽出する。具体的には、特徴抽出部17は、入力部16で入力された判定入力に基づいて、各分析方法の特徴を抽出する。例えば、図7A(a)に示したデータ対a11の時系列データq11、q12は、グラフが乖離しており類似度が低い。従って、データ対a11の出現確率は大きい数値になるはずである。図7A(b)に示すように、第3の分析方法により算出された出現確率は、小さい数値となっている。特徴抽出部17は、時系列データq11、q12の分析に対して、第3の分析方法は適さないという特徴を抽出する。即ち、特徴抽出部17は、分析方法の特徴として、当該分析方法による分析に適さない時系列データを抽出する。The
また、図7B(a)に示したデータ対a12の時系列データq13、q14は、グラフが接近しており類似度が高い。従って、データ対a12の出現確率は小さい数値になるはずである。図7B(b)に示すように、第2、第3、第4の分析方法により算出された出現確率は、大きい数値となっている。特徴抽出部17は、時系列データq11、q12の分析に対して、第2、第3、第4の分析方法は適さないという特徴を抽出する。特徴抽出部17は、記憶装置(図示省略)を備えており、抽出した特徴を記憶装置に記憶する。
In addition, the time series data q13 and q14 of the data pair a12 shown in FIG. 7B(a) are close to each other in the graph and have a high similarity. Therefore, the occurrence probability of the data pair a12 should be a small value. As shown in FIG. 7B(b), the occurrence probabilities calculated by the second, third, and fourth analysis methods are large values. The
記録部18は、時系列データの特性データを記録する。例えば、「野菜・海藻」については、季節の移り変わりにより影響されるという特性が予め認識されているので、この特性データを記録する。また、「自動車免許手数料」については、階段状に金額が変化するという特性が予め認識されているので、この特性データを記録する。また、上述した可視化部15は、データ対を構成する各時系列データ及び乖離度に加えて、時系列データの特性を可視化してもよい。The
次に、図8に示すフローチャートを参照して第1実施形態に係る特徴抽出装置1の動作について説明する。初めに、図8のステップS11において、組み合わせ部11は、データベース2に記憶されている複数の時系列データqi(i=1~m)を組み合わせることにより、データ対ajを生成する。時系列データqiがm個の場合には、「m*(m-1)/2」個のデータ対が生成される。Next, the operation of the
ステップS12において、データ分析部12は、複数の分析方法により各データ対ajを分析して分析値を算出する。具体的には、第1分析部21は第1の分析方法を用いて各データ対ajの分析値を算出する。第2分析部22は第2の分析方法を用いて各データ対ajの分析値を算出する。第3分析部23は第3の分析方法を用いて各データ対ajの分析値を算出する。第4分析部24は第4の分析方法を用いて各データ対ajの分析値を算出する。In step S12, the
更に、データ分析部12は、各分析方法で算出した分析値の分布曲線を生成する。具体的には、図4B(a)~(d)に示したように、第1の分析方法で算出した分析値の分布曲線s1、第2の分析方法で算出した分析値の分布曲線s2、第3の分析方法で算出した分析値の分布曲線s3、第4の分析方法で算出した分析値の分布曲線s4を生成する。
Furthermore, the
ステップS13において、出現確率算出部13は、各分布曲線s1~s4を正規化した正規化曲線を生成する。例えば、図5に示した正規化曲線s11を生成する。In step S13, the occurrence
ステップS14において乖離度算出部14は、正規化曲線s11に基づいて、各データ対ajの出現確率を算出する。例えば、図5に示すように、対象となるデータ対が全体の上位30%に属している場合には、出現確率を「0.3」に設定する。また、上位70%に属している場合には、出現確率を「0.7」に設定する。In step S14, the
ステップS15において、乖離度算出部14は、各出現確率の乖離度を算出する。具体的には、前述した(1)~(4)式により、各分析方法のデータ対ajの出現確率を算出する。更に、乖離度算出部14は、乖離度が大きい順にデータ対ajを並べ替える処理を実行する。その結果、例えば図6に示したように、第1の分析方法を用いて算出した出現確率p1-jの乖離度d1-jを大きい順に並べたデータが得られる。In step S15, the
例えば、「野菜・海藻」と「すし(外食)」のデータ対においては、第1の分析方法を用いて算出した出現確率は、「0.0473」であり、第2~第4の分析方法を用いて算出した出現確率は、およそ「1.0000」である。このため、第1の分析方法で算出した出現確率は、他の3つの分析方法で算出した出現確率との差分が大きい数値となっており、乖離度が「0.926428」と高い数値になっている。For example, for the data pair "Vegetables/Seaweed" and "Sushi (eating out)", the occurrence probability calculated using the first analysis method is "0.0473", while the occurrence probability calculated using the second to fourth analysis methods is approximately "1.0000". For this reason, the occurrence probability calculated using the first analysis method has a large difference from the occurrence probabilities calculated using the other three analysis methods, with the deviation being a high value of "0.926428".
ステップS16において、可視化部15は、乖離度d1-jが大きい(例えば、0.6以上のデータ対)と判定されたデータ対のグラフ、及び出現確率のデータを表示部(図示省略)に画面表示する。即ち、データ対のグラフ、及び出現確率のデータを可視化する。例えば、図7A、図7Bに示す情報を画面表示する。In step S16, the
ユーザは、この画面を視認することにより、各分析方法による分析結果の正当性を判定する。例えば、図7A(a)に示すグラフでは、2つの時系列データq11、q12は類似していない。従って、出現確率は大きい数値(「1」に近い数値)になるものと推察される。図7A(b)に示すデータでは、第1、第2、第4の分析方法により算出した出現確率は「1」に近い数値を示しており、第3の分析方法により算出した出現確率は上記3つの分析方法から乖離した数値「0.16」となっている。この場合には、第3の分析方法を採用した分析値は、不適切であり、第1、第2、第4の分析方法を採用した分析値は適切であると想定される。 By visually checking this screen, the user judges the validity of the analysis results by each analysis method. For example, in the graph shown in FIG. 7A(a), the two time series data q11 and q12 are not similar. Therefore, it is inferred that the occurrence probability will be a large value (a value close to "1"). In the data shown in FIG. 7A(b), the occurrence probability calculated by the first, second, and fourth analysis methods is close to "1", and the occurrence probability calculated by the third analysis method is a value of "0.16" that deviates from the above three analysis methods. In this case, it is assumed that the analysis value using the third analysis method is inappropriate, and the analysis value using the first, second, and fourth analysis methods is appropriate.
一方、図7B(a)に示すグラフでは、2つの時系列データq13、q14は類似している。従って、出現確率は小さい数値(「0」に近い数値)になるものと推察される。図7B(b)に示すデータでは、第2、第3、第4の分析方法により算出した出現確率は「1」に近い数値を示しており、第1の分析方法により算出した出現確率は上記3つの分析方法から乖離した数値「0.05」となっている。この場合には、第2、第3、第4の分析方法を採用した分析値は、不適切であり、第1の分析方法を採用した分析値は適切であると想定される。On the other hand, in the graph shown in FIG. 7B(a), the two time series data q13 and q14 are similar. Therefore, it is inferred that the occurrence probability will be a small value (a value close to "0"). In the data shown in FIG. 7B(b), the occurrence probability calculated using the second, third, and fourth analysis methods is close to "1", while the occurrence probability calculated using the first analysis method is a value of "0.05", which deviates from the above three analysis methods. In this case, it is assumed that the analysis values obtained using the second, third, and fourth analysis methods are inappropriate, and the analysis value obtained using the first analysis method is appropriate.
更に、可視化部15は、記録部18に記録されている各時系列データの特性データを読み取り、表示部に表示する。例えば、分析対象となるデータ対に「野菜・海藻」の時系列データが含まれている場合には、「季節の移り変わりにより影響される」という特性データを表示部に表示する。また、分析対象となるデータ対に「自動車免許手数料」の時系列データが含まれている場合には、「階段状に金額が変化する」という特性データを表示部に表示する。ユーザは、この特性データを視認することにより、分析結果の判定の参考にすることができる。
Furthermore, the
ステップS17において、入力部16は、ユーザによる類似、非類似の判定入力を受け付ける。ユーザは、可視化された情報を参照して各分析方法による分析値が適切であるか否かの判定結果を入力する。例えば、前述した図7Aに示した例では、第3の分析方法による分析値は不適切であり、第1、第2、第4の分析方法による分析値は適切である旨の判定結果を入力部16にて入力する。前述した図7Bに示した例では、第2、第3、第4の分析方法による分析値は不適切であり、第1の分析方法による分析値は適切である旨の判定結果を入力部16にて入力する。In step S17, the
即ち、一の分析方法を用いて時系列データを分析して算出される出現確率と、他の分析方法を用いて時系列データを分析して算出される出現確率との間の乖離度が高いということは、この時系列データの分析に用いる分析方法として、一の分析方法または他の分析方法が不適切である可能性が高い。ユーザによる判定入力を取得することにより、各分析方法の特徴(例えば、時系列データa1の分析には、第1の分析方法は適していないなど)を高精度に認識することが可能になる。In other words, if there is a high discrepancy between the occurrence probability calculated by analyzing time series data using one analysis method and the occurrence probability calculated by analyzing time series data using another analysis method, there is a high possibility that the one analysis method or the other analysis method is inappropriate as an analysis method to be used for analyzing the time series data. By acquiring a judgment input by the user, it becomes possible to recognize with high accuracy the characteristics of each analysis method (for example, the first analysis method is not suitable for analyzing time series data a1).
ステップS18において、特徴抽出部17は、入力部16にて入力された判定入力に基づいて、適切、不適切の判定結果に応じたスコアを計算する。具体的には、適切であると判定した分析方法に対してスコアを「+1」とし、適切でないと判定した分析方法に対してスコアを「-1」とする。図7Aに示した例では、第3の分析方法のスコアを「-1」とし、第1、第2、第4の分析方法のスコアを「+1」とする。図7Bに示した例では、第2、第3、第4の分析方法のスコアを「-1」とし、第1の分析方法のスコアを「+1」とする。特徴抽出部17は、第1~第4の分析方法ごとにスコアを積算する。なお、スコアの数値は「+1」、「-1」に限定されるものではなく、「適切」、「不適切」の度合いに応じて「+2」、「+1」、「-1」、「-2」などの数値としてもよい。In step S18, the
特徴抽出部17は、上記したスコアの積算値に基づいて、各分析方法の特徴を抽出する。例えば、4つの分析方法のうち上述したスコアが最も高い分析方法が、対象となる時系列データの分析に適している、などの特徴を抽出する。特徴抽出部17は、抽出した特徴を記憶装置(図示省略)に記録する。或いは、抽出した特徴に基づいて、既に記憶装置に記録されている特徴を修正する。The
ステップS19において、データ分析部12は、第1~第4の分析方法に修正が必要であるか否かを判定する。例えば、図7Aに示したように、データ対a11の分析には第3の分析方法は適していないと判定されており、この場合に第3の分析方法に修正が必要であるか否かを判定する。修正が必要であると判定された場合には(S19;YES)、ステップS20に処理を進め、そうでなければ(S19;NO)、本処理を終了する。In step S19, the
ステップS20において、データ分析部12は、対象となる分析方法を修正、或いは不適とする。その後、本処理を終了する。こうして、時系列データの類似度を分析する分析方法の特徴を抽出することができるのである。In step S20, the
このように、第1実施形態に係る特徴抽出装置1は、2つの時系列データを組み合わせたデータ対を複数生成する組み合わせ部11と、複数の分析方法を用いて、各データ対に含まれる2つの時系列データの類似度を分析する分析部(データ分析部12)と、分析部による分析結果に基づいて、各データ対の類似度の出現確率を分析方法ごとに算出する出現確率算出部13と、各データ対について、分析方法ごとに算出される出現確率の乖離度を算出する乖離度算出部14と、データ対に含まれる各時系列データ、及び乖離度を可視化してユーザに提示する可視化部15と、ユーザによる、類似、非類似の判定入力を受け付ける入力部16と、判定入力及び乖離度に基づいて、分析方法の特徴を抽出する特徴抽出部17と、を有して構成されている。Thus, the
上記のように構成された特徴抽出装置1では、時系列データを分析する分析方法がどのタイプの時系列データに適しているか、或いは適していないかを示す特徴を抽出することが可能となる。従って、データサイエンティストなどのユーザが、データ分析装置を用いて時系列データを分析する際に、ユーザがストックしている複数の分析方法から、適切な分析方法を選択できるように支援することが可能となる。
The
また、可視化部15は、乖離度算出部14で算出される乖離度が大きい所定数の分析結果のみを可視化する。例えば、乖離度が0.6以上の分析結果のみを可視化する。このため、乖離度が小さい分析結果についての可視化を省略することができる。即ち、4つの分析方法の全ての乖離度が小さいということは、4つの分析方法による分析値がほぼ同一の数値になっているということであり、ユーザが介入する必要性は低いものと考えられる。乖離度が大きい所定数の分析結果のみを可視化の対象とすることにより、ユーザによる労力を低減することができる。
Furthermore, the
また、予め認識されている各時系列データの特徴テータが記録部18に記録されており、この特徴データを可視化部15の表示部に表示することにより、ユーザは各分析方法の適正を判断するときの参考とすることができる。
In addition, characteristic data of each time series data that has been recognized in advance is recorded in the
即ち、図9に示すように、「野菜・海藻」の時系列データを含むデータ対a1について、記録部18に「季節変動に影響される」という特徴データが記録されている。また、「自動車免許手数料」の時系列データを含むデータ対a10について、記録部18に「階段状に物価が変化する」という特徴データが記録されている。ユーザはデータ対a1、a10の分析を行うときに、これらの特徴データを参照して各分析方法の特徴を判定することが可能となる。
That is, as shown in Figure 9, for data pair a1, which includes time series data for "vegetables and seaweed," feature data that "is influenced by seasonal fluctuations" is recorded in
[第2実施形態]
次に、第2実施形態について説明する。図10は、第2実施形態に係る特徴抽出装置1a、及びその周辺機器の構成を示すブロック図である。第2実施形態は、前述した第1実施形態と対比して、選択部19が設けられている点で相違する。従って、選択部19以外の構成要素については、同一符号を付して構成説明を省略する。
[Second embodiment]
Next, a second embodiment will be described. Fig. 10 is a block diagram showing the configuration of a
選択部19は、複数のデータ対のうち、一のデータ対の類似度の出現確率と、他のデータ対の類似度の出現確率が近似しており、一のデータ対に含まれる時系列データと、他のデータ対に含まれる時系列データが同一、または類似している場合に、他のデータ対を選択する。The
即ち、選択部19は、組み合わせ部11で生成されるデータ対のうち、時系列データが類似しているデータ対を選択する。可視化部15は、選択部19にて選択されたデータ対の出現確率を除外して可視化する。That is, the
図11Aは、第1の分析方法で複数のデータ対を分析して得られた分析結果の正規化分布曲線を示す図である。図11Bは、データ対を構成する2つの時系列データ、及び乖離度d1-jを示す図である。 Figure 11A shows a normalized distribution curve of the analysis results obtained by analyzing multiple data pairs using the first analysis method. Figure 11B shows two time series data constituting a data pair and the degree of discrepancy d1-j.
図11Bに示されているデータ対x1、x2、x3には、全て「大学授業料」の時系列データが含まれている。また、図11Aにおいて、データ対x1、x2、x3がプロットされている位置は近似している。従って、これら3つのデータ対x1、x2、x3のうちの2つのデータ対は冗長であり、不要であると考えられる。選択部19は、データ対x2、x3を分析対象から除外する。
The data pairs x1, x2, and x3 shown in FIG. 11B all contain time series data for "university tuition fees." Furthermore, in FIG. 11A, the positions at which the data pairs x1, x2, and x3 are plotted are close to each other. Therefore, two of these three data pairs x1, x2, and x3 are considered to be redundant and unnecessary. The
図11Bに示されているデータ対x4には「中華そば」の時系列データが含まれ、データ対x5には「そば」の時系列データが含まれている。また、図11Aにおいて、データ対x4、x5プロットされている位置は近似している。従って、これら2つのデータ対x4、x5のうちの一方のデータ対は冗長であり、不要であると考えられる。選択部19は、データ対x5を分析対象から除外する。
Data pair x4 shown in Figure 11B contains time series data for "Chinese noodles," and data pair x5 contains time series data for "soba." Furthermore, in Figure 11A, the positions at which data pairs x4 and x5 are plotted are close to each other. Therefore, one of these two data pairs x4 and x5 is considered to be redundant and unnecessary. The
このように、第2実施形態に係る特徴抽出装置1aでは、複数のデータ対から、一のデータ対に対して類似する他のデータ対を除外してデータ分析を行うので、データ対の分析処理に要する負荷を軽減することができる。In this way, in the
即ち、選択部19は、複数のデータ対のうち、一のデータ対の類似度の出現確率と、他のデータ対の類似度の出現確率が近似しており、且つ、一のデータ対を構成する時系列データと、他のデータ対を構成する時系列データが同一、または類似している場合に、他のデータ対を選択する。そして、可視化部15は、選択部19にて選択されたデータ対の出現確率を除外して表示部に表示する。このため、不要なデータの表示を回避することができ、演算負荷を軽減することができる。That is, the
上記説明した本実施形態の特徴抽出装置1には、図12に示すように例えば、CPU(Central Processing Unit、プロセッサ)901と、メモリ902と、ストレージ903(HDD:HardDisk Drive、SSD:SolidState Drive)と、通信装置904と、入力装置905と、出力装置906とを備える汎用的なコンピュータシステムを用いることができる。メモリ902およびストレージ903は、記憶装置である。このコンピュータシステムにおいて、CPU901がメモリ902上にロードされた所定のプログラムを実行することにより、特徴抽出装置1の各機能が実現される。
As shown in FIG. 12, the
なお、特徴抽出装置1は、1つのコンピュータで実装されてもよく、あるいは複数のコンピュータで実装されても良い。また、特徴抽出装置1は、コンピュータに実装される仮想マシンであっても良い。The
なお、特徴抽出装置1用のプログラムは、HDD、SSD、USB(Universal Serial Bus)メモリ、CD (Compact Disc)、DVD (Digital Versatile Disc)などのコンピュータ読取り可能な記録媒体に記憶することも、ネットワークを介して配信することもできる。
The program for the
なお、本発明は上記実施形態に限定されるものではなく、その要旨の範囲内で数々の変形が可能である。 The present invention is not limited to the above-described embodiments, and various modifications are possible within the scope of the invention.
1、1a 特徴抽出装置
2 データベース
11 組み合わせ部
12 データ分析部(分析部)
13 出現確率算出部
14 乖離度算出部
15 可視化部
16 入力部
17 特徴抽出部
18 記録部
19 選択部
21 第1分析部
22 第2分析部
23 第3分析部
24 第4分析部
1, 1a
13 occurrence
Claims (8)
複数の分析方法を用いて、各データ対に含まれる2つの時系列データの類似度を分析する分析部と、
前記分析部による分析結果に基づいて、各データ対の類似度の出現確率を分析方法ごとに算出する出現確率算出部と、
各データ対について、分析方法ごとに算出される前記出現確率の乖離度を算出する乖離度算出部と、
データ対に含まれる各時系列データ、及び前記乖離度を可視化してユーザに提示する可視化部と、
前記ユーザによる、類似、非類似の判定入力を受け付ける入力部と、
前記判定入力及び前記乖離度に基づいて、前記分析方法の特徴を抽出する特徴抽出部と、
を備えた特徴抽出装置。 A combination unit that generates a plurality of data pairs by combining two pieces of time series data;
an analysis unit that analyzes the similarity of two pieces of time series data included in each data pair by using a plurality of analysis methods;
an occurrence probability calculation unit that calculates the occurrence probability of the similarity of each data pair for each analysis method based on the analysis result by the analysis unit;
a deviation calculation unit that calculates a deviation of the occurrence probability calculated for each data pair for each analysis method;
a visualization unit that visualizes each of the time series data included in the data pair and the deviation degree and presents the visualized data to a user;
an input unit that accepts an input of a similarity/dissimilarity judgment by the user;
a feature extraction unit that extracts features of the analysis method based on the judgment input and the deviation degree;
A feature extraction device comprising:
請求項1または2に記載の特徴抽出装置。 The feature extraction device according to claim 1 , wherein the visualization unit visualizes only a predetermined number of analysis results having large degrees of deviation calculated by the deviation calculation unit.
前記可視化部は、前記選択部にて選択された他のデータ対の前記出現確率を除外して可視化する請求項1~3のいずれか1項に記載の特徴抽出装置。 a selection unit that selects one of the plurality of data pairs when an occurrence probability of a similarity between the one data pair and an occurrence probability of a similarity between the other data pair are similar and the time series data included in the one data pair and the time series data included in the other data pair are identical or similar to each other,
4. The feature extraction device according to claim 1, wherein the visualization unit performs visualization excluding the occurrence probabilities of other data pairs selected by the selection unit.
前記可視化部は、データ対に含まれる各時系列データ及び前記乖離度に加えて、前記時系列データの特性データを可視化する
請求項1~4のいずれか1項に記載の特徴抽出装置。 A recording unit that records characteristic data of the time series data,
The feature extraction device according to claim 1 , wherein the visualization unit visualizes characteristic data of the time series data in addition to each of the time series data included in the data pair and the degree of discrepancy.
前記組み合わせ部が、2つの時系列データを組み合わせたデータ対を複数生成するステップと、
前記分析部が、複数の分析方法を用いて、各データ対に含まれる2つの時系列データの類似度を分析するステップと、
前記出現確率算出部が、分析された類似度に基づいて、各データ対の類似度の出現確率を分析方法ごとに算出するステップと、
前記乖離度算出部が、各データ対について、分析方法ごとに算出される前記出現確率の乖離度を算出するステップと、
前記可視化部が、データ対に含まれる各時系列データ、及び前記乖離度を可視化してユーザに提示するステップと、
前記入力部が、前記ユーザによる、類似、非類似の判定入力を受け付けるステップと、
前記特徴抽出部が、前記判定入力及び前記乖離度に基づいて、前記分析方法の特徴を抽出するステップと、
を備えた特徴抽出方法。 A feature extraction method executed by a feature extraction device including a combination unit, an analysis unit, an occurrence probability calculation unit, a deviation calculation unit, a visualization unit, an input unit, and a feature extraction unit, comprising:
The combining unit generates a plurality of data pairs by combining two pieces of time series data;
The analysis unit analyzes the similarity between two pieces of time series data included in each data pair by using a plurality of analysis methods;
the occurrence probability calculation unit calculating an occurrence probability of the similarity of each data pair for each analysis method based on the analyzed similarity;
a step of the deviation calculation unit calculating a deviation of the occurrence probability calculated for each data pair for each analysis method;
the visualization unit visualizing each time-series data included in the data pair and the deviation degree and presenting the visualized data to a user;
a step of receiving an input of a judgment of similarity or dissimilarity from the user by the input unit ;
the feature extraction unit extracting features of the analysis method based on the judgment input and the deviation degree;
The feature extraction method includes:
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| PCT/JP2021/028957 WO2023012933A1 (en) | 2021-08-04 | 2021-08-04 | Feature extraction device, feature extraction method, and feature extraction program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPWO2023012933A1 JPWO2023012933A1 (en) | 2023-02-09 |
| JP7633563B2 true JP7633563B2 (en) | 2025-02-20 |
Family
ID=85155420
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2023539450A Active JP7633563B2 (en) | 2021-08-04 | 2021-08-04 | Feature extraction device, feature extraction method, and feature extraction program |
Country Status (2)
| Country | Link |
|---|---|
| JP (1) | JP7633563B2 (en) |
| WO (1) | WO2023012933A1 (en) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPWO2024171378A1 (en) * | 2023-02-16 | 2024-08-22 |
Family Cites Families (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR102279210B1 (en) * | 2019-11-29 | 2021-07-19 | 숙명여자대학교산학협력단 | Electronic device for determining similarity between sequences considering item classification scheme and control method thereof |
-
2021
- 2021-08-04 WO PCT/JP2021/028957 patent/WO2023012933A1/en not_active Ceased
- 2021-08-04 JP JP2023539450A patent/JP7633563B2/en active Active
Non-Patent Citations (2)
| Title |
|---|
| 植野 友祐,飲料の透過光スペクトルデータの収集とそれを利用した飲料判定の手法について,第9回データ工学と情報マネジメントに関するフォーラム (第15回日本データベース学会年次大会) [online],電子情報通信学会データ工学研究専門委員会,2017年02月27日 |
| 長友 誠,マーカーを用いたカメラと加速度センサによるセキュアデバイスペアリング手法の評価,情報処理学会研究報告 インターネットと運用技術(IOT) 2019-IOT-045 [online],2019年05月16日,pp.1-8 |
Also Published As
| Publication number | Publication date |
|---|---|
| WO2023012933A1 (en) | 2023-02-09 |
| JPWO2023012933A1 (en) | 2023-02-09 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US10860634B2 (en) | Artificial intelligence system and method for generating a hierarchical data structure | |
| US20140289071A1 (en) | Automatic product groupings for merchandising | |
| US20180067973A1 (en) | Column weight calculation for data deduplication | |
| WO2015053909A1 (en) | Attribute redundancy removal | |
| TWI853357B (en) | Method of providing review information performed by an electronic apparatus, electronic apparatus for performing a method for providing review information, and non-transitory computer readable storage medium | |
| JP2018147280A (en) | Data analysis device and data analysis method | |
| JP7633563B2 (en) | Feature extraction device, feature extraction method, and feature extraction program | |
| JP5398663B2 (en) | Data processing apparatus, data processing method, and program | |
| EP4220529A1 (en) | Information provision apparatus, information provision method, and program | |
| CN111046947A (en) | Training system and method of classifier and identification method of abnormal sample | |
| JP2006155344A (en) | Data analysis apparatus, data analysis program, and data analysis method | |
| JP6676993B2 (en) | Information providing apparatus, information providing method, and program | |
| JP2017207878A (en) | Missing data estimation method, missing data estimation device, and missing data estimation program | |
| JP5310196B2 (en) | Classification system revision support program, classification system revision support device, and classification system revision support method | |
| JP5424989B2 (en) | POS data analysis apparatus, method and program | |
| JP6861176B2 (en) | Project estimation support method and project estimation support device | |
| Pumjaroen | Conceptualizing economic leading indicators for early warning of Thailand's business cycle turning points | |
| US20230325304A1 (en) | Secret decision tree test apparatus, secret decision tree test system, secret decision tree test method, and program | |
| US20050204346A1 (en) | Using sampling data for program phase detection | |
| JP2003122572A (en) | Data analysis device and recording medium | |
| JP2021179832A (en) | Program, device, and method for detecting change | |
| JP7640910B2 (en) | Processing device, processing method, and program | |
| US11010039B2 (en) | Display control apparatus and non-transitory computer readable medium | |
| JP2019179509A (en) | Customer group extraction device, customer group extraction method, and program | |
| JP7195236B2 (en) | Response evaluation device, response evaluation method, and computer program |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20231226 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20241112 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20241216 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250107 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250120 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7633563 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |