JP7559959B2 - Model generation device, model generation method, and program - Google Patents
Model generation device, model generation method, and program Download PDFInfo
- Publication number
- JP7559959B2 JP7559959B2 JP2023542155A JP2023542155A JP7559959B2 JP 7559959 B2 JP7559959 B2 JP 7559959B2 JP 2023542155 A JP2023542155 A JP 2023542155A JP 2023542155 A JP2023542155 A JP 2023542155A JP 7559959 B2 JP7559959 B2 JP 7559959B2
- Authority
- JP
- Japan
- Prior art keywords
- model
- event sequence
- time series
- covariate
- marked event
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本発明は、マーク付きイベント系列と共変量の関係を分析するためのモデルを生成するモデル生成装置、モデル生成方法、プログラムに関する。 The present invention relates to a model generation device, a model generation method, and a program for generating a model for analyzing the relationship between marked event sequences and covariates.
統計モデルの手法として、各イベントがマークと呼ばれる特徴量をもつようなマーク付きイベント系列が知られている。とくに、ある別の共変量時系列が存在して、それがマーク付きイベント系列の発生に影響を及ぼしているような状況を想定する。 A statistical model is known for marked event sequences, where each event has a feature called a mark. In particular, we consider the presence of a separate covariate time series that influences the occurrence of the marked event sequence.
以上の状況を外部刺激に応じて発火頻度が変化するようなニューロンの発火列を例に説明する。ニューロンの発火活動を実験によって計測する際、各発火は電位の波形の情報からそれがどのニューロンから発生したものなのかが判断される。このような各発火を特徴づける情報をマークとみなすことで、複数のニューロンの発火列をひとつのマーク付きイベント系列で表すことができる。注目しているニューロンの集団が外部刺激に応じてどう発火をしているかを知るためには、特徴量が付加された発火列をマーク付きイベント系列、外部刺激の時系列を共変量とみなし、マーク付きイベント系列の発生頻度を共変量の関数として推定すればよい。以下に他の例を列挙する。The above situation will be explained using an example of a neuronal firing sequence whose firing frequency changes in response to external stimuli. When measuring neuronal firing activity through an experiment, the neuron from which each firing occurred can be determined based on information about the potential waveform. By regarding the information that characterizes each firing as a mark, the firing sequence of multiple neurons can be represented as a single marked event sequence. To find out how a population of neurons of interest fires in response to external stimuli, the firing sequence with added features can be considered as a marked event sequence, and the time series of the external stimuli as a covariate, and the occurrence frequency of the marked event sequence can be estimated as a function of the covariate. Other examples are listed below.
<地震>地震の発生時刻をイベントの発生時刻、地震のマグニチュードや発生位置をイベントのマークとみなすことができる。地震の発生に影響を及ぼす他の情報が共変量に相当する。地質や地層など。 <Earthquakes> The time of an earthquake's occurrence can be considered the time of the event, and the earthquake's magnitude and location can be considered the mark of the event. Other information that affects the occurrence of an earthquake corresponds to covariates, such as geology and strata.
<購買データ>商品を購入した日付をイベントの発生時刻、購入した商品の情報をイベントのマークとみなすことができる。商品の人気に影響を及ぼす他の情報が共変量に相当する。掲載ページの視聴数や貼られているリンクの数など。<Purchase data> The date when the product was purchased can be considered the time when the event occurred, and the information about the purchased product can be considered the mark of the event. Other information that affects the popularity of the product corresponds to covariates, such as the number of views of the listed page and the number of links posted.
<金融商品の取引>取引が成立した時刻をイベントの発生時刻、取引された金融商品の銘柄や価額をイベントのマークとみなすことができる。注目している金融商品の取引に影響を及ぼす他の情報が共変量に相当する。他の金融商品の取引量や景気指数など。 <Financial product trading> The time when a transaction is completed can be considered the time when an event occurs, and the brand and price of the traded financial product can be considered the mark of the event. Other information that affects the transaction of the financial product in question corresponds to covariates, such as the trading volume of other financial products and economic indices.
<SNS上の投稿>SNS上への投稿時刻をイベントの発生時刻、その内容やリンクの関係をイベントのマークとみなすことができる。SNSの投稿に影響を及ぼす他の情報が共変量に相当する。特定のワードの検索数やニュースサイトの記事など。 <Posts on social media> The time of posting on social media can be considered the time an event occurred, and the content and link relationships can be considered the mark of the event. Other information that influences SNS posts corresponds to covariates, such as the number of searches for a particular word or articles on a news site.
つぎに、関連する技術分野を以下に列挙する。 Next, the relevant technical fields are listed below.
(a)マーク付き点過程モデル。各イベントが特徴量をもつようなイベント系列の分布を表現する際に用いられる統計モデル。マーク付き点過程の分布はイベントの発生数の期待値の関数である条件付き強度関数によって決定される。統計モデリングの際は、この条件付き強度関数に相当するモデルをあらかじめ用意しておき、適当な目的関数を最大化することによって推定を行う。 (a) Marked point process model. A statistical model used to represent the distribution of an event sequence in which each event has features. The distribution of a marked point process is determined by a conditional intensity function, which is a function of the expected number of events occurring. When performing statistical modeling, a model equivalent to this conditional intensity function is prepared in advance, and estimation is performed by maximizing an appropriate objective function.
(b)Variational Autoencoder(VAE)。ニューラルネットワークを用いた生成モデル。画像や動画など、高次元の多様体上に分布するデータの生成によく用いられる。ある事前分布に従う潜在変数が存在するとし、その潜在変数がニューラルネットワークを含む条件付き分布によって変換されることでデータが生成されていると仮定する。この条件付き分布はデコーダーと呼ばれる。 (b) Variational Autoencoder (VAE). A generative model that uses a neural network. It is often used to generate data that is distributed on a high-dimensional manifold, such as images and videos. It assumes that there exists a latent variable that follows a certain prior distribution, and that data is generated by transforming that latent variable using a conditional distribution that includes a neural network. This conditional distribution is called a decoder.
(c)変分推論。モデルのもとでの尤度が陽に書き下せないときに、変分事後分布と呼ばれる分布族を用いて尤度の下限を導出し、その下限を最大化することによってパラメータを推定する方法。VAEの場合は、エンコーダーと呼ばれるニューラルネットワークを含む分布を用いる。Kullback-Leibler divergence 以外のダイバージェンスを基にした下限や、下限を最大化するかわりに尤度の上限を最小化するという方法も提案されている。 (c) Variational inference. When the likelihood under a model cannot be explicitly written down, a family of distributions called variational posterior distributions is used to derive a lower bound on the likelihood, and parameters are estimated by maximizing this lower bound. In the case of VAE, a distribution that includes a neural network called an encoder is used. Lower bounds based on divergences other than the Kullback-Leibler divergence and methods that minimize the upper bound of the likelihood instead of maximizing the lower bound have also been proposed.
(d)状態空間モデル。主に時系列に適用する確率モデルで、時系列の各時刻の値は背後に存在する潜在変数から独立に生成されているとし、潜在変数同士の関係を同時分布によって表現する。観測された時系列から背後にある潜在変数の事後分布、およびモデルのパラメータを学習する。昨今の研究では、非線形な時間発展をする時系列にも適用できるように、状態空間モデルの一部をニューラルネットワークに置き換えたブラックボックス状態空間モデルが提案されている。 (d) State space model. A probabilistic model that is mainly applied to time series, it assumes that the values at each time point in the time series are generated independently from the underlying latent variables, and expresses the relationship between the latent variables by a joint distribution. From the observed time series, the posterior distribution of the underlying latent variables and the model parameters are learned. Recent research has proposed a black-box state space model in which part of the state space model is replaced with a neural network so that it can be applied to time series that evolve nonlinearly.
本発明に特に関連する文献として非特許文献1がある。非特許文献1では、複数のニューロンの発火列をマーク付きイベント系列、発火活動に影響しているであろう外部刺激を共変量とみなし、後述する同時強度関数をカーネル密度推定によって推定し、さらに、推定した同時強度関数を発火列からの外部刺激の復元に活用する手法が開示されている。 Non-Patent Document 1 is a document particularly relevant to the present invention. Non-Patent Document 1 discloses a method in which a firing sequence of multiple neurons is regarded as a marked event sequence, and external stimuli that may affect the firing activity are regarded as covariates, a joint intensity function (described later) is estimated by kernel density estimation, and the estimated joint intensity function is used to reconstruct the external stimuli from the firing sequence.
本発明が解決しようとする課題を説明するために、マーク付き点過程の定義およびその尤度について説明する。マーク付き点過程は前述のマーク付きイベント系列を生成する確率過程である。マーク付き点過程の分布は条件付き強度関数によって決定されるため、その分布を知るためにはかわりに条件付き強度関数を推定すればよい。条件付き強度関数は過去の履歴が与えられたもとでの単位時間あたりのイベント数の期待値に相当する関数で
と定義される。ただし、k∈Kはマーク、N()は(0,T]×K上の計数測度、xt∈X,t∈(0,T]は共変量の時系列、Htは時刻tまでに得られた履歴の情報である。本発明では、マーク付き点過程のうち、非定常ポアソン過程で各時刻での発生頻度がその時刻での共変量の値の関数で表せるもののみを考える。このとき、条件付き強度関数は
のように、X×K上で定義されたある非負値関数λ(x,k)を使って表すことができる。このλ(x,k)は、共変量の値がxであるときに、マークがkであるようなイベントの単位時間当たりの発生数の期待値に相当する。以降、このλ(x,k)を同時強度関数とよぶことにする。
In order to explain the problem that the present invention aims to solve, the definition of a marked point process and its likelihood will be explained. A marked point process is a stochastic process that generates the above-mentioned marked event sequence. Since the distribution of a marked point process is determined by a conditional intensity function, to know the distribution, it is sufficient to estimate the conditional intensity function instead. The conditional intensity function is a function that corresponds to the expected value of the number of events per unit time given the past history, and
where k∈K is the mark, N() is the counting measure on (0,T]×K, x t ∈X,t ∈(0,T] is the time series of the covariates, and H t is the historical information obtained up to time t. In this invention, we consider only marked point processes that can be expressed as a function of the value of the covariates at that time in a nonstationary Poisson process. In this case, the conditional intensity function is
It can be expressed as follows, using a non-negative function λ(x,k) defined on X×K. This λ(x,k) corresponds to the expected number of occurrences per unit time of an event with mark k when the value of the covariate is x. Hereafter, this λ(x,k) will be called the joint intensity function.
いま、マーク付きイベント系列{(ti,ki)}n
i=1が(0,T]×K上で観測されているとする。このとき、同時強度関数λ(x,k)にしたがうマーク付きイベント系列を次の手順で生成することができる。まずはじめに、イベントの総数nを平均
のポアソン分布から生成する。そののち、λ(xt,k)に比例する確率密度関数をもつ(0,T]×K上の分布に従って{(ti,ki)}n
i=1を選ぶ。したがって、{xt}t∈(0,T]が与えられたもとでの{(ti,ki)}n
i=1の確率は
となる。いま、共変量xtは定間隔Δで観測されているとし、その時刻を{tj}m
j=1とする。このとき、{(ti,ki)}n
i=1が与えられたもとでの対数尤度は
となる。ただし、第二項は時間についての積分をxtj, j=1,...,mによる和で近似した。推定の際は、あらかじめλ(x,k)のモデルを用意しておき、そのなかで上の対数尤度関数を最大にするものをもとめればよい。以下に、同時強度関数の推定の際の課題を列挙する。
Now, suppose that a sequence of marked events {(t i ,k i )} n i=1 is observed on (0,T]×K. Then, a sequence of marked events according to the joint intensity function λ(x,k) can be generated by the following procedure. First, the total number of events n is calculated by the average
Then, choose {(t i ,k i )} n i=1 according to a distribution on (0,T]×K with a probability density function proportional to λ(x t ,k). Thus, the probability of {(t i ,k i )} n i=1 given {x t } t∈(0,T] is
Now, suppose that the covariate xt is observed at regular intervals Δ, and the time is { tj } mj =1 . In this case, the log likelihood given {( ti , ki )} ni =1 is
where the second term is an approximation of the integral over time, expressed as the sum over x tj , j=1,...,m. When estimating, a model of λ(x,k) is prepared in advance, and the one that maximizes the log-likelihood function above is found. The following are some of the challenges in estimating the joint intensity function.
<課題1>既存のマーク付き点過程モデルは単純なパラメトリックなモデルかニューラルネットワークを用いたモデルの二種類に大別される。前者のモデルは、共変量とマークの関係が明らかでない場合や、それらが高次元である場合は適用が難しい。後者のモデルはイベントの予測のために定式化されたものであり、共変量の予測には向いていない。また、マークの分布には単純な分布が採用されており、複雑な分布は表現できない。 <Challenge 1> Existing marked point process models can be broadly divided into two types: simple parametric models and models using neural networks. The former models are difficult to apply when the relationship between covariates and marks is unclear or when they are high-dimensional. The latter models are formulated for predicting events and are not suitable for predicting covariates. In addition, they use a simple distribution for the marks and cannot express complex distributions.
<課題2>マーク付き点過程の尤度はマークについての積分の項を含む。したがって、同時強度関数をニューラルネットワークで表現すると尤度の計算自体が難しくなる。 <Problem 2> The likelihood of a marked point process includes an integral term with respect to the mark. Therefore, when the joint intensity function is expressed by a neural network, the likelihood calculation itself becomes difficult.
<課題3>非線形な時間発展をする共変量について、その生成過程をモデル化する際はニューラルネットワークを含む状態空間モデルが有用である。一方で、そのようなモデルを用いる場合は、潜在変数の空間上での真の同時強度関数がそのニューラルネットワークによってデータドリブンで決まるため、その同時強度関数について適切なモデルを事前に用意することが難しい。 <Issue 3> State space models including neural networks are useful for modeling the generation process of covariates that evolve nonlinearly over time. However, when using such models, the true joint intensity function in the space of latent variables is determined data-driven by the neural network, making it difficult to prepare an appropriate model for the joint intensity function in advance.
そこで本発明では、上記の課題を鑑み、マーク付きイベント系列と共変量の関係を高い精度で表現するモデルを生成することができるモデル生成装置を提供することを目的とする。 In view of the above problems, the present invention aims to provide a model generation device capable of generating a model that expresses the relationship between marked event sequences and covariates with high accuracy.
本発明のモデル生成装置は、モデル記憶部と、マーク付きイベント系列潜在変数時系列計算部と、マーク付きイベント系列周辺分布パラメータ計算部と、イベント系列モデルパラメータ更新部を含む。The model generation device of the present invention includes a model memory unit, a marked event sequence latent variable time series calculation unit, a marked event sequence marginal distribution parameter calculation unit, and an event sequence model parameter update unit.
モデル記憶部は、推論モデルと生成モデルとを含む同時強度関数モデルであって、マーク付きイベント系列の同時強度関数をスケールパラメータと同時確率密度関数の積で表わした場合の同時確率密度関数を、ニューラルネットワークを含むデコーダーを用いて表現した同時強度関数モデルを記憶する。 The model memory unit is a simultaneous intensity function model including an inference model and a generation model, and stores a simultaneous intensity function model that expresses the simultaneous probability density function when the simultaneous intensity function of a marked event series is expressed as the product of a scale parameter and a simultaneous probability density function, using a decoder including a neural network.
マーク付きイベント系列潜在変数時系列計算部は、マーク付きイベント系列と、これに対応する共変量の潜在変数の時系列を推論モデルに入力し、マーク付きイベント系列の潜在変数の時系列を計算する。The marked event sequence latent variable time series calculation unit inputs a marked event sequence and the time series of the corresponding covariate latent variables into the inference model and calculates the time series of the latent variables for the marked event sequence.
マーク付きイベント系列周辺分布パラメータ計算部は、マーク付きイベント系列の潜在変数の時系列を生成モデルに入力し、マーク付きイベント系列の周辺分布のパラメータを計算する。 The marked event sequence marginal distribution parameter calculation unit inputs the time series of the latent variables of the marked event sequence into the generative model and calculates the parameters of the marginal distribution of the marked event sequence.
イベント系列モデルパラメータ更新部は、マーク付きイベント系列の周辺分布のパラメータを用いて、マーク付きイベント系列の尤度の下限を大きくするように生成モデルおよび推論モデルのパラメータを更新する。 The event sequence model parameter update unit uses parameters of the marginal distribution of the marked event sequence to update the parameters of the generative model and the inference model so as to increase the lower bound of the likelihood of the marked event sequence.
本発明のモデル生成装置は、マーク付きイベント系列と共変量の関係を高い精度で表現するモデルを生成することができる。 The model generation device of the present invention can generate a model that represents the relationship between marked event sequences and covariates with high accuracy.
以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。Hereinafter, an embodiment of the present invention will be described in detail. Components having the same functions are given the same numbers, and duplicate explanations will be omitted.
なお、以下の実施例では、条件付き強度関数が共変量とマークの関数で表せる場合のみを取り扱う。この関数は同時強度関数と呼ばれ、共変量が与えられたもとでのマーク付きイベント系列の予測や、マーク付きイベント系列が与えられたもとでの共変量の予測に利用される。In the following examples, we will only consider the case where the conditional intensity function can be expressed as a function of the covariates and the marks. This function is called the joint intensity function, and is used to predict a marked event sequence given a covariate, or to predict a covariate given a marked event sequence.
本実施例のマーク付きイベント系列分析装置は、VAEを用いた同時強度関数のモデル(同時強度関数モデル)を用いる。同時強度関数モデルは、マーク付きイベント系列の同時強度関数を、以下のようにスケールパラメータと同時確率密度関数の積に分解し、分解した同時確率密度関数をニューラルネットワークを含むデコーダーpθ(x,k|z)を用いて表現したものである。
ニューラルネットワークを利用することで、高次元かつ背後の関係性が未知である共変量とマーク付きイベント系列にも事前知識なしで適用できる(課題1)。また、VAEの定式化にならうことで,尤度に含まれるマークの積分を低次元の潜在変数上での積分に置き換えることができる(課題2)。
The marked event sequence analyzer of this embodiment uses a joint intensity function model using VAE. The joint intensity function model decomposes the joint intensity function of a marked event sequence into a product of a scale parameter and a joint probability density function as follows, and expresses the decomposed joint probability density function using a decoder pθ (x,k|z) including a neural network.
By using neural networks, it can be applied to high-dimensional covariates and marked event sequences with unknown underlying relationships without prior knowledge (Problem 1).Furthermore, by following the VAE formulation, the integral of the marks included in the likelihood can be replaced with an integral over low-dimensional latent variables (Problem 2).
本実施例のマーク付きイベント系列分析装置は、上述のモデルのもとで、二つのエンコーダーqφ(z|x,k),qφ(z|x)を用いて以下のように尤度の下限を導出し、その下限を最大化することでパラメータを推定する。
尤度の最大化をその下限の最大化に置き換えることで、安定したパラメータ推定が可能となる(課題2)。
In the marked event sequence analysis apparatus of this embodiment, under the above-mentioned model, a lower bound on the likelihood is derived using two encoders q φ (z|x, k) and q φ (z|x) as follows, and parameters are estimated by maximizing this lower bound.
By replacing the maximization of the likelihood with the maximization of its lower bound, stable parameter estimation becomes possible (problem 2).
本実施例のマーク付きイベント系列分析装置は、上述のモデルと共変量時系列についての状態空間モデルとを組み合わせることにより、非線形な時間発展をする共変量のもとでの同時強度関数を推定する。ニューラルネットワークを含む状態空間モデルを利用することで、どのような共変量時系列についてもデータドリブンに同時強度関数が推定でき、マーク付きイベント系列からの共変量時系列の予測も可能となる(課題3)。The marked event sequence analysis device of this embodiment estimates a joint intensity function under covariates that evolve nonlinearly over time by combining the above-mentioned model with a state space model for covariate time series. By using a state space model including a neural network, it is possible to estimate a joint intensity function in a data-driven manner for any covariate time series, and it is also possible to predict a covariate time series from a marked event sequence (Problem 3).
以下、図1を参照して、VAEを用いた同時強度関数モデルを用いる実施例1のマーク付きイベント系列分析装置の機能構成を説明する。 Below, with reference to Figure 1, the functional configuration of the marked event sequence analysis device of Example 1 using a joint intensity function model using VAE is explained.
同図に示すように本実施例のマーク付きイベント系列分析装置1は、モデル記憶部10と、パラメータ推定部11と、マーク付きイベント系列予測部12と、共変量時系列予測部13を含む。なお、モデル記憶部10とパラメータ推定部11によりモデルのパラメータを更新することができるため、これらの機能構成(10、11)のみを含むモデル生成装置5に対して、別装置として、マーク付きイベント系列予測部(装置)12、共変量時系列予測部(装置)13が接続された構成としてもよい。As shown in the figure, the marked event sequence analysis device 1 of this embodiment includes a
本実施例のマーク付きイベント系列分析装置1が用いるモデルはマーク付きイベント系列についての同時強度関数モデルと共変量時系列についての状態空間モデルの二つに分けられる。 The models used by the marked event sequence analysis device 1 of this embodiment are divided into two: a joint intensity function model for marked event sequences and a state space model for covariate time series.
マーク付きイベント系列についての同時強度関数モデルは2つの推論モデル(第1、第2推論モデル)と、生成モデルを含む。共変量時系列についての状態空間モデルは推定モデルと、生成モデルを含む。 The joint intensity function model for marked event sequences includes two inference models (first and second inference models) and a generative model. The state space model for covariate time series includes an estimation model and a generative model.
生成モデルはマーク付きイベント系列と共変量時系列の生成過程を記述する。推論モデルは、生成モデルのパラメータを推定するために補助的に導入するもので、観測データが与えられたもとでの潜在変数の事後分布を近似する。 The generative model describes the generation process of marked event sequences and covariate time series. The inference model is introduced as an auxiliary to estimate the parameters of the generative model and approximates the posterior distribution of latent variables given observed data.
[モデル記憶部10]
モデル記憶部10は、マーク付きイベント系列についての同時強度関数モデルと、共変量時系列についての状態空間モデルを予め記憶している。
[Model storage unit 10]
The
[パラメータ推定部11]
パラメータ推定部11は、モデル記憶部10に予め記憶されたモデルのもとで、尤度の下限を導出し、その下限を最大化することでパラメータを推定する(S11、図2)。
[Parameter Estimation Unit 11]
The
パラメータ推定部11は、マーク付きイベント系列と共変量時系列が与えられた条件の下で、上述のモデルのパラメータを推定する。まずはじめに、推論モデルを用いて生成モデルの尤度の下限を計算する。この尤度の下限を確率的勾配法によって最大化することで、生成モデルと推論モデルのパラメータを推定する。The
図3に示すように、パラメータ推定部11は、共変量潜在変数時系列計算部111と、共変量周辺分布パラメータ計算部112と、共変量モデルパラメータ更新部113と、マーク付きイベント系列潜在変数時系列計算部114と、マーク付きイベント系列周辺分布パラメータ計算部115と、イベント系列モデルパラメータ更新部116を含む。以下、図4を参照して、各機能構成の詳細な動作を説明する。3, the
<共変量潜在変数時系列計算部111>
共変量潜在変数時系列計算部111は、共変量時系列を共変量時系列の推論モデルに入力し、共変量の潜在変数の時系列を計算する(S111)。
<Covariate latent variable time
The covariate latent variable time
<共変量周辺分布パラメータ計算部112>
共変量周辺分布パラメータ計算部112は、S111で計算した共変量の潜在変数の時系列を共変量時系列の生成モデルに入力し、共変量の周辺分布のパラメータを計算する(S112)。
<Covariate marginal distribution
The covariate marginal distribution
<共変量モデルパラメータ更新部113>
共変量モデルパラメータ更新部113は、S112で計算した共変量の周辺分布のパラメータを用いて、共変量時系列の尤度の下限を計算し、この尤度の下限を大きくするように共変量時系列の生成モデルおよび推論モデルのパラメータを更新する(S113)。
<Covariate model
The covariate model
<マーク付きイベント系列潜在変数時系列計算部114>
マーク付きイベント系列潜在変数時系列計算部114は、これに対応するステップS111で計算した共変量の潜在変数の時系列と、これに対応するマーク付きイベント系列をマーク付きイベント系列についての2つの推論モデル(第1、第2推論モデル)に入力し、マーク付きイベント系列の潜在変数の時系列を計算する(S114)。
<Marked Event Series Latent Variable Time
The marked event series latent variable time
<マーク付きイベント系列周辺分布パラメータ計算部115>
マーク付きイベント系列周辺分布パラメータ計算部115は、ステップS114で計算したマーク付きイベント系列の潜在変数の時系列をマーク付きイベント系列についての生成モデルに入力し、マーク付きイベント系列の周辺分布のパラメータを計算する(S115)。
<Marked Event Sequence Marginal Distribution
The marked event sequence marginal distribution
<イベント系列モデルパラメータ更新部116>
イベント系列モデルパラメータ更新部116は、ステップS115で計算したマーク付きイベント系列の周辺分布のパラメータを用いて、マーク付きイベント系列の尤度の下限を計算し、この尤度の下限を大きくするようにマーク付きイベント系列についての生成モデルおよび推論モデルのパラメータを更新する(S116)。
<Event sequence model
The event sequence model
パラメータ推定部11は、ステップS111~S116の処理を収束するまで繰り返す。パラメータ推定部11は、収束したパラメータを出力する。
The
[マーク付きイベント系列予測部12]
マーク付きイベント系列予測部12は、パラメータ推定部11で推定されたパラメータを用いて、共変量時系列が与えられた下でのマーク付きイベント系列の予測分布を計算する(S12)。
[Marked event sequence prediction unit 12]
The marked event
図5に示すように、マーク付きイベント系列予測部12は、共変量潜在変数時系列計算部121と、マーク付きイベント系列予測分布計算部122を含む。以下、図6を参照して、各機能構成の詳細な動作を説明する。As shown in Fig. 5, the marked event
<共変量潜在変数時系列計算部121>
共変量潜在変数時系列計算部121は、共変量時系列を共変量時系列についての推論モデルに入力し、共変量の潜在変数の時系列を計算する(S121)。
<Covariate latent variable time
The covariate latent variable time
<マーク付きイベント系列予測分布計算部122>
マーク付きイベント系列予測分布計算部122は、S121で計算した共変量の潜在変数の時系列とマーク付きイベント系列についての生成モデルおよび推論モデルからマーク付きイベント系列の予測分布を計算し、出力する(S122)。
<Marked Event Sequence Prediction
The marked event sequence predictive
[共変量時系列予測部13]
共変量時系列予測部13は、パラメータ推定部11で推定されたパラメータを用いて、マーク付きイベント系列が与えられた下での共変量時系列の予測分布を計算する(S13)。
[Covariate time series prediction unit 13]
The covariate time
図7に示すように、共変量時系列予測部13は、予測分布初期化部131と、予測分布更新部132と、予測分布出力部133を含む。以下、図8を参照して、各機能構成の詳細な動作を説明する。As shown in Fig. 7, the covariate time
<予測分布初期化部131>
予測分布初期化部131は、共変量の潜在変数の時系列についての予測分布を初期化する(S131)。
<Predictive
The predictive
<予測分布更新部132>
予測分布更新部132は、マーク付きイベント系列についての生成モデルと推論モデル、共変量時系列の生成モデルを用いて、予測分布を更新する(S132)。予測分布更新部132は、ステップS132の処理を収束するまで繰り返す(収束?:Y→S133、N→S132)。
<Predictive
The predictive
<予測分布出力部133>
予測分布出力部133は、ステップS132で収束した予測分布を共変量時系列についての生成モデルに入力し、共変量時系列の周辺分布のパラメータを計算し、得られたパラメータに相当する分布を共変量時系列の予測分布として出力する(S133)。
<Prediction
The predictive
<補記>
本発明の装置は、例えば単一のハードウェアエンティティとして、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、ハードウェアエンティティの外部に通信可能な通信装置(例えば通信ケーブル)が接続可能な通信部、CPU(Central Processing Unit、キャッシュメモリやレジスタなどを備えていてもよい)、メモリであるRAMやROM、ハードディスクである外部記憶装置並びにこれらの入力部、出力部、通信部、CPU、RAM、ROM、外部記憶装置の間のデータのやり取りが可能なように接続するバスを有している。また必要に応じて、ハードウェアエンティティに、CD-ROMなどの記録媒体を読み書きできる装置(ドライブ)などを設けることとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。
<Additional Notes>
The device of the present invention has, as a single hardware entity, an input section to which a keyboard or the like can be connected, an output section to which a liquid crystal display or the like can be connected, a communication section to which a communication device (for example, a communication cable) capable of communicating with the outside of the hardware entity can be connected, a CPU (which may also have a central processing unit, cache memory, registers, etc.), memories such as RAM and ROM, an external storage device such as a hard disk, and a bus connecting the input section, output section, communication section, CPU, RAM, ROM, and external storage device so that data can be exchanged between them. If necessary, the hardware entity may also be provided with a device (drive) capable of reading and writing recording media such as a CD-ROM. A physical entity equipped with such hardware resources is, for example, a general-purpose computer.
ハードウェアエンティティの外部記憶装置には、上述の機能を実現するために必要となるプログラムおよびこのプログラムの処理において必要となるデータなどが記憶されている(外部記憶装置に限らず、例えばプログラムを読み出し専用記憶装置であるROMに記憶させておくこととしてもよい)。また、これらのプログラムの処理によって得られるデータなどは、RAMや外部記憶装置などに適宜に記憶される。The external storage device of the hardware entity stores the programs required to realize the above-mentioned functions and the data required in processing these programs (not limited to an external storage device, but for example the programs may be stored in a ROM, which is a read-only storage device). Data obtained by processing these programs is stored appropriately in RAM, an external storage device, etc.
ハードウェアエンティティでは、外部記憶装置(あるいはROMなど)に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてメモリに読み込まれて、適宜にCPUで解釈実行・処理される。その結果、CPUが所定の機能(上記、…部、…手段などと表した各構成要件)を実現する。In a hardware entity, each program stored in an external storage device (or ROM, etc.) and the data required to process each program are loaded into memory as needed, and interpreted, executed, and processed by the CPU as appropriate. As a result, the CPU realizes a specified function (each of the components represented as the above, ... unit, ... means, etc.).
本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。The present invention is not limited to the above-described embodiments, and appropriate modifications can be made without departing from the spirit of the present invention. Furthermore, the processes described in the above embodiments are not limited to being executed chronologically in the order described, but may be executed in parallel or individually depending on the processing capacity of the device executing the processes or as necessary.
既述のように、上記実施形態において説明したハードウェアエンティティ(本発明の装置)における処理機能をコンピュータによって実現する場合、ハードウェアエンティティが有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記ハードウェアエンティティにおける処理機能がコンピュータ上で実現される。As mentioned above, when the processing functions of the hardware entities (the devices of the present invention) described in the above embodiments are realized by a computer, the processing contents of the functions that the hardware entities should have are described by a program. Then, by executing this program on a computer, the processing functions of the hardware entities are realized on the computer.
上述の各種の処理は、図9に示すコンピュータ10000の記録部10020に、上記方法の各ステップを実行させるプログラムを読み込ませ、制御部10010、入力部10030、出力部10040などに動作させることで実施できる。The various processes described above can be implemented by loading a program that executes each step of the above method into the
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD-RAM(Random Access Memory)、CD-ROM(Compact Disc Read Only Memory)、CD-R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP-ROM(Electrically Erasable and Programmable-Read Only Memory)等を用いることができる。 The program describing the processing contents can be recorded on a computer-readable recording medium. Examples of computer-readable recording media include magnetic recording devices, optical disks, magneto-optical recording media, and semiconductor memories. Specifically, for example, hard disk drives, flexible disks, and magnetic tapes can be used as magnetic recording devices; DVDs (Digital Versatile Discs), DVD-RAMs (Random Access Memory), CD-ROMs (Compact Disc Read Only Memory), and CD-Rs (Recordable)/RWs (ReWritable) can be used as optical disks; MOs (Magneto-Optical discs) can be used as magneto-optical recording media; and EEP-ROMs (Electrically Erasable and Programmable-Read Only Memory) can be used as semiconductor memories.
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。 The program may be distributed, for example, by selling, transferring, lending, etc. portable recording media such as DVDs and CD-ROMs on which the program is recorded. Furthermore, the program may be distributed by storing the program in a storage device of a server computer and transferring the program from the server computer to other computers via a network.
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。A computer that executes such a program, for example, first stores the program recorded on a portable recording medium or the program transferred from a server computer in its own storage device. Then, when executing a process, the computer reads the program stored on its own recording medium and executes the process according to the read program. As another execution form of this program, the computer may read the program directly from the portable recording medium and execute the process according to the program, or may execute the process according to the received program each time a program is transferred from the server computer to this computer. In addition, the server computer may not transfer the program to this computer, but may execute the above-mentioned process by a so-called ASP (Application Service Provider) type service that realizes the processing function only by issuing an execution instruction and obtaining the results. Note that the program in this embodiment includes information used for processing by an electronic computer that is equivalent to a program (such as data that is not a direct command to the computer but has a nature that specifies the processing of the computer).
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、ハードウェアエンティティを構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。 In addition, in this embodiment, a hardware entity is constructed by executing a specific program on a computer, but at least a portion of these processing contents may also be realized by hardware.
Claims (4)
前記マーク付きイベント系列と、これに対応する共変量の潜在変数の時系列を前記推論モデルに入力し、前記マーク付きイベント系列の潜在変数の時系列を計算するマーク付きイベント系列潜在変数時系列計算部と、
前記マーク付きイベント系列の潜在変数の時系列を前記生成モデルに入力し、前記マーク付きイベント系列の周辺分布のパラメータを計算するマーク付きイベント系列周辺分布パラメータ計算部と、
前記マーク付きイベント系列の周辺分布のパラメータを用いて、前記マーク付きイベント系列の尤度の下限を大きくするように前記生成モデルおよび前記推論モデルのパラメータを更新するイベント系列モデルパラメータ更新部を含む
モデル生成装置。 a model storage unit that stores a joint intensity function model including an inference model and a generation model, the joint intensity function of a marked event sequence being expressed as a product of a scale parameter and a joint probability density function, the joint intensity function model being expressed using a decoder including a neural network;
a marked event sequence latent variable time series calculation unit that inputs the marked event sequence and a time series of a latent variable of the corresponding covariate to the inference model and calculates a time series of a latent variable of the marked event sequence;
a marked event sequence marginal distribution parameter calculation unit that inputs a time series of latent variables of the marked event sequence into the generative model and calculates parameters of the marginal distribution of the marked event sequence;
an event sequence model parameter update unit that updates parameters of the generative model and the inference model using parameters of a marginal distribution of the marked event sequence so as to increase a lower limit of the likelihood of the marked event sequence.
前記モデル記憶部は、
前記同時強度関数モデルに加え、推論モデルと生成モデルを含む状態空間モデルであって、共変量時系列についての状態空間モデルを記憶し、
前記共変量時系列を共変量時系列の推論モデルに入力し、共変量の潜在変数の時系列を計算する共変量潜在変数時系列計算部と、
前記共変量の潜在変数の時系列を前記共変量時系列の生成モデルに入力し、前記共変量の周辺分布のパラメータを計算する共変量周辺分布パラメータ計算部と、
前記共変量の周辺分布のパラメータを用いて、前記共変量時系列の尤度の下限を大きくするように前記共変量時系列の生成モデルおよび推論モデルのパラメータを更新する共変量モデルパラメータ更新部を含む
モデル生成装置。 2. The model generating device according to claim 1,
The model storage unit includes:
A state space model including an inference model and a generation model in addition to the joint intensity function model, the state space model for the covariate time series being stored;
a covariate latent variable time series calculation unit that inputs the covariate time series into a covariate time series inference model and calculates a time series of a latent variable of the covariate;
a covariate marginal distribution parameter calculation unit that inputs a time series of the latent variables of the covariates into a generation model of the covariate time series and calculates parameters of the marginal distribution of the covariates;
a covariate model parameter update unit that updates parameters of a generation model and an inference model of the covariate time series using parameters of the marginal distribution of the covariate so as to increase a lower limit of the likelihood of the covariate time series.
前記マーク付きイベント系列と、これに対応する共変量の潜在変数の時系列を前記推論モデルに入力し、前記マーク付きイベント系列の潜在変数の時系列を計算するマーク付きイベント系列潜在変数時系列計算ステップと、
前記マーク付きイベント系列の潜在変数の時系列を前記生成モデルに入力し、前記マーク付きイベント系列の周辺分布のパラメータを計算するマーク付きイベント系列周辺分布パラメータ計算ステップと、
前記マーク付きイベント系列の周辺分布のパラメータを用いて、前記マーク付きイベント系列の尤度の下限を大きくするように前記生成モデルおよび前記推論モデルのパラメータを更新するイベント系列モデルパラメータ更新ステップを、
モデル生成装置が実行するモデル生成方法。 a simultaneous intensity function model including an inference model and a generation model, the simultaneous intensity function of a marked event sequence being expressed as a product of a scale parameter and a simultaneous probability density function, the simultaneous intensity function model being expressed using a decoder including a neural network;
a marked event sequence latent variable time series calculation step of inputting the marked event sequence and a time series of latent variables of the corresponding covariates into the inference model and calculating a time series of latent variables of the marked event sequence;
a marked event sequence marginal distribution parameter calculation step of inputting a time series of latent variables of the marked event sequence into the generative model and calculating parameters of the marginal distribution of the marked event sequence;
an event sequence model parameter updating step of updating parameters of the generative model and the inference model using parameters of a marginal distribution of the marked event sequence so as to increase a lower bound of the likelihood of the marked event sequence;
A model generation method executed by a model generation device.
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| PCT/JP2021/030575 WO2023021690A1 (en) | 2021-08-20 | 2021-08-20 | Model generation device, model generation method and program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPWO2023021690A1 JPWO2023021690A1 (en) | 2023-02-23 |
| JP7559959B2 true JP7559959B2 (en) | 2024-10-02 |
Family
ID=85240275
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2023542155A Active JP7559959B2 (en) | 2021-08-20 | 2021-08-20 | Model generation device, model generation method, and program |
Country Status (2)
| Country | Link |
|---|---|
| JP (1) | JP7559959B2 (en) |
| WO (1) | WO2023021690A1 (en) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2025069151A1 (en) * | 2023-09-25 | 2025-04-03 | 日本電気株式会社 | Information processing device, information processing method, and recording medium |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2017094267A1 (en) | 2015-12-01 | 2017-06-08 | 株式会社Preferred Networks | Abnormality detection system, abnormality detection method, abnormality detection program, and method for generating learned model |
| JP2020123008A (en) | 2019-01-29 | 2020-08-13 | 日本電信電話株式会社 | Variable optimization device, noise removal device, variable optimization method, noise removal method, program |
-
2021
- 2021-08-20 JP JP2023542155A patent/JP7559959B2/en active Active
- 2021-08-20 WO PCT/JP2021/030575 patent/WO2023021690A1/en not_active Ceased
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2017094267A1 (en) | 2015-12-01 | 2017-06-08 | 株式会社Preferred Networks | Abnormality detection system, abnormality detection method, abnormality detection program, and method for generating learned model |
| JP2020123008A (en) | 2019-01-29 | 2020-08-13 | 日本電信電話株式会社 | Variable optimization device, noise removal device, variable optimization method, noise removal method, program |
Also Published As
| Publication number | Publication date |
|---|---|
| JPWO2023021690A1 (en) | 2023-02-23 |
| WO2023021690A1 (en) | 2023-02-23 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Zhang et al. | Bayesian dynamic regression for reconstructing missing data in structural health monitoring | |
| Zhao et al. | Bayesian deep learning on a quantum computer | |
| US11861464B2 (en) | Graph data structure for using inter-feature dependencies in machine-learning | |
| Dejaeger et al. | Data mining techniques for software effort estimation: a comparative study | |
| Conley | Spatial econometrics | |
| JP6821614B2 (en) | Model learning device, model learning method, program | |
| Elshahhat et al. | Bayesian survival analysis for adaptive Type-II progressive hybrid censored Hjorth data | |
| Strickland | Predictive analytics using R | |
| Brophy et al. | Adapting and evaluating influence-estimation methods for gradient-boosted decision trees | |
| JP7807463B2 (en) | Industry-Specific Machine Learning Applications | |
| US11087344B2 (en) | Method and system for predicting and indexing real estate demand and pricing | |
| JP7253324B2 (en) | Causal relationship learning device, causal relationship estimating device, causal relationship learning method, causal relationship estimating method and program | |
| Agarwal et al. | Time‐Series Forecasting Using SVMD‐LSTM: A Hybrid Approach for Stock Market Prediction | |
| Renner et al. | Machine learning for dynamic incentive problems | |
| Boyko et al. | Methodology for estimating the cost of construction equipment based on the analysis of important characteristics using machine learning methods | |
| WO2020235631A1 (en) | Model generation device, system, parameter calculation device, model generation method, parameter calculation method, and recording medium | |
| JP7559762B2 (en) | Information processing device, information processing method, and program | |
| JP7559959B2 (en) | Model generation device, model generation method, and program | |
| US12038823B2 (en) | Hierarchical attention time-series (HAT) model for behavior prediction | |
| US11004156B2 (en) | Method and system for predicting and indexing probability of financial stress | |
| Li et al. | Forecasting large collections of time series: feature-based methods | |
| Liu et al. | The courage to stop: Overcoming sunk cost fallacy in deep reinforcement learning | |
| Choi et al. | Matrix-based prediction approach for intraday instantaneous volatility vector | |
| Dong et al. | A new multivariate count data model to study multi-category physician prescription behavior | |
| US20230385682A1 (en) | Method and system of generating a classical model to simulate a quantum computational model via input perturbation to enhance explainability |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20231129 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240820 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240902 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7559959 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |