Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP6465440B2 - Analysis apparatus, method, and program - Google Patents
[go: Go Back, main page]

JP6465440B2 - Analysis apparatus, method, and program - Google Patents

Analysis apparatus, method, and program Download PDF

Info

Publication number
JP6465440B2
JP6465440B2 JP2016036106A JP2016036106A JP6465440B2 JP 6465440 B2 JP6465440 B2 JP 6465440B2 JP 2016036106 A JP2016036106 A JP 2016036106A JP 2016036106 A JP2016036106 A JP 2016036106A JP 6465440 B2 JP6465440 B2 JP 6465440B2
Authority
JP
Japan
Prior art keywords
parameter
regularization
term
data
estimation unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016036106A
Other languages
Japanese (ja)
Other versions
JP2017151904A (en
Inventor
竹内 孝
孝 竹内
具治 岩田
具治 岩田
吉伸 河原
吉伸 河原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Osaka NUC
NTT Inc
NTT Inc USA
Original Assignee
Nippon Telegraph and Telephone Corp
Osaka University NUC
NTT Inc USA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp, Osaka University NUC, NTT Inc USA filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2016036106A priority Critical patent/JP6465440B2/en
Publication of JP2017151904A publication Critical patent/JP2017151904A/en
Application granted granted Critical
Publication of JP6465440B2 publication Critical patent/JP6465440B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Description

本発明は、解析装置、方法、及びプログラムに係り、特に、正則化技術を利用して、データを解析する解析装置、方法、及びプログラムに関する。   The present invention relates to an analysis apparatus, method, and program, and more particularly, to an analysis apparatus, method, and program for analyzing data using a regularization technique.

教師あり学習は、観測データと教師データとのペアからなる訓練データが与えられた際に、観測データから教師データを予測するためのパラメータを推定する技術である。パラメータの推定は、観測データから教師データを予測したときの誤差を最小化する問題として定式化されている。推定されたパラメータの性能は、テストデータと呼ばれる訓練データに含まれない未知の観測データから教師データを予測した際の誤差(汎化誤差)によって評価され、汎化誤差が小さいほど性能が良いパラメータとされる。   Supervised learning is a technique for estimating parameters for predicting supervised data from observed data when given training data consisting of pairs of observed data and supervised data. Parameter estimation is formulated as a problem that minimizes errors when predicting teacher data from observed data. The performance of the estimated parameters is evaluated by the error (generalization error) when predicting the teacher data from unknown observation data not included in the training data called test data. The smaller the generalization error, the better the performance It is said.

近年、教師あり学習の研究分野では観測データの高次元化に伴い、訓練データが未知の観測データの次元より少ない場合において、推定されたパラメータの汎化誤差が大きくなることにより、推定精度が悪化する問題が注目を集めている。この現象は、過学習という現象に拠る。そこでデータに関して予め得られている事前知識を正則化項として導入し、パラメータの取りうる値を制約し、過学習を回避する正則化技術が研究されている。正則化技術のなかでも、パラメータの持つ構造を利用したものは構造正則化とよばれ、近年盛んに研究されている。   In recent years, in the supervised learning research field, the accuracy of estimation deteriorates as the generalization error of the estimated parameters increases when the training data is less than the dimensions of the unknown observation data as the observation data increases in dimension. The problem is getting attention. This phenomenon is based on the phenomenon of overlearning. Therefore, regularization techniques that introduce prior knowledge obtained in advance as data as regularization terms, restrict the possible values of parameters, and avoid overlearning have been studied. Among regularization techniques, the one using the structure of parameters is called structural regularization, and has been actively studied in recent years.

非特許文献1では、結合正則化(Fused Lasso)という構造正則化技術が提案されている。結合正則化技術は、あるパラメータと別のパラメータは隣接関係を持つために同一の真値をもつという事前知識を正則化項として導入する。非特許文献1は、結合正則化項の最小化法を提案し、実験からパラメータが隣接関係を持つデータにおいて、構造を用いない正則化技術よりも高い性能を達成すると報告されている。   Non-Patent Document 1 proposes a structural regularization technique called combined regularization (Fused Lasso). The combined regularization technique introduces prior knowledge that a certain parameter and another parameter have the same true value because they have an adjacent relationship as a regularization term. Non-Patent Document 1 proposes a method for minimizing the joint regularization term, and it is reported from experiments that the performance is higher than that of the regularization technique that does not use the structure in the data having parameters adjacent to each other.

非特許文献2では、結合正則化の隣接関係を任意の隣接関係に拡張した一般化結合正則化(Generalized Fused Lasso)という技術が提案されている。非特許文献2は、一般化結合正則化が離散最適化における劣モジュラ関数のロバシュ拡張と一致することを示し(非特許文献3参照)、さらにその性質を利用することで、非特許文献4及び非特許文献7によって一般化結合正則化項の最小化法を提案した。   Non-Patent Document 2 proposes a technique called generalized combined regularization (Generalized Fused Lasso) in which the adjacency relationship of connection regularization is expanded to an arbitrary adjacency relationship. Non-Patent Document 2 shows that generalized joint regularization is consistent with the Robache extension of the submodular function in discrete optimization (see Non-Patent Document 3), and further using its properties, Non-Patent Document 4 and Non-Patent Document 7 proposed a method for minimizing generalized coupled regularization terms.

教師なし学習では、訓練データとテストデータに観測データは含まれるが、教師データが含まれない場合に、データを解析する技術であり、行列分解などの技術が提案されている。教師なし学習においても、データの高次元化に伴い過学習の問題が起きており、この問題を回避するために正則化技術を適応する研究が行われており解析精度の向上が報告されている。   In unsupervised learning, observation data is included in training data and test data, but when teacher data is not included, a technique for analyzing data, such as matrix decomposition, has been proposed. Even in unsupervised learning, the problem of over-learning has occurred with higher data dimensions, and research to apply regularization technology to avoid this problem has been conducted, and improvement in analysis accuracy has been reported. .

Tibshirani,R., Saunders,M., Rosset,S., Zhu,J., Knight, K.: Sparsity and smoothness via the fused lasso. Journal of the Royal Statistical Society: Series B (Statistical Methodology) 67(1), 91−108 (2005)Tibshirani, R., Saunders, M., Rosset, S., Zhu, J., Knight, K .: Sparsity and smoothness via the fused lasso.Journal of the Royal Statistical Society: Series B (Statistical Methodology) 67 (1) , 91-108 (2005) Xin,B., Kawahara,Y., Wang,Y., Gao,W. :Efficient generalized fused lasso with its application to the diagnosis of Alzheimer’s disease. In: Proc. of AAAI. pp. 2163−2169 (2014)Xin, B., Kawahara, Y., Wang, Y., Gao, W.: Efficient generalized fused lasso with its application to the diagnosis of Alzheimer ’s disease.In: Proc. Of AAAI. Pp. 2163-2169 (2014) Fujishige,S.:Submodularfunctionsandoptimization,vol.58.Elsevier(2005)Fujishige, S .: Submodular function sandoptimization, vol. 58. Elsevier (2005) Gallo,G., Grigoriadis,M.D., Tarjan, R.E.: A fast parametric maximum flow algorithm and applications. SIAM Journal on Computing 18(1), 30−55 (1989)Gallo, G., Grigoriadis, M.D., Tarjan, R.E .: A fast parametric maximum flow algorithm and applications.SIAM Journal on Computing 18 (1), 30-55 (1989) Kohli,P., Ladicky,L., Torr,P.H.S. : Robust higher order potentials for enforcing label consistency. International Journal of Computer Vision 82(3), 302−324 (2009)Kohli, P., Ladicky, L., Torr, P.H.S .: Robust higher order potentials for enforcing label consistency.International Journal of Computer Vision 82 (3), 302-324 (2009) Combettes,P.L. ,Wajs,V.R.: Signal recovery by proximal forward−backward splitting. Multiscale Modeling & Simulation 4(4), 1168−1200 (2005)Combettes, P.L., Wajs, V.R .: Signal recovery by proximal forward-backward splitting.Multiscale Modeling & Simulation 4 (4), 1168-1200 (2005) Nagano,K., Kawahara,Y., Aihara,K.: Size−constrained submodular minimization through minimum norm base. In: Proc. of ICML. pp. 977−984 (2011)Nagano, K., Kawahara, Y., Aihara, K .: Size-constrained submodular minimization through minimum norm base. In: Proc. Of ICML. Pp. 977-984 (2011) Liu,J., Ji,S., Ye,J.: SLEP: Sparse Learning with Efficient Projections. Arizona State University (2009),Liu, J., Ji, S., Ye, J .: SLEP: Sparse Learning with Efficient Projections.Arizona State University (2009),

パラメータに関する事前知識として、高階の構造、すなわち、あるパラメータの集合は同一のグループに所属する、といった情報を正則化に利用したい場合を想定する。しかし、一般化結合正則化が利用可能な事前知識は隣接関係のみに限定されているため、高階の構造を利用できない。そのためにパラメータがグループ構造を持つデータに対して、十分な性能を得られない場合がある。   As prior knowledge regarding parameters, a case is assumed in which information such as a higher-order structure, that is, a set of parameters belonging to the same group, is used for regularization. However, prior knowledge that can be used for generalized joint regularization is limited only to the adjacency relationship, so a higher-order structure cannot be used. For this reason, sufficient performance may not be obtained for data having parameters having a group structure.

本発明は、上記問題点を解決するために成されたものであり、グループ構造を持つデータを精度よく解析することができる解析装置、方法、及びプログラムを提供することを目的とする。   The present invention has been made to solve the above-described problems, and an object of the present invention is to provide an analysis apparatus, method, and program capable of accurately analyzing data having a group structure.

上記目的を達成するために、第1の発明に係る解析装置は、観測データxに対する実数スカラー値yを予測する解析装置であって、観測データxと実数スカラー値yとの組み合わせからなるデータ点の集合である訓練データと、観測データxからなるテストデータと、観測データxに対する実数スカラー値yを予測するためのd次元のベクトルであるパラメータβの各次元の、各グループへの所属度を表すパラメータ構造データと、前記パラメータβを推定するための損失関数における前記訓練データの前記データ点の各々についての誤差項lの勾配∇lと、前記損失関数におけるR個の正則化項Ωの各々を最小化する関数∇Ωとを受け付けるデータ入力部と、前記訓練データと、前記誤差項lの勾配∇lと、前記R個の正則化項Ωの各々を最小化する関数∇Ωとに基づいて、前記訓練データの前記データ点の各々についての前記誤差項lと、前記R個の正則化項Ωと、各グループに対し、前記パラメータβにおける、前記グループに所属する次元間の要素の値の差を用いて表される高階結合正則化項とを含む前記損失関数を最小化するように、前記パラメータβを推定するパラメータ推定部と、前記パラメータ推定部によって推定された前記パラメータβに基づいて、前記テストデータに対する実数スカラー値yを予測する予測部と、を含んで構成されている。 In order to achieve the above object, an analysis apparatus according to a first invention is an analysis apparatus for predicting a real scalar value y with respect to observation data x, and is a data point comprising a combination of observation data x and real scalar value y. The degree of affiliation of each dimension of each parameter of the parameter β, which is a d-dimensional vector for predicting the real scalar value y for the observation data x, the training data that is a set of the training data, the observation data x, and Representing the parameter structure data representing, the slope ∇l of the error term l for each of the data points of the training data in the loss function for estimating the parameter β, and the R regularization terms Ω r in the loss function A data input unit that accepts a function ∇Ω r that minimizes each, the training data, the gradient ∇l of the error term l, and each of the R regularization terms Ω r On the basis of a function ∇Ω r that minimizes each of the training data, the error term l for each of the data points of the training data, the R regularization terms Ω r, and for each group, the parameter β A parameter estimation unit that estimates the parameter β so as to minimize the loss function including a higher-order coupled regularization term expressed using a difference in element values between dimensions belonging to the group in A prediction unit that predicts a real scalar value y for the test data based on the parameter β estimated by the parameter estimation unit.

また、第1の発明に係る解析装置において、前記パラメータ構造データは、前記パラメータβの次元対の類似度を更に含み、前記パラメータ推定部は、前記訓練データと、前記誤差項lの勾配∇lと、前記R個の正則化項Ωの各々を最小化する関数∇Ωとに基づいて、前記訓練データの前記データ点の各々についての前記誤差項lと、前記R個の正則化項Ωと、前記高階結合正則化項、及び前記パラメータβの次元対の類似度を用いて表される一般化結合正則化項を含む一般化高階結合正則化項とを含む前記損失関数を最小化するように、前記パラメータβを推定するようにしてもよい。 In the analysis apparatus according to the first invention, the parameter structure data further includes a dimension pair similarity of the parameter β, and the parameter estimation unit includes the training data and the gradient ∇l of the error term l. And the error term l for each of the data points of the training data, and the R regularization terms, based on and the function ∇Ω r that minimizes each of the R regularization terms Ω r Minimize the loss function including Ω r and the generalized higher order regularization term including the higher order joint regularization term and the generalized joint regularization term expressed using the similarity of the dimension pairs of the parameter β. Alternatively, the parameter β may be estimated.

また、第1の発明に係る解析装置において、前記パラメータ推定部は、前記誤差項lの勾配∇lに基づいて、前記パラメータβを推定する誤差項パラメータ推定部と、前記誤差項パラメータ推定部によって推定された前記パラメータβと、前記R個の正則化項Ωの各々を最小化する関数∇Ωとに基づいて、前記パラメータβを推定する正則化項パラメータ推定部と、前記正則化項パラメータ推定部によって推定された前記パラメータβと、前記高階結合正則化項とに基づいて、前記パラメータβを推定する高階結合正則化項パラメータ推定部とを含み、前記誤差項パラメータ推定部による推定、前記正則化項パラメータ推定部による推定、及び前記高階結合正則化項パラメータ推定部による推定を、少なくとも1回ずつ行うようにしてもよい。 In the analysis apparatus according to the first invention, the parameter estimation unit includes an error term parameter estimation unit that estimates the parameter β based on the gradient ∇l of the error term l, and the error term parameter estimation unit. A regularization term parameter estimator for estimating the parameter β based on the estimated parameter β and a function ∇Ω r that minimizes each of the R regularization terms Ω r , and the regularization term A higher-order coupled regularization term parameter estimation unit that estimates the parameter β based on the parameter β estimated by the parameter estimation unit and the higher-order coupling regularization term, and the estimation by the error term parameter estimation unit, The estimation by the regularization term parameter estimation unit and the estimation by the higher-order coupled regularization term parameter estimation unit may be performed at least once. .

また、第1の発明に係る解析装置において、前記パラメータ推定部は、前記誤差項lの勾配∇lに基づいて、前記パラメータβを推定する誤差項パラメータ推定部と、前記誤差項パラメータ推定部によって推定された前記パラメータβと、前記R個の正則化項Ωの各々を最小化する関数∇Ωとに基づいて、前記パラメータβを推定する正則化項パラメータ推定部と、前記正則化項パラメータ推定部によって推定された前記パラメータβと、前記一般化高階結合正則化項とに基づいて、前記パラメータβを推定する一般化高階結合正則化項パラメータ推定部とを含み、前記誤差項パラメータ推定部による推定、前記正則化項パラメータ推定部による推定、及び前記一般化高階結合正則化項パラメータ推定部による推定を、少なくとも1回ずつ行うようにしてもよい。 In the analysis apparatus according to the first invention, the parameter estimation unit includes an error term parameter estimation unit that estimates the parameter β based on the gradient ∇l of the error term l, and the error term parameter estimation unit. A regularization term parameter estimator for estimating the parameter β based on the estimated parameter β and a function ∇Ω r that minimizes each of the R regularization terms Ω r , and the regularization term A generalized higher-order coupled regularization term parameter estimation unit that estimates the parameter β based on the parameter β estimated by the parameter estimation unit and the generalized higher-order coupling regularization term, and the error term parameter estimation Estimation by the regular part, estimation by the regularization term parameter estimation unit, and estimation by the generalized higher order coupled regularization term parameter estimation unit at least once. You may make it.

また、第1の発明に係る解析装置において、前記高階結合パラメータ推定部は、前記正則化項パラメータ推定部によって推定された前記パラメータβと、前記高階結合正則化項に対応して予め定められたs/tグラフとに基づいて、パラメトリック最大流アルゴリズムに従って、パラメータβを推定するようにしてもよい。   In the analysis apparatus according to the first invention, the higher-order coupled parameter estimation unit is predetermined corresponding to the parameter β estimated by the regularization term parameter estimation unit and the higher-order coupled regularization term. The parameter β may be estimated according to the parametric maximum flow algorithm based on the s / t graph.

また、第1の発明に係る解析装置において、前記一般化高階結合正則化項パラメータ推定部は、前記正則化項パラメータ推定部によって推定された前記パラメータβと、前記一般化高階結合正則化項に対応して予め定められたs/tグラフとに基づいて、パラメトリック最大流アルゴリズムに従って、パラメータβを推定するようにしてもよい。   In the analysis apparatus according to the first aspect of the present invention, the generalized higher order coupled regularization term parameter estimation unit includes the parameter β estimated by the regularization term parameter estimation unit and the generalized higher order coupled regularization term. Correspondingly, the parameter β may be estimated according to a parametric maximum flow algorithm based on a predetermined s / t graph.

また、第2の発明に係る解析装置は、観測データxからなるデータ点の集合である訓練データと、観測データxを解析するためのd次元のベクトルであるパラメータβの各次元の、各グループへの所属度を表すパラメータ構造データと、前記パラメータβを推定するための損失関数における前記訓練データの前記データ点の各々についての誤差項lの勾配∇lと、前記損失関数におけるR個の正則化項Ωの各々を最小化する関数∇Ωとを受け付けるデータ入力部と、前記訓練データと、前記誤差項lの勾配∇lと、前記R個の正則化項Ωの各々を最小化する関数∇Ωとに基づいて、前記訓練データの前記データ点の各々についての前記誤差項lと、前記R個の正則化項Ωと、各グループに対し、前記パラメータβにおける、前記グループに所属する次元間の要素の値の差を用いて表される高階結合正則化項とを含む前記損失関数を最小化するように、前記パラメータβを推定するパラメータ推定部と、を含んで構成されている。 The analysis apparatus according to the second aspect of the present invention provides each group of training data that is a set of data points composed of observation data x and each dimension of parameter β that is a d-dimensional vector for analyzing observation data x. Parameter structure data representing the degree of membership in the data, the slope ∇l of the error term l for each of the data points of the training data in the loss function for estimating the parameter β, and R regulars in the loss function A data input that accepts a function ∇Ω r that minimizes each of the term Ω r, the training data, the slope ∇ l of the error term l, and each of the R regularization terms Ω r based on the function ∇Omega r of reduction, and the error term l for each of the data points of the training data, wherein the R-number of regularization term Omega r, for each group, in the parameter beta, the Guru A parameter estimator for estimating the parameter β so as to minimize the loss function including a higher-order coupled regularization term expressed using a difference in element values between dimensions belonging to It is configured.

また、第2の発明に係る解析装置において、前記パラメータ構造データは、前記パラメータβの次元対の類似度を更に含み、前記パラメータ推定部は、前記訓練データと、前記誤差項lの勾配∇lと、前記R個の正則化項Ωの各々を最小化する関数∇Ωとに基づいて、前記訓練データの前記データ点の各々についての前記誤差項lと、前記R個の正則化項Ωと、前記高階結合正則化項、及び前記パラメータβの次元対の類似度を用いて表される一般化結合正則化項を含む一般化高階結合正則化項とを含む前記損失関数を最小化するように、前記パラメータβを推定するようにしてもよい。 In the analysis apparatus according to the second invention, the parameter structure data further includes a dimension pair similarity of the parameter β, and the parameter estimation unit includes the training data and the gradient ∇l of the error term l. And the error term l for each of the data points of the training data, and the R regularization terms, based on and the function ∇Ω r that minimizes each of the R regularization terms Ω r Minimize the loss function including Ω r and the generalized higher order regularization term including the higher order joint regularization term and the generalized joint regularization term expressed using the similarity of the dimension pairs of the parameter β. Alternatively, the parameter β may be estimated.

第3の発明に係る解析方法は、観測データxに対する実数スカラー値yを予測する解析装置における解析方法であって、データ入力部が、観測データxと実数スカラー値yとの組み合わせからなるデータ点の集合である訓練データと、観測データxからなるテストデータと、観測データxに対する実数スカラー値yを予測するためのd次元のベクトルであるパラメータβの各次元の、各グループへの所属度を表すパラメータ構造データと、前記パラメータβを推定するための損失関数における前記訓練データの前記データ点の各々についての誤差項lの勾配∇lと、前記損失関数におけるR個の正則化項Ωの各々を最小化する関数∇Ωとを受け付けるステップと、パラメータ推定部が、前記訓練データと、前記誤差項lの勾配∇lと、前記R個の正則化項Ωの各々を最小化する関数∇Ωとに基づいて、前記訓練データの前記データ点の各々についての前記誤差項lと、前記R個の正則化項Ωと、各グループに対し、前記パラメータβにおける、前記グループに所属する次元間の要素の値の差を用いて表される高階結合正則化項とを含む前記損失関数を最小化するように、前記パラメータβを推定するステップと、予測部が、前記パラメータ推定部によって推定された前記パラメータβに基づいて、前記テストデータに対する実数スカラー値yを予測するステップと、を含んで実行することを特徴とする。 An analysis method according to a third invention is an analysis method in an analyzer for predicting a real scalar value y with respect to observation data x, wherein the data input unit is a data point comprising a combination of the observation data x and the real scalar value y. The degree of affiliation of each dimension of each parameter of the parameter β, which is a d-dimensional vector for predicting the real scalar value y for the observation data x, the training data that is a set of the training data, the observation data x, and Representing the parameter structure data representing, the slope ∇l of the error term l for each of the data points of the training data in the loss function for estimating the parameter β, and the R regularization terms Ω r in the loss function Receiving a function ∇Ω r that minimizes each, and a parameter estimator, wherein the training data, the slope ∇l of the error term l, Based each of the R regularization term Omega r in the function ∇Omega r that minimizes, and the error term l for each of the data points of the training data, and wherein the R regularization term Omega r For each group, the parameter β so as to minimize the loss function including a higher-order coupled regularization term represented using a difference in element values between dimensions belonging to the group in the parameter β. a step of estimating β, and a step of predicting a real scalar value y for the test data based on the parameter β estimated by the parameter estimation unit. .

また、第3の発明に係る解析方法において、前記パラメータ構造データは、前記パラメータβの次元対の類似度を更に含み、前記パラメータ推定部が推定するステップは、前記訓練データと、前記誤差項lの勾配∇lと、前記R個の正則化項Ωの各々を最小化する関数∇Ωとに基づいて、前記訓練データの前記データ点の各々についての前記誤差項lと、前記R個の正則化項Ωと、前記高階結合正則化項、及び前記パラメータβの次元対の類似度を用いて表される一般化結合正則化項を含む一般化高階結合正則化項とを含む前記損失関数を最小化するように、前記パラメータβを推定するようにしてもよい。 In the analysis method according to the third aspect of the invention, the parameter structure data further includes the similarity of the dimension pair of the parameter β, and the step of the parameter estimation unit estimating includes the training data and the error term l. , And the error term l for each of the data points of the training data, and the R pieces, based on the slope ∇l of and the function ∇Ω r that minimizes each of the R regularization terms Ω r A regularized term Ω r of the above, a higher-order coupled regularization term, and a generalized higher-order coupled regularization term including a generalized coupled regularization term expressed using the similarity of the dimension pairs of the parameter β The parameter β may be estimated so as to minimize the loss function.

また、第3の発明に係る解析方法において、前記パラメータ推定部が推定するステップは、誤差項パラメータ推定部が、前記誤差項lの勾配∇lに基づいて、前記パラメータβを推定するステップと、正則化項パラメータ推定部が、前記誤差項パラメータ推定部によって推定された前記パラメータβと、前記R個の正則化項Ωの各々を最小化する関数∇Ωとに基づいて、前記パラメータβを推定するステップと、高階結合正則化項パラメータ推定部が、前記正則化項パラメータ推定部によって推定された前記パラメータβと、前記高階結合正則化項とに基づいて、前記パラメータβを推定するステップと、を含み、前記誤差項パラメータ推定部による推定、前記正則化項パラメータ推定部による推定、及び前記高階結合正則化項パラメータ推定部による推定を、少なくとも1回ずつ行うようにしてもよい。 Further, in the analysis method according to the third aspect of the invention, the step of estimating the parameter estimation unit includes the step of the error term parameter estimation unit estimating the parameter β based on the gradient ∇l of the error term l; regularization term parameter estimation unit, and the parameter β estimated by the error term parameter estimator, based on the function ∇Omega r that minimizes each of the R number of regularization term Omega r, the parameter β And a step in which a higher-order coupled regularization term parameter estimation unit estimates the parameter β based on the parameter β estimated by the regularization-term parameter estimation unit and the higher-order coupling regularization term. And the estimation by the error term parameter estimation unit, the estimation by the regularization term parameter estimation unit, and the higher-order coupled regularization term parameter estimation The estimation by the fixed unit may be performed at least once.

また、第3の発明に係る解析方法において、前記高階結合パラメータ推定部が推定するステップは、前記正則化項パラメータ推定部によって推定された前記パラメータβと、前記高階結合正則化項に対応して予め定められたs/tグラフとに基づいて、パラメトリック最大流アルゴリズムに従って、パラメータβを推定するようにしてもよい。   In the analysis method according to the third aspect of the present invention, the step of estimating by the higher order coupled parameter estimation unit corresponds to the parameter β estimated by the regularization term parameter estimation unit and the higher order coupled regularization term. The parameter β may be estimated according to a parametric maximum flow algorithm based on a predetermined s / t graph.

第4の発明に係るプログラムは、コンピュータを、第1又は第2の発明に係る解析装置の各部として機能させるためのプログラムである。   A program according to a fourth invention is a program for causing a computer to function as each part of the analysis device according to the first or second invention.

本発明の解析装置、方法、及びプログラムによれば、訓練データと、誤差項lの勾配∇lと、R個の正則化項Ωの各々を最小化する関数∇Ωとに基づいて、訓練データのデータ点の各々についての誤差項lと、R個の正則化項Ωと、各グループに対し、パラメータβにおける、グループに所属する次元間の要素の値の差を用いて表される高階結合正則化項とを含む損失関数を最小化するように、パラメータβを推定することにより、グループ構造を持つデータを精度よく解析することができる、という効果が得られる。 According to the analysis apparatus, method and program of the present invention, based on the training data, the slope ∇l of the error term l, and the function ∇Ω r that minimizes each of the R regularization terms Ω r , Expressed using the error term l for each of the data points of the training data, R regularization terms Ω r, and for each group, the difference in element values between the dimensions belonging to the group in the parameter β. By estimating the parameter β so as to minimize a loss function including a higher-order coupled regularization term, data having a group structure can be analyzed with high accuracy.

本発明の第1の実施の形態に係る解析装置の構成を示すブロック図である。It is a block diagram which shows the structure of the analyzer which concerns on the 1st Embodiment of this invention. s/tグラフを構築した場合の一例を示す図である。It is a figure which shows an example at the time of constructing an s / t graph. 本発明の第1の実施の形態に係る解析装置における解析処理ルーチンを示すフローチャートである。It is a flowchart which shows the analysis process routine in the analyzer which concerns on the 1st Embodiment of this invention. 本発明の第2の実施の形態に係る解析装置の構成を示すブロック図である。It is a block diagram which shows the structure of the analyzer which concerns on the 2nd Embodiment of this invention. s/tグラフを構築した場合の一例を示す図である。It is a figure which shows an example at the time of constructing an s / t graph. 本発明の第3の実施の形態に係る解析装置の構成を示すブロック図である。It is a block diagram which shows the structure of the analyzer which concerns on the 3rd Embodiment of this invention. 本発明の第4の実施の形態に係る解析装置の構成を示すブロック図である。It is a block diagram which shows the structure of the analyzer which concerns on the 4th Embodiment of this invention. 実験例におけるnon-overlapping条件の結果の一例を示す図である。It is a figure which shows an example of the result of the non-overlapping conditions in an experiment example. 実験例におけるoverlapping条件の結果の一例を示す図である。It is a figure which shows an example of the result of the overlapping conditions in an experiment example. 実験例における真値、観測値、推定値の一例を示す図である。It is a figure which shows an example of the true value in an example of an experiment, an observed value, and an estimated value.

以下、図面を参照して本発明の実施の形態を詳細に説明する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

<本発明の実施の形態に係る原理> <Principle according to the embodiment of the present invention>

まず、本発明の実施の形態における原理を説明する。   First, the principle in the embodiment of the present invention will be described.

本発明の実施の形態では、高階結合正則化項の提案および、その最小化法を適用した解析装置を提案する。高階結合正則化項は非特許文献5に記載のロバストPモデルのロバシュ拡張として提案する。さらにロバストPモデルが劣モジュラ関数であることを利用し高階結合正則化項の効率的な最小化法を示す。 In the embodiment of the present invention, a proposal for a higher-order coupled regularization term and an analysis apparatus to which the minimization method is applied are proposed. The higher-order coupled regularization term is proposed as a Robust extension of the robust Pn model described in Non-Patent Document 5. Furthermore, an efficient minimization method for higher-order coupled regularization terms is shown using the fact that the robust Pn model is a submodular function.

観測データをM次元の実数ベクトルx、教師データの実数スカラー値yとする。訓練データをN個のデータ点の集合{(x,y)}n=1 、テストデータはN’個のデータ点からなる集合{(xn’)}n’=1 N’とする。正則化付き教師あり学習の損失関数は、d次元の実数ベクトルβをパラメータとして用いて次の(1)式ように定式化される。 The observation data is assumed to be an M-dimensional real vector x and a teacher data real scalar value y. The training data is a set of N data points {(x n , y n )} n = 1 N , and the test data is a set of N ′ data points {(x n ′ )} n ′ = 1 N ′ To do. The loss function of supervised learning with regularization is formulated as the following equation (1) using the d-dimensional real vector β as a parameter.

このとき、l(x,y)はデータ点毎の誤差項、Ω(β)は正則化項である。また、正則化項Ω(β)は At this time, l (x n , y n ) is an error term for each data point, and Ω (β) is a regularization term. Also, the regularization term Ω (β) is

と表される。ただし、Ωは、R個の正則化項であり、λは、正則化項Ωに対するハイパーパラメータであり、Ωho(β)は、後述する高階結合正則化項であり、λhoは、高階結合正則化項Ωhoに対するハイパーパラメータである。 It is expressed. Here, Ω r is R regularization terms, λ r is a hyperparameter to the regularization term Ω r , Ω ho (β) is a higher-order coupled regularization term described later, and λ ho is , A hyperparameter for the higher-order coupled regularization term Ω ho .

正則化付き教師なし学習の損失関数は、yを用いずに次の(2)式ように定式化される。 Loss function regularization with unsupervised learning is formulated into the following equation (2) so without a y n.

正則化付き教師あり学習、及び正則化付き教師なし学習は、次の(3)式に示す、損失関数を最小化するパラメータβを求める問題である。 Regularized supervised learning and regularized unsupervised learning are problems for obtaining a parameter β * that minimizes the loss function shown in the following equation (3).

パラメータβの推定は、誤差項と正則化項の最小化を交互に行う(上記非特許文献6参照)。教師あり学習においては、予測関数f(β;xn’)によって、テストデータの予測値{(yn’)}n’=1 N’を計算する。 The parameter β * is estimated by alternately minimizing the error term and the regularization term (see Non-Patent Document 6 above). In supervised learning, the predicted value {(y n ′ )} n ′ = 1 N ′ of the test data is calculated by the prediction function f (β * ; x n ′ ).

本発明の実施の形態では、新たな構造正則化項として、Ω(β)の1つである、高階結合正則化項Ωho(β)の提案と高階結合正則化項を最小化するパラメータの推定を提案し、機械学習問題に適応する。 In the embodiment of the present invention, as a new structural regularization term, one of Ω (β) is proposed as a higher order coupled regularization term Ω ho (β) and a parameter for minimizing the higher order coupled regularization term Propose estimation and adapt to machine learning problems.

<本発明の第1の実施の形態に係る解析装置の構成> <Configuration of analysis apparatus according to first embodiment of the present invention>

次に、本発明の第1の実施の形態に係る解析装置の構成について説明する。図1に示すように、本発明の第1の実施の形態に係る解析装置100は、CPUと、RAMと、後述する解析処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。この解析装置100は、機能的には図1に示すように入力部10と、演算部20と、出力部50とを備えている。   Next, the configuration of the analysis apparatus according to the first embodiment of the present invention will be described. As shown in FIG. 1, the analysis device 100 according to the first embodiment of the present invention includes a CPU, a RAM, and a ROM that stores a program and various data for executing an analysis processing routine described later. It can be configured with a computer including. Functionally, the analysis apparatus 100 includes an input unit 10, a calculation unit 20, and an output unit 50 as shown in FIG.

入力部10は、訓練データ、テストデータ、パラメータ構造データ、誤差項l、パラメータβを推定するための損失関数における訓練データのデータ点の各々についての誤差項lの勾配∇l、誤差項のリプシッツ定数L、R個の正則化項Ω(r=1,…,R)、損失関数におけるR個の正則化項Ωの各々を最小化する関数∇Ω(r=1,…,R)、予測関数f、繰り返し演算数P、ハイパーパラメータα、及びハイパーパラメータγを読み込む。 The input unit 10 includes training data, test data, parameter structure data, an error term l, a slope ll of the error term l for each of the data points of the training data in the loss function for estimating the parameter β, and Lipsitz of the error term. Constant L, R regularization terms Ω r (r = 1,..., R), and a function ∇Ω r (r = 1,..., R) that minimizes each of the R regularization terms Ω r in the loss function. ), The prediction function f, the number of repeated operations P, the hyper parameter α, and the hyper parameter γ are read.

訓練データは、観測データxと実数スカラー値yとの組み合わせからなるN個のデータ点の集合{(x,y)}n=1 である。テストデータは、N’個の観測データxの集合{(x)}n=1 N’である。 The training data is a set of N data points {(x n , y n )} n = 1 N consisting of a combination of the observation data x and the real scalar value y. The test data is a set {(x n )} n = 1 N ′ of N ′ observation data x.

パラメータ構造データは、次の(4)式に示す、観測データxに対する実数スカラー値yを予測するためのd次元のベクトルであるパラメータβの各次元の、各グループkへの所属度を表すc 、及びc である。 The parameter structure data is c indicating the degree of affiliation of each dimension of the parameter β, which is a d-dimensional vector for predicting the real scalar value y with respect to the observation data x, shown in the following equation (4), to each group k. 0 k and c 1 k .

パラメータ構造データは、K個のグループkにおけるc 、及びc であり、kにおけるc 、及びc は、グループkに属するパラメータβの各次元の要素の値が、と、グループkにおける真値と同じとなる度合いを表している。また、gはk番目のグループに属する、パラメータβの次元の集合である。また、パラメータ構造データは、グループkにおける真値と同じ値を持つ要素の数を制御するためのパラメータθ 、θ 、及びθmax を更に含む。 Parameter structure data is K c 0 k in group k in number, and c 1 k, c 0 k, and c 1 k at k, the value of each dimension element of the parameter β in the group k is the , The degree of being the same as the true value in the group k. G k is a set of dimensions of the parameter β belonging to the k-th group. The parameter structure data further includes parameters θ 0 k , θ 1 k , and θ max k for controlling the number of elements having the same value as the true value in group k.

演算部20は、パラメータ推定部30と、予測部40とを含んで構成されている。   The calculation unit 20 includes a parameter estimation unit 30 and a prediction unit 40.

パラメータ推定部30は、訓練データと、誤差項lの勾配∇lと、R個の正則化項Ωの各々を最小化する関数∇Ωと、誤差項のリプシッツ定数Lと、ハイパーパラメータα、γとに基づいて、訓練データのデータ点の各々についての誤差項lと、R個の正則化項Ωと、各グループkに対し、パラメータβにおける、グループkに所属する次元間の要素の値の差を用いて表される高階結合正則化項とを含む損失関数を最小化するように、パラメータβを推定する。 The parameter estimation unit 30 includes training data, a slope ∇l of the error term l, a function ∇Ω r that minimizes each of the R regularization terms Ω r , a Lipschitz constant L of the error term, and a hyperparameter α. , Γ, the error term l for each of the data points of the training data, the R regularization terms Ω r, and the elements between the dimensions belonging to group k in parameter β for each group k The parameter β is estimated so as to minimize the loss function including the higher-order coupled regularization term expressed using the difference between the values of.

パラメータ推定部30は、具体的には、以下に説明する初期化部32と、誤差項パラメータ推定部34と、正則化項パラメータ推定部36と、高階結合正則化項パラメータ推定部38と、を含んで構成されている。パラメータ推定部30では、誤差項パラメータ推定部34、正則化項パラメータ推定部36、及び高階結合正則化項パラメータ推定部38の推定を少なくとも1回ずつ行う。本実施の形態では、入力部10で受け付けた繰り返し演算数Pの回数分の推定を繰り返して得られたパラメータβを予測部40に出力する。 Specifically, the parameter estimation unit 30 includes an initialization unit 32, an error term parameter estimation unit 34, a regularization term parameter estimation unit 36, and a higher-order coupled regularization term parameter estimation unit 38 described below. It is configured to include. The parameter estimation unit 30 performs estimation of the error term parameter estimation unit 34, the regularization term parameter estimation unit 36, and the higher-order coupled regularization term parameter estimation unit 38 at least once. In the present embodiment, the parameter β * obtained by repeatedly estimating the number of repetition operations P received by the input unit 10 is output to the prediction unit 40.

初期化部32は、パラメータβの初期値βを一様乱数によって生成する。 Initialization unit 32 generates the uniform random initial value beta 0 parameter beta.

誤差項パラメータ推定部34は、誤差項lの勾配∇lと、誤差項のリプシッツ定数Lと、パラメータβの初期値β又は高階結合正則化項パラメータ推定部38によって推定されたp−1回目のパラメータ推定値βp−1に基づいて、パラメータβ を推定する。ここでは、上記非特許文献6に記載の手法に従って、以下(5)式に示すように、初期値β、又はp−1回目のパラメータ推定値βp−1を用いて、誤差項に関する推定値β を得る。 The error term parameter estimation unit 34 is the p−1th time estimated by the gradient ∇l of the error term l, the Lipschitz constant L of the error term, the initial value β 0 of the parameter β or the higher-order coupled regularization term parameter estimation unit 38. The parameter β p ^ is estimated based on the parameter estimated value β p−1 of Here, according to the method described in Non-Patent Document 6, the error term is estimated using the initial value β 0 or the (p−1) th parameter estimated value β p−1 as shown in the following equation (5). Obtain the value β p ^ .

正則化項パラメータ推定部36は、誤差項パラメータ推定部34によって推定されたパラメータβ^と、R個の正則化項Ωの各々を最小化する関数∇Ωとに基づいて、パラメータβ を推定する。ここでは、誤差項パラメータ推定部34で得られたβ と、1つ目の正則化項Ωの各々を最小化する関数∇Ωとを用いて、パラメータの推定値β(1)を得て、パラメータの推定値β(1)と、2つ目の正則化項Ωの各々を最小化する関数∇Ωとを用いて、パラメータの推定値β(2)を得る。同様に、パラメータの推定値β(r−1)と、2つ目の正則化項Ωの各々を最小化する関数∇Ωと用いて、パラメータの推定値β(2)を得る。ここでは、β (0)=β とし、以下の(6)式に示す操作をR回繰り返す。 The regularization term parameter estimation unit 36 determines the parameter β based on the parameter β p ^ estimated by the error term parameter estimation unit 34 and the function ∇Ω r that minimizes each of the R regularization terms Ω r. to estimate the p ~. Here, by using β p ^ obtained by the error term parameter estimation unit 34 and a function ∇Ω r that minimizes each of the first regularization terms Ω r , an estimated value β p (1 ) to give ~, estimate beta p (1 parameter) - and, second each regularization term Omega r by using the function ∇Omega r that minimizes the estimated value of the parameter beta p (2 ) Get ~ . Similarly, using the parameter estimate β p (r−1) ˜ and the function ∇Ω r that minimizes each of the second regularization terms Ω r , the parameter estimate β p (2) ˜ Get. Here, β p ˜ (0) = β p ^, and the operation shown in the following equation (6) is repeated R times.

そして、正則化項パラメータ推定部36は、R回繰り返した結果を、β =β (R)とする。 The regularization term parameter estimation unit 36, the result of repeated R times, β p ~ = β p ~ a (R).

高階結合正則化項パラメータ推定部38は、正則化項パラメータ推定部36によって推定されたパラメータβ と、高階結合正則化項Ωho(β)とに基づいて、パラメータβを推定する。 Higher-order bond regularization term parameter estimation unit 38, the parameter beta p and ~ estimated by the regularization term parameter estimation unit 36, based on the higher-order bond regularization term Omega ho (beta), to estimate the parameters beta p.

具体的には、まず高階結合正則化項を次の(7)式のように定式化する。以下、簡単のためにβ=β とする。 Specifically, first, the higher-order coupled regularization term is formulated as in the following equation (7). Below, β = β p and - for the sake of simplicity.

このとき、j 及びj は、 At this time, j s k and j t k are

である。 It is.

ここで、高階結合正則化項は、劣モジュラ関数である上記非特許文献5のロバストPモデルのロバシュ拡張に対応する。そこで高階結合正則化項に関するパラメータβの推定は上記非特許文献2と同様に、非特許文献4及び非特許文献7に記載の手法によって行う。 Here, the higher-order coupled regularization term corresponds to the Robust extension of the robust Pn model of Non-Patent Document 5, which is a submodular function. Therefore, the estimation of the parameter β related to the higher-order coupled regularization term is performed by the methods described in Non-Patent Document 4 and Non-Patent Document 7, similarly to Non-Patent Document 2.

次に、高階結合正則化項に関するパラメータβの推定のため、高階結合正則化項Ωho(β)に対応して定められたs/tグラフを図2のように構築する。s/tグラフにおいて、sは始点ノード、tは終点ノード、{v,…,v}はパラメータβの各次元に対応するノード、U={u ,…,u },U={u ,…,u }はグループkに対応するハイパーノードである。 Next, in order to estimate the parameter β related to the higher-order coupled regularization term, an s / t graph determined corresponding to the higher-order coupled regularization term Ω ho (β) is constructed as shown in FIG. In s / t graph, s is the start node, t is the end point node, {v 1, ..., v d} are nodes corresponding to each dimension of parameter β, U s = {u s 1, ..., u s K} , U t = {u t 1 ,..., U t K } are hypernodes corresponding to group k.

高階結合正則化項パラメータ推定部38は、正則化項パラメータ推定部36によって推定されたパラメータβ と、s/tグラフとに基づいて、上記非特許文献4に記載のパラメトリック最大流アルゴリズムによって、ハイパーパラメータαの値を変化させながら、始点ノードから終点ノードまでのフローが最大となるパスを探索することにより、パラメータβを推定する。 The higher-order coupled regularization term parameter estimation unit 38 uses the parametric maximum flow algorithm described in Non-Patent Document 4 based on the parameters β p ˜ estimated by the regularization term parameter estimation unit 36 and the s / t graph. Then, while changing the value of the hyper parameter α, the parameter β p is estimated by searching for a path that maximizes the flow from the start node to the end node.

パラメータ推定部30は、誤差項パラメータ推定部34、正則化項パラメータ推定部36、及び高階結合正則化項パラメータ推定部38による推定をP回繰り返して得られたパラメータの推定値βを、上記(3)式によって定式化されたパラメータβとして予測部40に出力する。 The parameter estimation unit 30 calculates the estimated value β p of the parameter obtained by repeating the estimation by the error term parameter estimation unit 34, the regularization term parameter estimation unit 36, and the higher-order coupled regularization term parameter estimation unit 38 P times. The parameter β * formulated by the equation (3) is output to the prediction unit 40.

予測部40は、パラメータ推定部30によって推定されたパラメータβと、予測関数fとに基づいて、テストデータに対する実数スカラー値yを予測する。ここでは、以下(8)式のように、パラメータ推定部30によって推定されたパラメータβと、予測関数fとを用いて、テストデータ{(x)}n=1 N’から予測値{(yn^)}n=1 N’を計算し、計算結果を出力部50に出力する。 The prediction unit 40 predicts a real scalar value y for the test data based on the parameter β * estimated by the parameter estimation unit 30 and the prediction function f. Here, as shown in the following equation (8), using the parameter β * estimated by the parameter estimation unit 30 and the prediction function f, the test data {(x n )} n = 1 N ′ is a predicted value { (Y n ^ )} n = 1 N ′ is calculated, and the calculation result is output to the output unit 50.

<本発明の第1の実施の形態に係る解析装置の作用> <Operation of the analyzing apparatus according to the first embodiment of the present invention>

次に、本発明の第1の実施の形態に係る解析装置100の作用について説明する。入力部10において訓練データ、テストデータ、パラメータ構造データ、誤差項l、誤差項lの勾配∇l、誤差項のリプシッツ定数L、R個の正則化項Ω、損失関数におけるR個の正則化項Ωの各々を最小化する関数∇Ω、予測関数f、繰り返し演算数P、ハイパーパラメータα、及びハイパーパラメータγを読み込むと、解析装置100は、図3に示す解析処理ルーチンを実行する。 Next, the operation of the analysis apparatus 100 according to the first embodiment of the present invention will be described. In the input unit 10, training data, test data, parameter structure data, error term l, error term l slope ∇l, error term Lipschitz constant L, R regularization terms Ω r , R regularization in loss function When the function ∇Ω r that minimizes each of the terms Ω r , the prediction function f, the number of iterations P, the hyper parameter α, and the hyper parameter γ are read, the analysis apparatus 100 executes the analysis processing routine shown in FIG. .

まず、ステップS100では、p=1として、p=0のパラメータβの初期値βを一様乱数によって生成する。 First, in step S100, as p = 1, the initial value beta 0 parameter beta for p = 0 generated by uniform random numbers.

次に、ステップS102では、誤差項lの勾配∇lと、誤差項のリプシッツ定数Lと、パラメータβの初期値β又は後述するステップS106によって推定されたp−1回目のパラメータ推定値βp−1に基づいて、上記(5)式に従って、パラメータβ を推定する。 Next, in step S102, the gradient ∇l error term l, and Lipschitz constant L of the error term, the parameter parameter estimates p-1 th estimated by the step S106 to the initial value beta 0 or below described beta beta p Based on −1 , the parameter β p ^ is estimated according to the above equation (5).

ステップS104では、ステップS102で推定されたパラメータβ^と、R個の正則化項Ωの各々を最小化する関数∇Ωとに基づいて、上記(6)式に従って、パラメータβ を推定する。 In step S104, based on the parameter β p ^ estimated in step S102 and the function ∇Ω r that minimizes each of the R regularization terms Ω r , the parameters β p ~ Is estimated.

ステップS106では、ステップS104で推定されたパラメータβ と、上記(7)式で定式化された高階結合正則化項Ωho(β)に対応して定められたs/tグラフとに基づいて、上記非特許文献4に記載のパラメトリック最大流アルゴリズムによって、ハイパーパラメータαの値を変化させながら、始点ノードから終点ノードまでのフローが最大となるパスを探索することにより、パラメータβを推定する。 In step S106, based on the parameter β p ~ estimated in step S104 and the s / t graph defined corresponding to the higher-order coupled regularization term Ω ho (β) formulated in the above equation (7). Then, the parameter β p is estimated by searching for a path that maximizes the flow from the start node to the end node while changing the value of the hyperparameter α by the parametric maximum flow algorithm described in Non-Patent Document 4 above. To do.

ステップS108では、ステップS102〜S106の処理をP回繰り返したかを判定し、P回繰り返していればステップS112へ移行し、P回繰り返していなければステップS110へ移行する。   In step S108, it is determined whether the processes in steps S102 to S106 have been repeated P times. If the process has been repeated P times, the process proceeds to step S112. If the process has not been repeated P times, the process proceeds to step S110.

ステップS110では、p=p+1として、ステップS102へ戻ってステップS102〜S106の処理を繰り返す。   In step S110, it sets p = p + 1, returns to step S102, and repeats the process of steps S102-S106.

ステップS112では、ステップS102〜S108の結果得られたパラメータの推定値βを、上記(3)式によって定式化されたパラメータβとして予測部40に出力する。 In step S112, the estimated value β p of the parameter obtained as a result of steps S102 to S108 is output to the prediction unit 40 as the parameter β * formulated by the above equation (3).

ステップS114では、ステップS110で得られたパラメータβと、予測関数fとに基づいて、テストデータに対する実数スカラー値yを予測し、予測結果を出力部50に出力して解析処理ルーチンを終了する。 In step S114, the real scalar value y for the test data is predicted based on the parameter β * obtained in step S110 and the prediction function f, the prediction result is output to the output unit 50, and the analysis processing routine is terminated. .

以上説明したように、第1の実施の形態に係る解析装置によれば、訓練データと、誤差項lの勾配∇lと、R個の正則化項Ωの各々を最小化する関数∇Ωとに基づいて、訓練データのデータ点の各々についての誤差項lと、R個の正則化項Ωと、各グループに対し、パラメータβにおける、グループに所属する次元間の要素の値の差を用いて表される高階結合正則化項とを含む損失関数を最小化するように、パラメータβを推定し、パラメータβに基づいて、テストデータに対する実数スカラー値yを予測することにより、グループ構造を持つデータを精度よく解析して、テストデータに対する実数スカラー値yを予測することができる。 As described above, according to the analysis apparatus according to the first embodiment, the training data, the gradient ∇l of the error term l, and the function ∇Ω that minimizes each of the R regularization terms Ω r. based on r , the error term l for each of the data points of the training data, R regularization terms Ω r, and for each group, the value of the element between the dimensions belonging to the group in the parameter β By estimating the parameter β so as to minimize a loss function including a higher-order coupled regularization term expressed using the difference, and predicting a real scalar value y for the test data based on the parameter β, the group It is possible to predict the real scalar value y for the test data by accurately analyzing the data having a structure.

<本発明の第2の実施の形態に係る解析装置の構成> <Configuration of analysis apparatus according to second embodiment of the present invention>

次に、本発明の第2の実施の形態に係る解析装置の構成について説明する。第2の実施の形態は、一般化高階結合正則化項を含む損失関数を用いる点が第1の実施の形態と異なっている。なお、第1の実施の形態と同様となる箇所については同一符号を付して説明を省略する。   Next, the configuration of the analysis apparatus according to the second embodiment of the present invention will be described. The second embodiment is different from the first embodiment in that a loss function including a generalized higher-order coupled regularization term is used. In addition, the same code | symbol is attached | subjected about the location similar to 1st Embodiment, and description is abbreviate | omitted.

図4に示すように、本発明の第2の実施の形態に係る解析装置200は、入力部210と、演算部220と、出力部50とを備えている。   As shown in FIG. 4, the analysis device 200 according to the second embodiment of the present invention includes an input unit 210, a calculation unit 220, and an output unit 50.

入力部210は、訓練データ、パラメータ構造データ、誤差項l、パラメータβを推定するための損失関数における訓練データのデータ点の各々についての誤差項lの勾配∇l、誤差項のリプシッツ定数L、R個の正則化項Ω(r=1,…,R)、損失関数におけるR個の正則化項Ωの各々を最小化する関数∇Ω(r=1,…,R)、繰り返し演算数P、ハイパーパラメータα、及びハイパーパラメータγを読み込む。以下に、各データについて、第1の実施の形態と異なる点を説明する。 The input unit 210 includes training data, parameter structure data, an error term l, a slope ∇l of the error term l for each of the data points of the training data in the loss function for estimating the parameter β, a Lipschitz constant L of the error term, R regularization terms Ω r (r = 1,..., R), a function ∇Ω r (r = 1,..., R) that minimizes each of the R regularization terms Ω r in the loss function, and repetition The operation number P, the hyper parameter α, and the hyper parameter γ are read. In the following, each data will be described with respect to differences from the first embodiment.

パラメータ構造データは、上記(4)式に示す、観測データxを解析するためのd次元のベクトルであるパラメータβの各次元の、各グループkへの所属度を表すc 、及びc である。パラメータ構造データは、更に、パラメータβの次元をノード、次元対に関する類似度をエッジに持つグラフ行列Wを含む。 The parameter structure data includes c 0 k and c 1 representing the degree of affiliation of each dimension of the parameter β, which is a d-dimensional vector for analyzing the observation data x shown in the above equation (4), to each group k. k . The parameter structure data further includes a graph matrix W having a dimension of the parameter β as a node and a similarity with respect to a dimension pair as an edge.

演算部220は、パラメータ推定部230と予測部40とを含んで構成されている。   The calculation unit 220 includes a parameter estimation unit 230 and a prediction unit 40.

パラメータ推定部230は、訓練データと、誤差項lの勾配∇lと、R個の正則化項Ωの各々を最小化する関数∇Ωと、誤差項のリプシッツ定数Lと、ハイパーパラメータα、γとに基づいて、訓練データのデータ点の各々についての誤差項lと、R個の正則化項Ωと、高階結合正則化項及びパラメータβの次元対の類似度を用いて表される一般化結合正則化項を含む一般化高階結合正則化項とを含む損失関数を最小化するように、パラメータβを推定する。また、パラメータ推定部30は、初期化部32と、誤差項パラメータ推定部34と、正則化項パラメータ推定部36と、一般化高階結合正則化項パラメータ推定部238と、を含んで構成されている。本実施の形態では、パラメータ推定部30によって、訓練データに含まれる観測データxを解析するためのパラメータβを推定し、出力部50に出力する。 The parameter estimation unit 230 includes training data, a slope ∇l of the error term l, a function ∇Ω r that minimizes each of the R regularization terms Ω r , a Lipschitz constant L of the error term, and a hyper parameter α. , Γ and is expressed using the error term l for each of the data points of the training data, the R regularization terms Ω r , the higher order joint regularization term and the similarity of the dimension pairs of the parameter β. The parameter β is estimated so as to minimize the loss function including the generalized higher order combined regularization term including the generalized combined regularization term. The parameter estimation unit 30 includes an initialization unit 32, an error term parameter estimation unit 34, a regularization term parameter estimation unit 36, and a generalized higher-order coupled regularization term parameter estimation unit 238. Yes. In the present embodiment, the parameter estimation unit 30 estimates the parameter β for analyzing the observation data x included in the training data, and outputs it to the output unit 50.

一般化高階結合正則化項パラメータ推定部238は、正則化項パラメータ推定部36によって推定されたパラメータβ と、一般化高階結合正則化項ΩGFL(β)とに基づいて、パラメータβを推定する。 Generalized higher order binding regularization term parameter estimating unit 238, based on the parameter beta p and ~ estimated by the regularization term parameter estimation unit 36, a generalized higher order binding regularization term Omega GFL (beta), the parameter beta p Is estimated.

具体的には、まず、一般化結合正則化項をΩGFL、高階結合正則化項をΩHOとし、一般化高階結合正則化項を次のように定式化する。以下、簡単のためにβ=β とする。 Specifically, first, the generalized coupled regularization term is Ω GFL , the higher order coupled regularization term is Ω HO , and the generalized higher order coupled regularization term is formulated as follows. Below, β = β p and - for the sake of simplicity.

非特許文献2より、一般化結合正則化は、劣モジュラ関数であるカット関数のロバシュ拡張に対応する。また、上記第1の実施の形態と同様に、高階結合正則化項は、劣モジュラ関数である非特許文献4のロバストPnモデルのロバシュ拡張に対応する。したがって、一般化高階結合正則化はカット関数とロバストPnモデルの和からなる劣モジュラ関数のロバシュ拡張と一致する。 From Non-Patent Document 2, the generalized combined regularization corresponds to the Robust extension of the cut function, which is a submodular function. As in the first embodiment, the higher-order coupled regularization term corresponds to Robust extension of the robust Pn model of Non-Patent Document 4 that is a submodular function. Therefore, the generalized higher order regularization is consistent with the Robust extension of the submodular function consisting of the sum of the cut function and the robust Pn model.

以上から、一般化高階結合正則化項に関するパラメータの推定値は非特許文献2と同様に、非特許文献4と非特許文献7によって行う。   From the above, the estimated values of the parameters related to the generalized higher-order coupled regularization term are performed by Non-Patent Document 4 and Non-Patent Document 7, similarly to Non-Patent Document 2.

この際、s/tグラフを図5のように構築する。グラフにおいて、sは始点ノード、tは終点ノード、{v,…,v}はパラメータの各次元に対応するノード、U={u ,…,u },U={u ,…,u }はグループに対応するハイパーノードである。 At this time, the s / t graph is constructed as shown in FIG. In the graph, s is a start node, t is an end node, {v 1 ,..., V d } is a node corresponding to each dimension of the parameter, U s = {u s 1 ,..., U s K }, U t = {U t 1 ,..., U t K } are hypernodes corresponding to groups.

一般化高階結合正則化項パラメータ推定部238は、正則化項パラメータ推定部36によって推定されたパラメータβ と、s/tグラフとに基づいて、上記非特許文献4に記載のパラメトリック最大流アルゴリズムによって、ハイパーパラメータαの値を変化させながら、始点ノードから終点ノードまでのフローが最大となるパスを探索することにより、パラメータβを推定する。 The generalized higher-order coupled regularization term parameter estimation unit 238 is based on the parameter β p ~ estimated by the regularization term parameter estimation unit 36 and the s / t graph, and the parametric maximum flow described in Non-Patent Document 4 above. the algorithm, while changing the value of the hyper-parameter alpha, flows from a source node to a destination node is by searching the path with the maximum, to estimate parameters beta p.

パラメータ推定部230は、誤差項パラメータ推定部34、正則化項パラメータ推定部36、及び一般化高階結合正則化項パラメータ推定部238による推定をP回繰り返して得られたパラメータの推定値βを、上記(3)式によって定式化されたパラメータβとして予測部40に出力する。 The parameter estimation unit 230 obtains an estimated value β p of the parameter obtained by repeating the estimation by the error term parameter estimation unit 34, the regularization term parameter estimation unit 36, and the generalized higher-order coupled regularization term parameter estimation unit 238 P times. The parameter β * formulated by the above equation (3) is output to the prediction unit 40.

なお、第2の実施の形態に係る解析装置の他の構成及び作用については、第1の実施の形態と同様であるため、説明を省略する。   In addition, since it is the same as that of 1st Embodiment about the other structure and effect | action of the analyzer which concerns on 2nd Embodiment, description is abbreviate | omitted.

以上説明したように、第2の実施の形態に係る解析装置によれば、訓練データと、誤差項lの勾配∇lと、R個の正則化項Ωの各々を最小化する関数∇Ωとに基づいて、訓練データのデータ点の各々についての誤差項lと、R個の正則化項Ωと、高階結合正則化項及びパラメータβの次元対の類似度を用いて表される一般化結合正則化項を含む一般化高階結合正則化項とを含む損失関数を最小化するように、パラメータβを推定し、パラメータβに基づいて、テストデータに対する実数スカラー値yを予測することにより、グループ構造を持つデータを精度よく解析して、テストデータに対する実数スカラー値yを予測することができる。 As described above, according to the analysis apparatus according to the second embodiment, the training data, the gradient ∇l of the error term l, and the function ∇Ω that minimizes each of the R regularization terms Ω r. is expressed using the error term l for each of the data points of the training data, the R regularization terms Ω r , the higher-order coupled regularization term, and the similarity of the dimension pairs of the parameter β. Estimate the parameter β to minimize a loss function including a generalized higher order regularization term including a generalized combined regularization term, and predict a real scalar value y for the test data based on the parameter β. Thus, it is possible to accurately analyze data having a group structure and predict a real scalar value y for test data.

また、パラメータに関する隣接、高階の事前情報を一般化高階結合正則化項として利用することにより、教師あり学習の定量的な性能向上が可能になる。   In addition, by using prior information on adjacent and higher orders regarding parameters as generalized higher order combined regularization terms, it is possible to improve the quantitative performance of supervised learning.

また、パラメータに関する事前知識として、隣接構造と高階構造の2種類の事前情報を正則化に利用したい場合に、これらの事前知識を利用するための一般化高階結合正則化項を含む損失関数を最小化するように、パラメータβを推定し、パラメータβに基づいて、テストデータに対する実数スカラー値yを予測することができる。   In addition, as prior knowledge about parameters, if you want to use two types of prior information of adjacent structure and higher-order structure for regularization, the loss function including generalized higher-order coupled regularization term to use these prior knowledge is minimized. The parameter β is estimated so that the real scalar value y for the test data can be predicted based on the parameter β.

また、一般化高階結合正則化が劣モジュラ関数のロバシュ拡張であることを利用して、効率的な最小化法により、パラメータβを推定することができる。   Further, the parameter β can be estimated by an efficient minimization method using the fact that the generalized higher-order joint regularization is a Robust extension of the submodular function.

<本発明の第3の実施の形態に係る解析装置の構成> <Configuration of analysis apparatus according to third embodiment of the present invention>

次に、本発明の第3の実施の形態に係る解析装置の構成について説明する。第3の実施の形態は教師データを用いない教師なし学習を行う点が第1の実施の形態と異なっている。なお、第1の実施の形態と同様となる箇所については同一符号を付して説明を省略する。   Next, the configuration of an analysis apparatus according to the third embodiment of the present invention will be described. The third embodiment is different from the first embodiment in that unsupervised learning without using teacher data is performed. In addition, the same code | symbol is attached | subjected about the location similar to 1st Embodiment, and description is abbreviate | omitted.

図6に示すように、本発明の第3の実施の形態に係る解析装置300は、CPUと、RAMと、後述する解析処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。この解析装置300は、機能的には図6に示すように入力部310と、演算部320と、出力部50とを備えている。   As shown in FIG. 6, an analysis apparatus 300 according to the third embodiment of the present invention includes a CPU, a RAM, and a ROM that stores a program and various data for executing an analysis processing routine described later. It can be configured with a computer including. Functionally, the analysis apparatus 300 includes an input unit 310, a calculation unit 320, and an output unit 50 as shown in FIG.

入力部310は、訓練データ、パラメータ構造データ、誤差項l、パラメータβを推定するための損失関数における訓練データのデータ点の各々についての誤差項lの勾配∇l、誤差項のリプシッツ定数L、R個の正則化項Ω(r=1,…,R)、損失関数におけるR個の正則化項Ωの各々を最小化する関数∇Ω(r=1,…,R)、繰り返し演算数P、ハイパーパラメータα、及びハイパーパラメータγを読み込む。以下に、各データについて、第1の実施の形態と異なる点を説明する。 The input unit 310 includes training data, parameter structure data, an error term l, a slope ∇l of the error term l for each of the data points of the training data in the loss function for estimating the parameter β, a Lipschitz constant L of the error term, R regularization terms Ω r (r = 1,..., R), a function ∇Ω r (r = 1,..., R) that minimizes each of the R regularization terms Ω r in the loss function, and repetition The operation number P, the hyper parameter α, and the hyper parameter γ are read. In the following, each data will be described with respect to differences from the first embodiment.

訓練データは、観測データxからなるN個のデータ点の集合{(x)}n=1 である。本実施の形態は、教師なし学習であるため、実数スカラー値{(y)}n=1 を読み込まない。 The training data is a set of N data points consisting of observation data x {(x n )} n = 1 N. Since this embodiment is unsupervised learning, a real scalar value {(y n )} n = 1 N is not read.

パラメータ構造データは、上記(4)式に示す、観測データxを解析するためのd次元のベクトルであるパラメータβの各次元の、各グループkへの所属度を表すc 、及びc である。 The parameter structure data includes c 0 k and c 1 representing the degree of affiliation of each dimension of the parameter β, which is a d-dimensional vector for analyzing the observation data x shown in the above equation (4), to each group k. k .

また、本実施の形態では、上記(2)式に示すように、損失関数における誤差項lが、第1の実施の形態と異なっている。   In the present embodiment, as shown in the above equation (2), the error term l in the loss function is different from that in the first embodiment.

演算部320は、パラメータ推定部30を含んで構成されている。   The calculation unit 320 includes the parameter estimation unit 30.

パラメータ推定部30は、第1の実施の形態と同様に、訓練データと、誤差項lの勾配∇lと、R個の正則化項Ωの各々を最小化する関数∇Ωと、誤差項のリプシッツ定数Lと、ハイパーパラメータα、γとに基づいて、訓練データのデータ点の各々についての誤差項lと、R個の正則化項Ωと、各グループkに対し、パラメータβにおける、グループkに所属する次元間の要素の値の差を用いて表される高階結合正則化項とを含む損失関数を最小化するように、パラメータβを推定する。また、パラメータ推定部30は、第1の実施の形態と同様に、初期化部32と、誤差項パラメータ推定部34と、正則化項パラメータ推定部36と、高階結合正則化項パラメータ推定部38と、を含んで構成されている。本実施の形態では、パラメータ推定部30によって、訓練データに含まれる観測データxを解析するためのパラメータβを推定し、出力部50に出力する。 Parameter estimation unit 30, like the first embodiment, the training data, and slope ∇l error term l, and functions ∇Omega r that minimizes each of the R regularization term Omega r, the error Based on the Lipschitz constant L of the term and the hyperparameters α, γ, the error term l for each of the data points of the training data, the R regularization terms Ω r, and for each group k in the parameter β The parameter β is estimated so as to minimize a loss function including a higher-order coupled regularization term expressed using a difference in element values between dimensions belonging to the group k. In addition, the parameter estimation unit 30 includes an initialization unit 32, an error term parameter estimation unit 34, a regularization term parameter estimation unit 36, and a higher-order coupled regularization term parameter estimation unit 38, as in the first embodiment. And. In the present embodiment, the parameter estimation unit 30 estimates the parameter β for analyzing the observation data x included in the training data, and outputs it to the output unit 50.

なお、第3の実施の形態の他の構成及び作用は第1の実施の形態と同様であるため、説明を省略する。   In addition, since the other structure and effect | action of 3rd Embodiment are the same as that of 1st Embodiment, description is abbreviate | omitted.

<本発明の第4の実施の形態に係る解析装置の構成> <Configuration of Analysis Device According to Fourth Embodiment of the Present Invention>

次に、本発明の第4の実施の形態に係る解析装置の構成について説明する。第4の実施の形態は教師データを用いない教師なし学習を行う点が第2の実施の形態と異なっている。なお、第2の実施の形態と同様となる箇所については同一符号を付して説明を省略する。   Next, the configuration of an analysis apparatus according to the fourth embodiment of the present invention will be described. The fourth embodiment is different from the second embodiment in that unsupervised learning without using teacher data is performed. In addition, about the location similar to 2nd Embodiment, the same code | symbol is attached | subjected and description is abbreviate | omitted.

図7に示すように、本発明の第4の実施の形態に係る解析装置400は、CPUと、RAMと、後述する解析処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。この解析装置400は、機能的には図7に示すように入力部410と、演算部420と、出力部50とを備えている。   As shown in FIG. 7, an analysis apparatus 400 according to the fourth embodiment of the present invention includes a CPU, a RAM, and a ROM that stores a program and various data for executing an analysis processing routine to be described later. It can be configured with a computer including. Functionally, the analysis apparatus 400 includes an input unit 410, a calculation unit 420, and an output unit 50 as shown in FIG.

入力部410は、訓練データ、パラメータ構造データ、誤差項l、パラメータβを推定するための損失関数における訓練データのデータ点の各々についての誤差項lの勾配∇l、誤差項のリプシッツ定数L、R個の正則化項Ω(r=1,…,R)、損失関数におけるR個の正則化項Ωの各々を最小化する関数∇Ω(r=1,…,R)、繰り返し演算数P、ハイパーパラメータα、及びハイパーパラメータγを読み込む。以下に、各データについて、第2の実施の形態と異なる点を説明する。 The input unit 410 includes training data, parameter structure data, an error term l, a slope ∇l of the error term l for each of the data points of the training data in the loss function for estimating the parameter β, a Lipschitz constant L of the error term, R regularization terms Ω r (r = 1,..., R), a function ∇Ω r (r = 1,..., R) that minimizes each of the R regularization terms Ω r in the loss function, and repetition The operation number P, the hyper parameter α, and the hyper parameter γ are read. Hereinafter, each data will be described with respect to differences from the second embodiment.

訓練データは、観測データxからなるN個のデータ点の集合{(x)}n=1 である。本実施の形態は、教師なし学習であるため、実数スカラー値{(y)}n=1 を読み込まない。 The training data is a set of N data points consisting of observation data x {(x n )} n = 1 N. Since this embodiment is unsupervised learning, a real scalar value {(y n )} n = 1 N is not read.

パラメータ構造データは、上記(4)式に示す、観測データxを解析するためのd次元のベクトルであるパラメータβの各次元の、各グループkへの所属度を表すc 、及びc である。パラメータ構造データは、更に、更に、パラメータβの次元をノード、次元対に関する類似度をエッジに持つグラフ行列Wを含む。 The parameter structure data includes c 0 k and c 1 representing the degree of affiliation of each dimension of the parameter β, which is a d-dimensional vector for analyzing the observation data x shown in the above equation (4), to each group k. k . The parameter structure data further includes a graph matrix W having a dimension of the parameter β as a node and a similarity with respect to a dimension pair as an edge.

また、本実施の形態では、上記(2)式に示すように、損失関数における誤差項lが、第2の実施の形態と異なっている。   In the present embodiment, as shown in the above equation (2), the error term l in the loss function is different from that in the second embodiment.

演算部420は、パラメータ推定部230を含んで構成されている。   The calculation unit 420 includes a parameter estimation unit 230.

パラメータ推定部230は、第2の実施の形態と同様に、訓練データと、誤差項lの勾配∇lと、R個の正則化項Ωの各々を最小化する関数∇Ωと、誤差項のリプシッツ定数Lと、ハイパーパラメータα、γとに基づいて、訓練データのデータ点の各々についての誤差項lと、R個の正則化項Ωと、一般化高階結合正則化項とを含む損失関数を最小化するように、パラメータβを推定する。また、パラメータ推定部230は、第2の実施の形態と同様に、初期化部32と、誤差項パラメータ推定部34と、正則化項パラメータ推定部36と、一般化高階結合正則化項パラメータ推定部238と、を含んで構成されている。本実施の形態では、パラメータ推定部30によって、訓練データに含まれる観測データxを解析するためのパラメータβを推定し、出力部50に出力する。 Parameter estimation unit 230, similarly to the second embodiment, the training data, and slope ∇l error term l, and functions ∇Omega r that minimizes each of the R regularization term Omega r, the error Based on the Lipsitz constant L of the term and the hyperparameters α, γ, an error term l for each of the data points of the training data, R regularization terms Ω r, and a generalized higher order coupled regularization term The parameter β is estimated so as to minimize the loss function including it. Also, the parameter estimation unit 230 is similar to the second embodiment in that the initialization unit 32, the error term parameter estimation unit 34, the regularization term parameter estimation unit 36, and the generalized higher-order coupled regularization term parameter estimation. Part 238. In the present embodiment, the parameter estimation unit 30 estimates the parameter β for analyzing the observation data x included in the training data, and outputs it to the output unit 50.

なお、第4の実施の形態の他の構成及び作用は第2の実施の形態と同様であるため、説明を省略する。   In addition, since the other structure and effect | action of 4th Embodiment are the same as that of 2nd Embodiment, description is abbreviate | omitted.

このように、パラメータに関する隣接、高階の事前情報を一般化高階結合正則化項として利用することにより、教師なし学習の定量的な性能向上が可能になる。   In this way, quantitative performance improvement of unsupervised learning can be performed by using adjacent information and higher-order prior information regarding parameters as generalized higher-order coupled regularization terms.

<実験例> <Experimental example>

本発明の第1の実施の形態に係る手法の効果を示すために、人工的に生成したデータセットと、インターネット上で公開されているデータセットに対して、教師あり学習の1つである線形回帰分析を行い、以下(9)式に示す平均二乗誤差という指標を用いて定量的な性能評価を行う。   In order to show the effect of the technique according to the first embodiment of the present invention, a linear that is one of supervised learning for an artificially generated data set and a data set published on the Internet. Regression analysis is performed, and quantitative performance evaluation is performed using an index called mean square error shown in the following equation (9).

人工的に生成したデータでは、データとパラメータの次元はM=d=100とし、データを30,50,70,100,150点の条件で生成した。乱数によって生成したxとあらかじめ設計したパラメータの線形和を取り、そこにガウスノイズを加えてy用を人工的に生成した。10回の交差検定によってテストデータに対する平均二乗誤差を計測した。比較手法には、SGL(非特許文献8)、GFL(非特許文献2)、Lasso(非特許文献1)、及びOLS(非特許文献1)を用いた。 In the artificially generated data, the dimension of the data and parameters was M = d = 100, and the data was generated under the conditions of 30, 50, 70, 100, and 150 points. Take the linear sum of pre-designed parameters x n generated by a random number, generated artificially a for y n thereto was added Gaussian noise. The mean square error for the test data was measured by 10 cross-validations. SGL (Non-Patent Document 8), GFL (Non-Patent Document 2), Lasso (Non-Patent Document 1), and OLS (Non-Patent Document 1) were used as the comparison method.

パラメータの設計には2つの条件を用いた。1つ目の条件をnon-overlappingと呼ぶ。本条件では、パラメータは全体で5つのグループ構造をもち、あるパラメータは1つのグループのみに所属すると定め、グループがオーバラップを持たないようにした。同一グループに所属するパラメータは同一の真値を持つように設定した。2つ目の条件をoverlappingと呼ぶ。本条件では、1つ目の設定と異なり、パラメータのうち2つのグループに所属するものが存在するようにし、グループがオーバラップを持つようにした。2つのグループに所属するパラメータの値は2つのグループのいずれかと同一の真値をもつようにせて値した。他の設定は条件non-overlappingと同様にした。なお、c0,i ,c1,i の値は1.0あるいは0.0とし、θ , θ は0.0、θmax は1.0とした。 Two conditions were used for designing the parameters. The first condition is called non-overlapping. Under this condition, the parameters have a total of five group structures, and certain parameters belong to only one group, so that the groups do not overlap. Parameters belonging to the same group were set to have the same true value. The second condition is called overlapping. In this condition, unlike the first setting, parameters belonging to two groups exist so that the groups have overlap. The values of the parameters belonging to the two groups were made to have the same true value as either of the two groups. The other settings were the same as the condition non-overlapping. Note that the values of c 0, i k , c 1, i k were 1.0 or 0.0, θ 0 k , θ 1 k were 0.0, and θ max k was 1.0.

Nを30から150までの条件で実験を行い、得られたテストデータに対する平均二乗誤差を以下の表1に示す。(a)はnon-overlapping、(b)はoverlappingの条件での結果である。太字は他の手法の平均二乗誤差と統計的に優位な差が有ることを示している。   An experiment was conducted under the condition of N from 30 to 150, and the mean square error for the obtained test data is shown in Table 1 below. (a) is the result under non-overlapping, and (b) is the result under overlapping conditions. Bold indicates that there is a statistically significant difference from the mean square error of other methods.

non−overlapping条件では本発明とGFLが良好な性能を示している。overlapping条件では、本発明によって、テストデータに対する平均二乗誤差の改善が確認された。本発明はNがdよりも小さく過学習が起こる場合(N=70,50,30)でも、良好な性能を示した。これは高階結合正則化項によって過学習を避けられたからである。   Under non-overlapping conditions, the present invention and GFL show good performance. Under the overlapping condition, the improvement of the mean square error for the test data was confirmed by the present invention. The present invention showed good performance even when N was smaller than d and overlearning occurred (N = 70, 50, 30). This is because overlearning was avoided by higher order regularization terms.

次に実験から推定されたパラメータ(N=30)を図8及び図9に示す。図中の線はパラメータの真値、白抜き丸は各手法によるパラメータの推定値である。図8のnon−overlapping条件では、本発明とGFLがパラメータの真値と近いパラメータを推定できた。図9のoverlapping条件では、本発明の実施の形態に係る手法のみがパラメータの真値と近いパラメータを推定できた。   Next, parameters (N = 30) estimated from the experiment are shown in FIGS. The line in the figure is the true value of the parameter, and the white circle is the estimated value of the parameter by each method. In the non-overlapping condition of FIG. 8, the present invention and GFL were able to estimate a parameter close to the true value of the parameter. Under the overlapping conditions in FIG. 9, only the method according to the embodiment of the present invention can estimate a parameter close to the true value of the parameter.

以上の結果から、本発明の第1の実施の形態に係る手法の性能は、パラメータが単一のグループに所属する場合、及び複数のグループに所属するような場合のいずれにおいても有効であることが示された。   From the above results, the performance of the technique according to the first embodiment of the present invention is effective both when the parameter belongs to a single group and when the parameter belongs to a plurality of groups. It has been shown.

次に、インターネット上で公開されているデータセットを用いて実験の結果を示す。本実験では、MovieLens100k、EachMovie、Book−Crossing(http://grouplens.org )のデータセットを利用し、データセットに含まれるユーザが視聴した映画と本の履歴データから、映画、及び本に与えた評価値を予測する実験を行った。 データセットの要約は次の表2のとおりである。   Next, the result of an experiment is shown using a data set published on the Internet. In this experiment, MovieLens100k, EachMovie, and Book-Crossing (http://grouplens.org) data sets are used to give movies and books from the history data of movies and books viewed by users in the data set. An experiment was conducted to predict the evaluation value. A summary of the data set is shown in Table 2 below.

表3に10回の交差検定によってテストデータに対する平均二乗誤差を計測した結果を示す。本発明の第1の実施の形態に係る手法は、すべての設定で既存の手法とほぼ同等、あるいは上回る性能を示している。   Table 3 shows the results of measuring the mean square error for the test data by 10 cross-validations. The technique according to the first embodiment of the present invention shows almost the same or better performance than the existing technique in all settings.

また、本発明の第1の実施の形態に係る手法の性能は、実世界で記録されたデータに対しても有効であることが示された。   It was also shown that the performance of the technique according to the first embodiment of the present invention is effective for data recorded in the real world.

次に、本発明の第2の実施の形態に係る手法の効果を示すために、人工的に生成したデータセットと、インターネット上で公開されているデータセットに対して、教師あり学習の1つである線形回帰分析を行い、上記(9)式に示す平均二乗誤差という指標を用いて定量的な性能評価を行う。   Next, in order to show the effect of the technique according to the second embodiment of the present invention, one of supervised learning is performed on an artificially generated data set and a data set released on the Internet. A linear regression analysis is performed, and quantitative performance evaluation is performed using an index called a mean square error shown in the above equation (9).

人工的に生成したデータでは、図10(a)に示す、行と列の次元が50の行列データを生成する。行列を12個(8つの長方形と星、丸、菱型の3図形を作成した)の領域に分割し、各領域内のすべての要素は1から12の整数値のいずれかを取る。この整数値をテストデータとする。次にこの整数値に平均0、分散1のガウス分布からサンプリングしたノイズを加算し、さらに要素の値を乱択により欠損させ、訓練データとする。行列補完では観測データから欠損した要素の真値を推定する問題となる。   With the artificially generated data, matrix data having 50 rows and columns as shown in FIG. 10A is generated. Divide the matrix into 12 regions (8 rectangles and 3 shapes, stars, circles, and diamonds), and every element in each region takes an integer value between 1 and 12. This integer value is used as test data. Next, noise sampled from a Gaussian distribution with mean 0 and variance 1 is added to this integer value, and element values are lost by random selection to obtain training data. Matrix interpolation is a problem of estimating the true value of missing elements from observed data.

実験では、行列をベクトル化してあつかう。すなわちパラメータの次元はd=502=2500となる。欠損値の割合をp=0.9, 0.5, 0.7, 0.9の条件で生成した。10回の交差検定によってテストデータに対する平均二乗誤差を計測した。比較手法には、GFL(非特許文献2)、HOFL(第1の実施の形態)、平均値を用いた。 In the experiment, the matrix is vectorized. That is, the parameter dimension is d = 50 2 = 2500. The percentage of missing values was generated under the conditions of p = 0.9, 0.5, 0.7, 0.9. The mean square error for the test data was measured by 10 cross-validations. As a comparison method, GFL (Non-patent Document 2), HOFL (first embodiment), and average value were used.

なお、wi,j, c0,i k , c1,i kの値は1.0あるいは0.0とし、θ0 k, θ1 kは0.0、θmax kは1.0とした。隣接構造には行列データで隣接するパラメータの情報、高階構造には8つの長方形と星形を与えた。つまり、丸と菱型は未知の構造として扱った。実験から得られた推定値と実際の観測値の平均二乗誤差を以下の表に示す。太字は平均二乗誤差が最も低いものを示している。 Note that the values of w i, j , c 0, i k , c 1, i k are 1.0 or 0.0, θ 0 k and θ 1 k are 0.0, and θ max k is 1.0. Adjacent structure was given information of adjacent parameters by matrix data, and 8 rectangles and star shape were given to higher order structure. In other words, the circle and rhombus were treated as unknown structures. The mean square error between the estimated value obtained from the experiment and the actual observed value is shown in the following table. Bold type indicates the lowest mean square error.

p=0.1の条件では本発明の第2の実施の形態に係る手法(prop.)とGFLが良好な性能を示している。本発明の第2の実施の形態に係る手法は、その他の欠損値が多く、過学習が起こる場合(p=0.5, 0.7, 0.9)でも、良好な性能を示した。これは一般化高階結合正則化項によって過学習を避けられたからである。   Under the condition of p = 0.1, the technique (prop.) and GFL according to the second embodiment of the present invention show good performance. The technique according to the second embodiment of the present invention has good performance even when there are many other missing values and overlearning occurs (p = 0.5, 0.7, 0.9). This is because over-learning was avoided by the generalized higher-order coupled regularization term.

次に実験から推定されたパラメータを図10に示す。図10(a)は、真の行列、図10(b)は、ランダム欠損してノイズが加えられた観測値、図10(c)は、本発明の第2の実施の形態に係る手法の推定値、図10(d)は、一般化結合正則化の推定値、図10(e)は、高階結合正則化の推定値である。本発明の第2の実施の形態に係る手法が他の手法と比べて真値と近いパラメータを推定できたことが確認できる。   Next, parameters estimated from the experiment are shown in FIG. FIG. 10 (a) is a true matrix, FIG. 10 (b) is an observed value added with noise due to random loss, and FIG. 10 (c) is a method according to the second embodiment of the present invention. FIG. 10D shows an estimated value, FIG. 10D shows an estimated value for generalized joint regularization, and FIG. 10E shows an estimated value for higher-order joint regularization. It can be confirmed that the method according to the second embodiment of the present invention was able to estimate a parameter closer to the true value than other methods.

以上から、本発明の第2の実施の形態に係る手法の有効性が示された。   From the above, the effectiveness of the technique according to the second embodiment of the present invention was shown.

なお、本発明は、上述した実施の形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。   The present invention is not limited to the above-described embodiment, and various modifications and applications can be made without departing from the gist of the present invention.

10、210、310、410 入力部
20、220、320、420 演算部
30、230 パラメータ推定部
32 初期化部
34 誤差項パラメータ推定部
36 正則化項パラメータ推定部
38 高階結合正則化項パラメータ推定部
238 一般化高階結合正則化項パラメータ推定部
40 予測部
50 出力部
100、200、300、400 解析装置
10, 210, 310, 410 Input unit 20, 220, 320, 420 Operation unit 30, 230 Parameter estimation unit 32 Initialization unit 34 Error term parameter estimation unit 36 Regularization term parameter estimation unit 38 Higher order regularization term parameter estimation unit 238 Generalized higher-order coupled regularization term parameter estimation unit 40 prediction unit 50 output unit 100, 200, 300, 400 analysis device

Claims (11)

観測データxに対する実数スカラー値yを予測する解析装置であって、
観測データxと実数スカラー値yとの組み合わせからなるデータ点の集合である訓練データと、観測データxからなるテストデータと、観測データxに対する実数スカラー値yを予測するためのd次元のベクトルであるパラメータβの各次元の、各グループへの所属度を表すパラメータ構造データと、前記パラメータβを推定するための損失関数における前記訓練データの前記データ点の各々についての誤差項lの勾配∇lと、前記損失関数におけるR個の正則化項Ωの各々を最小化する関数∇Ωとを受け付けるデータ入力部と、
前記訓練データと、前記誤差項lの勾配∇lと、前記R個の正則化項Ωの各々を最小化する関数∇Ωとに基づいて、前記訓練データの前記データ点の各々についての前記誤差項lと、前記R個の正則化項Ωと、各グループに対し、前記パラメータβにおける、前記グループに所属する次元間の要素の値の差を用いて表される高階結合正則化項とを含む前記損失関数を最小化するように、前記パラメータβを推定するパラメータ推定部と、
前記パラメータ推定部によって推定された前記パラメータβに基づいて、前記テストデータに対する実数スカラー値yを予測する予測部と、
を含む解析装置。
An analysis device for predicting a real scalar value y for observation data x,
A training data that is a set of data points consisting of a combination of observation data x and real scalar value y, test data consisting of observation data x, and a d-dimensional vector for predicting real scalar value y for observation data x. The parameter structure data representing the degree of affiliation of each dimension of a certain parameter β to each group, and the slope ∇l of the error term l for each of the data points of the training data in the loss function for estimating the parameter β And a data input unit for receiving a function ∇Ω r that minimizes each of the R regularization terms Ω r in the loss function;
Based on the training data, the slope ∇l of the error term l, and a function ∇Ω r that minimizes each of the R regularization terms Ω r , for each of the data points of the training data. Higher-order joint regularization expressed using the error term l, the R regularization terms Ω r, and the difference in element values between dimensions belonging to the group in the parameter β for each group A parameter estimator for estimating the parameter β so as to minimize the loss function including a term;
A prediction unit that predicts a real scalar value y for the test data based on the parameter β estimated by the parameter estimation unit;
Analysis device including
前記パラメータ構造データは、前記パラメータβの次元対の類似度を更に含み、
前記パラメータ推定部は、
前記訓練データと、前記誤差項lの勾配∇lと、前記R個の正則化項Ωの各々を最小化する関数∇Ωとに基づいて、前記訓練データの前記データ点の各々についての前記誤差項lと、前記R個の正則化項Ωと、前記高階結合正則化項、及び前記パラメータβの次元対の類似度を用いて表される一般化結合正則化項を含む一般化高階結合正則化項とを含む前記損失関数を最小化するように、前記パラメータβを推定する請求項1記載の解析装置。
The parameter structure data further includes a similarity of a dimension pair of the parameter β,
The parameter estimation unit includes:
Based on the training data, the slope ∇l of the error term l, and a function ∇Ω r that minimizes each of the R regularization terms Ω r , for each of the data points of the training data. Generalization including the error term l, the R regularization terms Ω r , the higher-order joint regularization term, and a generalized joint regularization term expressed using the similarity of the dimension pairs of the parameter β The analysis apparatus according to claim 1, wherein the parameter β is estimated so as to minimize the loss function including a higher-order coupled regularization term.
前記パラメータ推定部は、
前記誤差項lの勾配∇lに基づいて、前記パラメータβを推定する誤差項パラメータ推定部と、
前記誤差項パラメータ推定部によって推定された前記パラメータβと、前記R個の正則化項Ωの各々を最小化する関数∇Ωとに基づいて、前記パラメータβを推定する正則化項パラメータ推定部と、
前記正則化項パラメータ推定部によって推定された前記パラメータβと、前記高階結合正則化項とに基づいて、前記パラメータβを推定する高階結合正則化項パラメータ推定部とを含み、
前記誤差項パラメータ推定部による推定、前記正則化項パラメータ推定部による推定、及び前記高階結合正則化項パラメータ推定部による推定を、少なくとも1回ずつ行う請求項1に記載の解析装置。
The parameter estimation unit includes:
An error term parameter estimator for estimating the parameter β based on the gradient ∇l of the error term l;
Regularization term parameter estimation for estimating the parameter β based on the parameter β estimated by the error term parameter estimation unit and a function ∇Ω r that minimizes each of the R regularization terms Ω r And
A higher-order coupled regularization term parameter estimation unit that estimates the parameter β based on the parameter β estimated by the regularization term parameter estimation unit and the higher-order coupled regularization term;
The analysis apparatus according to claim 1, wherein the estimation by the error term parameter estimation unit, the estimation by the regularization term parameter estimation unit, and the estimation by the higher-order coupled regularization term parameter estimation unit are performed at least once.
前記パラメータ推定部は、
前記誤差項lの勾配∇lに基づいて、前記パラメータβを推定する誤差項パラメータ推定部と、
前記誤差項パラメータ推定部によって推定された前記パラメータβと、前記R個の正則化項Ωの各々を最小化する関数∇Ωとに基づいて、前記パラメータβを推定する正則化項パラメータ推定部と、
前記正則化項パラメータ推定部によって推定された前記パラメータβと、前記一般化高階結合正則化項とに基づいて、前記パラメータβを推定する一般化高階結合正則化項パラメータ推定部とを含み、
前記誤差項パラメータ推定部による推定、前記正則化項パラメータ推定部による推定、及び前記一般化高階結合正則化項パラメータ推定部による推定を、少なくとも1回ずつ行う請求項2に記載の解析装置。
The parameter estimation unit includes:
An error term parameter estimator for estimating the parameter β based on the gradient ∇l of the error term l;
Regularization term parameter estimation for estimating the parameter β based on the parameter β estimated by the error term parameter estimation unit and a function ∇Ω r that minimizes each of the R regularization terms Ω r And
A generalized higher order coupled regularization term parameter estimation unit that estimates the parameter β based on the parameter β estimated by the regularization term parameter estimation unit and the generalized higher order combination regularization term;
The analysis apparatus according to claim 2, wherein the estimation by the error term parameter estimation unit, the estimation by the regularization term parameter estimation unit, and the estimation by the generalized higher-order coupled regularization term parameter estimation unit are performed at least once.
前記高階結合正則化項パラメータ推定部は、前記正則化項パラメータ推定部によって推定された前記パラメータβと、前記高階結合正則化項に対応して予め定められたs/tグラフとに基づいて、パラメトリック最大流アルゴリズムに従って、パラメータβを推定する請求項3に記載の解析装置。   The higher order coupled regularization term parameter estimation unit is based on the parameter β estimated by the regularization term parameter estimation unit and an s / t graph predetermined corresponding to the higher order coupled regularization term, The analysis apparatus according to claim 3, wherein the parameter β is estimated according to a parametric maximum flow algorithm. 前記一般化高階結合正則化項パラメータ推定部は、前記正則化項パラメータ推定部によって推定された前記パラメータβと、前記一般化高階結合正則化項に対応して予め定められたs/tグラフとに基づいて、パラメトリック最大流アルゴリズムに従って、パラメータβを推定する請求項4に記載の解析装置。   The generalized higher-order coupled regularization term parameter estimation unit includes the parameter β estimated by the regularization term parameter estimation unit, and an s / t graph determined in advance corresponding to the generalized higher-order coupled regularization term. 5. The analysis apparatus according to claim 4, wherein the parameter β is estimated according to the parametric maximum flow algorithm. 観測データxからなるデータ点の集合である訓練データと、観測データxを解析するためのd次元のベクトルであるパラメータβの各次元の、各グループへの所属度を表すパラメータ構造データと、前記パラメータβを推定するための損失関数における前記訓練データの前記データ点の各々についての誤差項lの勾配∇lと、前記損失関数におけるR個の正則化項Ωの各々を最小化する関数∇Ωとを受け付けるデータ入力部と、
前記訓練データと、前記誤差項lの勾配∇lと、前記R個の正則化項Ωの各々を最小化する関数∇Ωとに基づいて、前記訓練データの前記データ点の各々についての前記誤差項lと、前記R個の正則化項Ωと、各グループに対し、前記パラメータβにおける、前記グループに所属する次元間の要素の値の差を用いて表される高階結合正則化項とを含む前記損失関数を最小化するように、前記パラメータβを推定するパラメータ推定部と、
を含む解析装置。
Training data that is a set of data points composed of observation data x; parameter structure data that represents the degree of affiliation of each dimension of parameter β, which is a d-dimensional vector for analyzing observation data x, to each group; The slope ∇l of the error term l for each of the data points of the training data in the loss function to estimate the parameter β, and the function ∇ that minimizes each of the R regularization terms Ω r in the loss function. A data input unit for receiving Ω r ;
Based on the training data, the slope ∇l of the error term l, and a function ∇Ω r that minimizes each of the R regularization terms Ω r , for each of the data points of the training data. Higher-order joint regularization expressed using the error term l, the R regularization terms Ω r, and the difference in element values between dimensions belonging to the group in the parameter β for each group A parameter estimator for estimating the parameter β so as to minimize the loss function including a term;
Analysis device including
前記パラメータ構造データは、前記パラメータβの次元対の類似度を更に含み、
前記パラメータ推定部は、
前記訓練データと、前記誤差項lの勾配∇lと、前記R個の正則化項Ωの各々を最小化する関数∇Ωとに基づいて、前記訓練データの前記データ点の各々についての前記誤差項lと、前記R個の正則化項Ωと、前記高階結合正則化項、及び前記パラメータβの次元対の類似度を用いて表される一般化結合正則化項を含む一般化高階結合正則化項とを含む前記損失関数を最小化するように、前記パラメータβを推定する請求項7記載の解析装置。
The parameter structure data further includes a similarity of a dimension pair of the parameter β,
The parameter estimation unit includes:
Based on the training data, the slope ∇l of the error term l, and a function ∇Ω r that minimizes each of the R regularization terms Ω r , for each of the data points of the training data. Generalization including the error term l, the R regularization terms Ω r , the higher-order joint regularization term, and a generalized joint regularization term expressed using the similarity of the dimension pairs of the parameter β The analysis apparatus according to claim 7, wherein the parameter β is estimated so as to minimize the loss function including a higher-order coupled regularization term.
観測データxに対する実数スカラー値yを予測する解析装置における解析方法であって、
データ入力部が、観測データxと実数スカラー値yとの組み合わせからなるデータ点の集合である訓練データと、観測データxからなるテストデータと、観測データxに対する実数スカラー値yを予測するためのd次元のベクトルであるパラメータβの各次元の、各グループへの所属度を表すパラメータ構造データと、前記パラメータβを推定するための損失関数における前記訓練データの前記データ点の各々についての誤差項lの勾配∇lと、前記損失関数におけるR個の正則化項Ωの各々を最小化する関数∇Ωとを受け付けるステップと、
パラメータ推定部が、前記訓練データと、前記誤差項lの勾配∇lと、前記R個の正則化項Ωの各々を最小化する関数∇Ωとに基づいて、前記訓練データの前記データ点の各々についての前記誤差項lと、前記R個の正則化項Ωと、各グループに対し、前記パラメータβにおける、前記グループに所属する次元間の要素の値の差を用いて表される高階結合正則化項とを含む前記損失関数を最小化するように、前記パラメータβを推定するステップと、
予測部が、前記パラメータ推定部によって推定された前記パラメータβに基づいて、前記テストデータに対する実数スカラー値yを予測するステップと、
を含む解析方法。
An analysis method in an analyzer for predicting a real scalar value y with respect to observation data x,
A data input unit for training data that is a set of data points composed of a combination of observation data x and real scalar value y, test data composed of observation data x, and real scalar value y for observation data x An error term for each of the data points of the training data in the loss function for estimating the parameter β and parameter structure data representing the degree of affiliation of each dimension of the parameter β, which is a d-dimensional vector, to each group receiving a slope ∇l of l and a function ∇Ω r that minimizes each of the R regularization terms Ω r in the loss function;
A parameter estimator based on the training data, the gradient ∇l of the error term l, and the function ∇Ω r that minimizes each of the R regularization terms Ω r ; Expressed using the error term l for each of the points, the R regularization terms Ω r, and for each group, the difference in element values between the dimensions belonging to the group in the parameter β. Estimating the parameter β so as to minimize the loss function including a higher order coupled regularization term,
A predicting unit predicting a real scalar value y for the test data based on the parameter β estimated by the parameter estimating unit;
Analysis method including
前記パラメータ構造データは、前記パラメータβの次元対の類似度を更に含み、
前記パラメータ推定部が推定するステップは、
前記訓練データと、前記誤差項lの勾配∇lと、前記R個の正則化項Ωの各々を最小化する関数∇Ωとに基づいて、前記訓練データの前記データ点の各々についての前記誤差項lと、前記R個の正則化項Ωと、前記高階結合正則化項、及び前記パラメータβの次元対の類似度を用いて表される一般化結合正則化項を含む一般化高階結合正則化項とを含む前記損失関数を最小化するように、前記パラメータβを推定する請求項9記載の解析方法。
The parameter structure data further includes a similarity of a dimension pair of the parameter β,
The step of the parameter estimation unit estimating includes:
Based on the training data, the slope ∇l of the error term l, and a function ∇Ω r that minimizes each of the R regularization terms Ω r , for each of the data points of the training data. Generalization including the error term l, the R regularization terms Ω r , the higher-order joint regularization term, and a generalized joint regularization term expressed using the similarity of the dimension pairs of the parameter β The analysis method according to claim 9, wherein the parameter β is estimated so as to minimize the loss function including a higher-order coupled regularization term.
コンピュータを、請求項1〜請求項8のいずれか1項に記載の解析装置の各部として機能させるためのプログラム。   The program for functioning a computer as each part of the analyzer of any one of Claims 1-8.
JP2016036106A 2016-02-26 2016-02-26 Analysis apparatus, method, and program Active JP6465440B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016036106A JP6465440B2 (en) 2016-02-26 2016-02-26 Analysis apparatus, method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016036106A JP6465440B2 (en) 2016-02-26 2016-02-26 Analysis apparatus, method, and program

Publications (2)

Publication Number Publication Date
JP2017151904A JP2017151904A (en) 2017-08-31
JP6465440B2 true JP6465440B2 (en) 2019-02-06

Family

ID=59740740

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016036106A Active JP6465440B2 (en) 2016-02-26 2016-02-26 Analysis apparatus, method, and program

Country Status (1)

Country Link
JP (1) JP6465440B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3745325A1 (en) * 2019-05-29 2020-12-02 Hitachi, Ltd. Data analysis apparatus, data analysis method, and data analysis program

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3493120A1 (en) * 2017-12-01 2019-06-05 Koninklijke Philips N.V. Training a neural network model
CN113469189B (en) * 2021-09-02 2021-11-19 国网江西省电力有限公司供电服务管理中心 Method, system and device for filling missing values of power utilization acquisition data

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8832006B2 (en) * 2012-02-08 2014-09-09 Nec Corporation Discriminant model learning device, method and program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3745325A1 (en) * 2019-05-29 2020-12-02 Hitachi, Ltd. Data analysis apparatus, data analysis method, and data analysis program

Also Published As

Publication number Publication date
JP2017151904A (en) 2017-08-31

Similar Documents

Publication Publication Date Title
JP7676383B2 (en) Method and system for estimating the computational cost of a simulation - Patents.com
Ng et al. The EM algorithm
Sgouralis et al. Single molecule force spectroscopy at high data acquisition: A Bayesian nonparametric analysis
US20190180181A1 (en) Iterative feature selection methods
US20180285769A1 (en) Artificial immune system for fuzzy cognitive map learning
JP6465440B2 (en) Analysis apparatus, method, and program
WO2018211721A1 (en) Abnormal information estimation device, abnormal information estimation method, and program
Friel et al. Exploiting multi-core architectures for reduced-variance estimation with intractable likelihoods
Daly et al. Comparing two sequential Monte Carlo samplers for exact and approximate Bayesian inference on biological models
Ling et al. An intelligent sampling framework for multi-objective optimization in high dimensional design space
Dayan et al. Expressivity of geometric inhomogeneous random graphs—metric and non-metric
JP2008289660A (en) Brain function image analysis apparatus and method, and program for brain function image analysis
Wu et al. HGCN2SP: Hierarchical graph convolutional network for two-stage stochastic programming
Zayats et al. Super resolution for turbulent flows in 2D: stabilized physics informed neural networks
Jokar et al. On the existence of proper stochastic Markov models for statistical reconstruction and prediction of chaotic time series
Sadr et al. Data-driven discovery of PDEs via the adjoint method
JP6389836B2 (en) Analysis apparatus, method, and program
Mohammadi et al. Large-scale Bayesian structure learning for Gaussian graphical models using marginal pseudo-likelihood
Frank et al. Input window size and neural network predictors
Defterli et al. Advanced mathematical and statistical tools in the dynamic modeling and simulation of gene-environment regulatory networks
Juneja et al. Optimization of dejong function using ga under different selection algorithms
JP5503577B2 (en) Data polarity determination apparatus, method, and program
JP5538354B2 (en) Topic model learning method, apparatus, and program
Porta et al. On some steplength approaches for proximal algorithms.
CN114155410A (en) Graph pooling, classification model training and reconstruction model training method and device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171220

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20171220

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181119

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181204

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181228

R150 Certificate of patent or registration of utility model

Ref document number: 6465440

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250