Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP7440938B2 - Event prediction system, event prediction method and program - Google Patents
[go: Go Back, main page]

JP7440938B2 - Event prediction system, event prediction method and program - Google Patents

Event prediction system, event prediction method and program Download PDF

Info

Publication number
JP7440938B2
JP7440938B2 JP2021573071A JP2021573071A JP7440938B2 JP 7440938 B2 JP7440938 B2 JP 7440938B2 JP 2021573071 A JP2021573071 A JP 2021573071A JP 2021573071 A JP2021573071 A JP 2021573071A JP 7440938 B2 JP7440938 B2 JP 7440938B2
Authority
JP
Japan
Prior art keywords
time
sensor data
prediction
series
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021573071A
Other languages
Japanese (ja)
Other versions
JPWO2021149528A1 (en
JPWO2021149528A5 (en
Inventor
崇人 本田
靖子 櫻井
光希 川畑
保志 櫻井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Osaka NUC
Original Assignee
Osaka University NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Osaka University NUC filed Critical Osaka University NUC
Publication of JPWO2021149528A1 publication Critical patent/JPWO2021149528A1/ja
Publication of JPWO2021149528A5 publication Critical patent/JPWO2021149528A5/ja
Application granted granted Critical
Publication of JP7440938B2 publication Critical patent/JP7440938B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/09Supervised learning
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Algebra (AREA)
  • General Business, Economics & Management (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • Computational Mathematics (AREA)
  • Economics (AREA)
  • Mathematical Analysis (AREA)
  • Marketing (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Automation & Control Theory (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、時系列センサデータに基づくイベント予測技術に関する。 The present invention relates to event prediction technology based on time-series sensor data.

近年、製造業においては製造工場のスマート化が推し進められている。大量のセンサを使用して生産ラインの稼働状況を常に監視し、その様子を時系列データとして蓄積、分析することにより、機器の異常検知(非特許文献25,32)や品質管理(非特許文献14)等、あらゆる側面から生産性を向上する取り組みが行われている。これらの取り組みに共通する重要な課題は、収集した大規模データからの効果的な知見獲得と、それに基づく将来予測技術の開発である。特に、製造工場から得られる時系列データは複数のドメイン(設備、センサ、時間など)を持つ複雑なデータであり、多角的なパターンを持つことが多い。生産ラインにおいては、複数の作業工程(パターン)の時間遷移のみならず、複数ラインでの並列作業によって生まれる作業ラインごとに共通/相違なパターンを持つ。不良品や設備故障の要因を効果的に捉えるためには、このような多角的かつ動的なパターンを柔軟に表現すると同時に、それらの間に隠された因果関係を明らかにする必要がある。 In recent years, in the manufacturing industry, there has been a push to make manufacturing plants smarter. By constantly monitoring the operating status of the production line using a large number of sensors, and accumulating and analyzing the status as time-series data, it is possible to detect abnormalities in equipment (Non-patent Documents 25, 32) and quality control (Non-patent Documents 14) Efforts are being made to improve productivity from all aspects. An important issue common to these efforts is the effective acquisition of knowledge from the large-scale data collected and the development of future prediction technology based on this knowledge. In particular, time-series data obtained from manufacturing plants is complex data with multiple domains (equipment, sensors, time, etc.) and often has multifaceted patterns. On a production line, not only the time transition of multiple work processes (patterns), but also common/different patterns are created for each work line due to parallel work on multiple lines. In order to effectively understand the causes of defective products and equipment failures, it is necessary to flexibly express such multifaceted and dynamic patterns and at the same time clarify the hidden causal relationships between them.

加えて、スマート工場で想定されるタスクでは、故障や不具合、加工精度の低下など、各イベントの発生を事前に把握することで、対策の選択肢が広がる。つまり、大規模センサデータの将来予測技術は、より長期的な予測能力を有することが望ましい(非特許文献15)。 In addition, for tasks envisioned in smart factories, knowing in advance the occurrence of various events, such as breakdowns, defects, and reductions in processing accuracy, will expand the options for countermeasures. In other words, it is desirable that future prediction technology for large-scale sensor data has a longer-term prediction ability (Non-Patent Document 15).

センサデータの解析に関する研究は、データベースやデータマイニング等、様々な分野で進められている(非特許文献2,17,19,22,24,25)。自己回帰モデル(AR: auto regressive model)、線形動的システム(LDS: linear dynamical systems) は代表的な技術であり,これらに基づくセンサデータの解析と予測手法が数多く存在する(非特許文献13)。 Research on analysis of sensor data is progressing in various fields such as databases and data mining (Non-Patent Documents 2, 17, 19, 22, 24, 25). Auto regressive models (AR) and linear dynamical systems (LDS) are representative technologies, and there are many sensor data analysis and prediction methods based on these (Non-patent Document 13). .

Regime-Cast(非特許文献15)は、大量に生成され続ける多次元センサデータから非線形動的システムをリアルタイムに推定し、適応的に将来を予測し続ける能力を持つ。しかし、この手法はセンサストリームを入力とし、センサデータの実測値の予測において高い性能を示すが、正常/異常といったイベントデータの予測には対応していない。 Regime-Cast (Non-Patent Document 15) has the ability to estimate nonlinear dynamic systems in real time from multidimensional sensor data that continues to be generated in large quantities, and to continue to adaptively predict the future. However, although this method uses sensor streams as input and shows high performance in predicting actual measured values of sensor data, it does not support prediction of event data such as normality/abnormality.

また、時系列ビッグデータを対象としたパターン発見とクラスタリングも重要な課題である(非特許文献8,10,11,16,28,29,31)。Matsubaraら(非特許文献18)は、大規模イベントテンソルの解析手法として、TriMineを提案した。TriMineは、与えられたデータを複数のトピックに分類し、潜在的なトレンドやパターンを検出するが、Web上のクリックログのような離散イベントデータを対象としており、IOTセンサデータのような時系列シーケンスの動的パターンやそのグループ(レジーム)を表現することができず、扱う問題が異なる。加えて、TriMineはイベントを予測する能力を持たない。 Furthermore, pattern discovery and clustering for time-series big data are also important issues (Non-Patent Documents 8, 10, 11, 16, 28, 29, 31). Matsubara et al. (Non-Patent Document 18) proposed TriMine as a method for analyzing large-scale event tensors. TriMine classifies given data into multiple topics and detects potential trends and patterns, but it targets discrete event data like click logs on the web and time series like IOT sensor data. It is not possible to express dynamic patterns of sequences or their groups (regimes), and the problems they deal with are different. Additionally, TriMine has no ability to predict events.

Deep Neural Networkに基づく非線形動特性の解析に関する研究も盛んである(非特許文献3,9,26,27)。Qinらは非特許文献21において、入力時系列の中で重要な次元と次元削減後の特空間で重要な次元を2階層にわたりモデル化することで、高精度に株価を予測する手法を提案した。一方で、本研究のように、不連続に発生するイベントを予測するタスクではイベントの発生強度(Intensity)をモデル化する手法が主流である(非特許文献5,6,20,30)。例えば、RMTPP(非特許文献5)は、過去のイベント履歴から次に発生するイベントの時刻と種類を予測するための非線形モデルを提案している。しかし、これらの手法はイベント履歴のみから構成されるカテゴリカルデータを対象としており、センサからの実測値で構成される連続データによるイベント予測を行うことはできない。 Research on analysis of nonlinear dynamic characteristics based on Deep Neural Networks is also active (Non-Patent Documents 3, 9, 26, 27). In Non-Patent Document 21, Qin et al. proposed a method for predicting stock prices with high accuracy by modeling important dimensions in the input time series and important dimensions in the special space after dimension reduction over two layers. . On the other hand, in the task of predicting events that occur discontinuously, as in this study, the mainstream is a method of modeling the intensity of event occurrence (Non-Patent Documents 5, 6, 20, 30). For example, RMTPP (Non-Patent Document 5) proposes a nonlinear model for predicting the time and type of the next event based on past event history. However, these methods target categorical data consisting only of event history, and cannot predict events using continuous data consisting of actual measured values from sensors.

C. M. Bishop. Pattern Recognition and Machine Learning (Information Science and Statistics). Springer, 2006.C. M. Bishop. Pattern Recognition and Machine Learning (Information Science and Statistics). Springer, 2006. G. E. Box, G. M. Jenkins, and G. C. Reinsel. Time Series Analysis: Forecasting and Control. Prentice Hall, Englewood Cliffs, NJ, 3rd edition, 1994.G. E. Box, G. M. Jenkins, and G. C. Reinsel. Time Series Analysis: Forecasting and Control. Prentice Hall, Englewood Cliffs, NJ, 3rd edition, 1994. P. Chen, S. Liu, C. Shi, B. Hooi, B. Wang, and X. Cheng. Neucast: Seasonal neural forecast of power grid time series. In IJCAI, pages 3315-3321, 2018.P. Chen, S. Liu, C. Shi, B. Hooi, B. Wang, and X. Cheng. Neucast: Seasonal neural forecast of power grid time series. In IJCAI, pages 3315-3321, 2018. K. Cho, B. van Merrienboer, D. Bahdanau, and Y. Bengio. On the Properties of Neural Machine Translation: Encoder-Decoder Approaches. arXiv e-prints, page arXiv:1409.1259, Sep 2014.K. Cho, B. van Merrienboer, D. Bahdanau, and Y. Bengio. On the Properties of Neural Machine Translation: Encoder-Decoder Approaches. arXiv e-prints, page arXiv:1409.1259, Sep 2014. N. Du, H. Dai, R. Trivedi, U. Upadhyay, M. Gomez-Rodriguez, and L. Song. Recurrent marked temporal point processes: Embedding event history to vector. In KDD, pages 1555-1564, 2016.N. Du, H. Dai, R. Trivedi, U. Upadhyay, M. Gomez-Rodriguez, and L. Song. Recurrent marked temporal point processes: Embedding event history to vector. In KDD, pages 1555-1564, 2016. N. Du, Y. Wang, N. He, and L. Song. Time-sensitive recommendation from recurrent user activities. In NIPS, pages 3492-3500, 2015.N. Du, Y. Wang, N. He, and L. Song. Time-sensitive recommendation from recurrent user activities. In NIPS, pages 3492-3500, 2015. J. G. DAVID FORNEY. The viterbi algorithm. In Proceedings of the IEEE, pages 268-278, 1973.J. G. DAVID FORNEY. The viterbi algorithm. In Proceedings of the IEEE, pages 268-278, 1973. D. Hallac, S. Vare, S. Boyd, and J. Leskovec. Toeplitz inverse covariance-based clustering of multivariate time series data. In KDD, pages 215-223, 2017.D. Hallac, S. Vare, S. Boyd, and J. Leskovec. Toeplitz inverse covariance-based clustering of multivariate time series data. In KDD, pages 215-223, 2017. S. Hochreiter and J. Schmidhuber. Long short-term memory. Neural Comput., 9(8):1735-1780, Nov. 1997.S. Hochreiter and J. Schmidhuber. Long short-term memory. Neural Comput., 9(8):1735-1780, Nov. 1997. T. Honda, Y. Matsubara, R. Neyama, M. Abe, and Y. Sakurai. Multi-aspect mining of complex sensor sequences. In ICDM, 2019.T. Honda, Y. Matsubara, R. Neyama, M. Abe, and Y. Sakurai. Multi-aspect mining of complex sensor sequences. In ICDM, 2019. K. Kawabata, Y. Matsubara, and Y. Sakurai. Automatic sequential pattern mining in data streams. In CIKM, pages 1733-1742, 2019.K. Kawabata, Y. Matsubara, and Y. Sakurai. Automatic sequential pattern mining in data streams. In CIKM, pages 1733-1742, 2019. D. P. Kingma and J. Ba. Adam: A method for stochastic optimization. CoRR, abs/1412.6980, 2015.D. P. Kingma and J. Ba. Adam: A method for stochastic optimization. CoRR, abs/1412.6980, 2015. L. Li, J. McCann, N. Pollard, and C. Faloutsos. Dynammo: Mining and summarization of coevolving sequences with missing values. In KDD, 2009.L. Li, J. McCann, N. Pollard, and C. Faloutsos. Dynammo: Mining and summarization of coevolving sequences with missing values. In KDD, 2009. Y. Li, J. Wang, J. Ye, and C. K. Reddy. A multi-task learning formulation for survival analysis. In KDD, pages 1715-1724, 2016.Y. Li, J. Wang, J. Ye, and C. K. Reddy. A multi-task learning formulation for survival analysis. In KDD, pages 1715-1724, 2016. Y. Matsubara and Y. Sakurai. Regime shifts in streams: Realtime forecasting of co-evolving time sequences. In KDD, 2016.Y. Matsubara and Y. Sakurai. Regime shifts in streams: Realtime forecasting of co-evolving time sequences. In KDD, 2016. Y. Matsubara, Y. Sakurai, and C. Faloutsos. Autoplait: Automatic mining of co-evolving time sequences. In SIGMOD, pages 193-204, 2014.Y. Matsubara, Y. Sakurai, and C. Faloutsos. Autoplait: Automatic mining of co-evolving time sequences. In SIGMOD, pages 193-204, 2014. Y. Matsubara, Y. Sakurai, and C. Faloutsos. The web as a jungle: Non-linear dynamical systems for co-evolving online activities. In WWW, pages 721-731, 2015.Y. Matsubara, Y. Sakurai, and C. Faloutsos. The web as a jungle: Non-linear dynamical systems for co-evolving online activities. In WWW, pages 721-731, 2015. Y. Matsubara, Y. Sakurai, C. Faloutsos, T. Iwata, and M. Yoshikawa. Fast mining and forecasting of complex timestamped events. In KDD, pages 271-279, 2012.Y. Matsubara, Y. Sakurai, C. Faloutsos, T. Iwata, and M. Yoshikawa. Fast mining and forecasting of complex timestamped events. In KDD, pages 271-279, 2012. Y. Matsubara, Y. Sakurai, B. A. Prakash, L. Li, and C. Faloutsos. Rise and fall patterns of information diffusion: model and implications. In KDD, pages 6-14, 2012.Y. Matsubara, Y. Sakurai, B. A. Prakash, L. Li, and C. Faloutsos. Rise and fall patterns of information diffusion: model and implications. In KDD, pages 6-14, 2012. H. Mei and J. Eisner. The neural hawkes process: A neutrally self-modulating multivariate point process. In NIPS, pages 6757-6767, 2017.H. Mei and J. Eisner. The neural hawkes process: A self-modulating neutral multivariate point process. In NIPS, pages 6757-6767, 2017. Y. Qin, D. Song, H. Chen, W. Cheng, G. Jiang, and G. W. Cottrell. A dual-stage attention-based recurrent neural network for time series prediction. In IJCAI, pages 2627-2633, 2017.Y. Qin, D. Song, H. Chen, W. Cheng, G. Jiang, and G. W. Cottrell. A dual-stage attention-based recurrent neural network for time series prediction. In IJCAI, pages 2627-2633, 2017. T. Rakthanmanon, B. J. L. Campana, A. Mueen, G. E. A. P. A. Batista, M. B. Westover, Q. Zhu, J. Zakaria, and E. J. Keogh. Searching and mining trillions of time series subsequences under dynamic time warping. In KDD, pages 262-270, 2012.T. Rakthanmanon, B. J. L. Campana, A. Mueen, G. E. A. P. A. Batista, M. B. Westover, Q. Zhu, J. Zakaria, and E. J. Keogh. Searching and mining trillions of time series subsequences under dynamic time warping. In KDD, pages 262-270, 2012. J. Rissanen. A Universal Prior for Integers and Estimation by Minimum Description Length. Ann. of Statist, 11(2):416-431, 1983.J. Rissanen. A Universal Prior for Integers and Estimation by Minimum Description Length. Ann. of Statist, 11(2):416-431, 1983. Y. Sakurai, Y. Matsubara, and C. Faloutsos. Mining and forecasting of big time-series data. In SIGMOD, pages 919-922, 2015.Y. Sakurai, Y. Matsubara, and C. Faloutsos. Mining and forecasting of big time-series data. In SIGMOD, pages 919-922, 2015. Y. Sakurai, S. Papadimitriou, and C. Faloutsos. Braid: Stream mining through group lag correlations. In SIGMOD, pages 599-610, 2005.Y. Sakurai, S. Papadimitriou, and C. Faloutsos. Braid: Stream mining through group lag correlations. In SIGMOD, pages 599-610, 2005. I. Sutskever, O. Vinyals, and Q. V. Le. Sequence to sequence learning with neural networks. In NIPS, pages 3104-3112. 2014.I. Sutskever, O. Vinyals, and Q. V. Le. Sequence to sequence learning with neural networks. In NIPS, pages 3104-3112. 2014. Tsungnan Lin, B. G. Horne, P. Tino, and C. L. Giles. Learning long-term dependencies in narx recurrent neural networks. IEEE Transactions on Neural Networks, 7(6):1329-1338, 1996.Tsungnan Lin, B. G. Horne, P. Tino, and C. L. Giles. Learning long-term dependencies in narx recurrent neural networks. IEEE Transactions on Neural Networks, 7(6):1329-1338, 1996. P. Wang, H. Wang, and W. Wang. Finding semantics in time series. In SIGMOD Conference, pages 385-396, 2011.P. Wang, H. Wang, and W. Wang. Finding semantics in time series. In SIGMOD Conference, pages 385-396, 2011. S.Wang, K. Kam, C. Xiao, S. R. Bowen, and W. A. Chaovalitwongse. An efficient time series subsequence pattern mining and prediction framework with an application to respiratory motion prediction. In AAAI, pages 2159-2165, 2016.S. Wang, K. Kam, C. Xiao, S. R. Bowen, and W. A. Chaovalitwongse. An efficient time series subsequence pattern mining and prediction framework with an application to respiratory motion prediction. In AAAI, pages 2159-2165, 2016. S. Xiao, J. Yan, X. Yang, H. Zha, and S. Chu. Modeling the intensity function of point process via recurrent neural networks, 2017.S. Xiao, J. Yan, X. Yang, H. Zha, and S. Chu. Modeling the intensity function of point process via recurrent neural networks, 2017. R. Zhao and Q. Ji. An adversarial hierarchical hidden markov model for human pose modeling and generation. In AAAI, 2018.R. Zhao and Q. Ji. An adversarial hierarchical hidden markov model for human pose modeling and generation. In AAAI, 2018. Y. Zhou, H. Zou, R. Arghandeh, W. Gu, and C. J. Spanos. Non-parametric outliers detection in multiple time series A case study: Power grid data analysis. In AAAI, 2018.Y. Zhou, H. Zou, R. Arghandeh, W. Gu, and C. J. Spanos. Non-parametric outliers detection in multiple time series A case study: Power grid data analysis. In AAAI, 2018.

以上説明したように、従来、時系列テンソルデータを対象とし、かつ時系列パターンに関する事前知識を必要とせず、時系列データの特徴的なパターンを用いてイベント予測を行うイベント予測方法乃至システムは提案されていない。 As explained above, conventional event prediction methods and systems have been proposed that target time-series tensor data and perform event prediction using characteristic patterns of time-series data without requiring prior knowledge of time-series patterns. It has not been.

本発明は、上記に鑑みてなされたもので、時系列テンソルデータを対象とし、データの要約処理を介して、長期的かつ高精度なイベント予測を可能にするイベント予測システム、その方法およびプログラムを提供するものである。 The present invention has been made in view of the above, and provides an event prediction system, method, and program for the event prediction system that targets time-series tensor data and enables long-term and highly accurate event prediction through data summarization processing. This is what we provide.

本発明に係るイベント予測システムは、複数の観測対象にそれぞれ配置された複数種のセンサから継続的に収集される時系列センサデータから多角的な動的パターンのモデルパラメータの抽出を継続的に行う第1の特徴量抽出手段と、前記モデルパラメータを用いて前記時系列センサデータをモデル化情報とその誤差情報とを含む要約情報に順次特徴量化する第2の特徴量抽出手段と、前記要約情報を入力として所定時間先での所定のイベントの発生確率を出力する予測手段とを備えたものである。 The event prediction system according to the present invention continuously extracts model parameters of multifaceted dynamic patterns from time-series sensor data continuously collected from multiple types of sensors placed on multiple observation targets. a first feature extracting means; a second feature extracting means for sequentially converting the time-series sensor data into features using the model parameters into summary information including modeling information and its error information; and the summary information and a prediction means for outputting the probability of occurrence of a predetermined event in a predetermined time period.

また、本発明に係るイベント予測方法は、コンピュータの第1の特徴量抽出部が、複数の観測対象にそれぞれ配置された複数種のセンサから継続的に収集され、記憶部に記憶された時系列センサデータから多角的な動的パターンのモデルパラメータの抽出を継続的に行って前記記憶部に記憶し、前記コンピュータの第2の特徴量抽出部が、前記モデルパラメータ及び前記時系列センサデータを前記記憶部から読み出して、前記時系列センサデータをモデル化情報とその誤差情報とを含む要約情報に順次特徴量化して前記記憶部に記憶し、前記コンピュータの予測部が、前記要約情報を前記記憶部から読み出して入力とし、所定時間先での所定のイベントの発生確率を出力するものである。 Further, in the event prediction method according to the present invention, the first feature extracting unit of the computer continuously collects data from multiple types of sensors placed on multiple observation targets, and stores the time series in the storage unit. Model parameters of a multifaceted dynamic pattern are continuously extracted from sensor data and stored in the storage unit, and a second feature extracting unit of the computer extracts the model parameters and the time-series sensor data from the sensor data. The time-series sensor data is read out from the storage unit and sequentially converted into feature quantities into summary information including modeling information and its error information, and stored in the storage unit, and the prediction unit of the computer converts the summary information into the storage unit. It is read from the section and used as input, and outputs the probability of occurrence of a predetermined event in a predetermined time period.

また、本発明に係るプログラムは、複数の観測対象にそれぞれ配置された複数種のセンサから継続的に収集される時系列センサデータから多角的な動的パターンのモデルパラメータの抽出を継続的に行う第1の特徴量抽出手段、前記モデルパラメータを用いて前記時系列センサデータをモデル化情報とその誤差情報とを含む要約情報に順次特徴量化する第2の特徴量抽出手段、及び前記要約情報を入力として所定時間先での所定のイベントの発生確率を出力する予測手段として、コンピュータを機能させるものである。 Further, the program according to the present invention continuously extracts model parameters of multifaceted dynamic patterns from time-series sensor data continuously collected from multiple types of sensors placed on multiple observation targets. a first feature extracting means; a second feature extracting means for sequentially converting the time-series sensor data into summary information including modeling information and its error information using the model parameters; The computer functions as a prediction means that outputs as input the probability of occurrence of a predetermined event in a predetermined time period.

これらの発明によれば、複数の観測対象にそれぞれ配置された複数種のセンサから継続的に時系列センサデータが収集され、収集された時系列センサデータから多角的な動的パターンのモデルパラメータの抽出が、第1の特徴量抽出手段によって継続的に行われる。次いで、第2の特徴量抽出手段によって、前記モデルパラメータを用いて前記時系列センサデータがモデル化情報とその誤差情報とを含む要約情報に順次特徴量化される。そして、予測手段によって、前記要約情報を入力として所定時間先での所定のイベントの発生確率が出力される。従って、時系列センサデータ内に含まれる時系列パターンに関する事前知識を必要とせず、パターン(レジーム)の変化点と潜在的な振る舞いとが、例えば時間遷移と観測対象間の多角的な観点とから把握される。また、大規模な時系列センサデータの特徴的なパターンを発見し、それらを用いて長期間先のイベント予測が可能となる。なお、センサの配置は、観測対象に直接設置され、乃至観測対象を遠隔的に観測可能な態様で設置でもよい。 According to these inventions, time-series sensor data is continuously collected from multiple types of sensors placed on multiple observation targets, and model parameters of multifaceted dynamic patterns are determined from the collected time-series sensor data. Extraction is continuously performed by the first feature extraction means. Next, the time-series sensor data is sequentially converted into features by the second feature extracting means using the model parameters into summary information including modeling information and its error information. Then, the prediction means inputs the summary information and outputs the probability of occurrence of a predetermined event in a predetermined time period. Therefore, there is no need for prior knowledge of time-series patterns contained in time-series sensor data, and changing points and potential behavior of patterns (regimes) can be determined based on, for example, time transitions and multiple perspectives between observation targets. be understood. Furthermore, it becomes possible to discover characteristic patterns in large-scale time-series sensor data and use them to predict events over a long period of time. Note that the sensors may be placed directly on the observation target, or may be installed in such a manner that the observation target can be observed remotely.

本発明によれば、時系列センサデータから多角的に特徴量を抽出して要約することで、簡易な構成で長期的かつ高精度なイベント予測を可能にする。 According to the present invention, by extracting and summarizing feature quantities from multiple angles from time-series sensor data, it is possible to perform long-term and highly accurate event prediction with a simple configuration.

本発明に係るイベント予測システムの一実施形態を示す全体ブロック図である。1 is an overall block diagram showing an embodiment of an event prediction system according to the present invention. 本発明が適用例であるスマート工場データから取り込んだ情報の処理状況の一例を示す図で、(a)は、オリジナルのセンサデータを示し、(b)は、オリジナルデータからのパターン検出結果を示し、(c)、(d)は、オリジナルデータに基づき、所定時間後に非常停止した場合(d)と、そうでない場合(c)との典型的なレジーム例を示した図である。A diagram showing an example of the processing status of information imported from smart factory data to which the present invention is applied, in which (a) shows original sensor data, and (b) shows pattern detection results from the original data. , (c), and (d) are diagrams showing typical regime examples of a case (d) in which an emergency stop is made after a predetermined time and a case (c) in which it is not, based on original data. 本発明に係る提案モデルの概要を示す図である。1 is a diagram showing an outline of a proposed model according to the present invention. 本発明に係る提案アルゴリズムの基本的な概念を説明するための遷移図である。FIG. 3 is a transition diagram for explaining the basic concept of the proposed algorithm according to the present invention. 予測先のステップ数lsを変化させたときの精度の比較図である。FIG. 7 is a comparison diagram of accuracy when changing the number of steps to predict, ls . ネットワーク学習時に使用するミニバッチのウインドウ幅を変化させたときの予測精度の比較図である。FIG. 4 is a comparison diagram of prediction accuracy when changing the window width of the mini-batch used during network learning. 予測結果の適合率(Precision)と再現率(Recall)とを示す比較図である。FIG. 3 is a comparison diagram showing precision and recall of prediction results. 検出セグメント数mに対する本予測システムの予測精度の変化を示す図である。FIG. 3 is a diagram showing changes in prediction accuracy of the present prediction system with respect to the number m of detected segments. 学習サンプル数と予測精度との関係性を示す図である。FIG. 3 is a diagram showing the relationship between the number of learning samples and prediction accuracy. 設備数w、センサ数d、シーケンス長nをそれぞれ変化させたときの本予測システムの計算コストを示す図である。FIG. 7 is a diagram showing the calculation cost of the present prediction system when the number of equipment w, the number of sensors d, and the sequence length n are changed.

本発明は、好ましくは大規模の時系列センサデータのためのイベント予測手法に関する。本発明は、一例として、(facility, sensor, time)の3つ組で構成される、例えば工場設備センサデータから、複数の観点に基づく多角的な時系列パターンを統合的に解析要約し、将来の長期的なイベント予測を行う技術に関する。より具体的には、工場に取り付けられた各設備における回転速度、稼働電圧、設備温度などのセンサデータの実測値で構成される時系列データが与えられたとき、(a)基本的な時系列パターン、各設備間における共通パターンや設備固有のパターンを抽出し、統計的に要約することで、(b)将来的なイベント予測を行う。さらに、これらの処理は、(c)データサイズに対して線形である。なお、後述するように、実データを用いた実験では、本予測手法が工場設備のセンサデータに含まれる特徴的な時系列パターンを多角的に捉え、長期的なイベント予測を行うことを確認し、さらに、後述するように最新の既存手法(比較例)と比較し、大幅な精度、性能向上を達成していることを明らかにした。 The present invention relates to an event prediction method, preferably for large-scale time-series sensor data. As an example, the present invention comprehensively analyzes and summarizes multifaceted time-series patterns based on multiple viewpoints from factory equipment sensor data, which is composed of the triplet of (facility, sensor, time). Regarding technology for long-term event prediction. More specifically, when given time series data consisting of actual measured values of sensor data such as rotation speed, operating voltage, and equipment temperature for each piece of equipment installed in a factory, (a) basic time series By extracting patterns, common patterns between each piece of equipment, and equipment-specific patterns, and statistically summarizing them, (b) predict future events. Furthermore, these processes are (c) linear with respect to data size. As described later, in experiments using real data, we confirmed that this prediction method captures characteristic time-series patterns included in sensor data of factory equipment from multiple angles and predicts long-term events. Furthermore, as described below, compared with the latest existing method (comparative example), it was revealed that significant accuracy and performance improvements were achieved.

すなわち、本予測システムは、時系列データに含まれる典型的なパターン(以下、レジームという)の数と変化点とを多角的に捉え、システムの稼働状況を正確に把握することで、将来発生するイベントを予測する。より具体的には、複数箇所の設備で複数のセンサから収集された大規模時系列センサデータが与えられたとき、所定時間後すなわちlsステップ先のイベントを予測する。 In other words, this prediction system analyzes the number and change points of typical patterns (hereinafter referred to as regimes) included in time-series data from multiple angles, and accurately grasps the operating status of the system to predict future occurrences. Predict events. More specifically, when given large-scale time-series sensor data collected from multiple sensors at multiple locations of equipment, events after a predetermined time, ie, 1 s steps ahead, are predicted.

さらに具体的には、(a)センサデータの中から多角的なパターンとその変化点を検出し、それらを要約情報としてまとめることで、(b)長期的かつ高精度な予測の実現に供する。さらに、(c)これらの処理を高速に行う。 More specifically, (a) detecting multifaceted patterns and their changing points from sensor data and summarizing them as summary information will (b) help realize long-term and highly accurate predictions. Furthermore, (c) these processes are performed at high speed.

以下、図面を参照して本発明を説明する。図1は、本発明に係るイベント予測システム(以下、予測システム1)の全体ブロック図を示す。本予測システム1は、例えば工場などの複数の設備としての観測対象20,…に設置されたそれぞれのセンサ群21からの、稼働状況に関連する大規模時系列センサデータを有線又は無線の通信路を介して収集する構成と、取り込んだ各時系列データから特徴量を抽出し、さらに所定時間後でのイベント予測処理を実行するプロセッサ(CPU)からなる制御部10を有するコンピュータとを備えている。また、本実施形態では、機械学習を利用しており、予測処理に適用されるパラメータを、機械学習を通して更新するようにしている。図1の詳細は後述する。 The present invention will be described below with reference to the drawings. FIG. 1 shows an overall block diagram of an event prediction system (hereinafter referred to as prediction system 1) according to the present invention. This prediction system 1 transmits large-scale time-series sensor data related to operating conditions from respective sensor groups 21 installed in observation targets 20, ..., which are a plurality of facilities such as factories, through wired or wireless communication channels. and a computer having a control unit 10 consisting of a processor (CPU) that extracts feature quantities from each imported time series data and further executes event prediction processing after a predetermined period of time. . Furthermore, in this embodiment, machine learning is used, and parameters applied to prediction processing are updated through machine learning. Details of FIG. 1 will be described later.

まず、予測処理の理解のために、図2に記載された具体例で説明する。図2は、観測対象20(図1)の一例としてのスマート工場からのセンサデータであって、予測処理に供する(入力するための)情報を示している。図2(a)は、オリジナルのセンサデータを示しており、5つの設備(#1~#5)からの、各センサ群21(図1)の一例として収集される3つのセンサ値(回転速度:Speed、稼働電圧:Load、設備温度:Temp)で構成されている。図2(a)中、黒矩形で塗られた箇所は、対応する設備が非常停止中であることを示す。なお、図2(a)の稼働電圧:Loadの波形は、回転速度:Speedの波形とおおむね重複している。図2(b)は、本予測システムによる、オリジナルデータからのパターン抽出結果を示している。図2(b)中の縦線は、時系列パターンが変化した時刻を示し、同一レジームに属するセグメントは同一の濃淡色で表されている。予測システム1は、複数の設備から得られた時系列データを同時に解析することにより、多角的なパターン、すなわち、各設備内のパターンの時間遷移だけでなく、設備間で共通あるいは相違するパターンを検出することが可能である。 First, in order to understand the prediction process, a specific example shown in FIG. 2 will be explained. FIG. 2 shows sensor data from a smart factory as an example of the observation target 20 (FIG. 1), and shows information used (input) for prediction processing. FIG. 2(a) shows the original sensor data, in which three sensor values (rotation speed :Speed, operating voltage: Load, equipment temperature: Temp). In FIG. 2(a), a portion filled with a black rectangle indicates that the corresponding equipment is in an emergency stop. Note that the waveform of the operating voltage: Load in FIG. 2(a) roughly overlaps with the waveform of the rotational speed: Speed. FIG. 2(b) shows the result of pattern extraction from the original data by this prediction system. Vertical lines in FIG. 2(b) indicate times when the time-series pattern changes, and segments belonging to the same regime are represented in the same shaded color. By simultaneously analyzing time-series data obtained from multiple pieces of equipment, the prediction system 1 analyzes multifaceted patterns, that is, not only temporal transitions of patterns within each piece of equipment, but also patterns that are common or different between pieces of equipment. It is possible to detect.

図2(c)(d)には、オリジナルデータの中から、ls = 200ステップ(約17分)後に非常停止した場合とそうでない場合との典型的な例を示した。図2(c)(d)の左側は、セグメンテーション結果を示す。右側のθ1~θ5は、それぞれ共通の時系列パターン(すなわちレジーム)を表し、それらの遷移の様子を可視化したものである。p200の値は、図2(c)(d)の左側の図にあたる部分シーケンスとそのパターン検出結果が与えられたとき、本予測システムが出力した200ステップ先での非常停止確率である。図2(c)(d)の右側の図において、より多くの遷移が検出されたレジーム間には、太い矢印が表示される。また、円の大きさはレジームの発生期間の大きさを示す。図2(d)を見ると、設備が非常停止する前に回転速度Speedが上昇(θ5)しており、その傾向はレジームθ4、θ5の遷移が現れることによって表現されている。実際に、本予測システム1は、非常停止を正確に予測し、p200が高い値を示している。すなわち、データに含まれる潜在的なパターンを検出することで、非常停止に至る過程を多角的に分析できるだけでなく、それらの要約情報を用いることで長期的かつ高精度な予測が可能となる。なお、図2(c)では、レジームθ2、θ3、θ2、θ1、θ2のような非常停止の予兆のない遷移が見られ、p200も低い値を示している。 FIGS. 2(c) and 2(d) show typical examples from the original data of cases in which an emergency stop occurs after l s = 200 steps (approximately 17 minutes) and cases in which it does not. The left side of FIGS. 2(c) and 2(d) shows the segmentation results. θ 1 to θ 5 on the right represent common time series patterns (ie, regimes), and their transitions are visualized. The value of p200 is the emergency stop probability 200 steps ahead that is output by this prediction system when the partial sequence and its pattern detection results corresponding to the left diagrams in FIGS. 2(c) and 2(d) are given. In the right-hand diagrams of FIGS. 2(c) and 2(d), thick arrows are displayed between regimes where more transitions are detected. Furthermore, the size of the circle indicates the size of the period during which the regime occurred. Looking at FIG. 2(d), the rotational speed Speed increases (θ 5 ) before the equipment makes an emergency stop, and this tendency is expressed by the appearance of a transition between regimes θ 4 and θ 5 . In fact, this prediction system 1 accurately predicts emergency stops, and p200 shows a high value. In other words, by detecting latent patterns contained in the data, not only can the process leading to an emergency stop be analyzed from multiple angles, but also long-term and highly accurate predictions can be made using the summary information. In addition, in FIG. 2(c), transitions such as regimes θ 2 , θ 3 , θ 2 , θ 1 , and θ 2 without any sign of emergency stop are observed, and p200 also shows a low value.

本予測システム1で扱う工場設備センサデータの一例として、三菱重工エンジン&ターボチャージャ株式会社で、2017年10月1日に稼働した55設備における3種類のセンサデータを示す。本データは、(facility, sensor, time) の3つ組で表現され、それぞれ、w個の設備、d種のセンサ、nの期間(例えば5秒単位)からなる。かかるセンサデータは、3階のテンソルX ∈ Rw×d×nとして表現することができ、テンソルXの要素xij(t)は、時刻tにおけるi番目の設備のj番目のセンサでの計測値を示す。本実施形態では、かかるセンサデータを多次元時系列テンソルと呼ぶ。 As an example of factory equipment sensor data handled by this prediction system 1, three types of sensor data from 55 equipment operated at Mitsubishi Heavy Industries Engine & Turbocharger Corporation on October 1, 2017 are shown. This data is expressed as a triplet (facility, sensor, time), each consisting of w pieces of equipment, d types of sensors, and n periods (for example, in units of 5 seconds). Such sensor data can be expressed as a third-floor tensor X ∈ R w × d × n , where the element x ij (t) of the tensor Show value. In this embodiment, such sensor data is referred to as a multidimensional time series tensor.

本予測システム1は、与えられた時系列テンソルXから、lsステップ先の設備アラートを予測するものであり、そのために必要な処理を以下に示す。 This prediction system 1 predicts an equipment alert ls steps ahead from a given time series tensor X, and the necessary processing for this is shown below.

すなわち、時系列テンソルX(ts:te)が与えられたとき、lsステップ先のアラートラベルy(te+ls)を次の式(1)に基づいて予測する。 That is, when the time series tensor X(t s :t e ) is given, the alert label y(t e +l s ) for l s steps ahead is predicted based on the following equation (1).

у(te+ls) ≒F(X(ts:te)) (1)
なお、ts:teは、予測に使用するシーケンスのウインドウ(現時点から過去方向に所定の期間)を表し、Fを提案モデルとする。
у(t e +l s ) ≒F(X(t s :t e )) (1)
Note that t s : te represents the window of the sequence used for prediction (a predetermined period from the current moment to the past), and F is the proposed model.

ここでは、アラートラベルy(te+ls)を高精度に予測するために、確率モデルと深層学習に基づくモデルを構築し、与えられたセンサデータから、例えば故障(アラート)の要因となる高次元かつ非線形な動的特性を抽出する。具体的には、本予測システム1は、次の3つの処理(P1),(P2),(P3)を実行する。 Here, in order to predict the alert label y(t e +l s ) with high accuracy, we build a model based on a probabilistic model and deep learning, and use the given sensor data to predict, for example, the cause of a failure (alert). Extract high-dimensional and nonlinear dynamic characteristics. Specifically, this prediction system 1 executes the following three processes (P1), (P2), and (P3).

(P1) 潜在的な動的パターンの多角的な検出
(P2) 動的パターンに基づく特徴抽出
(P3) lsステップ先の長期予測
まず、各処理(P1),(P2),(P3)について、図1との関連を説明する。図1において、制御部10には、記憶部100、例えば後述するウインドウの表示を行うなどの表示部121、及び外部からの指示を受け付ける操作部122が接続されている。記憶部100は、制御プログラム記憶部101、各センサ群21から入力される時系列センサデータを記憶するデータストリーム記憶部102、及び予測処理に適用される、人工知能(AI)を構成するニューラルネットワークモデルのパラメータ(各エッジの重みなど)を記憶するパラメータ記憶部103を備える。制御プログラム記憶部101は、後述するイベント予測処理を実行するためのプログラムデータ及び必要な各種の演算式データを格納する。また、記憶部100は、データストリーム記憶部102の他、後述する各処理「(P1)潜在的な動的パターンの多角的な検出」、「(P2)動的パターンに基づく特徴抽出」及び処理「(P3)lsステップ先の長期予測」の実行中に得られる夫々のデータを一時的に保管するワークエリア(記憶部)を有する。
(P1) Multifaceted detection of latent dynamic patterns
(P2) Feature extraction based on dynamic patterns
(P3) l Long-term prediction for s steps ahead First, the relationship with FIG. 1 will be explained for each process (P1), (P2), and (P3). In FIG. 1, the control unit 10 is connected to a storage unit 100, a display unit 121 that displays a window to be described later, for example, and an operation unit 122 that accepts instructions from the outside. The storage unit 100 includes a control program storage unit 101, a data stream storage unit 102 that stores time-series sensor data input from each sensor group 21, and a neural network that constitutes artificial intelligence (AI) that is applied to prediction processing. It includes a parameter storage unit 103 that stores model parameters (weights of each edge, etc.). The control program storage unit 101 stores program data and various necessary arithmetic expression data for executing event prediction processing, which will be described later. In addition to the data stream storage unit 102, the storage unit 100 also stores various processes such as “(P1) Multifaceted detection of latent dynamic patterns” and “(P2) Feature extraction based on dynamic patterns” which will be described later. It has a work area (storage unit) that temporarily stores each data obtained during the execution of "(P3) long-term prediction of the next step".

制御部10は、制御プログラムが実行されることで、データ取込処理部11、特徴量抽出部12、予測部13、及びパラメータ更新部14として機能する。データ取込処理部11は、各観測対象20(工場の各設備)のセンサ群21からの時系列センサデータをネットワーク110を経由して取り込む。 The control unit 10 functions as a data acquisition processing unit 11, a feature quantity extraction unit 12, a prediction unit 13, and a parameter updating unit 14 by executing a control program. The data acquisition processing unit 11 acquires time-series sensor data from the sensor group 21 of each observation target 20 (each piece of equipment in the factory) via the network 110.

特徴量抽出部12は、後述する、処理「(P1)潜在的な動的パターンの多角的な検出」、及び「(P2)動的パターンに基づく特徴抽出」を実行する。予測部13は、処理「(P3)lsステップ先の長期予測」を実行する。本実施形態では、予測部13は、パラメータ記憶部103からのパラメータを適用して予測処理を行う。各処理の詳細は後述する。 The feature extraction unit 12 executes the processes "(P1) Multifaceted detection of latent dynamic patterns" and "(P2) Feature extraction based on dynamic patterns", which will be described later. The prediction unit 13 executes the process “(P3) long-term prediction for s steps ahead”. In this embodiment, the prediction unit 13 performs prediction processing by applying parameters from the parameter storage unit 103. Details of each process will be described later.

機械学習装置30は、プロセッサを内蔵するコンピュータからなる制御部300、記憶部310を備えると共に、表示部321、操作部322を備える。記憶部310は、学習プログラム記憶部311、データストリーム記憶部312及びパラメータ記憶部313を備える。データストリーム記憶部312は、各センサ群21から入力される時系列センサデータを通信で、または外部メモリを介して取り込んで、あるいはデータストリーム記憶部102に一旦書き込まれたデータを取り込んで記憶する。 The machine learning device 30 includes a control section 300 and a storage section 310 that are made up of a computer with a built-in processor, as well as a display section 321 and an operation section 322. The storage unit 310 includes a learning program storage unit 311, a data stream storage unit 312, and a parameter storage unit 313. The data stream storage unit 312 captures time-series sensor data input from each sensor group 21 through communication or via an external memory, or captures and stores data once written in the data stream storage unit 102.

制御部300は、学習プログラム記憶部311からの学習プログラムが実行されることで、データ取込処理部301、特徴量抽出部302及び機械学習部303として機能する。データ取込処理部301は、データ取込処理部11と同様で、さらに取り込みデータの取り込み期間を適宜に自動乃至マニュアルで設定(例えば直近の1週間分など)可能である。特徴量抽出部302は、必要に応じて設けられ、例えば工場設備の変更その他の状況変化に応じて前記処理(P1)、(P2)の条件を適宜調整して処理を確認する。 The control unit 300 functions as a data acquisition processing unit 301, a feature extraction unit 302, and a machine learning unit 303 by executing a learning program from a learning program storage unit 311. The data acquisition processing unit 301 is similar to the data acquisition processing unit 11, and can further automatically or manually set the acquisition period of the acquired data (for example, for the most recent one week) as appropriate. The feature extraction unit 302 is provided as necessary, and checks the processing by adjusting the conditions of the processing (P1) and (P2) as appropriate, for example, in response to changes in factory equipment or other changes in the situation.

機械学習部303は、好ましくは直近の所定期間分の時系列センサデータに対して、例えば「教師あり学習」などを適用して機械学習を行い、学習結果であるパラメータをパラメータ記憶部313に保管し、かつ必要に応じてパラメータ更新部14を介して、あるいは機械学習装置30の操作部322からの指示を受けてパラメータ記憶部103を更新する。なお、機械学習は、別体の機械学習装置30の態様の他、各種の態様が採用可能である。例えば、入力データは、データストリーム記憶部102から所定期間分を取り出すようにしてもよい。また、システム停止期間(例えば夜間)を利用するなどして、予測部13を利用して学習を実行し、学習結果であるパラメータを更新する態様でもよい。 The machine learning unit 303 preferably performs machine learning by applying, for example, “supervised learning” to the time-series sensor data for the most recent predetermined period, and stores the parameters that are the learning results in the parameter storage unit 313. Then, the parameter storage unit 103 is updated as necessary via the parameter update unit 14 or in response to an instruction from the operation unit 322 of the machine learning device 30. Note that, in addition to the form of the separate machine learning device 30, various forms of machine learning can be adopted. For example, the input data may be extracted for a predetermined period from the data stream storage unit 102. Alternatively, learning may be performed using the prediction unit 13 during a system stop period (for example, at night), and the parameters that are the learning results may be updated.

次に、「提案モデル」の概要と必要な定義を、表1のように示す。 Next, the outline and necessary definitions of the "proposed model" are shown in Table 1.

Figure 0007440938000001
Figure 0007440938000001

<提案モデル>
(P1) 潜在的な動的パターンの検出
多次元時系列テンソルXが与えられたとき、本予測システムはまず、Xをm個のセグメント集合S={s1,. . . ,sm}に分割してその特徴をとらえる。siはi番目のセグメントの開始点ts、終了点te、設備番号で構成され(すなわち、si = {ts,te,facilityID})、各セグメントは重複がないものとする。そして、発見したセグメント集合を類似セグメントのグループに分類する。本予測システムではこれらのグループを「レジーム」と呼ぶ。
<Proposed model>
(P1) Detection of latent dynamic patterns When a multidimensional time series tensor X is given, this prediction system first divides X into a set of m segments S={s 1 ,. Divide it into parts to understand its characteristics. s i is composed of the start point t s , end point t e , and facility number of the i-th segment (i.e., s i ={t s ,t e ,facilityID}), and each segment is assumed to have no overlap. Then, the discovered segment set is classified into groups of similar segments. In this prediction system, these groups are called "regimes."

・定義1(レジーム)
rを最適なセグメントグループの個数とする。それぞれのセグメントsは、セグメントグループの1つに割り当てられる。さらに、各セグメントが所属するレジームを表現するため、新たにセグメントメンバーシップを定義する。
・Definition 1 (regime)
Let r be the optimal number of segment groups. Each segment s is assigned to one of the segment groups. Furthermore, to express the regime to which each segment belongs, segment membership is newly defined.

・定義2(セグメントメンバーシップ)
多次元時系列テンソルXが与えられたとき、F={f1, . . . ,fm}を、m個の整数列とし、fiをi番目のセグメントが所属するレジームの番号とする(1≦ fi≦r)。
・Definition 2 (segment membership)
When a multidimensional time series tensor X is given, let F={f 1 , . 1≦f i ≦r).

これにより、多次元時系列テンソルXをm個のセグメントとr個のレジームとで、{m,r,S,Θ,F} として表現することができる。次に、本予測システムは、得られたレジーム情報に基づき、多次元時系列テンソルXを統計モデル化し、重要な特徴を抽出する。 Thereby, the multidimensional time series tensor X can be expressed as {m, r, S, Θ, F} using m segments and r regimes. Next, the present prediction system statistically models the multidimensional time series tensor X based on the obtained regime information and extracts important features.

(P2)動的パターンに基づく特徴抽出
それぞれのレジームは、統計モデルΘ={θ1, . . . ,θrr×r}として表現される。本研究では、多次元時系列テンソルXの振る舞いを表現するため、隠れマルコフモデル(HMM:Hidden Markov Model)を用いる。HMMは、隠れ状態を持つマルコフ過程を仮定した確率モデルの一種であり、音声認識を含む様々な分野において、時系列処理手法として広く利用されている。HMMは、初期確率Π={πi}k i=1、遷移確率A={aij}k i,j=1、出力確率B={bi(x)}k i=1の3つ組で表現される(すなわち、θ={Π,A,B})。ここで、kは、HMMの潜在状態数を示す。本予測システムでは、出力確率Bが多次元ガウス分布から生成されるものとする。これにより多次元ベクトルのシーケンスを確率モデルで表現する(すなわちB~{N(μi2 i)}k i=1)。HMMのモデルパラメータθ={Π,A,B}と、入力データとしてあるユーザのシーケンスхが与えられた時、хの尤度P(х|θ)は、次式(数1)のように計算される。
(P2) Feature extraction based on dynamic patterns Each regime is expressed as a statistical model Θ={θ 1 , . . . , θ rr×r }. In this study, we use Hidden Markov Model (HMM) to express the behavior of multidimensional time series tensor X. HMM is a type of probabilistic model that assumes a Markov process with hidden states, and is widely used as a time series processing method in various fields including speech recognition. HMM is a triplet of initial probability Π={π i } k i=1 , transition probability A={a ij } k i,j=1 , and output probability B={b i (x)} k i=1 (i.e., θ={Π,A,B}). Here, k indicates the number of latent states of the HMM. In this prediction system, it is assumed that the output probability B is generated from a multidimensional Gaussian distribution. This represents a sequence of multidimensional vectors as a probabilistic model (ie, B~{N(μ i2 i )} k i=1 ). When the HMM model parameters θ={Π,A,B} and a certain user sequence х are given as input data, the likelihood P(х|θ) of х is expressed as the following equation (Equation 1): calculated.

Figure 0007440938000002
Figure 0007440938000002

ここで、pi(t)は、時刻tにおける潜在状態iの最大確率を示し、nは、хのシーケンス長である。この尤度は、図4に示す遷移図に基づき、動的計画法の一種であるビタビアルゴリズム(非特許文献7)を用いて計算される。ここでさらに、新たな概念としてレジーム遷移行列Δr×rを導入する。 Here, p i (t) indicates the maximum probability of latent state i at time t, and n is the sequence length of х. This likelihood is calculated using the Viterbi algorithm (non-patent document 7), which is a type of dynamic programming, based on the transition diagram shown in FIG. Here, we further introduce the regime transition matrix Δ r×r as a new concept.

・定義3(レジーム遷移行列)
Δr×rをr個のレジーム群の遷移行列と呼ぶ。ここで、要素δij∈Δ は、i番目のレジームからj番目のレジームへの遷移確率を示す。すなわち、0≦δij≦1,Σjδij = 1という条件を持つ。上記のモデルを用いて、多次元時系列テンソルXを、以下に示すHMMの潜在状態系列Zとモデル化した際の誤差εとで要約し、特徴量化することで、高精度かつ長期的な予測を実現する。
・Definition 3 (regime transition matrix)
Δ r×r is called the transition matrix of r regime groups. Here, the element δ ij ∈Δ indicates the transition probability from the i-th regime to the j-th regime. That is, the condition is 0≦δ ij ≦1, Σ j δ ij = 1. Using the above model, the multidimensional time series tensor Realize.

・定義4(潜在状態テンソル)
設備ごとのHMMの潜在状態系列Z={Z1,. . . ,Zw}を潜在状態テンソルと呼ぶ。ここで、Zi={zij(1),. . . ,zij(n)}d j=1 であり、zij(t)は、自身と同じ潜在状態に属するデータ集合xの平均と分散の組{μ,σ}で構成される。
・Definition 4 (latent state tensor)
The latent state sequence Z={Z 1 ,. . . ,Z w } of the HMM for each equipment is called the latent state tensor. Here, Z i ={z ij (1),. . . ,z ij (n)} d j=1 , and z ij (t) is the average of the data set It consists of a set of variances {μ,σ}.

・定義5(誤差テンソル)
多次元時系列テンソルXを潜在状態テンソルZでモデル化した際の誤差ε={E1, . . . ,Ew}を誤差テンソルと呼ぶ。本予測システムでは、HMMの出力確率Bが多次元ガウス分布に従うと仮定しているため、i番目の設備のj番目のセンサにおける時刻tでの誤差eij(t) ∈ Ei は、以下の(数2)ように表現される。
・Definition 5 (error tensor)
The error ε={E 1 , . . . , E w } when the multidimensional time series tensor X is modeled by the latent state tensor Z is called an error tensor. In this prediction system, it is assumed that the output probability B of the HMM follows a multidimensional Gaussian distribution, so the error e ij (t) ∈ E i at time t in the j-th sensor of the i-th equipment is It is expressed as (Equation 2).

Figure 0007440938000003
Figure 0007440938000003

すなわち,時系列テンソルXを、(P1)で得られたレジーム情報{m,r,S,Θ,F} に基づきX≒IGPDF(Z,ε)となるような潜在状態テンソルZと誤差テンソルεとによって要約し、重要な特徴を抽出する。ここで、IGPDF(Inverse Gaussian Probability Density Function) は、ガウス分布における確率密度関数の逆関数を表す。 That is, the time series tensor X is transformed into a latent state tensor Z and an error tensor ε such that and extract important features. Here, IGPDF (Inverse Gaussian Probability Density Function) represents the inverse function of the probability density function in Gaussian distribution.

(P3)lsステップ先の長期予測
結論として、前記式(1)は、以下の式(2)のように書き換えられる。
(P3) Long-term prediction for ls steps ahead In conclusion, the above equation (1) can be rewritten as the following equation (2).

Figure 0007440938000004
Figure 0007440938000004

ここで、Fは、予測モデルを表す。すなわち、時系列テンソルXが与えられたとき、提案手法は、Xを潜在状態テンソルZと誤差テンソルεとで要約することで重要な特徴を抽出し、それらに提案モデルFを適用し、lsステップ先の長期的な予測を高精度に行う。 Here, F represents a prediction model. That is, when a time series tensor X is given, the proposed method extracts important features by summarizing X with a latent state tensor Z and an error tensor ε, applies the proposed model F to them, and Make long-term predictions with high accuracy.

<処理(P1),(P2),(P3)についてのアルゴリズム>
上記では、多次元時系列テンソルXを要約し、効果的に予測するための提案モデルについて述べた。ここでは、前記式(1)を解決するためのアルゴリズムについて説明を行う。ここで問題となるのは、どのようにレジームやセグメントの数を決定するかである。本予測システムは、最小記述長(MDL:Minimum Description Length)の概念に基づき、適切なモデルを生成するための基準となる符号化スキームを導入する。
<Algorithm for processing (P1), (P2), (P3)>
Above, we have described a proposed model for summarizing and effectively predicting the multidimensional time series tensor X. Here, an algorithm for solving the above equation (1) will be explained. The problem here is how to determine the number of regimes and segments. This prediction system is based on the concept of minimum description length (MDL) and introduces a coding scheme that serves as a standard for generating an appropriate model.

1.モデル選択とデータ圧縮
直感的には、データが与えられたときのモデルのよさは、次の式(3)で表現できる。
1. Model selection and data compression Intuitively, the goodness of a model given data can be expressed by the following equation (3).

Figure 0007440938000005
Figure 0007440938000005

ここで,CostM(M)は、モデルMを表現するためのモデルコストを示し、CostC(X|M) は、モデルMが与えられたときのテンソルXの符号化コストを示す。αは、符号化コストに対する重み(デフォルトでは、α=1)であり、αの値が大きいほどより実データに正確なモデルを生成する(すなわち、セグメントの数m、レジームの数rが大きくなる)。 Here, Cost M (M) indicates the model cost for expressing the model M, and Cost C (X|M) indicates the encoding cost of the tensor X when the model M is given. α is the weight for the encoding cost (by default, α = 1), and a larger value of α produces a model that is more accurate to the real data (i.e., the number of segments m and the number of regimes r are larger) ).

・モデルコスト
具体的には、本予測システムの全パラメータ集合の表現コストは、以下の要素で構成される。
・Model cost Specifically, the representation cost of the entire parameter set of this prediction system is composed of the following elements.

Figure 0007440938000006
Figure 0007440938000006

なお、上記*2に示すlogは、整数のユニバーサル符号長を表し、log(x)≒log(x)+loglog(x)+…である(非特許文献23)。また、浮動小数点のコストをcFとすると、k個の状態を持つ単一のレジームパラメータθは、CostM(θ)=log(k)+cF(k+k2+2kd)、レジーム遷移行列Δは、CostM(Δ)=cFr2のコストを要する。 Note that log * shown in *2 above represents the universal code length of an integer, and log * (x)≈log 2 (x) + log 2 log 2 (x) +... (Non-Patent Document 23). Also, if the floating point cost is c F , then a single regime parameter θ with k states is Cost M (θ)=log * (k)+c F (k+k 2 +2kd), regime The transition matrix Δ requires a cost of Cost M (Δ)=c F r 2 .

・符号化コスト
モデルパラメータが与えられたときのXの符号化コストは、ハフマン符号を用いた情報圧縮により、負の対数尤度を用いて次の(数6)のように表現することができる。
・Encoding cost The encoding cost of X when model parameters are given can be expressed as follows (Equation 6) using negative log likelihood by information compression using Huffman codes. .

Figure 0007440938000007
Figure 0007440938000007

ここで、iと(i-1)番目のセグメントは、それぞれuとv番目のレジームに所属するものとし、X[si]は、Xに含まれるセグメントsiで構成される部分シーケンスを表す。P(X[si]|θu)は、θuが与えられたときのX[si]の尤度とする。結論として、提案アルゴリズムは、前記式(3)を最小化するようにXに含まれる時系列パターンの数rとその変化点の数mを決定する。 Here, the i and (i-1)th segments belong to the u and vth regimes, respectively, and X[s i ] represents a partial sequence composed of segments s i included in X. . P(X[s i ]|θ u ) is the likelihood of X[s i ] when θ u is given. In conclusion, the proposed algorithm determines the number r of time series patterns included in X and the number m of their changing points so as to minimize the above equation (3).

次いで、データをコスト関数に基づき要約しながら、長期的なラベル予測を実現するための具体的なアルゴリズムについて詳述する。 Next, a specific algorithm for realizing long-term label prediction will be detailed while summarizing data based on a cost function.

2.アルゴリズムの概要
本予測システムは、次のアルゴリズムで構成される。
2. Algorithm Overview This prediction system consists of the following algorithm.

・REGIMEGENRATION (P1):テンソルXに含まれる時系列パターンの種類と変化点を検出する。各時系列パターンのダイナミクスをモデルパラメータΘとして表現し、モデルパラメータ集合{m,r,S,Θ,F}を得る。 ・REGIMEGENRATION (P1): Detects the type and change points of time series patterns included in tensor X. The dynamics of each time-series pattern is expressed as model parameters Θ, and a model parameter set {m, r, S, Θ, F} is obtained.

・FEATUREEXTRACTION (P2):時系列パターンの要約情報{m,r,S,Θ,F}を用いて、オリジナルテンソルXを潜在状態テンソルZと誤差テンソルεとで表現する。 - FEATUREEXTRACTION (P2): Using the time series pattern summary information {m, r, S, Θ, F}, the original tensor X is expressed as a latent state tensor Z and an error tensor ε.

・SPLITCAST (P3):{Z,ε}のうち、あるウインドウts:teの部分シーケンス{Z(ts:te),ε(ts:te)}から故障の予兆となる特徴を抽出し、ls先の故障ラベルy(te+ls)を予測する。 ・SPLITCAST (P3): Features that indicate a failure from the partial sequence {Z(t s : t e ) ,ε(t s :t e )} of a certain window t s :t e in {Z, ε} , and predict the failure label y(t e +l s ) ahead of l s .

図3は、提案モデルの概要を示す。テンソルXが与えられたとき、提案手法は、Xの時系列パターンの時間遷移と設備固有のパターンを捉え,それに基づいてXを{Z,ε}で要約する。最終的に、得られた{Z,ε}からlsステップ先でのアラートラベルを予測し、出力する。 Figure 3 shows an overview of the proposed model. When a tensor X is given, the proposed method captures the time transition of the time series pattern of X and the equipment-specific pattern, and summarizes X as {Z, ε} based on that. Finally, the alert label for l s steps ahead is predicted and output from the obtained {Z, ε}.

3.RegimeGeneration(P1)
ここではアルゴリズムの詳細を述べる。時系列解析における根本的な問題は、時系列データに内在する隠された構造があるかどうかである。ここで扱う多次元時系列テンソルXは、複数の観点からの特徴を持つ。すなわち、時間ドメインの特徴と設備ドメインの特徴である。具体的には、スマート工場から得られる時系列センサデータは、各工程の時間遷移パターンと、設備固有のパターンとを持つ。そこで、以下では、与えられた時系列テンソルの根底にある構造を簡潔に要約した、多角的なパターン発見と、グループ化を同時に行う。
3. Regime Generation (P1)
Here we describe the details of the algorithm. A fundamental question in time series analysis is whether there is a hidden structure inherent in time series data. The multidimensional time series tensor X handled here has characteristics from multiple viewpoints. That is, they are characteristics of the time domain and characteristics of the equipment domain. Specifically, time-series sensor data obtained from smart factories has time transition patterns for each process and equipment-specific patterns. Therefore, in the following, we simultaneously perform grouping and multifaceted pattern discovery that concisely summarizes the underlying structure of a given time series tensor.

ここで、時系列テンソルの多角的解析のためのアルゴリズムであるV-SplitとH-Splitを提案する。V-Splitは、時間方向の観点からレジームを推定し、H-Splitは、設備ごとの特性をレジームとして表現する。これら2つのアルゴリズムを任意方向に行うことで効率的かつ効果的に重要なパターンを多角的に発見し、レジームとして要約する。具体的には、式(3)に基づき、以下の2つのアルゴリズムを繰り返す。 Here, we propose V-Split and H-Split, which are algorithms for multilateral analysis of time series tensors. V-Split estimates the regime from the perspective of time, and H-Split expresses the characteristics of each facility as a regime. By performing these two algorithms in any direction, important patterns can be efficiently and effectively discovered from multiple angles and summarized as a regime. Specifically, the following two algorithms are repeated based on equation (3).

・V-Split:テンソルXから時間遷移するパターンとその変化点を検出し、2つのグループ(すなわちレジーム)に分割する。それら2つのレジームに対し、モデルパラメータ{θ12,Δ}を推定する。 ・V-Split: Detects time-transition patterns and their changing points from tensor X, and divides it into two groups (i.e., regimes). For these two regimes, model parameters {θ 1 , θ 2 , Δ} are estimated.

・H-Split:テンソルXに表れる、ある1つのレジームから設備ごとの特徴を抽出し、2つのレジームに分割後、それらのレジームのモデルパラメータを推定する。 ・H-Split: Extracts the features of each equipment from one regime that appears in tensor X, divides it into two regimes, and then estimates the model parameters of those regimes.

上記のアルゴリズムにより、r = 1, 2, . . . とレジーム数が変化していく。もし、レジームθ0を2つのレジーム{θ12}に分割した際、コスト関数(式(3))の値が大きくなればθ0は最適とみなし、それ以上分割しない。生成された全てのレジームについて同様にコスト計算を繰り返し、コストが下がらなくなるまで上記の分割アルゴリズムを繰り返す。最終的に、コストが収束したときのセグメント、レジーム、モデルパラメータ{m,r,S,Θ,F}を出力して、RegimeGenerationを終了する。 Using the above algorithm, the number of regimes changes as r = 1, 2, . . . If, when regime θ 0 is divided into two regimes {θ 1 , θ 2 }, the value of the cost function (formula (3)) becomes large, θ 0 is considered optimal and is not divided any further. The cost calculation is repeated in the same way for all generated regimes, and the above division algorithm is repeated until the cost no longer decreases. Finally, the segment, regime, and model parameters {m, r, S, Θ, F} are output when the cost converges, and RegimeGeneration ends.

続いて、分割アルゴリズムV-Split、H-Splitのそれぞれについて述べる。 Next, the splitting algorithms V-Split and H-Split will be described.

(3-1)V-Split
多次元時系列テンソルXが与えられたとき、V-Splitは時間遷移の観点から2つのレジームを検出し、それらのモデルパラメータ{θ12,Δ}を推定する。高精度なモデルを生成するため、本予測システムは、セグメント/レジームの検出とモデルパラメータの更新を以下のように繰り返し行う。
(3-1)V-Split
When a multidimensional time series tensor X is given, V-Split detects two regimes from the perspective of time transition and estimates their model parameters {θ 1 , θ 2 , Δ}. In order to generate a highly accurate model, this prediction system repeatedly detects segments/regimes and updates model parameters as follows.

・(Phase 1) V-Assignment:2つのモデルパラメータが与えられたとき、それらに基づいて2つのセグメントセット{S1,S2}とパターンの変化点とを抽出する。 - (Phase 1) V-Assignment: When two model parameters are given, two segment sets {S 1 , S 2 } and pattern change points are extracted based on them.

・(Phase 2) ModelEstimation:2つのセグメントセットが与えられたとき、それらに基づいてモデルパラメータ{θ12,Δ}を更新する。 - (Phase 2) ModelEstimation: When two segment sets are given, model parameters {θ 1 , θ 2 , Δ} are updated based on them.

Figure 0007440938000008
Figure 0007440938000008

V-Splitの概要をアルゴリズム1(表2)に示す。上記のアルゴリズム1は期待値最大化法(EM:Expectation maximization)に基づいており、それぞれのフェーズがE,Mステップに対応している。 An overview of V-Split is shown in Algorithm 1 (Table 2). Algorithm 1 above is based on the expectation maximization method (EM), and each phase corresponds to E and M steps.

まず、最も単純な部分問題として、テンソルXと2つのモデルパラメータ{θ12,Δ}が与えられている場合を考える。V-Assignmentは、レジームのモデルパラメータに基づき、Xのパターンの変化点を検出することができる(表2のステップ5~7)。提案アルゴリズムの基本的な概念を説明するため、図4の遷移図を示す。2つのレジーム{θ12}の遷移を接続し、時刻ごとに2つのレジームの符号化コストを比較しながら、与えられたレジーム間のパターン遷移を推定する。本アルゴリズムは動的計画法の一種であるビタビアルゴリズム(非特許文献7)に基づき、符号化コストCostT(X|Θ)=-ln P(X|Θ)を計算する。具体的には、尤度P(X|Θ)は、次の(数7)ように計算される。 First, consider the case where a tensor X and two model parameters {θ 1 , θ 2 , Δ} are given as the simplest subproblem. V-Assignment can detect changing points in the pattern of X based on the model parameters of the regime (Steps 5 to 7 in Table 2). The transition diagram of FIG. 4 is shown to explain the basic concept of the proposed algorithm. The pattern transition between the given regimes is estimated by connecting the transitions of the two regimes {θ 1 , θ 2 } and comparing the encoding costs of the two regimes at each time. This algorithm calculates the encoding cost Cost T (X|Θ)=-ln P(X|Θ) based on the Viterbi algorithm (Non-Patent Document 7), which is a type of dynamic programming. Specifically, the likelihood P(X|Θ) is calculated as shown below (Equation 7).

Figure 0007440938000009
Figure 0007440938000009

ここで、P(X|Θ)iは、i番目のレジームθiへ遷移する時の尤度を示す。例として、P(X|Θ)1は、次の(数8)ように計算される。 Here, P(X|Θ) i indicates the likelihood of transitioning to the i-th regime θ i . As an example, P(X|Θ) 1 is calculated as follows (Equation 8).

Figure 0007440938000010
Figure 0007440938000010

ここで、p1;i(t)は、時刻tでのレジームθ1の潜在状態iの最大確率を表し、δ21は、レジームθ1からθ2へのレジーム遷移確率、maxu{p2;u(t-1)}は、前時刻t-1でのθ2の尤もらしい潜在状態である確率、π1;iは、θ1の潜在状態iの初期確率、b1;i(x(t))は、θ1の潜在状態iに対するx(t)の出力確率、そしてa1;jiは、θ1の潜在状態iから潜在状態jへの遷移確率を表す。ここで、時刻t=1において、レジームθ1である確率は、p1;i(1)=δ11π1;ib1;i(x(t))で与えられる。なお、モデルパラメータの推定には、BaumWelchアルゴリズム(非特許文献1)を用い、レジーム遷移確率Δ={δ11122122}を次の(数9)のように計算する。 Here, p 1;i (t) represents the maximum probability of latent state i in regime θ 1 at time t, δ 21 is the regime transition probability from regime θ 1 to θ 2 , max u {p 2 ;u (t-1)} is the probability of being a plausible latent state of θ 2 at the previous time t-1, π 1;i is the initial probability of latent state i of θ 1 , b 1;i (x (t)) represents the output probability of x(t) for latent state i of θ 1 , and a 1;ji represents the transition probability from latent state i to latent state j of θ 1 . Here, the probability of regime θ 1 at time t=1 is given by p 1;i (1)=δ 11 π 1;i b 1;i (x(t)). Note that the BaumWelch algorithm (non-patent document 1) is used to estimate the model parameters, and the regime transition probability Δ={δ 11 , δ 12 , δ 21 , δ 22 } is calculated as shown in the following (Equation 9). .

Figure 0007440938000011
Figure 0007440938000011

ここで、Σs∈S1 |s|は、レジームθ1に所属するセグメントの長さの総和を表し、N12は、θ1からθ2へのレジームの切り替え回数を示す。δ2122についても同様に計算できる。 Here, Σ s∈S1 |s| represents the total length of segments belonging to regime θ 1 , and N 12 represents the number of times the regime is switched from θ 1 to θ 2 . δ 21 and δ 22 can also be calculated in the same way.

(3-2)H-Split
これまで、時系列テンソルXの中から時間方向の特徴を捉えるためのアルゴリズム1のV-Splitについて説明した。現実問題として、時系列テンソルXは、パターンの時間遷移だけでなく、設備ごとの個体差を持っている。例えば、ある2つの設備において、同じ部品を加工する場合であっても、工程ごとに設備間でのセンサデータの振る舞いに個体差が生じる。本予測システムでは、このような設備固有の特徴を捉え、効果的にモデル化するためのアルゴリズムであるH-Splitを提案する。直感的には、本アルゴリズム2は、V-Splitと同様に、(Phase 1)レジーム分割と(Phase 2)モデル推定との2つのフェーズを繰り返し行うことで、適切なレジームとそのモデルパラメータを推定する。V-Splitと異なるのは、設備固有の特徴を捉えるためのアルゴリズムH-Assignment(Phase 1)である。H-Assignmentの概要をアルゴリズム2(表3)に示す。なお、(表3)に示すアルゴリズムは、(表2)中のステップ5の「V-Assignment」に対応する部分に該当し、H-Splitは、H-Assignmentに置き換えた内容で(表2)を実行すればよい。
(3-2)H-Split
So far, we have explained Algorithm 1, V-Split, for capturing temporal features from the time series tensor X. As a practical matter, the time series tensor X has not only the time transition of the pattern but also individual differences between each piece of equipment. For example, even when two pieces of equipment process the same part, individual differences occur in the behavior of sensor data between the pieces of equipment for each process. In this prediction system, we propose H-Split, an algorithm that captures these unique characteristics of equipment and effectively models them. Intuitively, like V-Split, Algorithm 2 estimates an appropriate regime and its model parameters by repeating two phases: (Phase 1) regime splitting and (Phase 2) model estimation. do. What differs from V-Split is the algorithm H-Assignment (Phase 1), which captures equipment-specific characteristics. An overview of H-Assignment is shown in Algorithm 2 (Table 3). The algorithm shown in (Table 3) corresponds to the part corresponding to "V-Assignment" in step 5 in (Table 2), and H-Split is the content replaced with H-Assignment (Table 2). All you have to do is execute.

Figure 0007440938000012
Figure 0007440938000012

これまでの典型的なクラスタリングアルゴリズムと異なり、H-Assignmentは、効果的に設備固有のパターンを抽出する。具体的には、テンソルXとモデルパラメータ{θ12}が与えられたとき、アルゴリズム2は、設備iのセグメントをあるレジームθに割り当てたときの符号化コストを以下の(数10)のように計算し、よりコストが小さくなるレジームに設備iのセグメントを割り当てる。 Unlike traditional clustering algorithms, H-Assignment effectively extracts equipment-specific patterns. Specifically , given the tensor Assign the segment of equipment i to the regime with the lower cost.

Figure 0007440938000013
Figure 0007440938000013

ここで、X[i]={s1, s2,. . . }は、設備iのセグメントのセットである。すなわち、同じ設備のセグメントは同じレジームに属するよう制約されている。 Here, X[i]={s 1 , s 2 ,. . . } is the set of segments of equipment i. That is, segments of the same equipment are constrained to belong to the same regime.

4.FeatureExtraction(P2)
ここまでは、多次元時系列テンソルから任意のタイミングで変化する時系列パターンを多角的に検出するためのアルゴリズムについて説明した。次に、故障発生の長期的な予測を実現するために、時系列データから故障の原因、あるいは予兆を示す特徴を抽出することである。一般に、高いサンプリングレートで収集されるセンサデータは、多くのノイズを含み、監視するシステムが複雑であるほどその正確なふるまいをモデル化することが難しくなる。そこで本予測システムでは、時系列パターンの特徴を利用してXを抽象化し、故障の予兆を効果的に抽出する手法を提案する。具体的には、時系列テンソルXとモデルパラメータ集合{m,r,S,Θ,F}とが与えられたとき、Xを時系列パターンに基づく潜在状態テンソルZとモデル化した際の誤差テンソルεとに分割する。
4.FeatureExtraction(P2)
So far, we have described an algorithm for multifacetedly detecting time series patterns that change at arbitrary timing from a multidimensional time series tensor. Next, in order to achieve long-term prediction of failure occurrence, it is necessary to extract features that indicate the cause or sign of failure from time-series data. Generally, sensor data collected at a high sampling rate contains a lot of noise, and the more complex the system being monitored, the more difficult it is to model its accurate behavior. Therefore, in this prediction system, we propose a method to abstract X using the characteristics of time-series patterns and effectively extract signs of failure. Specifically, given a time series tensor X and a model parameter set {m, r, S, Θ, F}, the error tensor when X is modeled as a latent state tensor Z based on a time series pattern Divide into ε.

今、r個のレジーム集合Θ={θ1, . . . ,θr}が与えられたとすると、各時刻tにおける、設備iのデータxi(t)={xij(t)}d j=1は、Θ内のレジームのいずれかの状態zi(t)に変換される。ここで、zi(t)は、自身と同じ状態に属する全データポイントの平均と分散の組{μ,σ}を示す。すなわち、潜在状態テンソルの次元は、Z∈Rw×2d×nとなる。続いて、Θが与えられたときの、時刻tにおける設備iのセンサjの計測値xij(t)∈Xの符号化誤差を事後確率p(xij(t)|θ)で表現する。すなわち、時系列テンソルX全体の符号化誤差は、ε∈Rw×d×nである。最終的に、2つの特徴を結合した系列X’∈Rw×3d×nを出力する。以上の処理により、入力データの情報を失うことなく、学習モデル推定の際に時系列方向の潜在的なふるまいを考慮することができる。 Now , assuming that r regime sets Θ ={ θ 1 , . =1 is transformed to any state z i (t) of the regime in Θ. Here, z i (t) represents the mean and variance set {μ,σ} of all data points belonging to the same state as itself. That is, the dimension of the latent state tensor is Z∈R w×2d×n . Next, when Θ is given, the encoding error of the measurement value x ij (t)∈X of sensor j of equipment i at time t is expressed as a posterior probability p(x ij (t)|θ). That is, the encoding error of the entire time series tensor X is εεR w×d×n . Finally, a sequence X'∈R w×3d×n, which is a combination of two features, is output. Through the above processing, potential behavior in the time series direction can be taken into account when estimating a learning model without losing information on input data.

5.SPLITCAST(P3)
本予測システムの最終的な目標は、与えられた時系列テンソルXから、lsステップ先の長期的な予測を高精度に行うことである。ラベル予測タスクの典型的な手法として、近年では深層学習に基づく手法が数多く提案されている。深層学習に基づく手法は、中間層を多層にしたり、中間層のユニット数を増やしたりすることで柔軟な学習を実現できる一方、層数やユニット数が増えるほど学習パラメータが多くなり計算時間が長くなる。また、過学習の問題もあり、問題を解決するためのテクニックが数多く存在する一方、どれも経験則に基づくものであり、人手を介した非常に細かなチューニングが必要となる。そこで本予測システムは、確率モデルに基づく特徴抽出手法と深層学習手法を組み合わせ、実データから抽出された特徴的な時系列パターンを学習することで、より小さなネットワークで学習でき、過学習の問題を軽減しながら効率的かつ効果的なアラートラベル予測を実現する。
5.SPLITCAST(P3)
The ultimate goal of this prediction system is to perform long-term prediction of l s steps ahead with high accuracy from a given time series tensor X. In recent years, many methods based on deep learning have been proposed as typical methods for label prediction tasks. Methods based on deep learning can achieve flexible learning by creating multiple intermediate layers or increasing the number of units in the intermediate layer, but as the number of layers and units increases, the number of learning parameters increases and the calculation time increases. Become. There is also the problem of overfitting, and while there are many techniques to solve this problem, they are all based on empirical rules and require extremely detailed manual tuning. Therefore, this prediction system combines a feature extraction method based on a probabilistic model and a deep learning method to learn characteristic time-series patterns extracted from real data, which enables learning with a smaller network and solves the problem of overfitting. Achieving efficient and effective alert label prediction while reducing

具体的には、テンソルX’={Z,ε}の時間発展の様子をモデル化するために、図3に示すように、LSTM(Long-short term memory)(非特許文献9)を適用する。LSTMは、入力サンプルを時系列データとして扱い、高次元の非線形ダイナミクスを学習可能にする深層学習モデルのひとつである。LSTMは、RNN(Recurrent neural network) の中間層のユニットをメモリユニットと呼ばれる特殊な構造に置き換えたもので、入力ゲート、出力ゲート、忘却ゲートの3種類を使用して時刻tのユニット値ctとユニットの出力値htとを制御する。各ゲートの出力値をそれぞれit, ot, ftとすると、LSTMの順伝播は、以下の式(数11)で表される。 Specifically, in order to model the time evolution of the tensor . LSTM is a deep learning model that treats input samples as time-series data and makes it possible to learn high-dimensional nonlinear dynamics. LSTM is an RNN (Recurrent neural network) in which the middle layer unit is replaced with a special structure called a memory unit, and it uses three types of input gates, output gates, and forgetting gates to calculate the unit value c t at time t. and the output value h t of the unit. When the output values of each gate are respectively i t , o t , f t , forward propagation of LSTM is expressed by the following equation (Equation 11).

Figure 0007440938000014
Figure 0007440938000014

本予測システムでは、活性化関数にsigmoid関数を使用する。LSTMは、公知のように、メモリユニットによって与えられた入力系列の長期依存性を学習することができるため、レジーム遷移とレジーム内部の状態遷移の過程で設備故障に対して特に重要な特徴を記憶しながら、設備の最新の稼働状況を要約した特徴ベクトルを抽出すると考えられる。 This prediction system uses the sigmoid function as the activation function. As is well known, LSTM is capable of learning long-term dependencies of input sequences given by a memory unit, and thus remembers features that are particularly important for equipment failures in the process of regime transitions and state transitions within regimes. It is conceivable to extract a feature vector that summarizes the latest operating status of the equipment.

最後に、htを用いてlsステップ先のラベル予測を行う。本実施形態では、時刻tにおける最新の部分シーケンスからのls先の故障予測を2クラス分類タスクとして扱い、出力を時刻t+lsにおける故障発生確率とする。したがって、本予測システムの最終的な出力は、(数12)で示すようになる。 Finally, use h t to predict the label for l s steps ahead. In this embodiment, prediction of a failure in the future from the latest partial sequence at time t is handled as a two-class classification task, and the output is the probability of failure occurrence at time t+ l s . Therefore, the final output of this prediction system is as shown in (Equation 12).

Figure 0007440938000015
Figure 0007440938000015

また、本予測システムにおけるモデルが最小化すべき目的関数は、BCE(Binary cross entropy)となり、モデル学習時のバッチサイズをN、各入力サンプルiに対する本予測システムにおける出力値をy^ iとすると、(数13)で示すように表される。 In addition, the objective function that the model in this prediction system should minimize is BCE (Binary cross entropy), and if the batch size during model learning is N and the output value in this prediction system for each input sample i is y ^ i , It is expressed as shown in (Equation 13).

Figure 0007440938000016
Figure 0007440938000016

ここで重要な点として、本予測システムは、比較的小さなユニット数(=10)、かつシンプルな構造のモデルを用いながら、以下の評価実験に示すように、非常に高い性能を示している。 The important point here is that this prediction system uses a model with a relatively small number of units (=10) and a simple structure, but has shown extremely high performance as shown in the evaluation experiment below.

(5-1)理論的な分析
本予測システムでの計算量は、データサイズに対し線形(O(wdn))である。以下、この補助(実質的な)定理について説明する。
(5-1) Theoretical analysis The amount of calculation in this prediction system is linear (O(wdn)) with respect to the data size. This auxiliary (substantive) theorem will be explained below.

各反復処理において、V-Assignment、H-Assignment、およびModelEstimationは、符号化コストとモデルパラメータの推定のためにO(wdnk2)の計算量を要する。ここで、wは設備数、dは次元数、nは時系列の長さ、kはレジーム{θi}r i=1の中の隠れ状態の数を示す。よって、RegimeGeneration (P1)の計算量は、O(#iter wdnk2)である。ここで、反復回数#iterと隠れ状態の個数kとは非常に小さい定数であるため、無視することができる。よって、RegimeGeneration の計算量は、O(wdn)となる。FeatureExtraction (P2)においては、各設備、各センサ、各時刻の潜在状態とモデル化した際の誤差を出力するため、計算量はO(wdn)である。最終的に、得られたモデルをユニット数uのLSTMで学習する際、計算量はO(u2 wdn)となる。ここで、本予測システムにおいては、複雑なニューラルネットワークを想定しておらず、ニューラルネットワークのユニット数uは、非常に小さい定数であるため無視できる。従って、本予測システムでの計算量はO(wdn)である。 In each iteration, V-Assignment, H-Assignment, and ModelEstimation require O(wdnk 2 ) computational complexity due to encoding cost and model parameter estimation. Here, w is the number of equipment, d is the number of dimensions, n is the length of the time series, and k is the number of hidden states in the regime {θ i } r i=1 . Therefore, the amount of calculation for RegimeGeneration (P1) is O(#iter wdnk 2 ). Here, the number of iterations #iter and the number k of hidden states are very small constants and can be ignored. Therefore, the amount of calculation for RegimeGeneration is O(wdn). In FeatureExtraction (P2), the amount of calculation is O(wdn) because it outputs the latent state of each equipment, each sensor, and each time and the error when modeling. Finally, when learning the obtained model using LSTM with the number of units u, the amount of calculation becomes O(u 2 wdn). Here, in this prediction system, a complicated neural network is not assumed, and the number u of units of the neural network is a very small constant and can therefore be ignored. Therefore, the amount of calculation in this prediction system is O(wdn).

<評価実験>
本予測システムの有効性を検証するため、図2の具体例を適用して、実データを用いた実験を行った。本実験では、以下の項目について検証した。
<Evaluation experiment>
In order to verify the effectiveness of this prediction system, we applied the specific example in Figure 2 and conducted an experiment using actual data. In this experiment, the following items were verified.

(1)設備故障の長期的予測に対する提案手法の精度
(2)設備のリアルタイム監視に対する計算時間の検証
実験は128GBのメモリ、NVIDIA TITAN V 12GBのGPU搭載のLinux(登録商標)(Ubuntu 18.04 LTS)マシン上で実施した。また、データセットは、平均値と分散値で正規化(z-normalization)して使用した。
(1) Accuracy of the proposed method for long-term prediction of equipment failures
(2) Verification experiments on calculation time for real-time monitoring of equipment were conducted on a Linux (registered trademark) (Ubuntu 18.04 LTS) machine equipped with 128 GB of memory and NVIDIA TITAN V 12 GB GPU. In addition, the data set was used after normalization (z-normalization) using the mean value and variance value.

1.本予測システムの予測精度
与えられた時系列テンソルに対する故障予測精度について検証した。比較例として、一般的な2値予測モデルであるロジスティック回帰(LR:Logistic regression)(非特許文献1)と再帰型ニューラルネットワークモデルであるRNN(Recurrent neural network)、GRU(Gated recurrent unit)(非特許文献4)、LSTMとを採用した。LRでは、他の再帰型モデルを推定する際にミニバッチとして与える部分シーケンスから平均値、分散値、最大値、最小値を算出し、4次元の特徴ベクトルとしてラベル予測を行った。RNN,GRU,LSTMでは、実データを入力としてラベル予測を行った。
1. Prediction accuracy of this prediction system We verified the failure prediction accuracy for a given time series tensor. As a comparative example, we use a general binary prediction model, Logistic regression (LR) (Non-Patent Document 1), a recurrent neural network model, RNN (Recurrent neural network), and GRU (Gated recurrent unit). Patent Document 4) and LSTM were adopted. In LR, the mean value, variance value, maximum value, and minimum value were calculated from the partial sequence given as a mini-batch when estimating other recurrent models, and label prediction was performed as a four-dimensional feature vector. RNN, GRU, and LSTM performed label prediction using real data as input.

本予測システムに関して、予測ステップ数200、ウインドウサイズ400、符号化コストの重み(α=)1.0をデフォルトとして実験を行った。また、本予測システム(Proposed、図5)を含むすべての再帰型モデルについて、中間層のユニット数を10、出力層のユニット数は5とし、最適化アルゴリズムにはAdam(非特許文献12)を使用した。 評価指標にはAccuracyを使用し、5分割交差検証を行なった際の平均値を比較した。 Regarding this prediction system, we conducted an experiment with the number of prediction steps as 200, the window size as 400, and the encoding cost weight (α=) 1.0 as defaults. In addition, for all recurrent models including this prediction system (Proposed, Figure 5), the number of units in the intermediate layer is 10, the number of units in the output layer is 5, and Adam (Non-patent Document 12) is used as the optimization algorithm. used. Accuracy was used as the evaluation index, and the average values obtained when 5-fold cross validation was performed were compared.

使用したデータセットは、三菱重工エンジン&ターボチャージャ株式会社で2017年10月から3ヶ月間実際に稼働し、ベアリング・ハウジング加工を行っていた55の工場設備に取り付けられた、回転速度(Speed)、稼働電圧(Load)、設備温度(Temp) の3つのセンサによって5秒間隔で取得されたものである。スライディングウインドウで学習用サンプルを生成しており、設備自体が稼働していないときのサンプルは省いている。正常稼働時のサンプル数が62983、非常停止前のサンプル数が1069あり、学習に偏りが生じるため、非常停止時のサンプル数に正常稼働時のサンプル数を揃え、結果として1069×2サンプルを用い実験を行った。 The data set used was the rotational speed (Speed) installed in 55 factory equipment that was actually in operation at Mitsubishi Heavy Industries Engine & Turbocharger Corporation for three months from October 2017 and was processing bearing housings. , operating voltage (Load), and equipment temperature (Temp) at 5-second intervals. Training samples are generated using a sliding window, and samples taken when the equipment itself is not in operation are omitted. The number of samples during normal operation is 62983, and the number of samples before emergency stop is 1069, which causes bias in learning. Therefore, the number of samples during emergency stop is equal to the number of samples during normal operation, and as a result, 1069 × 2 samples are used. We conducted an experiment.

(1)予測先ステップ数を変化させたときの予測精度
図5は、予測先のステップ数lsを変化させたときの精度の比較図である。図中、比較例の種別表記とデータ表示順(左右)とは対応している。本実験は、異なるlsごとにサンプルを生成し、学習と予測を行った。比較例は、ランダムに予測した場合と同程度(Accuracy=0.5)の予測精度を示す一方で、本予測システムでは、いずれの条件下でも優れた性能を示している。この結果から、非常停止の要因は、温度の上昇や稼働電圧の低下といった単純なものではなく、非線形性を有する複雑な事象だと考えられる。本予測システムは、実データに含まれる時系列パターンを考慮して各時刻のダイナミクスを捉えることができるため、他の再帰型モデルと比べて効果的に非常停止の要因を抽出することに成功した。
(1) Prediction accuracy when changing the number of prediction destination steps FIG. 5 is a comparison diagram of accuracy when changing the prediction destination step number l s . In the figure, the type notation of the comparative example and the data display order (left and right) correspond. In this experiment, samples were generated for each different l s , and learning and prediction were performed. While the comparative example shows prediction accuracy comparable to that of random prediction (Accuracy=0.5), the present prediction system shows excellent performance under all conditions. From this result, it is thought that the cause of the emergency stop is not a simple one such as a rise in temperature or a drop in operating voltage, but a complex event with nonlinearity. This prediction system can capture the dynamics at each time by taking into account the time-series patterns contained in the actual data, so it has succeeded in extracting the causes of emergency stops more effectively than other recursive models. .

(2)ウインドウサイズを変化させたときの予測精度
図6は、ネットワーク学習時に使用するミニバッチのウインドウ幅を変化させたときの予測精度の比較図である。本予測システムは、異なるウインドウ幅のデータに対しても安定して高い性能を示している。
(2) Prediction accuracy when changing window size FIG. 6 is a comparison diagram of prediction accuracy when changing the window width of the mini-batch used during network learning. This prediction system shows stable and high performance even for data with different window widths.

(3)予測結果の適合率と再現率
図7は、予測結果の適合率(Precision)と再現率(Recall)とを示す図である。適合率は、予測されたイベントの合計数とそのうち正解であったイベントの合計数の割合を示す。再現率は、全てのイベントの正解値の数と予測されたイベントの中で正解した合計数の割合を示す。両者とも、精度が高い場合には、1に近づく。本予測システムはどちらの指標に対しても優れた性能を示している。
(3) Precision and recall of prediction results FIG. 7 is a diagram showing precision and recall of prediction results. Precision rate indicates the ratio of the total number of predicted events to the total number of correct events. Recall rate indicates the ratio of the number of correct values for all events to the total number of correct values among predicted events. Both approaches 1 when the accuracy is high. This prediction system shows excellent performance for both indicators.

(4)発見セグメント数に対する予測精度
図8は、検出セグメント数mに対する本予測システムの予測精度を示す図である。符号化コストの重みであるαを、0.1~10まで変化させながら、検出セグメント数を増減させた。図8に示すように、本予測システムによって分割したセグメントの数によって予測精度は大きく変化している。mが小さい場合、時系列データから十分な要約情報を得ることができず予測精度が低下している。また、mが大きい場合にも同様に、要約情報が実データに近づくため予測精度が低下している。この結果からも、時系列テンソルからのパターン検出が故障予測の精度向上に有効であると考えられる。本実験では、m=1000のとき、最も良い結果(Accuracy=0.88)が得られた。結論として、本予測システムは比較例に対し、平均して約62%もの精度向上を達成した。
(4) Prediction accuracy with respect to the number of discovered segments FIG. 8 is a diagram showing the prediction accuracy of this prediction system with respect to the number of detected segments m. The number of detected segments was increased or decreased while changing α, which is the weight of the encoding cost, from 0.1 to 10. As shown in FIG. 8, the prediction accuracy varies greatly depending on the number of segments divided by this prediction system. When m is small, it is not possible to obtain sufficient summary information from time-series data, resulting in a decrease in prediction accuracy. Similarly, when m is large, the prediction accuracy decreases because the summary information approaches the actual data. This result also suggests that pattern detection from time-series tensors is effective in improving failure prediction accuracy. In this experiment, the best result (Accuracy=0.88) was obtained when m=1000. In conclusion, this prediction system achieved an average accuracy improvement of about 62% compared to the comparative example.

(5)学習サンプル数と予測精度の関係
実運用において、学習サンプルが少ない場合、十分な精度を得られない可能性がある。図9は、学習サンプル数と予測精度との関係性を示す図である。本予測システムは、少ないサンプル数においても比較例より高い性能を示しており、学習サンプル数が増大するにつれて、より高い精度で故障イベントを予測することができている。
(5) Relationship between the number of training samples and prediction accuracy In actual operation, if the number of training samples is small, sufficient accuracy may not be obtained. FIG. 9 is a diagram showing the relationship between the number of learning samples and prediction accuracy. This prediction system shows higher performance than the comparative example even with a small number of samples, and as the number of learning samples increases, it is able to predict failure events with higher accuracy.

2.提案手法の計算速度
図10は、設備数w、センサ数d、シーケンス長nをそれぞれ変化させたときの本予測システムの計算コストを示す図である。より具体的には、入力データを時系列パターンに分割し、モデルの学習を10 epoch分、終えたときの計算時間である。本予測システムは、与えられた時系列テンソルから効率的に時系列パターンを検出するため、すべての実験においてデータサイズに線形な計算量であり(すなわち、O(wdn))、大規模センサデータの解析に適した手法であることが分かった。
2. Calculation speed of the proposed method FIG. 10 is a diagram showing the calculation cost of the present prediction system when the number of equipment w, the number of sensors d, and the sequence length n are varied. More specifically, it is the calculation time when the input data is divided into time-series patterns and the model training is completed for 10 epochs. This prediction system efficiently detects time-series patterns from a given time-series tensor, so the amount of calculation is linear with the data size in all experiments (i.e., O(wdn)), and it is This method was found to be suitable for analysis.

以上のように、本予測システムは、例えば工場設備で得られた実データを用いて実験を行い、本予測システムが複雑な時系列パターンを適切にモデル化し、長期的な故障予測を高精度に行えることが確認でき、さらに既存の比較例と比較して大幅な精度と性能の向上を達成していることが確認できた。 As described above, this prediction system has been tested using actual data obtained from factory equipment, for example, and has demonstrated that this prediction system can appropriately model complex time-series patterns and accurately predict long-term failures. It was confirmed that this method can be used, and it was also confirmed that a significant improvement in accuracy and performance was achieved compared to existing comparative examples.

なお、本発明は、工場設備に対するアラートイベントの予測に限らず、車載の各種センサを利用して各車両の走行状態による故障などのアラートラベル予測、各種の生体情報に基づくアラートラベルの予測などに適用可能である。また、アラートラベルは、不良、故障、品質低下の他、適用対象に応じて種々のアラート内容を設定することが可能である。また、予測処理は、人工知能(AI)に限定されず、他の手法を採用してもよい。 The present invention is not limited to predicting alert events for factory equipment, but can also be used to predict alert labels such as failures depending on the driving condition of each vehicle using various on-board sensors, and predict alert labels based on various biological information. Applicable. Further, the alert label can be set with various alert contents depending on the application target, in addition to defects, failures, and quality deterioration. Furthermore, the prediction processing is not limited to artificial intelligence (AI), and other techniques may be employed.

以上説明したように、本発明に係るイベント予測システムは、複数の観測対象にそれぞれ配置された複数種のセンサから継続的に収集される時系列センサデータから多角的な動的パターンのモデルパラメータの抽出を継続的に行う第1の特徴量抽出手段と、前記モデルパラメータを用いて前記時系列センサデータをモデル化情報とその誤差情報とを含む要約情報に順次特徴量化する第2の特徴量抽出手段と、前記要約情報を入力として所定時間先での所定のイベントの発生確率を出力する予測手段とを備えることが好ましい。 As explained above, the event prediction system according to the present invention can estimate model parameters of multifaceted dynamic patterns from time-series sensor data continuously collected from multiple types of sensors placed on multiple observation targets. a first feature extraction means that continuously performs extraction, and a second feature extraction that sequentially converts the time-series sensor data into features using the model parameters into summary information including modeling information and its error information. It is preferable to include a prediction means for inputting the summary information and outputting a probability of occurrence of a predetermined event in a predetermined time period.

また、本発明に係るイベント予測方法は、コンピュータの第1の特徴量抽出部が、複数の観測対象にそれぞれ配置された複数種のセンサから継続的に収集され、記憶部に記憶された時系列センサデータから多角的な動的パターンのモデルパラメータの抽出を継続的に行って前記記憶部に記憶し、前記コンピュータの第2の特徴量抽出部が、前記モデルパラメータ及び前記時系列センサデータを前記記憶部から読み出して、前記時系列センサデータをモデル化情報とその誤差情報とを含む要約情報に順次特徴量化して前記記憶部に記憶し、前記コンピュータの予測部が、前記要約情報を前記記憶部から読み出して入力とし、所定時間先での所定のイベントの発生確率を出力することが好ましい。 Further, in the event prediction method according to the present invention, the first feature extracting unit of the computer continuously collects data from multiple types of sensors placed on multiple observation targets, and stores the time series in the storage unit. Model parameters of a multifaceted dynamic pattern are continuously extracted from sensor data and stored in the storage unit, and a second feature extracting unit of the computer extracts the model parameters and the time-series sensor data from the sensor data. The time-series sensor data is read out from the storage unit and sequentially converted into feature quantities into summary information including modeling information and its error information, and stored in the storage unit, and the prediction unit of the computer converts the summary information into the storage unit. It is preferable that the probability of occurrence of a predetermined event in a predetermined period of time is output.

また、本発明に係るプログラムは、複数の観測対象にそれぞれ配置された複数種のセンサから継続的に収集される時系列センサデータから多角的な動的パターンのモデルパラメータの抽出を継続的に行う第1の特徴量抽出手段、前記モデルパラメータを用いて前記時系列センサデータをモデル化情報とその誤差情報とを含む要約情報に順次特徴量化する第2の特徴量抽出手段、及び前記要約情報を入力として所定時間先での所定のイベントの発生確率を出力する予測手段として、コンピュータを機能させることが好ましい。 Further, the program according to the present invention continuously extracts model parameters of multifaceted dynamic patterns from time-series sensor data continuously collected from multiple types of sensors placed on multiple observation targets. a first feature extracting means; a second feature extracting means for sequentially converting the time-series sensor data into summary information including modeling information and its error information using the model parameters; Preferably, the computer functions as a prediction means that outputs as input the probability of occurrence of a predetermined event in a predetermined time period.

これらの発明によれば、複数の観測対象にそれぞれ配置された複数種のセンサから継続的に時系列センサデータが収集され、収集された時系列センサデータから多角的な動的パターンのモデルパラメータの抽出が、第1の特徴量抽出手段によって継続的に行われる。次いで、第2の特徴量抽出手段によって、前記モデルパラメータを用いて前記時系列センサデータがモデル化情報とその誤差情報とを含む要約情報に順次特徴量化される。そして、予測手段によって、前記要約情報を入力として所定時間先での所定のイベントの発生確率が出力される。従って、時系列センサデータ内に含まれる時系列パターンに関する事前知識を必要とせず、パターン(レジーム)の変化点と潜在的な振る舞いとが、例えば時間遷移と観測対象間の多角的な観点とから把握される。また、大規模な時系列センサデータの特徴的なパターンを発見し、それらを用いて長期間先のイベント予測が可能となる。なお、センサの配置は、観測対象に直接設置され、乃至観測対象を遠隔的に観測可能な態様で設置でもよい。 According to these inventions, time-series sensor data is continuously collected from multiple types of sensors placed on multiple observation targets, and model parameters of multifaceted dynamic patterns are determined from the collected time-series sensor data. Extraction is continuously performed by the first feature extraction means. Next, the time-series sensor data is sequentially converted into features by the second feature extracting means using the model parameters into summary information including modeling information and its error information. Then, the prediction means inputs the summary information and outputs the probability of occurrence of a predetermined event in a predetermined time period. Therefore, there is no need for prior knowledge of time-series patterns contained in time-series sensor data, and changing points and potential behavior of patterns (regimes) can be determined based on, for example, time transitions and multiple perspectives between observation targets. be understood. Furthermore, it becomes possible to discover characteristic patterns in large-scale time-series sensor data and use them to predict events over a long period of time. Note that the sensors may be placed directly on the observation target, or may be installed in such a manner that the observation target can be observed remotely.

また、前記第1の特徴量抽出手段は、前記動的パターンを時間方向及び前記観測対象間におけるセグメント及びそのパターン化を行って検出することが好ましい。この構成によれば、動的パターンが多角的に抽出されるので、精度の低下を抑止しつつ処理に要するデータ量の低減が図れる。 Further, it is preferable that the first feature extraction means detects the dynamic pattern by segmenting the dynamic pattern in the time direction and between the observation objects and patterning the segment. According to this configuration, since dynamic patterns are extracted from multiple angles, it is possible to reduce the amount of data required for processing while suppressing a decrease in accuracy.

また、前記第1の特徴量抽出手段は、前記セグメントの個数の設定を、コスト関数を用いて行うことが好ましい。この構成によれば、時系列センサデータのセグメント化において、セグメント数がコスト関数によってデータ量及び処理時間を考慮した最適値に設定される。 Further, it is preferable that the first feature extraction means sets the number of segments using a cost function. According to this configuration, in segmenting time-series sensor data, the number of segments is set to an optimal value using a cost function in consideration of data amount and processing time.

また、前記予測手段は、ニューラルネットワークモデルに設定されたパラメータに基づいて前記所定のイベントの発生確率を得ることが好ましい。この構成によれば、小型かつシンプルな構造のモデルで高精度の予測が可能となる。 Further, it is preferable that the prediction means obtains the probability of occurrence of the predetermined event based on parameters set in a neural network model. According to this configuration, highly accurate predictions can be made using a model with a small and simple structure.

また、前記予測手段は、ニューラルネットワークモデルにLSTM(Long-short term memory)を適用することが好ましい。この構成によれば、LSTMによって、深層学習モデルでの適用が可能であり、また、入力系列の長期依存性を学習することができるため、長期間先の高精度での予測が可能となる。 Further, it is preferable that the prediction means applies LSTM (Long-short term memory) to the neural network model. According to this configuration, LSTM can be applied to deep learning models, and long-term dependence of input sequences can be learned, making it possible to make highly accurate predictions for a long period of time.

また、本発明は、前記第2の特徴量抽出手段で得た前記要約情報を所定期間分取り込み、前記予測手段と同一の構成を有する学習用予測手段で機械学習をさせ、学習結果で得られたパラメータを前記予測手段に更新する機械学習装置を備えることが好ましい。この構成によれば、予測精度を漸次向上させることが可能となる。 Further, the present invention captures the summary information obtained by the second feature extracting means for a predetermined period, performs machine learning with a learning prediction means having the same configuration as the prediction means, and obtains a learning result. It is preferable to include a machine learning device that updates the predicted parameters to the prediction means. According to this configuration, it is possible to gradually improve prediction accuracy.

1 イベント予測システム
11 データ取込処理部
12 特徴量抽出部(第1、第2の特徴量抽出手段)
13 予測部
14 パラメータ更新部
100 記憶部
20 観測対象
21 センサ群
30 機械学習装置
1 Event prediction system 11 Data import processing section 12 Feature amount extraction section (first and second feature amount extraction means)
13 Prediction unit 14 Parameter update unit 100 Storage unit 20 Observation target 21 Sensor group 30 Machine learning device

Claims (4)

複数の観測対象にそれぞれ配置された複数種のセンサから継続的に収集され、かつts:te(現時点teから過去方向のtsまでの所定の期間。)のウインドウに表れる時系列センサデータから多角的な動的パターンのモデルパラメータを含むモデルパラメータ集合の抽出を継続的に行う第1の特徴量抽出手段と、
前記時系列センサデータと前記モデルパラメータ集合とが与えられたとき、前記モデルパラメータ集合を用いて前記時系列センサデータを時系列パターンに基づくモデル化情報Z(ts:te)とモデル化した際の前記時系列センサデータと前記モデル化情報Z(ts:te)との誤差情報ε(ts:te)とに分割して順次特徴量化する第2の特徴量抽出手段と、
前記モデル化情報Z(ts:te)と誤差情報ε(ts:te)とを入力として所定時間先での所定のイベントの発生確率を出力する予測手段とを備え、
前記第1の特徴量抽出手段は、前記動的パターンを時間方向及び前記観測対象間におけるセグメント及びそのパターン化を行って検出し、かつ前記セグメントの個数をコスト関数を用いて設定し、
前記モデルパラメータ集合は、{m,r,S,Θ,F}であり、
前記第2の特徴量抽出手段は、隠れマルコフモデルを用いて、前記モデル化情報Z(ts:te)とモデル化した際の誤差情報ε(ts:te)とに要約し、
前記予測手段は、LSTM(Long-short term memory)を適用したニューラルネットワークモデルに設定されたパラメータに基づいて前記所定のイベントの発生確率を得ることを特徴とするイベント予測システム。
但し、mは、時系列センサデータ内のセグメントの個数、rは、そのうちのレジームの個数、Sは、各セグメントの開始点、終了点及び観測対象の番号を表すセグメント集合、Θは、各レジームのモデルパラメータ、及びFは、セグメントが所属するレジームの番号。
Multifaceted analysis is performed from time-series sensor data that is continuously collected from multiple types of sensors placed on multiple observation targets and appears in the window of ts:te (a predetermined period from the current time te to the past direction ts). a first feature extraction means that continuously extracts a model parameter set including model parameters of a dynamic pattern;
When the time-series sensor data and the model parameter set are given, the time-series sensor data is modeled using the model parameter set as modeling information Z(ts:te) based on the time-series pattern. a second feature extraction means that sequentially converts the time-series sensor data and the error information ε(ts:te) of the modeling information Z(ts:te) into features;
a prediction means for inputting the modeling information Z(ts:te) and the error information ε(ts:te) and outputting the probability of occurrence of a predetermined event in a predetermined time ahead;
The first feature extracting means detects the dynamic pattern by segmenting and patterning the dynamic pattern in the time direction and between the observation targets, and sets the number of the segments using a cost function,
The model parameter set is {m, r, S, Θ, F},
The second feature extracting means uses a hidden Markov model to summarize the modeling information Z(ts:te) and error information ε(ts:te) during modeling,
The event prediction system is characterized in that the prediction means obtains the probability of occurrence of the predetermined event based on parameters set in a neural network model applying LSTM (Long-short term memory).
However, m is the number of segments in the time-series sensor data, r is the number of regimes among them, S is the segment set representing the start point, end point, and observation target number of each segment, Θ is the number of each regime. model parameters, and F is the number of the regime to which the segment belongs.
前記第2の特徴量抽出手段で得た前記モデル化情報Z(ts:te)と前記誤差情報ε(ts:te)とを所定期間分取り込み、前記予測手段と同一の構成を有する学習用予測手段で機械学習をさせ、学習結果で得られたパラメータを前記予測手段に更新する機械学習装置を備えた請求項1に記載のイベント予測システム。 A learning prediction having the same configuration as the prediction means takes in the modeling information Z(ts:te) and the error information ε(ts:te) obtained by the second feature extracting means for a predetermined period. 2. The event prediction system according to claim 1 , further comprising a machine learning device that performs machine learning in said prediction means and updates said prediction means with parameters obtained as a learning result . コンピュータの第1の特徴量抽出手段が、複数の観測対象にそれぞれ配置された複数種のセンサから継続的に収集され、かつts:te(現時点teから過去方向のtsまでの所定の期間。)のウインドウに表れる時系列センサデータから多角的な動的パターンのモデルパラメータを含むモデルパラメータ集合の抽出を継続的に行い、The first feature extracting means of the computer continuously collects data from a plurality of types of sensors placed on a plurality of observation targets, and ts:te (a predetermined period from the current time te to the past direction ts). We continuously extract model parameter sets including model parameters of multifaceted dynamic patterns from time-series sensor data appearing in the window of
コンピュータの第2の特徴量抽出手段が、前記時系列センサデータと前記モデルパラメータ集合とが与えられたとき、前記モデルパラメータ集合を用いて前記時系列センサデータを時系列パターンに基づくモデル化情報Z(ts:te)とモデル化した際の前記時系列センサデータと前記モデル化情報Z(ts:te)との誤差情報ε(ts:te)とに分割して順次特徴量化し、When the second feature extracting means of the computer is given the time-series sensor data and the model parameter set, the second feature extracting means of the computer converts the time-series sensor data into modeling information Z based on the time-series pattern using the model parameter set. (ts:te) and error information ε(ts:te) between the time-series sensor data when modeled and the modeling information Z(ts:te), and sequentially convert them into features,
コンピュータの予測手段が、前記モデル化情報Z(ts:te)と誤差情報ε(ts:te)とを入力として所定時間先での所定のイベントの発生確率を出力し、さらに、A prediction means of the computer inputs the modeling information Z(ts:te) and error information ε(ts:te) and outputs the probability of occurrence of a predetermined event in a predetermined time ahead, and further,
前記第1の特徴量抽出手段は、前記動的パターンを時間方向及び前記観測対象間におけるセグメント及びそのパターン化を行って検出し、かつ前記セグメントの個数をコスト関数を用いて設定し、The first feature extracting means detects the dynamic pattern by segmenting and patterning the dynamic pattern in the time direction and between the observation targets, and sets the number of the segments using a cost function,
前記モデルパラメータ集合は、{m,r,S,Θ,F}であり、The model parameter set is {m, r, S, Θ, F},
前記第2の特徴量抽出手段は、隠れマルコフモデルを用いて、前記モデル化情報Z(ts:te)とモデル化した際の誤差情報ε(ts:te)とに要約し、The second feature extracting means uses a hidden Markov model to summarize the modeling information Z(ts:te) and error information ε(ts:te) during modeling,
前記予測手段は、LSTM(Long-short term memory)を適用したニューラルネットワークモデルに設定されたパラメータに基づいて前記所定のイベントの発生確率を得ることを特徴とするイベント予測方法。The event prediction method is characterized in that the prediction means obtains the probability of occurrence of the predetermined event based on parameters set in a neural network model applying LSTM (Long-short term memory).
但し、mは、時系列センサデータ内のセグメントの個数、rは、そのうちのレジームの個数、Sは、各セグメントの開始点、終了点及び観測対象の番号を表すセグメント集合、Θは、各レジームのモデルパラメータ、及びFは、セグメントが所属するレジームの番号。However, m is the number of segments in the time-series sensor data, r is the number of regimes among them, S is the segment set representing the start point, end point, and observation target number of each segment, Θ is the number of each regime. model parameters, and F is the number of the regime to which the segment belongs.
複数の観測対象にそれぞれ配置された複数種のセンサから継続的に収集され、かつts:te(現時点teから過去方向のtsまでの所定の期間。)のウインドウに表れる時系列センサデータから多角的な動的パターンのモデルパラメータを含むモデルパラメータ集合の抽出を継続的に行う第1の特徴量抽出手段、Multifaceted analysis is performed from time-series sensor data that is continuously collected from multiple types of sensors placed on multiple observation targets and appears in the window of ts:te (a predetermined period from the current time te to the past direction ts). a first feature extraction means that continuously extracts a model parameter set including model parameters of a dynamic pattern;
前記時系列センサデータと前記モデルパラメータ集合とが与えられたとき、前記モデルパラメータ集合を用いて前記時系列センサデータを時系列パターンに基づくモデル化情報Z(ts:te)とモデル化した際の前記時系列センサデータと前記モデル化情報Z(ts:te)との誤差情報ε(ts:te)とに分割して順次特徴量化する第2の特徴量抽出手段、及びWhen the time-series sensor data and the model parameter set are given, the time-series sensor data is modeled using the model parameter set as modeling information Z(ts:te) based on the time-series pattern. a second feature extraction means that sequentially converts the time-series sensor data and error information ε(ts:te) between the time-series sensor data and the modeling information Z(ts:te) into features;
前記モデル化情報Z(ts:te)と誤差情報ε(ts:te)とを入力として所定時間先での所定のイベントの発生確率を出力する予測手段として、コンピュータを機能させ、さらに、The computer functions as a prediction means that inputs the modeling information Z (ts: te) and error information ε (ts: te) and outputs the probability of occurrence of a predetermined event in a predetermined time ahead, and further,
前記第1の特徴量抽出手段は、前記動的パターンを時間方向及び前記観測対象間におけるセグメント及びそのパターン化を行って検出し、かつ前記セグメントの個数をコスト関数を用いて設定し、The first feature extracting means detects the dynamic pattern by segmenting and patterning the dynamic pattern in the time direction and between the observation targets, and sets the number of the segments using a cost function,
前記モデルパラメータ集合は、{m,r,S,Θ,F}であり、The model parameter set is {m, r, S, Θ, F},
前記第2の特徴量抽出手段は、隠れマルコフモデルを用いて、前記モデル化情報Z(ts:te)とモデル化した際の誤差情報ε(ts:te)とに要約し、 The second feature extracting means uses a hidden Markov model to summarize the modeling information Z(ts:te) and error information ε(ts:te) during modeling,
前記予測手段は、LSTM(Long-short term memory)を適用したニューラルネットワークモデルに設定されたパラメータに基づいて前記所定のイベントの発生確率の発生確率を出力する、プログラム。The prediction means is a program that outputs an occurrence probability of the predetermined event based on parameters set in a neural network model to which LSTM (Long-short term memory) is applied.
但し、mは、時系列センサデータ内のセグメントの個数、rは、そのうちのレジームの個数、Sは、各セグメントの開始点、終了点及び観測対象の番号を表すセグメント集合、Θは、各レジームのモデルパラメータ、及びFは、セグメントが所属するレジームの番号。However, m is the number of segments in the time-series sensor data, r is the number of regimes among them, S is the segment set representing the start point, end point, and observation target number of each segment, Θ is the number of each regime. model parameters, and F is the number of the regime to which the segment belongs.
JP2021573071A 2020-01-22 2021-01-12 Event prediction system, event prediction method and program Active JP7440938B2 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2020008388 2020-01-22
JP2020008388 2020-01-22
PCT/JP2021/000606 WO2021149528A1 (en) 2020-01-22 2021-01-12 Event predicting system, event predicting method, and program

Publications (3)

Publication Number Publication Date
JPWO2021149528A1 JPWO2021149528A1 (en) 2021-07-29
JPWO2021149528A5 JPWO2021149528A5 (en) 2022-08-17
JP7440938B2 true JP7440938B2 (en) 2024-02-29

Family

ID=76992209

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021573071A Active JP7440938B2 (en) 2020-01-22 2021-01-12 Event prediction system, event prediction method and program

Country Status (3)

Country Link
US (1) US20230058585A1 (en)
JP (1) JP7440938B2 (en)
WO (1) WO2021149528A1 (en)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US12561555B2 (en) * 2021-02-25 2026-02-24 International Business Machines Corporation Network of tensor time series
US20220358182A1 (en) * 2021-05-07 2022-11-10 International Business Machines Corporation Scalable error mitigation
JPWO2023149236A1 (en) * 2022-02-04 2023-08-10
DE112022005289T5 (en) * 2022-04-18 2024-08-29 Mitsubishi Electric Corporation Simulation program, simulation device and control method
CN115856208B (en) * 2022-11-17 2024-12-20 山西中谷科技股份有限公司 A method, terminal and system for detecting the operation and status of a rotating shaft of a rotating device
CN116723078A (en) * 2023-07-14 2023-09-08 中国电信股份有限公司 Cloud service failure early warning method and device
CN117493068B (en) * 2024-01-03 2024-03-26 安徽思高智能科技有限公司 Root cause positioning method, equipment and storage medium for micro-service system
CN118656665B (en) * 2024-08-19 2024-11-05 山东康吉诺技术有限公司 Deep learning model-based wind turbine gearbox bearing temperature state detection method
CN119809404B (en) * 2024-11-21 2025-10-17 国网上海市电力公司 A method for evaluating the potential of interruptible load demand response
CN120430882B (en) * 2025-07-08 2025-11-28 西北工业大学 Social network event prediction method and device

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005251185A (en) 2004-02-05 2005-09-15 Toenec Corp Electric equipment diagnostic system
WO2018012487A1 (en) 2016-07-12 2018-01-18 国立大学法人熊本大学 Forecasting device, parameter set production method and program

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2964507B2 (en) * 1989-12-12 1999-10-18 松下電器産業株式会社 HMM device
JP6276732B2 (en) * 2015-07-03 2018-02-07 横河電機株式会社 Equipment maintenance management system and equipment maintenance management method
US10504036B2 (en) * 2016-01-06 2019-12-10 International Business Machines Corporation Optimizing performance of event detection by sensor data analytics
JP6895816B2 (en) * 2017-06-15 2021-06-30 株式会社 日立産業制御ソリューションズ Abnormality diagnosis device, abnormality diagnosis method and abnormality diagnosis program

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005251185A (en) 2004-02-05 2005-09-15 Toenec Corp Electric equipment diagnostic system
WO2018012487A1 (en) 2016-07-12 2018-01-18 国立大学法人熊本大学 Forecasting device, parameter set production method and program

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
入船恭彰ほか,弱ラベルを用いた時系列データへの詳細ラベル付与,第11回データ工学と情報マネジメントに関するフォーラム (第17回日本データベース学会年次大会) [Online], 2019.03.06,2019年03月06日
山室冴ほか,深層学習を用いた時系列データの要約と分類,第10回データ工学と情報マネジメントに関するフォーラム (第16回日本データベース学会年次大会) [Online], 2018.03.06,2018年03月06日

Also Published As

Publication number Publication date
WO2021149528A1 (en) 2021-07-29
US20230058585A1 (en) 2023-02-23
JPWO2021149528A1 (en) 2021-07-29

Similar Documents

Publication Publication Date Title
JP7440938B2 (en) Event prediction system, event prediction method and program
Lindemann et al. A survey on anomaly detection for technical systems using LSTM networks
Esteban et al. Data mining in predictive maintenance systems: A taxonomy and systematic review
US12299084B2 (en) Artificial intelligence optimization platform
US8909582B2 (en) Hierarchical latent variable model estimation device, hierarchical latent variable model estimation method, and recording medium
KR20140041766A (en) Method of sequential kernel regression modeling for forecasting and prognostics
Hsu et al. Remaining useful life prediction based on state assessment using edge computing on deep learning
Ringsquandl et al. Semantic-guided feature selection for industrial automation systems
Hryniewicz et al. Bayesian analysis of time series using granular computing approach
KR20220145007A (en) Data Processing Method of Detecting and Recovering Missing Values, Outliers and Patterns in Tensor Stream Data
US20240289609A1 (en) System for training neural network to detect anomalies in event data
Tkachenko et al. Recovery of missing sensor data with GRNN-based cascade scheme
Jha et al. Symbolic analysis-based reduced order Markov modeling of time series data
Heyden et al. Adaptive Bernstein change detector for high-dimensional data streams
Nguyen et al. Robust active learning framework for structural reliability analysis using uncertainty quantification and flexible meta-model
Fang et al. Mixer-transformer: Adaptive anomaly detection with multivariate time series
Wu et al. Hybrid-Order Graph Embedded Distributed Encoder-Decoder for Multiunit Industrial Plant-Wide Process Monitoring
Kancharla et al. Applicability of AutoML to modeling of time-series data
Silva et al. Predictive maintenance for sensor enhancement in industry 4.0
Rahman Multivariate time series classification of sensor data from an industrial drying hopper: A deep learning approach
Liu et al. Efficient state change detection method for modeling stateful time series data
Tambuwal et al. DeepConAD: Deep and Confidence Prediction for Unsupervised Anomaly Detection in Time Series
CN106096063A (en) A kind of parallel half definition sorting technique and system for big data
Zhao et al. Data preprocessing techniques
Martinez Diffeomorphic Transformations for Time Series Analysis: An Efficient Approach to Nonlinear Warping

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220615

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220615

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230725

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230913

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231114

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240111

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240123

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240208

R150 Certificate of patent or registration of utility model

Ref document number: 7440938

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150