Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP6633403B2 - Analysis target determination apparatus and analysis target determination method - Google Patents
[go: Go Back, main page]

JP6633403B2 - Analysis target determination apparatus and analysis target determination method - Google Patents

Analysis target determination apparatus and analysis target determination method Download PDF

Info

Publication number
JP6633403B2
JP6633403B2 JP2016016950A JP2016016950A JP6633403B2 JP 6633403 B2 JP6633403 B2 JP 6633403B2 JP 2016016950 A JP2016016950 A JP 2016016950A JP 2016016950 A JP2016016950 A JP 2016016950A JP 6633403 B2 JP6633403 B2 JP 6633403B2
Authority
JP
Japan
Prior art keywords
data
analysis target
unit
analysis
target determination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016016950A
Other languages
Japanese (ja)
Other versions
JP2017138643A (en
Inventor
友近 信行
信行 友近
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kobe Steel Ltd
Original Assignee
Kobe Steel Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kobe Steel Ltd filed Critical Kobe Steel Ltd
Priority to JP2016016950A priority Critical patent/JP6633403B2/en
Publication of JP2017138643A publication Critical patent/JP2017138643A/en
Application granted granted Critical
Publication of JP6633403B2 publication Critical patent/JP6633403B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、多種多量のデータから解析対象のデータを決定するための解析対象決定装置及び解析対象決定方法に関する。   The present invention relates to an analysis target determination apparatus and an analysis target determination method for determining data to be analyzed from a large amount of various data.

事業に役立つ知見を導出するために多種多量のデータ(ビッグデータ)を解析することが行われている。検索、電子商取引、ソーシャルメディア等のウェブサービス分野においては、検索履歴、商品・デジタルコンテンツの購買履歴、決算情報、コミュニケーションの発信履歴等のデータが大量に蓄積される。また、機械、工場内設備においては、各種センサによって機械、設備の状態(温度、圧力、流量等)の多種多量のデータが蓄積される。このようなビッグデータの解析方法の一つとして、重回帰分析によって複数のデータ項目(変数)について成立する関係式(モデル)を導出し、データ項目間の関係を捉えることが行われている。   Analyzing a large amount of data (big data) is performed to derive knowledge useful for business. 2. Description of the Related Art In the field of web services such as search, electronic commerce, and social media, a large amount of data such as search histories, purchase histories of products and digital contents, settlement information, and communication histories are accumulated. Further, in a machine or a facility in a factory, various sensors accumulate various and large amounts of data on the state (temperature, pressure, flow rate, etc.) of the machine or facility. As one of such big data analysis methods, a relational expression (model) that holds for a plurality of data items (variables) is derived by multiple regression analysis, and a relationship between the data items is captured.

特許文献1には、プラント設備において蓄積されたデータを重回帰分析し、プロセスの状態を予測する方法が記載されている。この方法では、1つのプラントから複数のデータ項目を含むデータを時系列でサンプリングし、サンプリング時刻毎に重回帰分析に使用するデータ項目(説明変数)をステップワイズ法を用いて絞り込むようになっている。   Patent Literature 1 describes a method of predicting a process state by performing multiple regression analysis on data accumulated in plant equipment. In this method, data including a plurality of data items is sampled in time series from one plant, and data items (explanatory variables) used for multiple regression analysis are narrowed down by a stepwise method at each sampling time. I have.

特開2012−128800号公報JP 2012-128800 A

例えば複数の機械を解析する場合、各機械から複数のデータ項目を含むデータをサンプリングし、得られた各機械のデータに対して解析処理を行う。データをサンプリングした複数の機械に異なる種類の機械が含まれていたり、異常が発生している機械が含まれていたりすると、これらの機械からサンプリングされたデータは他の機械からサンプリングされたデータとは傾向が異なる。このため、全ての機械のデータに対してステップワイズ法を適用すると、適切にデータ項目を選択することができず、適切に機械を解析することができない。   For example, when analyzing a plurality of machines, data including a plurality of data items is sampled from each machine, and an analysis process is performed on the obtained data of each machine. If the machines that sampled data include different types of machines or machines that have malfunctions, the data sampled from these machines will be different from the data sampled from other machines. Have different tendencies. For this reason, if the stepwise method is applied to the data of all the machines, the data items cannot be properly selected, and the machines cannot be analyzed properly.

本発明は斯かる事情に鑑みてなされたものであり、その主たる目的は、多種多量のデータから解析に適したデータを決定できる解析対象決定装置及び解析対象決定方法を提供することにある。   The present invention has been made in view of such circumstances, and a main object thereof is to provide an analysis object determination apparatus and an analysis object determination method capable of determining data suitable for analysis from a large amount of various data.

上述した課題を解決するために、本発明の一の態様の解析対象決定装置は、複数のデータ項目を含むデータを解析する場合に、少なくとも一部のデータ項目を変数として含むモデルを用いた解析の対象を決定する解析対象決定装置であって、複数のデータから毎回異なる一部のデータを選択する選択手段と、前記選択手段によって選択されたデータに基づいて、モデルの生成に適するデータ項目が選択可能であるか否かを判定する判定手段と、前記選択手段及び前記判定手段による処理を複数回繰り返した後、前記判定手段による判定結果に基づいて、解析対象とするデータを決定する決定手段と、を備える。   In order to solve the above-described problem, an analysis target determination apparatus according to an aspect of the present invention is configured such that when analyzing data including a plurality of data items, an analysis using a model including at least some of the data items as variables is performed. An analysis target determination apparatus that determines an object of the above, wherein a selection unit that selects a part of data that is different each time from a plurality of data, based on the data selected by the selection unit, a data item suitable for generating a model is Determining means for determining whether selection is possible or not, and determining means for determining data to be analyzed based on the determination result by the determining means after repeating the processing by the selecting means and the determining means a plurality of times. And.

この態様において、前記解析対象決定装置は、前記選択手段及び前記判定手段による処理を複数回繰り返した後、前記判定手段による判定結果に基づいて、解析に用いられるデータ項目を決定する第2決定手段をさらに備えてもよい。   In this aspect, the analysis target determination device repeats the processing by the selection unit and the determination unit a plurality of times, and then determines a data item used for analysis based on a determination result by the determination unit. May be further provided.

また、上記態様において、前記決定手段は、前記判定手段によって選択可能とされたデータ項目毎の回数に基づいて、解析に用いられるデータ項目を決定するように構成されていてもよい。   Further, in the above aspect, the determination unit may be configured to determine a data item used for analysis based on the number of times for each data item selected by the determination unit.

また、上記態様において、前記解析対象決定装置は、前記判定手段によって前記データ項目が選択可能と判定された場合、選択可能とされたデータ項目を用いて生成されたモデルの誤差を評価する評価手段をさらに備え、前記第2決定手段は、前記選択手段、前記判定手段、及び前記評価手段による処理を複数回繰り返した後、前記評価手段による評価結果に基づいて、解析に用いられるデータ項目を決定するように構成されていてもよい。   Further, in the above aspect, the analysis target determination apparatus, when the determination unit determines that the data item is selectable, an evaluation unit that evaluates an error of a model generated using the selectable data item. The second determining means determines a data item to be used for analysis based on the evaluation result by the evaluating means after repeating the processing by the selecting means, the determining means, and the evaluating means a plurality of times. It may be configured to do so.

また、上記態様において、前記解析対象決定装置は、前記決定手段によって決定された解析対象のデータを出力する出力手段をさらに備えてもよい。   Further, in the above aspect, the analysis target determination device may further include an output unit that outputs data of the analysis target determined by the determination unit.

また、上記態様において、前記解析対象決定装置は、前記第2決定手段によって決定された解析に用いられるデータ項目を出力する出力手段をさらに備えてもよい。   In the above aspect, the analysis target determination device may further include an output unit that outputs a data item used for the analysis determined by the second determination unit.

また、上記態様において、前記解析対象決定装置は、前記解析対象のデータとは異なるデータを解析に適さないデータとして出力する第2出力手段をさらに備えてもよい。   In the above aspect, the analysis target determination device may further include a second output unit that outputs data different from the data to be analyzed as data that is not suitable for analysis.

また、上記態様において、前記複数のデータは時系列データであり、前記第2出力手段は、前記判定手段が連続する複数のデータについて前記データ項目が選択可能と判定し、且つ、次の連続する複数のデータについて前記データ項目が選択不可能と判定した場合に、前記次の連続する複数のデータの先頭のデータを異常データとして出力するように構成されていてもよい。   Further, in the above aspect, the plurality of data is time-series data, and the second output unit determines that the data item is selectable for the plurality of continuous data by the determination unit, and the next continuous When it is determined that the data item cannot be selected for a plurality of data, the first data of the next successive plurality of data may be output as abnormal data.

また、上記態様において、前記判定手段は、ステップワイズ法により前記モデルの生成に適するデータ項目が選択可能か否かを判定するように構成されていてもよい。   In the above aspect, the determination unit may be configured to determine whether a data item suitable for generating the model can be selected by a stepwise method.

また、上記態様において、前記解析対象決定装置は、前記判定手段によって前記データ項目を選択可能と複数回判定された場合に、前記選択手段によって共通して選択されたデータを同一のグループとして決定する第3決定手段と、前記第3決定手段によって同一のグループとして決定されたデータを出力する第3出力手段と、をさらに備えてもよい。   Further, in the above aspect, the analysis target determination apparatus determines, when the determination unit determines that the data item is selectable a plurality of times, the data commonly selected by the selection unit as the same group. The image processing apparatus may further include third determining means, and third output means for outputting data determined as the same group by the third determining means.

本発明の他の態様の解析対象決定方法は、複数のデータ項目を含むデータを解析する場合に、少なくとも一部のデータ項目を変数として含むモデルを用いた解析の対象を決定する解析対象決定方法であって、コンピュータが、複数のデータから毎回異なる一部のデータを選択するステップと、前記コンピュータが、選択されたデータに基づいて、モデルの生成に適するデータ項目が選択可能であるか否かを判定するステップと、前記コンピュータが、前記選択するステップ及び前記判定するステップを複数回繰り返した後、前記判定するステップにおける判定結果に基づいて、解析対象とするデータを決定するステップと、を有する。   According to another aspect of the present invention, there is provided an analysis target determination method for determining an analysis target using a model including at least some data items as variables when analyzing data including a plurality of data items. Wherein the computer selects different data each time from the plurality of data, and the computer determines whether a data item suitable for generating a model can be selected based on the selected data. Determining the data to be analyzed based on the determination result in the determining step after the computer repeats the selecting step and the determining step a plurality of times. .

本発明によれば、多種多量のデータから解析に適したデータを決定できる。   According to the present invention, data suitable for analysis can be determined from a large amount of data.

解析対象決定装置を含む解析システムの一例を示す模式図。FIG. 1 is a schematic diagram illustrating an example of an analysis system including an analysis target determination device. 解析対象決定装置を含む解析システムの他の例を示す模式図。The schematic diagram which shows the other example of the analysis system including the analysis target determination apparatus. 実施の形態1に係る解析対象決定装置の構成を示すブロック図。FIG. 2 is a block diagram illustrating a configuration of an analysis target determination device according to the first embodiment. 実施の形態1に係る解析対象決定装置による解析対象決定処理の手順を示すフローチャート。5 is a flowchart showing a procedure of an analysis target determination process by the analysis target determination device according to the first embodiment. 処理結果画面の一例を示す図。The figure which shows an example of a processing result screen. 処理結果画面の他の例を示す図。The figure which shows the other example of a processing result screen. 性能評価試験に使用したデータを示すグラフ。5 is a graph showing data used in a performance evaluation test. データの選択例を説明するためのグラフ。A graph for explaining an example of data selection. 目的変数の推定結果を示すグラフ。9 is a graph showing the estimation result of an objective variable. 時系列データ全体に対して本モデルを適用した場合のグラフ。Graph when this model is applied to the entire time series data. ステップワイズ法が成功したときのデータ項目毎の選択率を示すグラフ。7 is a graph showing a selection rate for each data item when the stepwise method is successful. モデルの誤差の評価値が小さい場合におけるデータ項目の選択率を示すグラフ。9 is a graph showing the selectivity of data items when the evaluation value of the model error is small. ステップワイズ法が失敗したときのデータ毎の選択率を示すグラフ。5 is a graph showing a selectivity for each data when the stepwise method fails. 実施の形態2に係る解析対象決定装置による解析対象決定処理の手順を示すフローチャート。9 is a flowchart illustrating a procedure of an analysis target determination process performed by the analysis target determination device according to the second embodiment. 処理結果画面の例を示す図。The figure which shows the example of a processing result screen. 実施の形態3に係る解析対象決定装置による解析対象決定処理の手順を示すフローチャート。13 is a flowchart showing a procedure of an analysis target determination process by the analysis target determination device according to the third embodiment. 処理結果画面の例を示す図。The figure which shows the example of a processing result screen.

以下、本発明の好ましい実施の形態を、図面を参照しながら説明する。   Hereinafter, preferred embodiments of the present invention will be described with reference to the drawings.

(実施の形態1)
本実施の形態に係る解析対象決定装置の構成について説明する。本実施の形態に係る解析対象決定装置は、多種多量のデータを収集する。図1は、本実施の形態に係る解析対象決定装置を含む解析システムの一例を示す模式図であり、図2は、他の例を示す模式図である。例えば、生産設備を解析する場合、図1に示すように、解析対象決定装置1は、生産設備に設けられた複数のセンサ2,2,…に接続されており、各センサ2,2,…からの検出信号を受信することで、時系列データを収集する。なお、図1では、圧延鋼板の製造設備を解析するための解析システムを示しており、センサ2,2,…には、振動センサ、速度センサ、張力センサ、厚みセンサ、圧力センサ、温度センサ等の多種のセンサが含まれる。また、複数の機械を解析する場合、図2に示すように、解析対象決定装置1は、複数の機械3,3,…のそれぞれに設けられた複数のセンサ21,21,…に接続されており、各センサ21,21,…からの検出信号を受信することで、複数の機械の状態を示すデータを収集する。なお、図2では、複数の溶接ロボットを解析するための解析システムを示しており、センサ21,21,…には、温度センサ、圧力センサ、角度センサ、速度センサ、加速度センサ、電流センサ等の多種のセンサが含まれる。また、解析対象決定装置1が収集するデータは、センサ情報に限られず、制御系の指令値情報又は誤差情報などでもよい。
(Embodiment 1)
The configuration of the analysis target determination device according to the present embodiment will be described. The analysis target determination device according to the present embodiment collects a large amount of various data. FIG. 1 is a schematic diagram illustrating an example of an analysis system including the analysis target determination device according to the present embodiment, and FIG. 2 is a schematic diagram illustrating another example. For example, when analyzing a production facility, as shown in FIG. 1, the analysis target determining apparatus 1 is connected to a plurality of sensors 2, 2,. The time series data is collected by receiving the detection signal from. FIG. 1 shows an analysis system for analyzing a rolled steel plate manufacturing facility, and the sensors 2, 2,... Include a vibration sensor, a speed sensor, a tension sensor, a thickness sensor, a pressure sensor, a temperature sensor, and the like. The various types of sensors are included. When analyzing a plurality of machines, as shown in FIG. 2, the analysis target determination apparatus 1 is connected to a plurality of sensors 21, 21,... Provided for each of the plurality of machines 3, 3,. Receive the detection signals from the sensors 21, 21,... To collect data indicating the states of a plurality of machines. 2 shows an analysis system for analyzing a plurality of welding robots. The sensors 21, 21,... Include temperature sensors, pressure sensors, angle sensors, speed sensors, acceleration sensors, current sensors, and the like. Various types of sensors are included. The data collected by the analysis target determining apparatus 1 is not limited to sensor information, but may be command value information or error information of a control system.

検索、電子商取引、ソーシャルメディア等のウェブサービス分野の解析システムの場合、サーバから解析対象決定装置1が検索履歴、商品・デジタルコンテンツの購買履歴、決算情報、コミュニケーションの発信履歴等のデータを受信するようにしてもよい。また、上記のようにして得られたデータを記録した記録媒体から、解析対象決定装置1がデータを読み出すようにしてもよい。   In the case of an analysis system in the web service field such as search, electronic commerce, social media, and the like, the analysis target determination device 1 receives data such as search history, product / digital content purchase history, settlement information, and communication transmission history from the server. You may do so. Alternatively, the analysis target determination device 1 may read data from a recording medium on which the data obtained as described above is recorded.

図3は、本実施の形態に係る解析対象決定装置の構成を示すブロック図である。解析対象決定装置1は、コンピュータ10によって実現される。図3に示すように、コンピュータ10は、本体11と、表示部13と、入力部12とを備えている。本体11は、CPU111、ROM112、RAM113、ハードディスク115、読出装置114、入出力インタフェース116、画像出力インタフェース117、及び通信インタフェース118を備えており、CPU111、ROM112、RAM113、ハードディスク115、読出装置114、入出力インタフェース116、画像出力インタフェース117、及び通信インタフェース118は、バスによって接続されている。   FIG. 3 is a block diagram illustrating a configuration of the analysis target determination device according to the present embodiment. The analysis target determination device 1 is realized by a computer 10. As shown in FIG. 3, the computer 10 includes a main body 11, a display unit 13, and an input unit 12. The main body 11 includes a CPU 111, a ROM 112, a RAM 113, a hard disk 115, a reading device 114, an input / output interface 116, an image output interface 117, and a communication interface 118. The CPU 111, the ROM 112, the RAM 113, the hard disk 115, the reading device 114, The output interface 116, the image output interface 117, and the communication interface 118 are connected by a bus.

CPU111は、RAM113にロードされたコンピュータプログラムを実行することが可能である。そして、解析対象決定処理用のコンピュータプログラムである解析対象決定プログラム110を当該CPU111が実行することにより、コンピュータ10が解析対象決定装置1として機能する。   The CPU 111 can execute a computer program loaded on the RAM 113. When the CPU 111 executes the analysis target determination program 110 which is a computer program for the analysis target determination processing, the computer 10 functions as the analysis target determination device 1.

ROM112は、マスクROM、PROM、EPROM、又はEEPROM等によって構成されており、CPU111に実行されるコンピュータプログラム及びこれに用いるデータ等が記録されている。   The ROM 112 includes a mask ROM, a PROM, an EPROM, an EEPROM, or the like, and stores a computer program executed by the CPU 111, data used for the computer program, and the like.

RAM113は、SRAMまたはDRAM等によって構成されている。RAM113は、ハードディスク115に記録されている解析対象決定プログラム110の読み出しに用いられる。また、CPU111がコンピュータプログラムを実行するときに、CPU111の作業領域として利用される。   The RAM 113 is configured by an SRAM, a DRAM, or the like. The RAM 113 is used to read the analysis target determination program 110 recorded on the hard disk 115. When the CPU 111 executes a computer program, it is used as a work area for the CPU 111.

ハードディスク115は、オペレーティングシステム及びアプリケーションプログラム等、CPU111に実行させるための種々のコンピュータプログラム及び当該コンピュータプログラムの実行に用いられるデータがインストールされている。解析対象決定プログラム110も、このハードディスク115にインストールされている。   The hard disk 115 has installed therein various computer programs to be executed by the CPU 111, such as an operating system and application programs, and data used for executing the computer programs. The analysis target determination program 110 is also installed on the hard disk 115.

入出力インタフェース116は、例えばUSB,IEEE1394,又はRS-232C等のシリアルインタフェース、SCSI,IDE,又は IEEE1284等のパラレルインタフェース、及びD/A変換器、A/D変換器等からなるアナログインタフェース等から構成されている。入出力インタフェース116には、キーボード及びマウスからなる入力部12が接続されており、ユーザが当該入力部12を使用することにより、コンピュータ10にデータを入力することが可能である。   The input / output interface 116 includes, for example, a serial interface such as USB, IEEE1394, or RS-232C, a parallel interface such as SCSI, IDE, or IEEE1284, and an analog interface including a D / A converter and an A / D converter. It is configured. The input unit 12 including a keyboard and a mouse is connected to the input / output interface 116, and the user can input data to the computer 10 by using the input unit 12.

画像出力インタフェース117は、LCDまたはCRT等で構成された表示部13に接続されており、CPU111から与えられた画像データに応じた映像信号を表示部13に出力するようになっている。表示部13は、入力された映像信号にしたがって、画像(画面)を表示する。   The image output interface 117 is connected to the display unit 13 composed of an LCD, a CRT, or the like, and outputs a video signal corresponding to image data provided from the CPU 111 to the display unit 13. The display unit 13 displays an image (screen) according to the input video signal.

通信インタフェース118は、外部の機器とデータ通信するためのものである。データを通信によって受信する場合、通信インタフェース118には、各種センサ、又はデータを蓄積するサーバが接続される。例えば、圧延鋼板の製造設備の場合、通信インタフェース118には、振動センサ、速度センサ、張力センサ、厚みセンサ、圧力センサ、温度センサ等のセンサ2,2,…が接続されており、これらのセンサから出力された時系列データが通信インタフェース118によって取り込まれる。   The communication interface 118 is for performing data communication with an external device. When receiving data by communication, the communication interface 118 is connected to various sensors or a server that stores data. For example, in the case of a rolled steel plate manufacturing facility, the communication interface 118 is connected to sensors 2, 2,... Such as a vibration sensor, a speed sensor, a tension sensor, a thickness sensor, a pressure sensor, and a temperature sensor. Is output by the communication interface 118.

[解析対象決定装置の動作]
以下、本実施の形態に係る解析対象決定装置1の動作について説明する。
[Operation of analysis target determination device]
Hereinafter, the operation of the analysis target determination device 1 according to the present embodiment will be described.

図3は、本実施の形態に係る解析対象決定装置1による解析対象決定処理の手順を示すフローチャートである。   FIG. 3 is a flowchart illustrating a procedure of an analysis target determination process by the analysis target determination device 1 according to the present embodiment.

CPU111は、解析対象決定処理を開始すると、データのなかからランダムに一部のデータを選択する(ステップS101)。   When starting the analysis target determination process, the CPU 111 randomly selects some data from the data (step S101).

解析対象決定装置1によって収集されたデータは、次のように表される。

Figure 0006633403
ここで、N,Mは1より大きい整数であり、kは1≦k≦N,Mを満たす整数である。 The data collected by the analysis target determination device 1 is represented as follows.
Figure 0006633403
Here, N and M are integers larger than 1, and k is an integer satisfying 1 ≦ k ≦ N and M.

(1)式においてYは目的変数であり、Xは変数である。上からk番目のデータは、(y,xk1,xk2,…,xkM)である。ステップS101の処理では、CPU111は、ランダムにkを複数選択する。例えば、次に示すように、2番目、p番目、q番目、…(p,qは1≦p,q≦Mを満たす整数)をCPU111は選択する。

Figure 0006633403
In the equation (1), Y is a target variable, and X is a variable. The k-th data from the top is (y k , x k1 , x k2 ,..., X kM ). In the process of step S101, the CPU 111 randomly selects a plurality of k. For example, as shown below, the CPU 111 selects the second, p-th, q-th,... (P and q are integers satisfying 1 ≦ p, q ≦ M).
Figure 0006633403

次に、CPU111は、ステップS101において選択したデータ(Ysi,Xsi)に対してステップワイズ法を適用し、(3)式に示すモデル(線型モデル)の生成に適したデータ項目(変数)を選択する(ステップS102)。ここで、iは1以上の整数であり、初期値は1である。ステップS102の処理では、XsiのN個の変数の中から、モデルの生成に適した一部の変数が選択される。

Figure 0006633403
Next, the CPU 111 applies the stepwise method to the data (Y si , X si ) selected in step S101, and data items (variables) suitable for generating the model (linear model) shown in equation (3) Is selected (step S102). Here, i is an integer of 1 or more, and the initial value is 1. In the process of step S102, some variables suitable for model generation are selected from the N variables of Xsi .
Figure 0006633403

ステップS102の処理についてさらに詳しく説明する。ステップS102では、CPU111は、選択されたデータに対してステップワイズ法を適用する。ステップワイズ法については、田中豊、脇本和昌著、「多変量統計解析法」、第9版、現代数学社、1994年2月20日、p.42−47(以下、「参照文献1」という)等に記載されている。以下、ステップワイズ法について説明する。なお、以下のステップワイズ法の説明において、(4)及び(5)式で用いるパラメータの表記は、参照文献1に記載されているパラメータの表記に合わせている。   The processing in step S102 will be described in more detail. In step S102, the CPU 111 applies the stepwise method to the selected data. Regarding the stepwise method, Yutaka Tanaka and Kazumasa Wakimoto, “Multivariate Statistical Analysis”, 9th edition, Gendai Mathematics, Feb. 20, 1994, p. 42-47 (hereinafter referred to as “Reference Document 1”) and the like. Hereinafter, the stepwise method will be described. In the following description of the stepwise method, the notation of parameters used in equations (4) and (5) matches the notation of parameters described in Reference Document 1.

(ステップI)まず、目的変数yとの単相関が最大の変数を選ぶ。つまり、1つずつ順番に変数(データ項目)を採用してモデル(回帰式)を生成し、回帰係数検定のためのtの絶対値又はF値(下式参照)が最大の変数を選ぶ。選ばれた変数に対する回帰係数が0であるという仮説の検定を行い、棄却されなければどの変数もモデルに含めない。棄却されればこの変数をモデルに取り込んでステップIIに進む。   (Step I) First, a variable having the largest single correlation with the objective variable y is selected. That is, a model (regression equation) is generated by sequentially adopting variables (data items) one by one, and the variable having the largest absolute value or F value (see the following equation) of t for regression coefficient test is selected. Test the hypothesis that the regression coefficient for the selected variable is 0, and do not include any variables in the model unless rejected. If rejected, this variable is taken into the model and the process proceeds to step II.

(ステップII)既にモデルに入っている変数に加えて残りの変数を順番に1つずつ採用し、偏相関が最大(回帰係数検定のためのtの絶対値又はF値が最大)の変数を選ぶ。回帰係数が0であるという仮説の検定を行い棄却されなければ処理を終了する。棄却されれば選ばれた変数をモデルに取り込んでステップIIIに進む。   (Step II) In addition to the variables already in the model, the remaining variables are adopted one by one in order, and the variable with the maximum partial correlation (the absolute value of t or the F value for the regression coefficient test is the maximum) is determined. Choose. The hypothesis test that the regression coefficient is 0 is performed, and if not rejected, the process ends. If rejected, the selected variables are taken into the model and the process proceeds to step III.

(ステップIII)モデルを計算して各変数について回帰係数の検定を行い、F値が最小になる変数について仮説が棄却されなければその変数をモデルから除外する。   (Step III) The model is calculated and the regression coefficient is tested for each variable. If the hypothesis is not rejected for the variable with the smallest F value, the variable is excluded from the model.

(ステップIV)全ての変数がモデルに取り込まれていれば処理を終了する。そうでなければステップIIに戻る。   (Step IV) If all variables have been taken into the model, the process ends. Otherwise, return to step II.

上記のステップワイズ法において、回帰係数の検定は次のようにして行う。p個の変数を含むモデルでの変数xに対する回帰係数が0であるという仮説H:a=0の検定は、次式でt値を求めて自由度n−p−1のt分布の限界値と比較し、|t|≧tα(n−p−1)ならば仮説を棄却し、|t|<tα(n−p−1)ならば仮説を採択する。

Figure 0006633403
ここで、tα(n−p−1)は自由度(n−p−1)のt分布の両側100α%点の限界値(100×(1−α)%の信頼区間の境界値)を、nはステップS101において選択したデータ個数(すなわち、Ysiの要素数あるいはXsiの行数)を、sjjは誤差の分散の不偏推定値を、Veはp個の変数を含むモデルでの説明変数の分散共分散行列において、その逆行列のj番目の対角要素の値をそれぞれ示している。 In the above-mentioned stepwise method, the test of the regression coefficient is performed as follows. The test of the hypothesis H 0 : a j = 0 that the regression coefficient for the variable x j in the model including p variables is 0 is obtained by calculating the t value by the following equation to obtain the t distribution with n-p−1 degrees of freedom. compared with the limit value, | t | ≧ t α ( n-p-1) if reject the hypothesis, | t | adopt <t α (n-p- 1) if the hypothesis.
Figure 0006633403
Here, t α (n-p-1) is the limit value (100 × (1-α)% confidence interval boundary value) at the 100α% point on both sides of the t distribution of the degree of freedom (n-p-1). , N is the number of data selected in step S101 (that is, the number of elements of Y si or the number of rows of X si ), s jj is an unbiased estimate of error variance, and V e is a model including p variables. In the variance-covariance matrix of the explanatory variable, the value of the j-th diagonal element of the inverse matrix is shown.

上記の回帰係数の検定に代えて、t分布とF分布の関係より、次式のFを求めて自由度(1,n−p−1)のF分布の限界値と比較し、|F|≧F n−p−1(α)ならば仮説を棄却するようにしてもよい。

Figure 0006633403
Instead of the above-described regression coefficient test, F in the following equation is obtained from the relationship between the t distribution and the F distribution, and is compared with the limit value of the F distribution having (1, n−p−1) degrees of freedom. If ≧ F 1 n−p−1 (α), the hypothesis may be rejected.
Figure 0006633403

ここでは、ステップワイズ法によりモデルの生成に適した変数を選択したが、総当たり法、前進選択法、後退消去法、ベストサブセット回帰、部分最小二乗法、主成分回帰等のステップワイズ法以外の変数選択法によって変数を選択してもよい。   Here, variables suitable for model generation were selected by the stepwise method.However, methods other than the stepwise methods such as the brute force method, forward selection method, backward elimination method, best subset regression, partial least squares method, and principal component regression were used. Variables may be selected by a variable selection method.

次にCPU111は、有意なモデルの生成が可能か否か、即ち、モデルの生成に適したデータとデータ項目の組合せの選択に成功したか否かを判定する(ステップS103)。有意なモデルの生成が可能と判定した場合(ステップS103においてYES)、CPU111は、ステップS101において選択されたデータ中のステップS102において選択されたデータ項目を用いてモデルを生成し、目的変数の実際の値Ysiと、モデルから求めた目的変数の値Ymiとを比較し、モデルの誤差を評価する(ステップS104)。ステップS104においては、CPU111は、評価値Jを算出する。評価値Jは、例えば、YsiとYmiとの差の二乗和の平方根とすることができる。

Figure 0006633403
ここで、||●||はユークリッドノルムを、Tは行列又はベクトルの転置を示す。 Next, the CPU 111 determines whether a significant model can be generated, that is, whether a combination of data and data items suitable for generating the model has been successfully selected (step S103). If it is determined that a significant model can be generated (YES in step S103), CPU 111 generates a model using the data item selected in step S102 in the data selected in step S101, and sets the actual Is compared with the value Y mi of the objective variable obtained from the model, and the error of the model is evaluated (step S104). In step S104, CPU 111 calculates the evaluation value J i. The evaluation value J i can be, for example, the square root of the sum of squares of the difference between Y si and Y mi .
Figure 0006633403
Here, || ● || 2 indicates the Euclidean norm, and T indicates the transpose of a matrix or vector.

上記のステップS104の後、CPU111は、そのとき選択されているデータの番号(上記の例では2,p,q,…)と、ステップワイズ法によって選択されたデータ項目の番号をハードディスク115に記憶する(ステップS105)。ステップS105の後、CPU111は、処理をステップS107へ進める。   After the above step S104, the CPU 111 stores the number of the data selected at that time (2, p, q,... In the above example) and the number of the data item selected by the stepwise method on the hard disk 115. (Step S105). After step S105, CPU 111 causes the process to proceed to step S107.

ステップS103において、モデルの生成が不可能と判定された場合(ステップS103においてNO)、CPU111は、モデルの誤差の評価値Jを∞に設定する(ステップS106)。無限大を表現できない場合は、Jを十分大きな数に設定すればよい。ステップS106の後、CPU111は、処理をステップS107へ進める。 In step S103, if the model generation is determined to not (NO in step S103), CPU 111 sets the evaluation value J i of the error models ∞ (step S106). If you can not express the infinite, it may be set sufficiently large number of J i. After step S106, CPU 111 proceeds with the process to step S107.

ステップS107において、CPU111は、上記のS101〜S106の処理を規定回数繰り返したか否かを判定する。規定回数繰り返していない場合(ステップS107においてNO)、CPU111は、変数iを1インクリメントし(ステップS108)、ステップS101に処理を戻す。これにより、ステップS101〜S106の処理が規定回数繰り返される。   In step S107, the CPU 111 determines whether or not the processes of S101 to S106 have been repeated a specified number of times. If it has not been repeated the specified number of times (NO in step S107), CPU 111 increments variable i by 1 (step S108), and returns to step S101. Thereby, the processing of steps S101 to S106 is repeated a specified number of times.

ステップS101〜S106の処理が規定回数繰り返された場合(ステップS107においてYES)、CPU111は、評価値Jを小さいものの上位1%を選択し、選択された上位1%の評価値が得られた場合に選択されたデータ項目を集計する(ステップS109)。なお、上位1%ではなく上位5%とする等、選択対象の評価値Jの割合は適宜設定することができる。 When the process of step S101~S106 is repeated predetermined number of times (YES in step S107), CPU 111 selects the top 1% of small evaluation values J i, the evaluation value of the top 1% selected is obtained In this case, the selected data items are totaled (step S109). Incidentally, etc. to 1% rather than the top 5% higher percentage of the evaluation value J i to be selected can be set as appropriate.

ステップS109で集計されたデータ項目のうち、選択された回数が多いデータ項目は、目的変数Yに影響を与える因子つまり、解析に適したデータ項目であると考えることができる。CPU111は、ステップS109で集計されたデータ項目のうち、例えば、予め設定された回数以上選択されたデータ項目を、解析に適したデータ項目として決定し、これらのデータ項目の番号をハードディスク115に記憶する(ステップS110)。   Among the data items totaled in step S109, the data item whose number of selections is large can be considered as a factor affecting the objective variable Y, that is, a data item suitable for analysis. The CPU 111 determines, for example, among the data items totaled in step S109, data items selected at least a preset number of times as data items suitable for analysis, and stores the numbers of these data items on the hard disk 115. (Step S110).

また、CPU111は、ステップS103においてモデルの生成が不可能であると判断された場合に(つまり、J=∞の場合に)選択された回数をデータ毎に集計する(ステップS111)。あるデータが選択されているときに、モデルの生成が不可能であると判定されている回数が多い場合、そのデータは解析に適さないデータであると考えることができる。これに対し、解析に適さないデータ以外は、解析可能なデータであると考えることができる。CPU111は、モデルの生成が不可能であると判定された場合に所定回数以上選択されたデータを、解析に適さないデータとして決定し、それ以外のデータを解析対象のデータとして決定し、解析に適さないデータ及び解析対象のデータの番号をそれぞれハードディスク115に記憶する(ステップS112)。 When it is determined in step S103 that model generation is not possible (that is, when J i = ∞), the CPU 111 totals the number of times selected for each data (step S111). When certain data is selected and the number of times that it is determined that generation of a model is impossible is large, the data can be considered to be data unsuitable for analysis. On the other hand, data other than data that is not suitable for analysis can be considered to be data that can be analyzed. When it is determined that the model cannot be generated, the CPU 111 determines the data selected a predetermined number of times or more as data that is not suitable for analysis, determines other data as data to be analyzed, and performs analysis. The numbers of the unsuitable data and the data to be analyzed are stored in the hard disk 115 (step S112).

CPU111は、上記のような解析対象決定処理の処理結果画面を表示部13に表示させ(ステップS113)、解析対象決定処理を終了する。   The CPU 111 causes the display unit 13 to display the processing result screen of the analysis target determination processing as described above (step S113), and ends the analysis target determination processing.

図5は、処理結果画面の一例を示す図である。この例の処理結果画面30は、解析対象として決定されたデータの番号と、解析に適するデータ項目の番号とを含む。これにより、解析対象のデータ、及び、解析に適するデータ項目をユーザが確認できる。また、解析対象のデータ中の解析に適するデータ項目を用いてモデルを生成することで多種多量のデータを解析できる。   FIG. 5 is a diagram illustrating an example of the processing result screen. The processing result screen 30 in this example includes the number of data determined to be analyzed and the number of a data item suitable for analysis. Thereby, the user can confirm the data to be analyzed and the data items suitable for the analysis. In addition, a large amount of data can be analyzed by generating a model using data items suitable for analysis in data to be analyzed.

図6は、処理結果画面の他の例を示す図である。この例の処理結果画面31は、解析に適するデータ項目の番号と、解析に適さないデータの番号とを含む。解析に適さないデータには異常なデータが含まれる可能性がある。解析に適さないデータを出力することで、異常の可能性があるデータをユーザに通知できる。また、解析に適さないデータ以外のデータを解析対象とすることができ、解析対象のデータの中の解析に適するデータ項目を用いてモデルを生成することで多種多量のデータを解析できる。   FIG. 6 is a diagram illustrating another example of the processing result screen. The processing result screen 31 of this example includes a data item number suitable for analysis and a data number not suitable for analysis. Data that is not suitable for analysis may include abnormal data. By outputting data that is not suitable for analysis, data that may be abnormal can be notified to the user. In addition, data other than data that is not suitable for analysis can be set as an analysis target, and a large amount of data can be analyzed by generating a model using data items suitable for analysis in data to be analyzed.

(性能評価試験)
発明者は、上記の実施の形態1に係る解析対象決定方法の性能評価試験を実施した。
(Performance evaluation test)
The inventor performed a performance evaluation test of the analysis target determination method according to the first embodiment.

図7は、性能評価試験に使用したデータを示すグラフである。図7において縦軸は目標変数Yの値を、横軸は時間を示す。このデータは時系列データであり、1つのデータ(つまり、1つの時点におけるデータ)には時間情報を含む20個のデータ項目が含まれる。発明者はこの時系列データ全体に対してステップワイズ法を適用したが、モデルの生成に適するデータ項目を選択することはできなかった。   FIG. 7 is a graph showing data used in the performance evaluation test. In FIG. 7, the vertical axis represents the value of the target variable Y, and the horizontal axis represents time. This data is time-series data, and one data (that is, data at one time point) includes 20 data items including time information. The inventor applied the stepwise method to the entire time-series data, but could not select a data item suitable for generating a model.

次に、発明者は、上記の時系列データの中から5割のデータをランダムに選択した。図8は、データの選択例を説明するためのグラフである。図8において、▲マークは、ある場合において選択されたデータを示し、●マークは、その場合において選択されなかったデータを示している。   Next, the inventor randomly selected 50% of the time-series data. FIG. 8 is a graph for explaining an example of data selection. In FIG. 8, a mark indicates data selected in a certain case, and a mark indicates data not selected in the case.

選択されたデータに対してステップワイズ法を適用すると、20個のデータ項目のうち、8個のデータ項目(変数)が選択された。この8個の変数を使用してモデルを生成し、選択されたデータについて目的変数Yの値を推定した。図9は、目的変数Yの推定結果を示すグラフである。なお、図9において、時間と目的変数との関係を明らかにするために、目的変数の値を他の説明変数の値で修正して、修正後の目的変数の値を対応する時間毎にプロットしている。即ち、回帰モデルが(7)式で表される場合、xが時間情報であるとすると、(8)式の左辺が図9の縦軸に対応している。

Figure 0006633403
When the stepwise method was applied to the selected data, eight data items (variables) were selected from the twenty data items. A model was generated using these eight variables, and the value of the objective variable Y was estimated for the selected data. FIG. 9 is a graph showing the estimation result of the objective variable Y. In FIG. 9, in order to clarify the relationship between time and the objective variable, the value of the objective variable is corrected with the values of other explanatory variables, and the corrected value of the objective variable is plotted for each corresponding time. are doing. That is, if the regression model is represented by equation (7), when x 1 is the time information corresponds to the vertical axis of FIG. 9 is the left side of equation (8).
Figure 0006633403

図9に示すように、精度の良い回帰式が得られていることが分かる。図10は、時系列データ全体に対して本モデルを適用した場合のグラフである。図10において、▲マークは、選択されたデータを示し、●マークは、選択されなかったデータを示している。選択されなかったデータには、本モデルにしたがわないものが含まれ、選択されたデータとは属性が異なっている可能性があることが分かる。   As shown in FIG. 9, it can be seen that a highly accurate regression equation is obtained. FIG. 10 is a graph when the present model is applied to the entire time-series data. In FIG. 10, a mark indicates selected data, and a mark indicates data not selected. The data not selected includes data that does not conform to the model, and it can be seen that there is a possibility that the attribute is different from the selected data.

上記のような処理を10000回繰り返し、ステップワイズ法が成功した(つまり、ステップワイズ法でデータ項目を選択できた)場合における各データ項目の選択率を求めた。図11は、ステップワイズ法が成功したときのデータ項目毎の選択率を示すグラフである。図11において、縦軸は選択率を、横軸はデータ項目の番号を示している。図11に示すように、2番目のデータ項目の選択率が突出して高く、重要なデータ項目であると考えられる。また、6番目、8番目、17番目のデータ項目も選択率が高く、重要なデータ項目であると考えられる。   The above processing was repeated 10,000 times, and the selectivity of each data item when the stepwise method was successful (that is, when the data item could be selected by the stepwise method) was obtained. FIG. 11 is a graph showing the selectivity for each data item when the stepwise method is successful. In FIG. 11, the vertical axis indicates the selectivity, and the horizontal axis indicates the data item number. As shown in FIG. 11, the selectivity of the second data item is remarkably high and is considered to be an important data item. The sixth, eighth, and seventeenth data items also have high selection rates and are considered to be important data items.

また、発明者は、ステップワイズ法が成功した場合それぞれにおけるモデルの誤差を評価し、誤差の小さなモデルに共通して選ばれたデータ項目を調査した。図12は、モデルの誤差の評価値が小さい場合におけるデータ項目の選択率を示すグラフである。図12の上のグラフは評価値を誤差の二乗平均平方根とした場合の結果を示し、中央のグラフは評価値を誤差のL1ノルム(絶対値平均)とした場合の結果を示し、下のグラフは評価値を誤差の∞ノルム(最大値)とした場合の結果を示している。各グラフにおいて、縦軸は選択率を示し、横軸はデータ項目の番号を示している。   In addition, the inventor evaluated the model error in each case where the stepwise method was successful, and investigated data items that were commonly selected for models with small errors. FIG. 12 is a graph showing the selectivity of data items when the evaluation value of the model error is small. The upper graph in FIG. 12 shows the result when the evaluation value is the root mean square of the error, the middle graph shows the result when the evaluation value is the L1 norm of the error (average absolute value), and the lower graph. Indicates the result when the evaluation value is the ∞ norm (maximum value) of the error. In each graph, the vertical axis indicates the selectivity, and the horizontal axis indicates the number of the data item.

図12より、6番目、16番目、11番目等のデータ項目が、誤差の小さなモデルに共通して選択されていることが分かり、重要なデータ項目であると考えられる。   From FIG. 12, it can be seen that the sixth, sixteenth, eleventh, etc. data items are commonly selected for models with small errors, and are considered important data items.

また、発明者は、ステップワイズ法が失敗した(つまり、ステップワイズ法ではデータ項目を選択できなかった)場合における各データの選択率を求めた。図13は、ステップワイズ法が失敗したときのデータ毎の選択率を示すグラフである。図13において、縦軸は選択率を、横軸はデータの番号を示している。図13に示すように、11番目のデータが選択されたときには、8割程度の確率でステップワイズ法が失敗している。このデータは異常データである可能性が高く、解析対象から除外すべきデータであることが分かる。   In addition, the inventor calculated the selectivity of each data when the stepwise method failed (that is, the data item could not be selected by the stepwise method). FIG. 13 is a graph showing the selectivity for each data when the stepwise method fails. In FIG. 13, the vertical axis indicates the selectivity, and the horizontal axis indicates the data number. As shown in FIG. 13, when the eleventh data is selected, the stepwise method has failed with a probability of about 80%. This data is highly likely to be abnormal data, and it can be seen that this data is data to be excluded from the analysis target.

以上のように、実施の形態1に係る解析対象決定方法は、一見関係を見いだせないデータ群からでも、関係性を導出するための解析対象のデータ及びデータ項目を高精度に決定することができる。   As described above, the analysis target determination method according to Embodiment 1 can determine the analysis target data and data items for deriving the relationship with high accuracy even from a data group in which a relationship cannot be found at first glance. .

(実施の形態2)
本実施の形態に係る解析対象決定装置は、時系列データに対して処理を行い、異常が発生した時点を推定する。本実施の形態に係る解析対象決定装置の構成は、実施の形態1に係る解析対象決定装置1の構成と同様であるので、同一構成要素については同一符号を伏し、その説明を省略する。
(Embodiment 2)
The analysis target determination device according to the present embodiment performs processing on the time-series data, and estimates the time when an abnormality has occurred. The configuration of the analysis target determining apparatus according to the present embodiment is the same as the configuration of the analysis target determination apparatus 1 according to the first embodiment, and therefore, the same components are denoted by the same reference numerals and description thereof is omitted.

本実施の形態に係る解析対象決定装置の動作について説明する。図14は、本実施の形態に係る解析対象決定装置による解析対象決定処理の手順を示すフローチャートである。   The operation of the analysis object determination device according to the present embodiment will be described. FIG. 14 is a flowchart illustrating a procedure of an analysis target determination process performed by the analysis target determination device according to the present embodiment.

ステップS101〜S112の処理は、実施の形態1において説明したものと同様であるので、その説明を省略する。   The processing in steps S101 to S112 is the same as that described in the first embodiment, and a description thereof will not be repeated.

ステップS112の処理の後、CPU111は、各時刻におけるモデルの生成が可能か否かの判定結果により、ある時刻までは所定回数以上連続してモデルが生成可能と判定され、その時刻の後は所定回数以上連続してモデルが生成不可能と判定される時刻を検出する(ステップS213)。時系列データにおいて、このようなある時刻を挟んでモデルの生成が可能な状態からモデルの生成が不可能な状態に変化する場合、その時刻において異常が発生したと考えることができる。以下、当該時刻を「異常発生時刻」という。   After the process of step S112, the CPU 111 determines that the model can be continuously generated for a predetermined number of times or more until a certain time, based on the determination result of whether or not the model can be generated at each time. The time at which it is determined that the model cannot be generated continuously for the number of times or more is detected (step S213). In the time-series data, when the state changes from a state in which a model can be generated across such a certain time to a state in which a model cannot be generated, it can be considered that an abnormality has occurred at that time. Hereinafter, the time is referred to as “abnormality occurrence time”.

CPU111は、上記のような解析対象決定処理の処理結果画面を表示部13に表示させ(ステップS214)、解析対象決定処理を終了する。図15は、処理結果画面の例を示す図である。ステップS213において異常発生時刻が検出された場合、ステップS214において表示される処理結果画面32には、異常発生時刻の情報(異常発生時刻及びその時刻におけるデータの番号)が含まれる。これにより、ユーザに対して異常が発生したと推定される時刻を通知することができる。また、時系列データのどのデータにおいて異常が発生したかをユーザが特定できる   The CPU 111 causes the display unit 13 to display the processing result screen of the analysis target determination processing as described above (step S214), and ends the analysis target determination processing. FIG. 15 is a diagram illustrating an example of the processing result screen. When the abnormality occurrence time is detected in step S213, the processing result screen 32 displayed in step S214 includes information on the abnormality occurrence time (the abnormality occurrence time and the data number at that time). This allows the user to be notified of the time at which it is estimated that an abnormality has occurred. Further, the user can specify which data of the time-series data has an abnormality.

(実施の形態3)
本実施の形態に係る解析対象決定装置は、解析対象として決定されたデータのグループ分けを行う。本実施の形態に係る解析対象決定装置の構成は、実施の形態1に係る解析対象決定装置1の構成と同様であるので、同一構成要素については同一符号を伏し、その説明を省略する。
(Embodiment 3)
The analysis target determining apparatus according to the present embodiment performs grouping of data determined as an analysis target. The configuration of the analysis target determining apparatus according to the present embodiment is the same as the configuration of the analysis target determination apparatus 1 according to the first embodiment, and therefore, the same components are denoted by the same reference numerals and description thereof is omitted.

本実施の形態に係る解析対象決定装置の動作について説明する。図16は、本実施の形態に係る解析対象決定装置による解析対象決定処理の手順を示すフローチャートである。   The operation of the analysis object determination device according to the present embodiment will be described. FIG. 16 is a flowchart illustrating a procedure of an analysis target determination process performed by the analysis target determination device according to the present embodiment.

ステップS101〜S112の処理は、実施の形態1において説明したものと同様であるので、その説明を省略する。   The processing in steps S101 to S112 is the same as that described in the first embodiment, and a description thereof will not be repeated.

ステップS112の処理の後、CPU111は、モデルを生成可能と複数回判定された場合に、モデルを生成可能と判定されたときに共通して選択されていた複数のデータを特定し、特定された複数のデータを同一のグループとして決定する(ステップS313)。   After the process of step S112, when it is determined that the model can be generated a plurality of times, the CPU 111 specifies a plurality of data that are commonly selected when the model is determined to be able to be generated, and A plurality of data are determined as the same group (step S313).

例えば、複数の溶接ロボットから取得されたデータの場合、溶接ロボットの構成の違い(例えば、ロボットの大きさの違い、手先トーチの違い、地面据え置きかスライダーに取り付けられているか)、用途の違い(溶接材料の厚みの違い、継ぎ手の違い、ウィビングの仕方の違い)等によって、溶接ロボットの特性の傾向が異なる。このため、モデルの生成が可能か否かの判定対象のデータに、構成、用途等が異なる複数種類の溶接ロボットから収集されたデータが含まれている場合、モデルが生成不可能と判定されることが多い。これに対して、モデルが生成可能と判定された場合に選択されているデータは、構成、用途等が共通する溶接ロボットから収集されたものであると推定できる。したがって、上記のステップS313の処理によって、傾向毎にデータをグループ分けすることができる。各グループのデータを解析することで、グループ毎にデータの傾向を捉えることが可能となる。   For example, in the case of data obtained from a plurality of welding robots, differences in the configuration of the welding robot (for example, differences in the size of the robot, differences in the hand torch, whether the robot is stationary on the ground or mounted on the slider), differences in the application ( The tendency of the characteristics of the welding robot differs depending on the difference in the thickness of the welding material, the difference in the joint, the difference in the way of weaving, and the like. For this reason, if data to be determined as to whether or not a model can be generated includes data collected from a plurality of types of welding robots having different configurations, uses, and the like, it is determined that the model cannot be generated. Often. On the other hand, the data selected when it is determined that the model can be generated can be estimated to be collected from welding robots having a common configuration, application, and the like. Therefore, data can be grouped for each tendency by the process of step S313 described above. By analyzing the data of each group, it is possible to grasp the tendency of the data for each group.

CPU111は、上記のような解析対象決定処理の処理結果画面を表示部13に表示させ(ステップS314)、解析対象決定処理を終了する。図17は、処理結果画面の例を示す図である。ステップS314において表示される処理結果画面33には、ステップS313において分けられたグループに含まれるデータの番号が、グループ毎に表示される。これにより、ユーザに対してグループ分けの結果を通知することができる。ユーザは、各グループに含まれるデータを特定することができ、グループ毎にデータの解析を行うことができる。   The CPU 111 causes the display unit 13 to display the processing result screen of the analysis target determination processing as described above (step S314), and ends the analysis target determination processing. FIG. 17 is a diagram illustrating an example of the processing result screen. On the processing result screen 33 displayed in step S314, the numbers of the data included in the groups divided in step S313 are displayed for each group. This allows the user to be notified of the grouping result. The user can specify the data included in each group, and can analyze the data for each group.

(その他の実施の形態)
上述した実施の形態1〜3においては、全データからランダムに選択されたデータ(Ysi,Xsi)に対してステップワイズ法を適用する構成について述べたが、これに限定されるものではない。前回以前のモデルの生成が可能か否かの判定結果に基づいて、モデルの生成に適さないデータと推定されるデータをステップワイズ法の適用対象から除外するようにしてもよい。これにより、データの探索範囲を絞ることができ、解析対象決定処理の計算量を低減することができる。
(Other embodiments)
In the above-described first to third embodiments, the configuration in which the stepwise method is applied to data (Y si , X si ) randomly selected from all data has been described, but the present invention is not limited to this. . Based on the result of the determination as to whether or not it is possible to generate a model before the previous time, data that is estimated to be unsuitable for generating a model may be excluded from the target to which the stepwise method is applied. As a result, the data search range can be narrowed, and the amount of calculation in the analysis target determination processing can be reduced.

また、上述した実施の形態1〜3においては、ステップワイズ法によって全データ項目からモデルの生成に適したデータ項目を選択する構成について述べたが、これに限定されるものではない。前回以前のステップワイズ法の処理結果に基づいて、モデルの生成に適さないと推定されるデータ項目をステップワイズ法の適用対象から除外するようにしてもよい。これによっても、データの探索範囲を絞ることができ、解析対象決定処理の計算量を低減することができる。   Further, in the above-described first to third embodiments, the configuration in which a data item suitable for generating a model is selected from all data items by the stepwise method has been described, but the present invention is not limited to this. Based on the processing results of the stepwise method before the previous time, data items that are estimated to be unsuitable for generating a model may be excluded from the application of the stepwise method. This also makes it possible to narrow the data search range and reduce the amount of calculation in the analysis target determination processing.

また、上述した実施の形態1〜3においては、解析対象決定装置を1つのコンピュータによって構成したが、これに限定されるものではない。互いにデータ通信可能に接続された複数のコンピュータによって解析対象決定装置を構成し、異なるデータの組み合わせに対して各コンピュータでステップワイズ法を実行する構成とすることも可能である。   In Embodiments 1 to 3 described above, the analysis target determination apparatus is configured by one computer, but is not limited to this. The analysis target determination apparatus may be configured by a plurality of computers connected to each other so as to be able to perform data communication, and each computer may execute the stepwise method for a different combination of data.

本発明の解析対象決定装置及び解析対象決定方法は、多種多量のデータから解析対象のデータを決定するための解析対象決定装置及び解析対象決定方法として有用である。   INDUSTRIAL APPLICABILITY The analysis target determination apparatus and the analysis target determination method of the present invention are useful as an analysis target determination apparatus and an analysis target determination method for determining data to be analyzed from a large amount of various data.

1 解析対象決定装置
10 コンピュータ
11 本体
12 入力部
13 表示部
110 機器データ処理プログラム
111 CPU
115 ハードディスク
116 入出力インタフェース
117 画像出力インタフェース
118 通信インタフェース
Reference Signs List 1 analysis target determination device 10 computer 11 main body 12 input unit 13 display unit 110 device data processing program 111 CPU
115 hard disk 116 input / output interface 117 image output interface 118 communication interface

Claims (11)

複数のデータ項目を含むデータを解析する場合に、少なくとも一部のデータ項目を変数として含むモデルを用いた解析の対象を決定する解析対象決定装置であって、
複数のデータから毎回異なる一部のデータを選択する選択手段と、
前記選択手段によって選択されたデータに基づいて、モデルの生成に適するデータ項目が選択可能であるか否かを判定する判定手段と、
前記選択手段及び前記判定手段による処理を複数回繰り返した後、前記判定手段による判定結果に基づいて、解析対象とするデータを決定する決定手段と、
を備える、解析対象決定装置。
When analyzing data including a plurality of data items, an analysis target determination device that determines an analysis target using a model including at least some data items as variables,
Selecting means for selecting some different data each time from a plurality of data;
A determination unit that determines whether a data item suitable for generating a model is selectable based on the data selected by the selection unit;
After repeating the processing by the selection unit and the determination unit a plurality of times, a determination unit that determines data to be analyzed based on a determination result by the determination unit,
An analysis target determination device comprising:
前記選択手段及び前記判定手段による処理を複数回繰り返した後、前記判定手段による判定結果に基づいて、解析に用いられるデータ項目を決定する第2決定手段をさらに備える、
請求項1に記載の解析対象決定装置。
After repeating the processing by the selection unit and the determination unit a plurality of times, further includes a second determination unit that determines a data item used for analysis based on a determination result by the determination unit,
The analysis target determination device according to claim 1.
前記決定手段は、前記判定手段によって選択可能とされたデータ項目毎の回数に基づいて、解析に用いられるデータ項目を決定するように構成されている、
請求項2に記載の解析対象決定装置。
The determining unit is configured to determine a data item used for analysis based on the number of times for each data item selected by the determining unit.
The analysis target determination device according to claim 2.
前記判定手段によって前記データ項目が選択可能と判定された場合、選択可能とされたデータ項目を用いて生成されたモデルの誤差を評価する評価手段をさらに備え、
前記第2決定手段は、前記選択手段、前記判定手段、及び前記評価手段による処理を複数回繰り返した後、前記評価手段による評価結果に基づいて、解析に用いられるデータ項目を決定するように構成されている、
請求項2に記載の解析対象決定装置。
When the data item is determined to be selectable by the determination unit, further includes an evaluation unit that evaluates an error of a model generated using the selectable data item,
The second determining unit is configured to determine a data item used for analysis based on an evaluation result by the evaluating unit after repeating the processing by the selecting unit, the determining unit, and the evaluating unit a plurality of times. Have been
The analysis target determination device according to claim 2.
前記決定手段によって決定された解析対象のデータを出力する出力手段をさらに備える、
請求項1乃至4の何れかに記載の解析対象決定装置。
Further comprising an output unit that outputs data of the analysis target determined by the determination unit,
The analysis target determination device according to claim 1.
前記第2決定手段によって決定された解析に用いられるデータ項目を出力する出力手段をさらに備える、
請求項2乃至4の何れかに記載の解析対象決定装置。
Output means for outputting a data item used for the analysis determined by the second determination means,
The analysis target determination device according to claim 2.
前記解析対象のデータとは異なるデータを解析に適さないデータとして出力する第2出力手段をさらに備える、
請求項1乃至6の何れかに記載の解析対象決定装置。
The apparatus further includes a second output unit that outputs data different from the data to be analyzed as data that is not suitable for analysis,
The analysis target determination device according to claim 1.
前記複数のデータは時系列データであり、
前記第2出力手段は、前記判定手段が連続する複数のデータについて前記データ項目が選択可能と判定し、且つ、次の連続する複数のデータについて前記データ項目が選択不可能と判定した場合に、前記次の連続する複数のデータの先頭のデータを異常データとして出力するように構成されている、
請求項7に記載の解析対象決定装置。
The plurality of data is time-series data,
The second output unit, when the determination unit determines that the data item is selectable for a plurality of continuous data, and, when it is determined that the data item is not selectable for the next plurality of continuous data, It is configured to output the leading data of the next plurality of continuous data as abnormal data,
The analysis target determination device according to claim 7.
前記判定手段は、ステップワイズ法により前記モデルの生成に適するデータ項目が選択可能か否かを判定するように構成されている、
請求項1乃至8の何れかに記載の解析対象決定装置。
The determining means is configured to determine whether a data item suitable for generating the model can be selected by a stepwise method,
An analysis target determination device according to claim 1.
前記判定手段によって前記データ項目を選択可能と複数回判定された場合に、前記選択手段によって共通して選択されたデータを同一のグループとして決定する第3決定手段と、
前記第3決定手段によって同一のグループとして決定されたデータを出力する第3出力手段と、
をさらに備える、
請求項1乃至9の何れかに記載の解析対象決定装置。
A third determination unit that determines, when the determination unit determines that the data item is selectable a plurality of times, the data commonly selected by the selection unit as the same group;
Third output means for outputting data determined as the same group by the third determination means,
Further comprising,
The analysis target determination device according to claim 1.
複数のデータ項目を含むデータを解析する場合に、少なくとも一部のデータ項目を変数として含むモデルを用いた解析の対象を決定する解析対象決定方法であって、
コンピュータが、複数のデータから毎回異なる一部のデータを選択するステップと、
前記コンピュータが、選択されたデータに基づいて、モデルの生成に適するデータ項目が選択可能であるか否かを判定するステップと、
前記コンピュータが、前記選択するステップ及び前記判定するステップを複数回繰り返した後、前記判定するステップにおける判定結果に基づいて、解析対象とするデータを決定するステップと、
を有する、解析対象決定方法。
When analyzing data including a plurality of data items, an analysis target determination method for determining an analysis target using a model including at least some data items as variables,
A step in which the computer selects different data from the plurality of data each time;
The computer determines, based on the selected data, whether a data item suitable for generating a model can be selected, and
The computer, after repeating the selecting step and the determining step a plurality of times, based on the determination result in the determining step, determining data to be analyzed,
An analysis target determination method, comprising:
JP2016016950A 2016-02-01 2016-02-01 Analysis target determination apparatus and analysis target determination method Active JP6633403B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016016950A JP6633403B2 (en) 2016-02-01 2016-02-01 Analysis target determination apparatus and analysis target determination method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016016950A JP6633403B2 (en) 2016-02-01 2016-02-01 Analysis target determination apparatus and analysis target determination method

Publications (2)

Publication Number Publication Date
JP2017138643A JP2017138643A (en) 2017-08-10
JP6633403B2 true JP6633403B2 (en) 2020-01-22

Family

ID=59565902

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016016950A Active JP6633403B2 (en) 2016-02-01 2016-02-01 Analysis target determination apparatus and analysis target determination method

Country Status (1)

Country Link
JP (1) JP6633403B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6529688B2 (en) * 2016-11-21 2019-06-12 株式会社日立製作所 Selection apparatus, selection method, and selection program

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005222445A (en) * 2004-02-09 2005-08-18 Nifty Corp Information processing method and analysis device in data mining
JP5085016B2 (en) * 2005-06-01 2012-11-28 富士通セミコンダクター株式会社 Data analysis method and data analysis program
JP5011830B2 (en) * 2006-06-09 2012-08-29 富士通セミコンダクター株式会社 DATA PROCESSING METHOD, DATA PROCESSING PROGRAM, RECORDING MEDIUM CONTAINING THE PROGRAM, AND DATA PROCESSING DEVICE
JP5176206B2 (en) * 2007-08-24 2013-04-03 新日鉄住金エンジニアリング株式会社 Process state similar case search method and process control method
WO2014199920A1 (en) * 2013-06-12 2014-12-18 日本電気株式会社 Prediction function creation device, prediction function creation method, and computer-readable storage medium

Also Published As

Publication number Publication date
JP2017138643A (en) 2017-08-10

Similar Documents

Publication Publication Date Title
US10739752B2 (en) Computer system and method for causality analysis using hybrid first-principles and inferential model
US7373283B2 (en) Monitoring and fault detection system and method using improved empirical model for range extrema
US7739096B2 (en) System for extraction of representative data for training of adaptive process monitoring equipment
US11216741B2 (en) Analysis apparatus, analysis method, and non-transitory computer readable medium
CN102209958B (en) Systems and methods for real-time classification and performance monitoring of batches
JP5284503B2 (en) Diagnostic system and method for predictive condition monitoring
JP4394286B2 (en) Multidimensional method and system for statistical process management
JP4911055B2 (en) Batch process data analysis apparatus and abnormality detection / quality estimation apparatus using the same
JP5292477B2 (en) Diagnostic device and diagnostic method
JP4046309B2 (en) Plant monitoring device
EP2930579A2 (en) State monitoring system, state monitoring method and state monitoring program
KR20200017506A (en) Device for diagnosing abnormalities in processes and how to diagnose abnormalities
JP6708203B2 (en) Information processing apparatus, information processing method, and program
JP6702297B2 (en) Abnormal state diagnosis method and abnormal state diagnosis device
JP2017194341A (en) Abnormality diagnosis method, abnormality diagnosis device, and abnormality diagnosis program
CN118568647A (en) Industrial equipment fault intelligent detection method and system based on digital twin
Gitzel Data Quality in Time Series Data: An Experience Report.
KR101883277B1 (en) Method and device for fault detection of manufacturing process based on dynamic time warping and exponentioal penaltu(dtwep)
CN115640860A (en) Electromechanical equipment remote maintenance method and system for industrial cloud service
US7171314B2 (en) Methods and systems for analyzing structural test data
JP6633403B2 (en) Analysis target determination apparatus and analysis target determination method
KR102486463B1 (en) Method and Apparatus for Real Time Fault Detection Using Time series data According to Degradation
CN112685846A (en) Load spectrum acquisition test method and system
TW202121221A (en) Transferability determination apparatus, transferability determination method, and recording medium
JP7726298B2 (en) Information Processing Systems

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181203

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191126

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191210

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191212

R150 Certificate of patent or registration of utility model

Ref document number: 6633403

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150