JP7316129B2 - Processing system and processing program - Google Patents
Processing system and processing program Download PDFInfo
- Publication number
- JP7316129B2 JP7316129B2 JP2019130901A JP2019130901A JP7316129B2 JP 7316129 B2 JP7316129 B2 JP 7316129B2 JP 2019130901 A JP2019130901 A JP 2019130901A JP 2019130901 A JP2019130901 A JP 2019130901A JP 7316129 B2 JP7316129 B2 JP 7316129B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- evaluation
- processing
- information
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 373
- 238000011156 evaluation Methods 0.000 claims description 359
- 238000000034 method Methods 0.000 claims description 167
- 238000013210 evaluation model Methods 0.000 claims description 156
- 230000008569 process Effects 0.000 claims description 130
- 238000004891 communication Methods 0.000 claims description 129
- 238000004422 calculation algorithm Methods 0.000 description 47
- 230000010365 information processing Effects 0.000 description 28
- 238000010801 machine learning Methods 0.000 description 22
- 238000010586 diagram Methods 0.000 description 12
- 238000012854 evaluation process Methods 0.000 description 12
- 230000000694 effects Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 230000002159 abnormal effect Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000005856 abnormality Effects 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 230000015654 memory Effects 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Debugging And Monitoring (AREA)
Description
本発明は、処理システム、及び処理プログラムに関する。 The present invention relates to a processing system and a processing program.
従来、通信ログを解析して異常に関する評価を行う技術が知られていた(例えば、特許文献1参照)。 Conventionally, there has been known a technique of analyzing communication logs and evaluating abnormalities (see, for example, Patent Document 1).
しかしながら、特許文献1の技術においては、通信ログに対応する1個のモデルを用いて異常を評価していたので、通信ログに対する多面的な解析ができずに、評価精度が低下してしまう可能性があった。
However, in the technique of
本発明は上記事実に鑑みなされたもので、評価対象データの評価の精度を向上させることが可能となる処理システム及び処理プログラムを提供する事を目的とする。 SUMMARY OF THE INVENTION It is an object of the present invention to provide a processing system and a processing program capable of improving the accuracy of evaluation of evaluation target data.
上述した課題を解決し、目的を達成するために、請求項1に記載の処理システムは、評価対象データの評価に用いられる複数の評価用モデルを用いて行われる前記評価対象データの評価に関連する処理である評価関連処理を行う処理システムであって、評価関連データを取得する取得手段と、前記取得手段が取得した前記評価関連データに基づいて、前記評価関連処理を行う処理手段と、を備え、前記処理手段は、所定の基準に基づいて、前記取得手段が取得した複数の前記評価関連データを相互に関連付ける第1処理と、前記第1処理で関連付けられた複数の前記評価関連データに基づいて、前記評価関連処理を行う第2処理と、を実行し、複数の前記評価関連データは、所定の規格の通信で用いられる第1属性の複数のデータと、前記所定の規格の通信で用いられる第2属性の複数のデータと、を含み、前記第1属性の複数のデータ各々及び前記第2属性の複数のデータ各々は、所定の通信順番で通信されるデータであり、前記処理手段は、前記第1処理において、前記評価関連データの通信順番に基づいて、前記第1属性の複数のデータ各々及び前記第2属性の複数のデータ各々を相互に関連付け、前記第2処理において、前記第1処理で関連付けた前記第1属性の複数のデータ各々と前記第2属性の複数のデータ各々とを含む複数の組み合わせに基づいて、前記評価関連処理を行い、前記複数の組み合わせ各々に含まれるデータは、前記第1属性及び前記第2属性を含む2種類の属性のデータのみである。
In order to solve the above-described problems and achieve the object, the processing system according to
請求項2に記載の処理システムは、請求項1に記載の処理システムにおいて、前記取得手段は、前記評価対象データを、前記評価関連データとして取得し、前記処理手段は、前記取得手段が取得した前記評価対象データと、前記複数の評価用モデルとに基づいて、前記評価対象データを評価する処理を前記評価関連処理として行う。
The processing system according to
請求項3に記載の処理システムは、請求項2に記載の処理システムにおいて、前記処理手段は、前記取得手段が取得した前記評価対象データを、前記複数の評価用モデル各々を用いて評価し、前記複数の評価用モデル各々を用いて行われた各評価の結果を示す評価結果情報を生成する処理を前記評価関連処理として行う。
The processing system according to
請求項4に記載の処理システムは、請求項2又は3に記載の処理システムにおいて、前記処理手段は、前記評価対象データに含まれているデータ値に関する評価を行う処理、又は、前記評価対象データに含まれている時間に関する評価を行う処理を前記評価関連処理として行う。
4. The processing system according to
請求項5に記載の処理プログラムは、評価対象データの評価に用いられる複数の評価用モデルを用いて行われる前記評価対象データの評価に関連する処理である評価関連処理を行う処理プログラムであって、コンピュータを、評価関連データを取得する取得手段と、前記取得手段が取得した前記評価関連データに基づいて、前記評価関連処理を行う処理手段と、として機能させ、前記処理手段は、所定の基準に基づいて、前記取得手段が取得した複数の前記評価関連データを相互に関連付ける第1処理と、前記第1処理で関連付けられた複数の前記評価関連データに基づいて、前記評価関連処理を行う第2処理と、を実行し、複数の前記評価関連データは、所定の規格の通信で用いられる第1属性の複数のデータと、前記所定の規格の通信で用いられる第2属性の複数のデータと、を含み、前記第1属性の複数のデータ各々及び前記第2属性の複数のデータ各々は、所定の通信順番で通信されるデータであり、前記処理手段は、前記第1処理において、前記評価関連データの通信順番に基づいて、前記第1属性の複数のデータ各々及び前記第2属性の複数のデータ各々を相互に関連付け、前記第2処理において、前記第1処理で関連付けた前記第1属性の複数のデータ各々と前記第2属性の複数のデータ各々とを含む複数の組み合わせに基づいて、前記評価関連処理を行い、前記複数の組み合わせ各々に含まれるデータは、前記第1属性及び前記第2属性を含む2種類の属性のデータのみである。
The processing program according to
請求項1に記載の処理システム、及び請求項5に記載の処理プログラムによれば、複数の評価用モデルを用いて行われる評価に関連する評価関連処理を行うことにより、例えば、複数の評価用モデルを用いて行われる評価対象データの評価を行うことができるので、評価対象データの評価の精度を向上させることが可能となる。
また、所定の基準に基づいて複数の評価関連データを相互に関連付け、関連付けられた複数の評価関連データに基づいて、評価関連処理を行うことにより、例えば、所定の基準として評価関連データの通信仕様等の実情に即した基準を採用した場合、当該実情に即して評価関連処理を適切に行うことが可能となる。
According to the processing system according to
Further, by associating a plurality of evaluation-related data with each other based on a predetermined standard and performing evaluation-related processing based on the associated plurality of evaluation-related data, for example, the communication specification of the evaluation-related data as a predetermined standard In the case of adopting a criterion that is in line with the actual situation, it is possible to appropriately perform the evaluation-related processing in line with the actual situation.
請求項2に記載の処理システムによれば、評価対象データと複数の評価用モデルとに基づいて、評価対象データを評価する処理を行うことにより、例えば、評価対象データの評価精度を向上させることが可能となる。
According to the processing system of
請求項3に記載の処理システムによれば、評価対象データを複数の評価用モデル各々を用いて評価し、複数の評価用モデル各々を用いて行われた各評価の結果を示す評価結果情報を生成する処理を行うことにより、例えば、複数の評価用モデル各々を用いて行った評価対象データの評価の結果を適切に示すことが可能となる。
According to the processing system of
請求項4に記載の処理システムによれば、評価対象データに含まれているデータ値に関する評価を行う処理、又は、評価対象データに含まれている時間に関する評価を行う処理を行うことにより、例えば、データ値に関する評価、及び時間に関する評価を行うことができるので、評価対象データに対して様々な評価を行うことが可能となる。
According to the processing system of
以下に添付図面を参照して、この発明に係る処理システムの実施の形態を詳細に説明する。まず、〔I〕実施の形態の基本的概念を説明した後、〔II〕実施の形態の具体的内容について説明し、最後に、〔III〕実施の形態に対する変形例について説明する。ただし、実施の形態によって本発明が限定されるものではない。 Embodiments of a processing system according to the present invention will be described in detail below with reference to the accompanying drawings. First, [I] the basic concept of the embodiment will be explained, then [II] the specific contents of the embodiment will be explained, and finally [III] modifications of the embodiment will be explained. However, the present invention is not limited by the embodiment.
〔I〕実施の形態の基本的概念
まず、実施の形態の基本的概念について説明する。実施の形態は、処理システム、及び処理プログラムに関する。本発明に係る処理システムは、評価関連処理を行うシステムであり、例えば、評価関連処理を行うための専用システム、あるいは、汎用的に用いられるシステム(例えば、サーバコンピュータ、パーソナルコンピュータ、タブレット端末、車載システム等)に対して評価関連処理を行うための機能を実装することにより実現されるシステム等を含む概念である。「処理システム」とは、例えば、取得手段、及び処理手段を備える。
[I] Basic concept of the embodiment First, the basic concept of the embodiment will be described. Embodiments relate to a processing system and a processing program. The processing system according to the present invention is a system that performs evaluation-related processing. It is a concept that includes a system realized by implementing a function for performing evaluation-related processing on a system, etc.). A "processing system" comprises, for example, acquisition means and processing means.
また、「評価関連処理」とは、評価対象データの評価に用いられる複数の評価用モデルを用いて行われる評価対象データの評価に関連する処理であり、例えば、複数の評価用モデルを生成する処理、及び評価対象データを評価する処理等を含む概念である。 Further, "evaluation-related processing" is processing related to evaluation of evaluation target data performed using a plurality of evaluation models used for evaluation of evaluation target data. It is a concept that includes processing, processing for evaluating evaluation target data, and the like.
また、「取得手段」とは、評価関連データを取得する手段であり、例えば、複数の評価用モデルを生成するための教師データを評価関連データとして取得する手段等を含む概念であり、また、評価対象データを評価関連データとして取得する手段等を含む概念である。 In addition, "acquisition means" means means for acquiring evaluation-related data, and is a concept including, for example, means for acquiring teacher data for generating a plurality of evaluation models as evaluation-related data, and This is a concept including means for acquiring evaluation target data as evaluation-related data.
また、「評価関連データ」とは、評価関連処理を行う基となるデータであり、例えば、評価対象データ、及び教師データ等を含む概念である。 "Evaluation-related data" is data that serves as a basis for performing evaluation-related processing, and is a concept that includes, for example, evaluation target data, teacher data, and the like.
また、「評価対象データ」とは、複数の評価用モデルを用いて評価される対象となるデータであり、具体的には、任意の通信規格を想定した通信でのデータ、あるいは、当該通信規格を想定していない通信でのデータ等を含む概念であり、例えば、各データの属性が識別可能なデータ、あるいは、各データの属性が識別不可能なデータ等を含む概念であり、一例としては、CAN(Controller Area Network)、イーサネット(登録商標)、USB(Universal Serial Bus)等の通信規格の通信のデータ等を含む概念であり、また、これらの通信規格の通信を想定した機器での実際の通信のログデータ等を含む概念である。 In addition, "evaluation target data" is data to be evaluated using a plurality of evaluation models. For example, it is a concept that includes data whose attributes are identifiable, or data whose attributes are unidentifiable. , CAN (Controller Area Network), Ethernet (registered trademark), USB (Universal Serial Bus), and other communication standards. This concept includes communication log data, etc.
また、「教師データ」とは、複数の評価用モデルを生成するためのデータであり、例えば、複数のモデルを生成するために行われる機械学習で用いられるデータであり、具体的な種類やフォーマットは前述の評価対象データと同様であり、つまり、CAN等の通信規格に準拠した通信のログデータ等を含む概念である。なお、この「教師データ」として用いられるデータについては、例えば、前述の任意の通信規格又は他の所定のルールを基準に判断して、正常であるか異常であるかが予め定められているデータを用いることができる。 In addition, "teaching data" is data for generating multiple evaluation models. For example, it is data used in machine learning to generate multiple models. is the same as the evaluation target data described above, that is, it is a concept that includes communication log data and the like conforming to communication standards such as CAN. It should be noted that the data used as this "teaching data" is, for example, data that is determined in advance as to whether it is normal or abnormal based on the above-mentioned arbitrary communication standards or other predetermined rules. can be used.
また、「評価用モデル」とは、評価対象データの評価に用いられるモデルであり、例えば、機械学習によって生成されるモデル、あるいは、機械学習以外の他の任意の手法(例えば、シミュレーション、又は、実験等を行う手法等)で生成されるモデル等を含む概念である。なお、「評価対象データの評価に用いられる複数の評価用モデル」とは、例えば、評価対象データを評価する場合の処理に用いられる複数個の評価用モデル等を含む概念であり、つまり、一例としては、処理システムでは、評価対象データを1個評価するために、評価用モデルが複数個用いられることになる。 In addition, "evaluation model" is a model used for evaluation of evaluation target data, for example, a model generated by machine learning, or any other method other than machine learning (e.g., simulation, or It is a concept that includes models, etc. generated by methods of conducting experiments, etc.). Note that "a plurality of evaluation models used to evaluate evaluation target data" is a concept that includes, for example, a plurality of evaluation models used in processing when evaluating evaluation target data. As a result, in the processing system, a plurality of evaluation models are used in order to evaluate one piece of evaluation target data.
また、「処理手段」とは、取得手段が取得した評価関連データに基づいて、評価関連処理を行う手段であり、例えば、取得手段が取得した評価関連データの属性単位で評価関連処理を行う手段等を含む概念である。「評価関連データの属性」とは、例えば、評価関連データをグループに分ける基準として用いられる概念であり、一例としては、CAN等の通信規格で定められているデータの任意の事項(例えば、データ内容や送信ノード等)を識別するための識別情報(つまり、「ID」)等を含む概念である。 Further, the "processing means" is means for performing evaluation-related processing based on the evaluation-related data acquired by the acquisition means. It is a concept that includes "Attribute of evaluation-related data" is, for example, a concept used as a criterion for dividing evaluation-related data into groups. It is a concept including identification information (that is, “ID”) for identifying content, transmission node, etc.).
また、「処理手段」とは、例えば、所定の基準に基づいて、取得手段が取得した複数の評価関連データを相互に関連付け、関連付けられた複数の評価関連データに基づいて評価関連処理を行う手段等を含む概念である。「所定の基準」とは、予め定められている基準であり、例えば、通信規格又は通信の仕様等から定められている基準(つまり、通信の実情に即した基準)等を含む概念である。 Further, the "processing means" means, for example, a means for performing evaluation-related processing based on the associated plurality of evaluation-related data, by associating the plurality of evaluation-related data acquired by the acquisition means with each other based on a predetermined standard. It is a concept that includes The “predetermined standard” is a predetermined standard, and is a concept including, for example, a standard determined from a communication standard or a communication specification (that is, a standard based on the actual situation of communication).
また、「処理手段」とは、例えば、予め定められている判定用モデルに基づいて、取得手段が取得した評価関連データを評価関連処理の対象とするか否かを判定し、評価関連処理の対象とするものと判定した評価関連データに基づいて、評価関連処理を行う手段等を含む概念である。「判定用モデル」とは、取得手段が取得した評価関連データを評価関連処理の対象とするか否かを判定するために用いられるモデルであり、例えば、機械学習によって生成されるモデル、あるいは、機械学習以外の他の任意の手法(例えば、シミュレーション、又は、実験等を行う手法等)で生成されるモデル等を含む概念である。 Further, the "processing means", for example, determines whether or not the evaluation-related data acquired by the acquisition means is to be subjected to the evaluation-related processing, based on a predetermined determination model, and performs the evaluation-related processing. This is a concept including means for performing evaluation-related processing based on evaluation-related data determined to be targeted. The “determination model” is a model used for determining whether or not the evaluation-related data acquired by the acquisition means is to be subjected to evaluation-related processing. For example, a model generated by machine learning, or It is a concept that includes models and the like generated by any method other than machine learning (for example, a method of conducting simulations, experiments, or the like).
また、「処理手段」とは、例えば、取得手段が取得した教師データと、複数の評価用モデルを生成するための機械学習用の所定のアルゴリズムとに基づいて、機械学習により複数の評価用モデルを生成する処理を評価関連処理として行う手段等を含む概念である。「所定のアルゴリズム」とは、複数の評価用モデルを生成するためのアルゴリズムであり、具体的には、外れ値を検出するためのモデルを生成するためのアルゴリズム、あるいは、その他の任意のアルゴリズム等を含む概念であり、例えば、機械学習における「OneClassSVMのアルゴリズム」等を含む概念である。 In addition, the "processing means" is, for example, based on the teacher data acquired by the acquisition means and a predetermined algorithm for machine learning for generating a plurality of evaluation models, by machine learning is a concept including means for performing the process of generating the , as an evaluation-related process. "Predetermined algorithm" is an algorithm for generating a plurality of evaluation models, specifically an algorithm for generating a model for detecting outliers, or any other algorithm, etc. For example, it is a concept that includes the "OneClass SVM algorithm" in machine learning.
また、「処理手段」とは、例えば、前述の所定のアルゴリズムにおける複数のパラメータの内の一部のパラメータの値を変更することにより、複数の評価用モデルを生成する手段等を含む概念であり、一例としては、前述の「OneClassSVMのアルゴリズム」が有する調整可能なパラメータである「カーネル」等を含む公知の複数のパラメータのうちの1個のパラメータの値を変更することにより、複数の評価用モデルを生成する手段等を含む概念である。 Further, "processing means" is a concept that includes means for generating a plurality of evaluation models by, for example, changing the values of some of the plurality of parameters in the above-described predetermined algorithm. , As an example, by changing the value of one of a plurality of known parameters including the "kernel" which is an adjustable parameter of the above-mentioned "OneClass SVM algorithm", a plurality of evaluation It is a concept that includes means for generating a model.
また、「処理手段」とは、例えば、取得手段が取得した評価対象データを、複数の評価用モデル各々を用いて評価し、複数の評価用モデル各々を用いて行われた各評価の結果を示す評価結果情報を生成する処理を評価関連処理として行う手段等を含む概念であり、また、評価対象データに含まれているデータ値に関する評価を行う処理、又は、評価対象データに含まれている時間に関する評価を行う処理を評価関連処理として行う手段等を含む概念である。 Further, the "processing means" means, for example, evaluating the evaluation target data acquired by the acquiring means using each of a plurality of evaluation models, and calculating the results of each evaluation performed using each of the plurality of evaluation models. It is a concept that includes means for performing, as an evaluation-related process, the process of generating the evaluation result information shown, and also the process of evaluating the data values contained in the evaluation target data, or the evaluation target data This is a concept including means for performing time-related evaluation processing as evaluation-related processing.
そして、以下に示す各実施の形態においては、「評価対象データ」及び「教師データ」がCANの通信規格の通信のログデータである場合について説明し、特に、実施の形態1では、評価対象データに含まれているデータ値に関する評価を行う場合について説明し、また、実施の形態2では、評価対象データに含まれている時間に関する評価を行う場合について説明し、また、実施の形態3では、評価対象データに含まれているデータ値に関する評価を行う場合であって、複数の評価関連データを相互に関連付けて評価する場合について説明する。 In each of the embodiments shown below, a case where "evaluation target data" and "teacher data" are communication log data of the CAN communication standard will be described. In the second embodiment, the case of evaluating the time included in the evaluation target data will be described. In the third embodiment, A case will be described where evaluation is performed on data values contained in evaluation target data, and evaluation is performed by associating a plurality of evaluation-related data with each other.
〔II〕各実施の形態の具体的内容
次に、各実施の形態の具体的内容について説明する。
[II] Specific Contents of Each Embodiment Next, specific contents of each embodiment will be described.
(実施の形態1)
最初に、実施の形態1について説明する。この実施の形態は、評価対象データに含まれているデータ値に関する評価を行う形態である。
(Embodiment 1)
First,
(構成)
まず、本実施の形態に係る情報処理装置について説明する。図1は、本実施の形態に係る情報処理装置を機能概念的に示すブロック図である。情報処理装置1は、処理システムであり、例えば、パーソナルコンピュータであり、一例としては、入力部11、出力部12、記録部13、及び制御部14を備える。
(composition)
First, an information processing apparatus according to this embodiment will be described. FIG. 1 is a block diagram functionally conceptually showing an information processing apparatus according to the present embodiment. The
(構成‐入力部)
入力部11は、情報を入力する入力手段である。この入力部11の具体的な構成は任意であるが、例えば、公知のマウスやキーボード等を用いて構成することができる。
(Configuration - input section)
The
(構成‐出力部)
出力部12は、情報を出力する出力手段である。この出力部12の具体的な構成は任意であるが、例えば、公知のディスプレイ等を用いて構成することができる。
(Configuration - output section)
The
(構成‐記録部)
記録部13は、情報処理装置1の動作に必要なプログラム及び各種のデータを記録する記録手段であり、例えば、外部記録装置としてのハードディスク(図示省略)を用いて構成されている。ただし、ハードディスクに代えてあるいはハードディスクと共に、フラッシュメモリ、磁気ディスクの如き磁気的記録媒体、又はDVDやブルーレイディスクの如き光学的記録媒体を含む、その他の任意の記録媒体を用いることができる。
(Construction-recording unit)
The
この記録部13には、例えば、分析対象データ特定情報、学習用データ特定情報、及び第1モデル特定情報が格納されている。
The
(構成‐記録部‐分析対象データ特定情報)
記録部13の「分析対象データ特定情報」とは、分析対象データを特定する情報である。「分析対象データ」とは、前述の評価関連データであり、具体的には、前述の評価対象データであり、例えば、CANの通信規格の通信のログデータ(つまり、CAN通信の通信を想定した機器での通信のログデータ)である。図2は、分析対象データ特定情報を例示した図である。「分析対象データ特定情報」は、例えば、図2に示すように、項目「行情報」、項目「時間情報」、項目「データID」、及び項目「ペイロード情報」と、各項目に対応する情報とが相互に関連付けられている情報である。項目「行情報」は、各情報(時間情報、データID、及びペイロード情報の組み合わせ)を一意に識別する行情報である(図2では、一意の数値であり「1」等)。項目「時間情報」に対応する情報は、各情報(データID、及びペイロード情報)に付されているタイムスタンプ(つまり、通信が行われた時間)を特定する時間情報である(図2では、「t1」等)。なお、ここでの「t1」等について便宜上の表記であり、実際には、任意のタイミングを基準にして、当該タイミングからの経過時間等が用いられ、つまり、CAN通信で各データの送信または受信が行われたタイミングを特定する時間が用いられることとする。項目「データID」に対応する情報は、評価関連データの属性を特定する情報であり、例えば、CAN通信のデータ内容や送信ノード等を識別するIDである(図2では、CAN通信のデータフレームの中のIDに対応する情報であり、「ID11」等)。なお、この「ID11」等については、説明の便宜上の記載である。項目「ペイロード情報」とは、データ値であり、CAN通信で送受信されるデータ本体を特定するペイロード情報である。なお、ペイロード情報は任意であり、CAN通信のデータフレーム中のデータフィールドに対応する情報であり、8バイトの情報であって16進数表記の「10 20 30 40 50 60 70 80」等の情報であるが、図2では、説明の便宜上、この情報を「D1」等を表記して説明する。なお、ここので、行情報、時間情報、データID、及びペイロード情報が相互に対応付けられた情報が、「分析対象データ」に対応する。
(Configuration - recording section - analysis target data identification information)
The “analysis target data specifying information” of the
そして、このような分析対象データ特定情報における分析対象データの格納手法は任意であるが、例えば、公知の不図示のログ収集装置が、CAN通信を行う車載システム(開発中又は実装済のシステム)における、CAN通信の通信データ(少なくともデータID及びペイロード情報を含むデータ)を収集し、収集した通信データにタイムスタンプを付してログ収集装置の記録部に記録するように構成されていることとする。そして、このログ収集装置に記録されているタイムスタンプが付された通信データを、任意の手法(例えば、当該ログ収集装置との間で通信を行う手法、あるいは、メモリスティック等の記録媒体を用いる手法等)で情報処理装置1に入力することとし、制御部14が、この入力されたタイムスタンプ付きの通信データに行情報を付して、当該付した行情報、タイムスタンプ、通信データのデータID、及び通信データのペイロード情報を記録することにより、図2の分析対象データとして格納する。あるいは、前述の公知の不図示のログ収集装置が、CAN通信を行う車載システムにおける、CAN通信の通信データを収集して、図2の分析対象データを生成して自己の記録部に記録するように構成されていることとし、このログ収集装置に記録されている分析対象データを任意の手法で情報処理装置1に入力することとし、制御部14が、入力された分析対象データを格納することとしてもよい(他の実施の形態も同様とする)。
Any method of storing the analysis target data in such analysis target data specifying information may be used. 3, collects communication data of CAN communication (data including at least data ID and payload information), attaches a time stamp to the collected communication data, and records it in the recording unit of the log collection device do. Then, the time-stamped communication data recorded in the log collection device is collected by any method (for example, a method of communicating with the log collection device, or a recording medium such as a memory stick). method, etc.) to the
このようにして格納することにより、図2の分析対象データについては、順次行われたCAN通信の各情報が、図面上側から下側に向かって示されていることとし、つまり、少なくとも、時間情報「t1」~「t9」については、「データID」=「ID11」の通信が順次行われ、この後、少なくとも、時間情報「t101」~「t104」については、「データID」=「ID13」の通信が順次行われていることが示されていることとして、以下説明する。 By storing in this way, for the data to be analyzed in FIG. For 't1' to 't9', communication of 'data ID'='ID11' is performed sequentially, and thereafter, at least for time information 't101' to 't104', 'data ID'='ID13'. , which is shown to be performed sequentially, will be described below.
(構成‐記録部‐学習用データ特定情報)
図1に戻って、記録部13の「学習用データ特定情報」とは、学習用データを特定する情報である。「学習用データ」とは、前述の評価関連データであり、具体的には、前述の教師データであり、例えば、前述の分析対象データと同じ種類のデータであり、つまり、CANの通信規格の通信のログデータ(つまり、CAN通信の通信ログのデータ)である。「学習用データ特定情報」は、例えば、不図示であるが、図2の分析対象データ特定情報と同様に、項目「行情報」、項目「時間情報」、項目「データID」、及び項目「ペイロード情報」と、各項目に対応する情報とが相互に関連付けられている情報である。なお、これらの各項目に対応する情報が、「学習用データ」に対応し、分析対象データの同一名称の情報と同様であるので、詳細の説明を省略する。
(Configuration - recording unit - learning data identification information)
Returning to FIG. 1, the “learning data specifying information” of the
そして、このような学習用データ特定情報における学習用データの格納手法は任意であるが、例えば、前述のように、公知の不図示のログ収集装置が、CAN通信を行う車載システム(開発中又は実装済のシステム)における、CAN通信の通信データ(少なくともデータID及びペイロード情報を含むデータ)を収集し、収集した通信データにタイムスタンプを付してログ収集装置の記録部に記録するように構成されていることとする。そして、これらの記録されているタイムスタンプが付された通信データについて、例えば、任意の手法で、正常であるか異常であるかを判定し、正常であるものと判定した場合にのみ、当該正常であるものと判定された通信データを、前述の任意の手法で情報処理装置1に入力することとし、制御部14が、入力されたタイムスタンプ付きの通信データに行情報を付して、当該付した行情報、タイムスタンプ、通信データのデータID、及び通信データのペイロード情報を記録することにより、図1の学習用データ特定情報における学習用データとして格納する(他の実施の形態も同様とする)。 Any method can be used to store the learning data in the learning data specifying information. configured to collect CAN communication communication data (at least data including data ID and payload information) in the implemented system), attach a time stamp to the collected communication data, and record it in the recording unit of the log collection device It is assumed that Then, for the recorded communication data with time stamps, for example, it is determined by an arbitrary method whether it is normal or abnormal, and only when it is determined to be normal, the normal The communication data determined to be By recording the attached line information, time stamp, data ID of communication data, and payload information of communication data, it is stored as learning data in the learning data specifying information of FIG. do).
なお、ここでの通信データの判定については、例えば、管理者が、通信データのペイロード情報に着目して、車載システムにおけるCAN通信の仕様を基準に目視確認して判定することとしてもよいし、あるいは、CAN通信の仕様を基準に正常であるか異常であるかを判定する判定機能を任意の装置に実装し、当該判定機能を用いて判定することとしてもよい。このようにして格納することにより、正常であるものと定められている通信データ等が学習用データとして格納されることになる。 In addition, regarding the determination of the communication data here, for example, the administrator may pay attention to the payload information of the communication data and visually check based on the specification of CAN communication in the in-vehicle system. Alternatively, a judgment function for judging normality or abnormality based on CAN communication specifications may be implemented in any device, and judgment may be made using the judgment function. By storing in this manner, communication data determined to be normal is stored as learning data.
また、この学習用データとしては、CAN通信の仕様に基づく通信の通信データを含む、機械学習を行うために十分な量の正常であるものと定められている通信データ等が格納されていることとして、以下説明する。 In addition, as this learning data, a sufficient amount of communication data, etc., which is determined to be normal for performing machine learning, including communication data based on CAN communication specifications, is stored. will be described below.
(構成‐記録部‐第1モデル特定情報)
図1に戻って、記録部13の「第1モデル特定情報」とは、複数の評価用モデルを特定する情報であり、具体的には、分析対象データのデータID単位でペイロード情報(つまり、データ値)について評価するためのモデルを特定する情報である。図3は、第1モデル特定情報を例示した図である。「第1モデル特定情報」は、例えば、図3に示すように、項目「データID」、及び項目「モデル情報」と、各項目に対応する情報とが相互に関連付けられている情報である。項目「データID」に対応する情報は、図2の同一名称の情報と同様である。項目「モデル情報」に対応する情報は、評価用モデルを特定するモデル情報である。なお、モデル情報は任意であり、後述するモデル生成処理で生成されるモデルを特定する情報であって、例えば、説明の便宜上の記載としての図3の「ML11-1」等である。また、本実施の形態では、「評価用モデル」が、分析対象データが入力され、当該入力された分析対象データにおいて、分析対象データのペイロード情報が、学習用データを基準にして比較的大きく外れた値である、いわゆる外れ値に該当するか否かを検出するモデルであって、当該ペイロード情報が外れ値に該当する分析対象データを示す情報を出力するモデルである場合について説明する。そして、このような第1モデル特定情報の格納手法は任意であるが、例えば、後述するモデル生成処理を実行することにより格納される。
(Configuration-recording unit-first model specific information)
Returning to FIG. 1, the "first model specifying information" of the
(構成‐制御部)
図1に戻って、制御部14は、情報処理装置1を制御する制御手段であり、具体的には、CPU、当該CPU上で解釈実行される各種のプログラム(OSなどの基本制御プログラムや、OS上で起動され特定機能を実現するアプリケーションプログラムを含む)、及びプログラムや各種のデータを格納するためのRAMの如き内部メモリを備えて構成されるコンピュータである。特に、実施の形態に係るプログラムは、任意の記録媒体又はネットワークを介して情報処理装置1にインストールされることで、制御部14の各部を実質的に構成する。
(Configuration - control unit)
Returning to FIG. 1, the
この制御部14は、例えば、機能概念的に、取得部141、及び処理部142を備える。取得部141とは、評価関連データを取得する取得手段である。処理部142とは、取得部141が取得した評価関連データに基づいて、評価関連処理を行う処理手段である。なお、この制御部14の各部の処理については、後述する。
For example, the
(処理)
続いて、本実施の形態に係る情報処理装置1によって実行される処理について説明する。具体的には、モデル生成処理、及び分析処理について説明する。
(process)
Next, processing executed by the
(処理‐モデル生成処理)
まず、モデル生成処理について説明する。「モデル生成処理」とは、概略的には、学習用データを用いて評価用モデルを生成する処理であり、例えば、図3の第1モデル特定情報を生成して格納する処理である。図4は、モデル生成処理のフローチャートである(以下の各処理の説明ではステップを「S」と略記する)。このモデル生成処理を実行するタイミングは任意であるが、例えば、図1の記録部13に十分な量の学習用データを特定する学習用データ特定情報が記録された後に、入力部11を介してユーザが所定操作を行った場合に起動を開始することとし、起動を開始したところから説明する(他の実施の形態のモデル生成処理も同様とする)。
(Processing - Model generation processing)
First, model generation processing will be described. The "model generation process" is roughly a process of generating an evaluation model using learning data, for example, a process of generating and storing the first model identification information in FIG. FIG. 4 is a flowchart of model generation processing (steps are abbreviated as "S" in the following description of each processing). Although the timing of executing this model generation process is arbitrary, for example, after the learning data specifying information for specifying a sufficient amount of learning data is recorded in the
図4のSA1において取得部141は、学習用データを取得する。具体的には任意であるが、例えば、図1の記録部13の学習用データ特定情報が特定する学習用データを取得する。ここでは、例えば、正常であるものと定められているCAN通信の通信データ等を取得することになるが、具体的には、図2の分析対象データと同じ種類のデータであって、行情報、時間情報、データID、及びペイロード情報が相互に関連付けられている学習用データを取得する。
At SA1 in FIG. 4, the
図4のSA2において処理部142は、学習用データをデータIDを基準に分類する。具体的には任意であるが、例えば、SA1で取得した学習用データを取得し、当該学習用データのデータIDを基準にして、同じデータIDが同じグループになるように分類する。ここでは、例えば、SA1で取得した学習用データに、図2の「データID」=「ID11」、「ID13」、不図示の「ID12」に対応する情報等が格納されていることとし、この場合、当該学習用データを、「データID」=「ID11」に対応するグループ、「データID」=「ID12」に対応するグループ、及び「データID」=「ID13」に対応するグループ等に分類する。このように分類することにより、データID単位で以下の処理を行うことが可能となる。
At SA2 in FIG. 4, the
図4のSA3において処理部142は、1つの処理単位のデータを取得する。具体的には任意であるが、例えば、SA2で分類した各グループにおけるの内の未だ取得されていない1つのデータIDに対応するグループの学習用データを取得する。ここでは、例えば、「データID」=「ID11」に対応するグループの学習用データ(つまり、行情報、時間情報、データID、及びペイロード情報)を取得する。
At SA3 in FIG. 4, the
図4のSA4において処理部142は、評価用モデルを複数生成する。具体的には任意であるが、例えば、不図示のモデル生成用アルゴリズムが記録部13に記録されていることとし、このモデル生成用アルゴリズムを用いて生成することとする。「モデル生成用アルゴリズム」とは、前述の所定のアルゴリズムであり、具体的には、外れ値を検出するためのモデルを生成するためのアルゴリズムであり、例えば、「OneClassSVMのアルゴリズム」である。そして、このモデル生成用アルゴリズムである「OneClassSVMのアルゴリズム」については、ユーザが値を設定可能な複数のパラメータとして「P1」、「P2」、及び「P3」の相互に異なる3個のパラメータを有しており、これらのパラメータに値を設定した上で、学習用データを当該モデル生成用アルゴリズムに適用することにより、モデルが生成されるように構成されており、当該生成されたモデルを評価用モデルとする。なお、ここでの複数のパラメータの名称としての「P1」、「P2」、及び「P3」は説明の便宜上の名称である。
At SA4 in FIG. 4, the
SA4の処理についてより具体的には、例えば、記録部13のモデル生成用アルゴリズムを取得し、取得したモデル生成用アルゴリズムの3個のパラメータの内の2個のパラメータについては各々任意の固定値を1個ずつ設定し、また、当該3個のパラメータの内の残りの1個のパラメータについては、10個の値を順次設定し、SA3で取得した学習用データのペイロード情報を当該モデル生成用アルゴリズムに順次適用して機械学習することにより、当該10個の値各々に対応する評価用モデルを1個ずつ生成して、合計10個の評価用モデルを生成する。
More specifically, for the processing of SA4, for example, the model generation algorithm of the
なお、ここでのモデル生成用アルゴリズムの3個のパラメータの内の何れのパラメータを10個の値を設定するパラメータにするか、及び各パラメータに設定する値(1個ずつの値、及び10個の値)については、モデル生成用アルゴリズムの仕様に基づいてユーザが事前に定めてもよし、又は、実験又はシミュレーション等に基づいてユーザが事前に定めてもよいし、又は、ランダムに定めてもよいし、また、これらを定めるための任意のロジックを実装して、当該ロジックを実行することにより定めてもよく、これらの定められた内容に応じて処理が実行されることとしてもよい。なお、本実施の形態では、前述の「P1」、「P2」、及び「P3」の内の、「P1」を10個の値を設定するパラメータとし「P2」、及び「P3」を1個ずつの値を設定するパラメータとする場合について説明する。 It should be noted that which of the three parameters of the model generation algorithm here should be the parameter for setting 10 values, and the values to be set for each parameter (one value each and 10 value) may be determined in advance by the user based on the specifications of the model generation algorithm, may be determined in advance by the user based on experiments or simulations, or may be determined randomly. Alternatively, they may be determined by implementing arbitrary logic for determining them and executing the logic, and processing may be executed according to these determined contents. In the present embodiment, of the above-mentioned "P1", "P2", and "P3", "P1" is a parameter for setting ten values, and "P2" and "P3" are one. A case where each value is set as a parameter will be described.
ここでは、例えば、記録部13の不図示のモデル生成用アルゴリズムである「OneClassSVMのアルゴリズム」を取得し、取得した「OneClassSVMのアルゴリズム」の3個のパラメータである「P1」、「P2」、及び「P3」の内の2個のパラメータである「P2」、及び「P3」については各々任意の固定値を1個ずつ設定し、また、当該3個のパラメータの内の残りの1個のパラメータである「P1」については、相互に異なる10個の値である「第1の値~第10の値」を順次設定し、SA3で取得した学習用データのペイロード情報を当該モデル生成用アルゴリズムに順次適用することにより、当該10個の値各々に対応する評価用モデルを1個ずつ生成して、合計10個の評価用モデルを生成する。より詳細には、例えば、「P1」に「第1の値」を設定した上で、前述の学習用データのペイロード情報である図2の「D1」~「D9」等を「OneClassSVMのアルゴリズム」に適用することにより機械学習を行って、「P1」が「第1の値」である場合の評価用モデルである図3の「ML11-1」が特定する評価用モデルを生成し、また、「P1」に「第2の値」を設定した上で、前述の学習用データのペイロード情報である図2の「D1」~「D9」等を「OneClassSVMのアルゴリズム」に適用することにより機械学習を行って、「P1」が「第2の値」である場合の評価用モデルである図3の「ML11-2」が特定する評価用モデルを生成する。そして、この後に、「P1」に「第3の値」~「第10の値」を設定した上で、前述の学習用データのペイロード情報である図2の「D1」~「D9」等を「OneClassSVMのアルゴリズム」に適用することにより機械学習を行って、「P1」が「第3の値」~「第10の値」である場合の評価用モデルである図3の「ML11-3」~「ML11-10」が特定する評価用モデルを生成する。
Here, for example, a "OneClassSVM algorithm" that is a model generation algorithm (not shown) of the
なお、ここでは、前述のように、正常であるものと定められている通信データ(つまり、ペイロード情報)が学習用データとして用いられ、また、「P1」に相互に異なる「第1の値」~「第10の値」が設定されることにより、相互に異なる基準で外れ値を検出する評価用モデルである「ML11-1」~「ML11-10」が特定する評価用モデルが生成されることになる。 Here, as described above, communication data determined to be normal (that is, payload information) is used as learning data, and mutually different "first values" ~ By setting the "tenth value", an evaluation model specified by "ML11-1" to "ML11-10", which are evaluation models that detect outliers based on mutually different criteria, is generated. It will be.
図4のSA5において処理部142は、評価用モデルを格納する。具体的には任意であるが、例えば、SA3で取得した単位であるデータIDを特定し、また、SA4で生成した評価用モデルを取得した上で、この特定したデータID、取得した評価用モデルを特定する情報を相互に対応付けて、図3のデータID及びモデル情報として格納する。ここでは、例えば、SA3で取得した単位であるデータIDである「ID11」を特定し、また、SA4で生成した評価用モデルであるが特定する評価用モデルを取得した上で、図3の「データID」=「ID11」、及び「モデル情報」=「ML11-1」~「ML11-10」を格納する。
At SA5 in FIG. 4, the
図4のSA6において処理部142は、処理を終了するか否かを判定する。具体的には任意であるが、例えば、SA2で分類した各グループの学習用データについて全て取得して対応する評価用モデルを生成したか否かを任意の手法(例えば、SA2で分類した各グループについて取得して評価用モデルを生成したか否かを示す情報が記録部13に記録されていることとし、この情報に着目して判定する手法等)で判定し、判定結果に基づいて判定する。そして、SA2で分類した各グループの学習用データについて全て取得して対応する評価用モデルを生成したわけではないものと判定した場合(つまり、SA2で分類した各グループにおいて、対応する評価用モデルが生成されていないものが未だ存在する場合)、処理を終了しないものと判定し(SA6のNO)、SA3に移行する。また、SA2で分類した各グループの学習用データについて全て取得して対応する評価用モデルを生成したものと判定した場合(つまり、SA2で分類した各グループにおいて、対応する評価用モデルが全て生成された場合)、処理を終了するものと判定し(SA6のYES)、処理を終了する。ここでは、例えば、前述の各処理を繰り返し行うことにより、SA2で分類した「データID」=「ID11」に対応するグループ、「データID」=「ID12」に対応するグループ、及び「データID」=「ID13」等に対応するグループ全てについて、対応する評価用モデルが生成された場合、処理を終了するものと判定する。そして、このようにして、図3の第1モデル特定情報が生成されて格納されることになる。これにて、モデル生成処理を終了する。
At SA6 in FIG. 4, the
(処理‐分析処理)
次に、分析処理について説明する。「分析処理」とは、概略的には、評価用モデルを用いて分析対象データを評価する処理である。図5は、分析処理のフローチャートである。この分析処理を実行するタイミングは任意であるが、例えば、記録部13に分析対象データ及び第1モデル特定情報が記録された後に、入力部11を介してユーザが所定操作を行った場合に起動を開始することとし、起動を開始したところから説明する。
(processing-analytical processing)
Next, analysis processing will be described. "Analysis processing" is roughly a process of evaluating analysis target data using an evaluation model. FIG. 5 is a flowchart of analysis processing. Although the timing of executing this analysis process is arbitrary, for example, after the data to be analyzed and the first model specifying information are recorded in the
図5のSB1において取得部141は、分析対象データを取得する。具体的には任意であるが、例えば、図1の記録部13の分析対象データ特定情報の分析対象データを取得する。ここでは、例えば、図2に示すように、行情報、時間情報、データID、及びペイロード情報が相互に関連付けられている分析対象データを取得する。
At SB1 in FIG. 5, the
図5のSB2において処理部142は、分析対象データをデータIDを基準に分類する。具体的には任意であるが、例えば、図4のSA2と同様な処理を行う。詳細には、SB1で取得した分析対象データを取得し、当該分析対象データのデータIDを基準にして、同じデータIDが同じグループになるように分類する。ここでは、例えば、SB1で取得した分析対象データを、図2の「データID」=「ID11」に対応するグループ、不図示の「データID」=「ID12」に対応するグループ、及び図2の「データID」=「ID13」に対応するグループ等に分類する。このように分類することにより、データID単位で以下の処理を行うことが可能となる。
At SB2 in FIG. 5, the
図5のSB3において処理部142は、1つの処理単位のデータを取得する。具体的には任意であるが、例えば、図4のSA3と同様な処理を行う。詳細には、SB2で分類した各グループにおけるの内の未だ取得されていない1つのデータIDに対応するグループの分析対象データを取得する。ここでは、例えば、図2の「データID」=「ID11」に対応するグループの分析対象データ(つまり、行情報、時間情報、データID、及びペイロード情報)を取得する。
At SB3 in FIG. 5, the
図5のSB4において処理部142は、評価処理を実行する。「評価処理」とは、分析対象データを評価して評価結果を格納する処理である。図6は、評価処理のフローチャートである。
At SB4 in FIG. 5, the
図6のSC1において処理部142は、評価用モデルを選択する。具体的には任意であるが、例えば、図5のSB3で取得した分析対象データに対応するデータIDを特定し、図3の第1モデル特定情報を参照して、当該特定したデータIDに対応するモデル情報を取得し、取得したモデル情報が特定する評価用モデルを選択する。ここでは、例えば、図5のSB3で取得した分析対象データに対応するデータIDである「ID11」を特定し、図3の第1モデル特定情報を参照して、当該特定したデータIDである「ID11」に対応するモデル情報である「ML11-1」~「ML11-10」を取得し、「ML11-1」~「ML11-10」が特定する評価用モデルを選択する。
In SC1 of FIG. 6, the
図6のSC2において処理部142は、分析対象データを評価する。具体的には任意であるが、例えば、前述したように、「評価用モデル」が、分析対象データが入力され、当該入力された分析対象データにおいて、分析対象データのペイロード情報が、学習用データを基準にして比較的大きく外れた値である、いわゆる外れ値に該当するか否かを検出するモデルであって、当該ペイロード情報が外れ値に該当する分析対象データを示す情報を出力するモデルであることに着目して、以下の処理を行う。詳細には、図5のSB3で取得した分析対象データを、図6のSC1で選択した評価用モデル全てに入力し、各評価用モデルから出力される情報を取得し、取得した当該情報に基づいて、各分析対象データについて評価スコアを算出して生成する。なお、「評価スコア」とは、評価結果情報であり、例えば、分析対象データが異常である可能性の高低を示す情報であり、一例としては、テストエンジニアが異常である通信ログを見て感じる違和感に関連する指標の情報である。なお、ここでの評価スコアの算出手法は任意であるが、例えば、各分析対象データについて、当該各分析対象データが入力される評価用モデルの個数に対する、当該各分析対象データを外れ値として検出した評価用モデルの個数の割合を算出し、当該算出した割合を評価スコアとすることとする。
In SC2 of FIG. 6, the
ここでは、例えば、図5のSB3で取得した分析対象データである図2の「データID」=「ID11」に対応するグループの分析対象データ(つまり、行情報、時間情報、データID、及びペイロード情報)を、図6のSC1で選択した評価用モデルである図3の「ML11-1」~「ML11-10」が特定する評価用モデル全てに入力し、各評価用モデルから出力される情報を取得し、取得した当該情報に基づいて、各分析対象データについて評価スコアを算出して生成する。ここでは、図2の「データID」=「ID11」の内の、「行情報」=「1」の分析対象データに着目して詳細に説明する。具体的には、「行情報」=「1」の分析対象データを、図3の「ML11-1」~「ML11-10」が特定する10個の評価用モデルに入力し、「ML11-1」~「ML11-9」が特定する9個の評価用モデルにおいて、「行情報」=「1」に対応する「ペイロード情報」=「D1」を外れ値と検出し、当該9個の評価用モデルが、「行情報」=「1」の分析対象データが異常値であることを含む情報を出力した場合、当該各分析対象データが入力される評価用モデルの個数である「10個」に対する、当該各分析対象データを外れ値として検出した評価用モデルの個数である「9個」の割合について「9÷10」の演算を行って「90%」を算出し、当該算出した割合である「90%」を、「行情報」=「1」の分析対象データの評価スコアとする。そして、ここで説明した各処理が、「行情報」=「2」~「9」等の分析対象データについても行われるので、「行情報」=「2」~「9」等の分析対象データについても、評価スコアが算出されることになる。 Here, for example, the analysis target data of the group corresponding to "data ID"="ID11" in FIG. 2, which is the analysis target data acquired at SB3 in FIG. information) is input to all the evaluation models specified by “ML11-1” to “ML11-10” in FIG. 3, which are the evaluation models selected in SC1 in FIG. 6, and the information output from each evaluation model is obtained, and an evaluation score is calculated and generated for each piece of analysis target data based on the obtained information. Here, a detailed description will be given by focusing on the analysis target data of "line information" = "1" in "data ID" = "ID11" in Fig. 2 . Specifically, the data to be analyzed with “line information” = “1” is input to the 10 evaluation models specified by “ML11-1” to “ML11-10” in FIG. ” to “ML11-9” identify 9 evaluation models, “payload information” ="D1" corresponding to ``row information'' ="1" is detected as an outlier, and the 9 evaluation models When the model outputs information including that the analysis target data of "row information" = "1" is an abnormal value, for "10" which is the number of evaluation models to which each analysis target data , calculate “90%” by calculating “9 ÷ 10” for the ratio of “9”, which is the number of evaluation models that detected each analysis target data as an outlier, and is the calculated ratio Let “90%” be the evaluation score of the analysis target data with “line information”=“1”. Since each process described here is also performed for the analysis target data such as "line information" = "2" to "9", the analysis target data such as "line information" = "2" to "9" An evaluation score is also calculated for
図6のSC3において処理部142は、分析対象データの評価結果を格納する。具体的には任意であるが、例えば、各分析対象データについて評価スコアを取得し、取得した評価スコアを当該評価スコアに対応する分析対象データと対応付けた状態で、記録部13に記録する。ここでは、例えば、「行情報」=「1」の分析対象データの評価スコアである「90%」、及び「行情報」=「2」~「9」等の分析対象データの評価スコアを取得し、取得した「90%」と「行情報」=「1」の分析対象データとが対応付けられた情報、及び「行情報」=「2」~「9」等の評価スコアと「行情報」=「2」~「9」等の分析対象データが対応付けられた情報を格納する。これにて、評価処理をリターンする。
At SC3 in FIG. 6, the
図5のSB5において処理部142は、処理を終了するか否かを判定する。具体的には任意であるが、例えば、図4のSA6と同様な処理を行う。詳細には、図5のSB2で分類した各グループの分析対象データについて全て取得して評価を行ったか否か任意の手法(例えば、SB2で分類した各グループについて取得して評価を行ったか否かを示す情報が記録部13に記録されていることとし、この情報に着目して判定する手法等)で判定し、判定結果に基づいて判定する。そして、SB2で分類した各グループの分析対象データについて全て取得して評価を行ったわけではないものと判定した場合(つまり、SB2で分類した各グループにおいて、評価を行っていないものが未だ存在する場合)、処理を終了しないものと判定し(SB5のNO)、SB3に移行する。また、SB2で分類した各グループの分析対象データについて全て取得して評価を行ったものと判定した場合(つまり、SB2で分類した各グループにおいて、評価を全て行った場合)、処理を終了するものと判定し(SB5のYES)、SB6に移行する。ここでは、例えば、上述の処理を繰り返し行うことにより、SB2で分類した図2の「データID」=「ID11」に対応するグループ、不図示の「データID」=「ID12」に対応するグループ、及び図2の「データID」=「ID13」に対応するグループ等に対応するグループ全てについて、評価を行った場合、SB6に移行する。
At SB5 in FIG. 5, the
図5のSB6において処理部142は、評価結果を出力する。具体的には任意であるが、例えば、ユーザが入力部11を介して表示閾値スコアを入力することとし、図6のSC3で記録した評価結果である評価スコアの内の当該表示閾値スコア以上の評価スコアを選択して取得し、取得した評価スコアを当該評価スコアに対応する分析対象データに対応付けた情報を、出力部12のディスプレイに表示して出力する。なお、「表示閾値スコア」とは、表示するべき評価スコアを選択する基準となる情報である。ここでは、例えば、ユーザが入力部11を介して表示閾値スコアとして「80%」を入力した場合、図6のSC3で記録した評価結果である評価スコアの内の当該表示閾値スコア以上の評価スコアである前述の「90%」等を選択して取得し、取得した評価スコアである「90%」を当該評価スコアに対応する分析対象データである「行情報」=「1」、「時間情報」=「t1」、「データID」=「ID11」、及び「ペイロード情報」=「D1」に対応付けた情報を、出力部12のディスプレイに表示して出力する。なお、実際には、「行情報」=「1」の分析対象データ以外にも、表示閾値スコアとして「80%」以上のデータが存在する場合、当該データに関する情報を表示されることになる。これにて、分析処理を終了する。
At SB6 in FIG. 5, the
(本実施の形態の効果)
本実施の形態によれば、複数の評価用モデルを用いて行われる評価に関連する評価関連処理を行うことにより、例えば、複数の評価用モデルを用いて行われる分析対象データ(評価対象データ)の評価を行うことができるので、評価対象データの評価の精度を向上させることが可能となる。
(Effect of this embodiment)
According to the present embodiment, by performing evaluation-related processing related to evaluation performed using a plurality of evaluation models, for example, analysis target data (evaluation target data) performed using a plurality of evaluation models can be evaluated, it is possible to improve the accuracy of the evaluation of the evaluation target data.
また、分析対象データ(評価関連データ)又は学習用データ(評価関連データ)の属性であるデータID単位でモデル生成処理(評価関連処理)及び分析処理(評価関連処理)を行うことにより、例えば、同様な属性を有する評価関連データ単位で評価関連処理を行うことができるので、評価関連処理を効率的且つ適切に行うことが可能となる。 In addition, by performing model generation processing (evaluation-related processing) and analysis processing (evaluation-related processing) for each data ID that is an attribute of analysis target data (evaluation-related data) or learning data (evaluation-related data), for example, Since evaluation-related processing can be performed in units of evaluation-related data having similar attributes, evaluation-related processing can be performed efficiently and appropriately.
また、学習用データ(教師データ)とモデル生成用アルゴリズム(機械学習用の所定のアルゴリズム)とに基づいて、機械学習により複数の評価用モデルを生成する処理を行うことにより、例えば、複数の評価用モデルを適切に生成することが可能となる。 In addition, based on learning data (teacher data) and a model generation algorithm (predetermined algorithm for machine learning), by performing a process of generating a plurality of evaluation models by machine learning, for example, a plurality of evaluation models It is possible to appropriately generate a model for
また、「OneClassSVMのアルゴリズム」の複数のパラメータの内の一部のパラメータの値を変更することにより、複数の評価用モデルを生成することにより、例えば、複数の評価用モデルをより適切に生成することが可能となる。 In addition, by changing the values of some of the parameters of the "OneClassSVM algorithm" to generate a plurality of evaluation models, for example, a plurality of evaluation models can be generated more appropriately. becomes possible.
また、分析対象データ(評価関連データ)と複数の評価用モデルとに基づいて、評価対象データを評価する処理を行うことにより、例えば、評価対象データの評価精度を向上させることが可能となる。 Further, by performing a process of evaluating the evaluation target data based on the analysis target data (evaluation-related data) and a plurality of evaluation models, it is possible to improve the evaluation accuracy of the evaluation target data, for example.
また、分析対象データ(評価関連データ)を複数の評価用モデル各々を用いて評価し、複数の評価用モデル各々を用いて行われた各評価の結果を示す評価スコア(評価結果情報)を生成する処理を行うことにより、例えば、複数の評価用モデル各々を用いて行った評価対象データの評価の結果を適切に示すことが可能となる。 In addition, the data to be analyzed (evaluation-related data) is evaluated using each of the multiple evaluation models, and an evaluation score (evaluation result information) that indicates the results of each evaluation performed using each of the multiple evaluation models is generated. By performing the processing to do so, for example, it is possible to appropriately indicate the results of the evaluation of the evaluation target data performed using each of the plurality of evaluation models.
また、分析対象データ(評価関連データ)に含まれているデータ値に関する評価を行う処理を行うことにより、例えば、データ値に関する評価を行うことが可能となる。 Further, by performing a process of evaluating the data values included in the analysis target data (evaluation-related data), for example, it is possible to evaluate the data values.
(実施の形態2)
次に、実施の形態2について説明する。この実施の形態は、評価対象データに含まれている時間に関する評価を行う形態である。なお、実施の形態1と同様な内容については、説明を適宜省略して、本実施の形態に特徴的な部分についてのみ詳細に説明する。
(Embodiment 2)
Next,
(構成)
まず、本実施の形態に係る情報処理装置について説明する。図7は、本実施の形態に係る情報処理装置を機能概念的に示すブロック図である。情報処理装置2は、処理システムであり、例えば、パーソナルコンピュータであり、一例としては、入力部21、出力部22、記録部23、及び制御部24を備える。なお、入力部21、出力部22は、実施の形態1の同一名称の構成と同様である。
(composition)
First, an information processing apparatus according to this embodiment will be described. FIG. 7 is a block diagram functionally conceptually showing the information processing apparatus according to the present embodiment. The
(構成‐記録部)
記録部23は、情報処理装置2の動作に必要なプログラム及び各種のデータを記録する記録手段であり、実施の形態1の記録部13と同様に構成されており、例えば、分析対象データ特定情報、学習用データ特定情報、第2モデル特定情報、及びタイミング判定用モデル特定情報が格納されている。なお、分析対象データ特定情報、及び学習用データ特定情報は、実施の形態1の同一名称の情報と同様である。
(Construction-recording unit)
The
(構成‐記録部‐第2モデル特定情報)
記録部23の「第2モデル特定情報」とは、複数の評価用モデルを特定する情報であり、具体的には、データID単位で分析対象データの時間情報(つまり、時間)について評価するためのモデルを特定する情報である。図8は、第2モデル特定情報を例示した図である。「第2モデル特定情報」は、例えば、図8に示すように、項目「データID」、及び項目「モデル情報」と、各項目に対応する情報とが相互に関連付けられている情報である。なお、これらの各情報は、図3の同一名称の情報と同様である。なお、本実施の形態では、「評価用モデル」が、分析対象データの時間差分データが入力され、当該入力された時間差分データが、学習用データを基準にして比較的大きく外れた値である、いわゆる外れ値に該当するか否かを検出するモデルであって、当該時間差分データが外れ値に該当する分析対象データを示す情報を出力するモデルである場合について説明する。なお、「時間差分データ」とは、分析対象データの連続する時間情報の相互間の差分に対応する情報であり、例えば、図2の「t1」と「t2」の相互間の差分、「t2」と「t3」の相互間の差分、及び「t3」と「t4」の相互間の差分等に対応する情報である。そして、このような第2モデル特定情報の格納手法は任意であるが、例えば、後述するモデル生成処理を実行することにより格納される。
(Configuration-Recording Unit-Second Model Specific Information)
The “second model identification information” of the
(構成‐記録部‐タイミング判定用モデル特定情報)
記録部23の「タイミング判定用モデル特定情報」とは、タイミング判定用モデルを特定する情報である。「タイミング判定用モデル」とは、前述の判定用モデルであり、例えば、CAN通信での通信タイミングを基準に任意の単位(例えば、データID単位)の複数の時間差分データの種類を判定するためのモデルである。なお、ここで想定される種類については、CAN通信の通信仕様等に基づいて様々想定されるが、例えば、所定時間間隔(例えば、1.0秒~1.5秒間隔等)で連続して通信を行う「通常通信」、前述の通常通信が一時途切れて一時停止が発生する「ポーズ付き通常通信」、及びランダムなタイミングで通信が行われる「イベント通信」の何れかの種類が想定される通信仕様となっていることとして、以下説明する。そして、ここで用いられる具体的なタイミング判定用モデル、及び当該モデルを特定するタイミング判定用モデル特定情報の格納手法については後述する。
(Configuration - recording unit - model specific information for timing determination)
The “timing determination model identification information” in the
(構成‐制御部)
図7に戻って、制御部24は、情報処理装置2を制御する制御手段であり、実施の形態1の制御部14と同様に構成されており、例えば、機能概念的に、取得部241、及び処理部242を備える。取得部241、及び処理部242は、実施の形態1の同一名称の構成要素と同様である。なお、この制御部24の各部の処理については、後述する。
(Configuration - control unit)
Returning to FIG. 7, the
(処理)
続いて、本実施の形態に係る情報処理装置2によって実行される処理について説明する。具体的には、モデル生成処理、及び分析処理について説明する。
(process)
Next, processing executed by the
(処理‐モデル生成処理)
まず、モデル生成処理について説明する。「モデル生成処理」とは、概略的には、学習用データを用いて評価用モデルを生成する処理であり、例えば、図8の第2モデル特定情報を生成して格納する処理である。図9は、モデル生成処理のフローチャートである。
(Processing - Model generation processing)
First, model generation processing will be described. The "model generation process" is roughly a process of generating an evaluation model using learning data, for example, a process of generating and storing the second model specifying information in FIG. FIG. 9 is a flowchart of model generation processing.
図9のSD1において取得部241は、学習用データを取得する。具体的には任意であるが、例えば、図4のSA1と同様な処理を行う。詳細には、例えば、図8の記録部23の学習用データ特定情報が特定する学習用データを取得する。ここでは、例えば、図2の分析対象データと同じ種類のデータであって、行情報、時間情報、データID、及びペイロード情報が相互に関連付けられている学習用データを取得する。
In SD1 of FIG. 9, the
図9のSD2において処理部242は、学習用データをデータIDを基準に分類する。具体的には任意であるが、例えば、図4のSA2と同様な処理を行う。SD1で取得した学習用データを取得し、当該学習用データのデータIDを基準にして、同じデータIDが同じグループになるように分類する。ここでは、例えば、SD1で取得した学習用データに、図2の「データID」=「ID11」、「ID13」、不図示の「ID12」に対応する情報等が格納されていることとし、この場合、当該学習用データを、「データID」=「ID11」に対応するグループ、「データID」=「ID12」に対応するグループ、及び「データID」=「ID13」に対応するグループ等に分類する。
In SD2 of FIG. 9, the
図9のSD3において処理部242は、1つの処理単位のデータを取得する。具体的には任意であるが、例えば、図4のSA3と同様な処理を行う。詳細には、例えば、SD2で分類した各グループにおけるの内の未だ取得されていない1つのデータIDに対応するグループの学習用データを取得する。ここでは、例えば、「データID」=「ID11」に対応するグループの学習用データ(つまり、行情報、時間情報、データID、及びペイロード情報)を取得する。
At SD3 in FIG. 9, the
図9のSD4において処理部242は、時間差分データ生成処理を実行する。「時間差分データ生成処理」とは、時間差分データを生成して、当該生成した時間差分データを適宜除外等する処理である。図10は、時間差分データ生成処理のフローチャートである。
At SD4 in FIG. 9, the
図10のSE1において処理部242は、時間差分データを複数生成する。具体的には任意であるが、例えば、図9のSD3で取得した学習用データの連続する時間情報相互間の差分を算出することにより、時間差分データを生成する。ここでは、例えば、学習用データの連続する時間情報として、不図示であるが「tg1」、「tg2」、「tg3」、「tg4」等が格納されている場合、「tg2-tg1」、「tg3-tg2」、及び「tg4-tg3」等の演算結果を、時間差分データとする。
At SE1 in FIG. 10, the
なお、ここで生成される複数の時間差分データ(具体的には、相互に同じデータIDにおける複数の時間差分データ)としては、CAN通信の通信仕様等に基づいて様々想定されるが、前述のように「通常通信」、「ポーズ付き通常通信」、及び「イベント通信」が想定されるので、これらのうちの何れかに対応する複数の時間差分データが生成されることになる。 Incidentally, as the plurality of time difference data generated here (specifically, the plurality of time difference data having the same data ID), various assumptions are made based on the communication specifications of CAN communication, etc., but the above-mentioned Since "normal communication", "normal communication with pause", and "event communication" are assumed as described above, a plurality of pieces of time difference data corresponding to any of these are generated.
図10のSE2において処理部242は、統計値及び個数を取得する。具体的には任意であるが、例えば、SE1で生成した複数の時間差分データを取得し、取得した複数の時間差分データについて公知の統計処理を行って、当該複数の時間差分データの最大値、分散、標準偏差、平均値、及び中央値を統計値として求めて、当該求めた統計値を取得し、また、SE1で生成した時間差分データの個数を計数して、計数した個数を取得する。ここでは、例えば、「tg2-tg1」、「tg3-tg2」、及び「tg4-tg3」等の最大値、分散、標準偏差、平均値、及び中央値として、「Tm」、「Tv」、「Ts」、及び「Tm」を取得し、また、「tg2-tg1」、「tg3-tg2」、及び「tg4-tg3」等の個数として「Tnum」を取得する(これらの「Tm」等の表記は説明の便宜上のものである)。
At SE2 in FIG. 10, the
図10のSE3において処理部242は、SE1で生成した時間差分データの種類を特定する。具体的には任意であるが、例えば、図7の記録部23のタイミング判定用モデル特定情報が特定する「タイミング判定用モデル」が、時間差分データの任意の統計値(例えば、分散)、及び時間差分データの個数が入力され、これらの入力された情報に基づいて、当該入力された情報の時間差分データが「通常通信」、「ポーズ付き通常通信」、又は「イベント通信」に対応するかを出力するモデルである場合について説明する。そして、このようなタイミング判定用モデルについては、事前に行われる任意の機械学習(例えば、公知の教師あり学習等)を行って生成されており、当該生成されたタイミング判定用モデルを特定するタイミング判定用モデルが図7の記録部23に格納されているものとして以下説明する。
At SE3 in FIG. 10, the
図10のSE3においてより具体的には、例えば、図7の記録部23のタイミング判定用モデル特定情報が特定する「タイミング判定用モデル」を取得し、また、SE2で取得した統計値である分散、及び個数を取得し、当該取得したタイミング判定用モデルに対して、これらの取得した分散及び個数を入力し、タイミング判定用モデルから出力される情報が示す種類を特定する。詳細には、タイミング判定用モデルから「通常通信」が出力された場合、時間差分データの種類を「通常通信」と特定し、また、タイミング判定用モデルから「ポーズ付き通常通信」が出力された場合、時間差分データの種類を「ポーズ付き通常通信」と特定し、また、タイミング判定用モデルから「イベント通信」が出力された場合、時間差分データの種類を「イベント通信」と特定する。
More specifically, in SE3 of FIG. 10, for example, the "timing determination model" specified by the timing determination model specifying information of the
ここでは、例えば、図7の記録部23のタイミング判定用モデル特定情報が特定する「タイミング判定用モデル」を取得し、また、SE2で取得した分散である「Tv」、及び個数である「Tnum」を取得し、当該取得したタイミング判定用モデルに対して、これらの取得した「Tv」及び「Tnum」を入力して、タイミング判定用モデルから出力される情報が示す種類を特定する。
Here, for example, the “timing determination model” specified by the timing determination model specification information of the
具体例について詳細には、例えば、SE1で生成した時間差分データが「通常通信」に対応している場合、当該時間差分データの一例としては、「1.0」、「1.3」、「1.2」、「1.2」、「1.2」、「1.1」・・・(単位である「秒」は省略、以下同様)等が含まれており、これらに対応する分散及び個数をタイミング判定用モデルに入力した場合、当該タイミング判定用モデルから「通常通信」が出力され、「通常通信」を特定することになる。また、例えば、SE1で生成した時間差分データが「ポーズ付き通常通信」に対応している場合、当該時間差分データの一例としては、「1.0」、「1.3」、「1.2」、「6.2」、「1.2」、「1.1」・・・等が含まれており、これらに対応する分散及び個数をタイミング判定用モデルに入力した場合、当該タイミング判定用モデルから「ポーズ付き通常通信」が出力され、「ポーズ付き通常通信」を特定することになる。また、例えば、SE1で生成した時間差分データが「通常通信」に対応している場合、当該時間差分データの一例としては、「5.0」、「1.3」、「1.2」、「4.2」、「1.2」、「20.1」・・・等が含まれており、これらに対応する分散及び個数をタイミング判定用モデルに入力した場合、当該タイミング判定用モデルから「イベント通信」が出力され、「イベント通信」を特定することになる。 Specifically, for example, when the time difference data generated in SE1 corresponds to "normal communication", examples of the time difference data are "1.0", "1.3", " 1.2", "1.2", "1.2", "1.1" ... (the unit "seconds" is omitted, the same applies hereinafter), etc., and the corresponding dispersion and the number are input to the timing determination model, "normal communication" is output from the timing determination model, and "normal communication" is specified. Further, for example, when the time difference data generated in SE1 corresponds to "normal communication with pause", examples of the time difference data are "1.0", "1.3", "1.2 ", "6.2", "1.2", "1.1", etc. are included, and when the variance and the number corresponding to these are input to the timing determination model, the timing determination "Normal communication with pause" is output from the model, and "normal communication with pause" is specified. Further, for example, when the time difference data generated in SE1 corresponds to "normal communication", examples of the time difference data are "5.0", "1.3", "1.2", "4.2", "1.2", "20.1", etc. are included, and when the variance and the number corresponding to these are input to the timing determination model, the timing determination model "Event communication" is output, and "event communication" is specified.
図10のSE4において処理部242は、SE1で生成した時間差分データ(つまり、1つの処理単位のデータであって、1つのデータIDに対応する時間情報に基づく時間差分データ)を、全て処理の対象とするか否かを判定する。具体的には任意であるが、例えば、SE3で特定した時間差分データの種類に基づいて判定する。そして、特定した時間差分データの種類が「通常通信」である場合、生成した時間差分データを全て処理の対象とするものと判定し(SE4のYES)、リターンする。また、特定した時間差分データの種類が「通常通信」でない場合(「ポーズ付き通常通信」又は「イベント通信」である場合)、生成した時間差分データを全て処理の対象とするわけではないものと判定し(つまり、少なくとも一部の時間差分データについては処理の対象とはしないものと判定し)(SE4のNO)、SE5に移行する。ここでは、例えば、SE3において「通常通信」と特定したので、生成した時間差分データを全て処理の対象とするものと判定する。
At SE4 in FIG. 10, the
図10のSE5において処理部242は、SE1で生成した時間差分データ(つまり、1つの処理単位のデータであって、1つのデータIDに対応する時間情報に基づく時間差分データ)を、全て処理の対象から除外するか否かを判定する。具体的には任意であるが、例えば、SE3で特定した時間差分データの種類に基づいて判定する。そして、特定した時間差分データの種類が「イベント通信」である場合、生成した時間差分データを全て処理の対象から除外するものと判定し(SE5のYES)、リターンする。また、特定した時間差分データの種類が「イベント通信」でない場合(「ポーズ付き通常通信」である場合)、生成した時間差分データを全て処理の対象から除外するわけではないものと判定し(つまり、一部のみの時間差分データについては処理の対象とするものと判定し)(SE5のNO)、SE6に移行する。
At SE5 in FIG. 10, the
図10のSE6において処理部242は、SE1で生成した時間差分データ(つまり、1つの処理単位のデータであって、1つのデータIDに対応する時間情報に基づく時間差分データ)の内の一部のデータを除外する。具体的には任意であるが、例えば、SE1で生成した時間差分データを取得し、取得した時間差分データにおいて、CAN通信における通常通信が一時途切れる一時停止に対応する時間差分データを特定する任意の手法(例えば、DBSCAN (Density-based spatial clustering of applications with noise)等のクラスタリングの技術を用いる公知の外れ値を特定する手法(なお、前述の「OneClassSVM」を用いる手法とは異なる手法)、あるいは、単に閾値と比較する手法(一例としては、1.5秒を閾値として当該閾値以上の時間差分データを一時停止に対応する時間差分データとして特定する手法等))を用いて、一時停止に対応する時間差分データを特定し、特定した時間差分データを除外する。なお、「時間差分データを除外する」とは、以降の処理において当該除外された時間差分データを用いないことに対応する概念である。ここでは、例えば、前述のように、SE1で生成した時間差分データに「1.0」、「1.3」、「1.2」、「6.2」、「1.2」、「1.1」・・・等が含まれている場合、「6.2」を除外することになる。この後、時間差分データ生成処理をリターンする。
At SE6 in FIG. 10, the
図9のSD5において処理部242は、評価用モデルを生成するか否かを判定する。具体的には任意であるが、例えば、図10の時間差分データ生成処理において、時間差分データを全て処理の対象から除外するものと判定したか否かに基づいて判定する。そして、図10のSE5において、時間差分データを全て処理の対象から除外するものと判定した場合、処理の対象となる時間差分データが存在しないことになるので、評価用モデルを生成しないものと判定し(SD5のNO)、処理を終了する。また、図10のSE5において、時間差分データを全て処理の対象から除外するわけではないものと判定した場合、処理の対象となる時間差分データが存在することになるので、評価用モデルを生成するものと判定し(SD5のYES)、SD6に移行する。ここでは、例えば、SE1で生成した時間差分データが「通常通信」又は「ポーズ付き通常通信」に対応している場合、評価用モデルを生成するものと判定し、一方、SE1で生成した時間差分データが「イベント通信」に対応している場合、評価用モデルを生成しないものと判定することになる。
At SD5 in FIG. 9, the
図9のSD6において処理部242は、評価用モデルを複数生成する。具体的には任意であるが、例えば、概略的には図4のSA4の処理と同様にして生成するが、特に、機械学習のために適用するデータとして、SA4では「学習用データのペイロード情報」が用いられていたが、この図9のSD6では、SA4の場合とは異なり、図10のSE1で生成した時間差分データを用いる点以外については同様にして生成する。
At SD6 in FIG. 9, the
SD6の処理についてより具体的には、例えば、まず、図10のSE1で生成した時間差分データを取得する。なお、図10のSE6において一部の時間差分データが除外された場合、SE1で生成した時間差分データの内の、当該除外された時間差分データ以外のデータを取得する。次に、記録部23の不図示のモデル生成用アルゴリズムを取得し、取得したモデル生成用アルゴリズムの3個のパラメータの内の2個のパラメータについては各々任意の固定値を1個ずつ設定し、また、当該3個のパラメータの内の残りの1個のパラメータについては、10個の値を順次設定し、前述の取得した時間差分データ(つまり、図10のSE1で生成した時間差分データ、あるいは、当該SE1で生成した時間差分データにおいて一部が除外された残りのデータ)を当該モデル生成用アルゴリズムに順次適用することにより、当該10個の値各々に対応する評価用モデルを1個ずつ生成して、合計10個の評価用モデルを生成する。そして、ここでは、前述の時間差分データ生成処理の各判定及びデータの除外等により、例えば、CAN通信の所定時間間隔(例えば、1.0秒~1.5秒間隔等)で連続して行われている通信を正常であるものとして、外れ値に該当するか否かを検出する評価用モデルを生成することが可能となる。
More specifically, for example, the time difference data generated in SE1 of FIG. 10 is obtained first. It should be noted that if some of the time difference data is excluded in SE6 of FIG. 10, data other than the excluded time difference data is obtained from among the time difference data generated in SE1. Next, a model generation algorithm (not shown) in the
ここでは、例えば、SE1で生成した時間差分データが「通常通信」に対応している場合、当該時間差分データの一例としては、「1.0」、「1.3」、「1.2」、「1.2」、「1.2」、「1.1」・・・等を取得し、また、別な例としてSE1で生成した時間差分データが「ポーズ付き通常通信」に対応している場合、当該時間差分データの一例としては、「1.0」、「1.3」、「1.2」、「6.2」、「1.2」、「1.1」・・・等が含まれているが、前述のようにSE6で「6.2」が除外されるので、「1.0」、「1.3」、「1.2」、「1.2」、「1.1」・・・等を取得する。次に、記録部23のモデル生成用アルゴリズムである「OneClassSVMのアルゴリズム」を取得し、取得した「OneClassSVMのアルゴリズム」の3個のパラメータである「P1」、「P2」、及び「P3」の内の2個のパラメータである「P2」、及び「P3」については各々任意の固定値を1個ずつ設定し、また、当該3個のパラメータの内の残りの1個のパラメータである「P1」については、相互に異なる10個の値である「第1の値~第10の値」を順次設定し、前述の取得した時間差分データを当該モデル生成用アルゴリズムに順次適用することにより、当該10個の値各々に対応する評価用モデルを1個ずつ生成して、合計10個の評価用モデルを生成する。より詳細には、例えば、「P1」に「第1の値」を設定した上で、(一例としては「通常通信」に対応する)時間差分データである前述の「1.0」、「1.3」、「1.2」、「1.2」、「1.2」、「1.1」・・・等を「OneClassSVMのアルゴリズム」に適用することにより機械学習を行って、「P1」が「第1の値」である場合の評価用モデルである図8の「MT11-1」が特定する評価用モデルを生成する。そして、この後、「P1」に「第2の値」~「第10の値」を設定して同様な処理を行うことにより、図8の「MT11-3」~「MT11-10」が特定する評価用モデルを生成する。
Here, for example, when the time difference data generated in SE1 corresponds to "normal communication", examples of the time difference data are "1.0", "1.3", and "1.2". , "1.2", "1.2", "1.1", etc. are obtained, and as another example, the time difference data generated in SE1 corresponds to "normal communication with pause". If there is, as an example of the time difference data, "1.0", "1.3", "1.2", "6.2", "1.2", "1.1"... etc. are included, but since "6.2" is excluded in SE6 as described above, "1.0", "1.3", "1.2", "1.2", " 1.1” and so on. Next, the “OneClass SVM algorithm” that is the model generation algorithm of the
図9のSD7において処理部242は、評価用モデルを格納する。具体的には任意であるが、例えば、図4のSA5と同様な処理を行う。詳細には、図9のSD3で取得した単位であるデータIDを特定し、また、SD6で生成した評価用モデルを取得した上で、この特定したデータID、取得した評価用モデルを特定する情報を相互に対応付けて、図8のデータID及びモデル情報として格納する。ここでは、例えば、SD3で取得した単位であるデータIDである「ID11」を特定し、また、SD6で生成した評価用モデルであるが特定する評価用モデルを取得した上で、図8の「データID」=「ID11」、及び「モデル情報」=「MT11-1」~「MT11-10」を格納する。
At SD7 in FIG. 9, the
図9のSD8において処理部242は、処理を終了するか否かを判定する。具体的には任意であるが、例えば、図4のSA6と同様な処理を行う。詳細には、SD2で分類した各グループの学習用データについて全て取得して対応する評価用モデルを生成したか否かを任意の手法で判定し、判定結果に基づいて判定する。そして、SD2で分類した各グループの学習用データについて全て取得して対応する評価用モデルを生成したわけではないものと判定した場合、処理を終了しないものと判定し(SD8のNO)、SD3に移行する。また、SD2で分類した各グループの学習用データについて全て取得して対応する評価用モデルを生成したものと判定した場合、処理を終了するものと判定し(SD8のYES)、処理を終了する。ここでは、例えば、上述の処理を繰り返し行って、SD2で分類した「データID」=「ID11」に対応するグループ、「データID」=「ID12」に対応するグループ、及び「データID」=「ID13」等に対応するグループ全てについて、対応する評価用モデルが生成された場合、処理を終了するものと判定する。そして、このようにして、図8の第2モデル特定情報が生成されて格納されることになる。これにて、モデル生成処理を終了する。
At SD8 in FIG. 9, the
(処理‐分析処理)
次に、分析処理について説明する。「分析処理」とは、概略的には、評価用モデルを用いて分析対象データを評価する処理である。図11は、分析処理のフローチャートである。この分析処理を実行するタイミングは任意であるが、例えば、記録部23に分析対象データ及び第2モデル特定情報が記録された後に、入力部21を介してユーザが所定操作を行った場合に起動を開始することとし、起動を開始したところから説明する。
(processing-analytical processing)
Next, analysis processing will be described. "Analysis processing" is roughly a process of evaluating analysis target data using an evaluation model. FIG. 11 is a flowchart of analysis processing. Although the timing of executing this analysis process is arbitrary, for example, after the data to be analyzed and the second model specifying information are recorded in the
図11のSF1において取得部241は、分析対象データを取得する。具体的には任意であるが、例えば、図5のSB1と同様な処理を行う。詳細には、図7の記録部23の分析対象データ特定情報の分析対象データを取得する。ここでは、例えば、図2に示すように、行情報、時間情報、データID、及びペイロード情報が相互に関連付けられている分析対象データを取得する。
In SF1 of FIG. 11, the
図11のSF2において処理部242は、分析対象データをデータIDを基準に分類する。具体的には任意であるが、例えば、図9のSD2と同様な処理を行う。詳細には、SF1で取得した分析対象データを取得し、当該分析対象データのデータIDを基準にして、同じデータIDが同じグループになるように分類する。ここでは、例えば、SD1で取得した分析対象データを、図2の「データID」=「ID11」に対応するグループ、不図示の「データID」=「ID12」に対応するグループ、及び図2の「データID」=「ID13」に対応するグループ等に分類する。
In SF2 of FIG. 11, the
図11のSF3において処理部242は、1つの処理単位のデータを取得する。具体的には任意であるが、例えば、図9のSD3と同様な処理を行う。詳細には、SF2で分類した各グループにおけるの内の未だ取得されていない1つのデータIDに対応するグループの分析対象データを取得する。ここでは、例えば、図2の「データID」=「ID11」に対応するグループの分析対象データ(つまり、行情報、時間情報、データID、及びペイロード情報)を取得する。
In SF3 of FIG. 11, the
図11のSF4において処理部242は、時間差分データ生成処理を実行する。ここで実行する時間差分データ生成処理については、取り扱うデータが学習用データではなく分析対象データである点を除いて、前述の図9のSD4で実行する時間差分データ生成処理と同様であるので、図10の時間差分データ生成処理の各ステップに「G」という符号を付して、概要のみ説明する。
In SF4 of FIG. 11, the
図10のSG1において処理部242は、時間差分データを複数生成する。具体的には任意であるが、例えば、図11のSF3で取得した分析対象データの連続する時間情報相互間の差分を算出することにより、時間差分データを生成する。特に、ここで生成される時間差分データについては、何れの分析対象データ相互間の時間情報の差分に対応しているかを特定できるように、時間差分データの基となる2個の分析対象データの2個の行情報と対応付けて処理部242によって管理されていることとする。ここでは、例えば、図2の時間情報において「t2-t1」、「t3-t2」、及び「t4-t3」等の演算結果を、時間差分データとする。そして、これらの「t2-t1」、「t3-t2」、及び「t4-t3」等については「行情報」=「2」及び「1」、「3」及び「2」、「4」及び「3」と対応付けられて管理されていることとする。
In SG1 of FIG. 10, the
図10のSG2において処理部242は、統計値及び個数を取得する。具体的には任意であるが、例えば、SG1で生成した複数の時間差分データを取得し、取得した複数の時間差分データについて公知の統計処理を行って、当該複数の時間差分データの最大値、分散、標準偏差、平均値、及び中央値を統計値として求めて、当該求めた統計値を取得し、また、SG1で生成した時間差分データの個数を計数して、計数した個数を取得する。ここでは、例えば、「t2-t1」、「t3-t2」、及び「t4-t3」等の最大値、分散、標準偏差、平均値、及び中央値として、「Tam」、「Tav」、「Tas」、及び「Tam」を取得し、また、「t2-t1」、「t3-t2」、及び「t4-t3」等の個数として「Tanum」を取得する。
In SG2 of FIG. 10, the
図10のSG3において処理部242は、SG1で生成した時間差分データの種類を特定する。具体的には任意であるが、例えば、図7の記録部23のタイミング判定用モデル特定情報が特定する「タイミング判定用モデル」を取得し、また、SG2で取得した統計値である分散、及び個数を取得し、当該取得したタイミング判定用モデルに対して、これらの取得した分散及び個数を入力し、タイミング判定用モデルから出力される情報が示す種類を特定する。
In SG3 of FIG. 10, the
ここでは、例えば、図7の記録部23のタイミング判定用モデル特定情報が特定する「タイミング判定用モデル」を取得し、また、SG2で取得した分散である「Tav」、及び個数である「Tanum」を取得し、当該取得したタイミング判定用モデルに対して、これらの取得した「Tav」及び「Tanum」を入力して、タイミング判定用モデルから出力される情報が示す種類を特定する。
Here, for example, the “timing determination model” specified by the timing determination model specification information of the
図10のSG4において処理部242は、SG1で生成した時間差分データ(つまり、1つの処理単位のデータであって、1つのデータIDに対応する時間情報に基づく時間差分データ)を、全て処理の対象とするか否かを判定する。
In SG4 of FIG. 10, the
図10のSG5において処理部242は、SG1で生成した時間差分データ(つまり、1つの処理単位のデータであって、1つのデータIDに対応する時間情報に基づく時間差分データ)を、全て処理の対象から除外するか否かを判定する。
In SG5 of FIG. 10, the
図10のSG6において処理部242は、SG1で生成した時間差分データ(つまり、1つの処理単位のデータであって、1つのデータIDに対応する時間情報に基づく時間差分データ)の内の一部のデータを除外する。この後、時間差分データ生成処理をリターンする。
In SG6 of FIG. 10, the
図11のSF5において処理部242は、評価処理を実行するか否かを判定する。具体的には任意であるが、例えば、図9のSD5と同様な処理を行う。詳細には、図10の時間差分データ生成処理において、時間差分データを全て処理の対象から除外するものと判定したか否かに基づいて判定する。そして、図10のSG5において、時間差分データを全て処理の対象から除外するものと判定した場合、処理の対象となる時間差分データが存在しないことになるので、評価処理を実行しないものと判定し(SF5のNO)、処理を終了する。また、図10のSG5において、時間差分データを全て処理の対象から除外するわけではないものと判定した場合、処理の対象となる時間差分データが存在することになるので、評価処理を実行するものと判定し(SF5のYES)、SF6に移行する。ここでは、例えば、SG1で生成した時間差分データが「通常通信」又は「ポーズ付き通常通信」に対応している場合、評価処理を実行するものと判定し、一方、SG1で生成した時間差分データが「イベント通信」に対応している場合、評価処理を実行しないものと判定することになる。
In SF5 of FIG. 11, the
図11のSF6において処理部242は、評価処理を実行する。ここで実行する評価処理については、取り扱うデータが分析対象の時間差分データである点を除いて、前述の図5のSB4で実行する評価処理と同様であるので、図6の評価処理の各ステップに「H」という符号を付して、概要のみ説明する。
In SF6 of FIG. 11, the
図6のSH1において処理部242は、評価用モデルを選択する。具体的には任意であるが、例えば、SC1と同様の処理を行う。詳細には、図11のSF3で取得した分析対象データに対応するデータIDを特定し、図8の第2モデル特定情報を参照して、当該特定したデータIDに対応するモデル情報を取得し、取得したモデル情報が特定する評価用モデルを選択する。ここでは、例えば、図11のSF3で取得した分析対象データに対応するデータIDである「ID11」を特定し、図8の第2モデル特定情報を参照して、当該特定したデータIDである「ID11」に対応するモデル情報である「MT11-1」~「MT11-10」を取得し、「MT11-1」~「MT11-10」が特定する評価用モデルを選択する。
At SH1 in FIG. 6, the
図6のSH2において処理部242は、分析対象データを評価する。具体的には任意であるが、例えば、前述したように、「評価用モデル」が、分析対象データの時間差分データが入力され、当該入力された時間差分データが、学習用データを基準にして比較的大きく外れた値である、いわゆる外れ値に該当するか否かを検出するモデルであって、当該時間差分データが外れ値に該当する分析対象データを示す情報を出力するモデルであることに着目して、以下の処理を行う。詳細には、図10のSG1で生成した時間差分データ(なお、図10のSG6において一部の時間差分データが除外された場合、SG1で生成した時間差分データの内の、当該除外された時間差分データ以外のデータ)と、当該時間差分データの基となる各2個の分析対象データの各2個の行情報とを相互に対応付けて、図6のSH1で選択した評価用モデル全てに入力し、各評価用モデルから出力される情報を取得し、取得した当該情報に基づいて、各分析対象データについて評価スコアを算出して生成する。
At SH2 in FIG. 6, the
ここでは、例えば、図10のSG1で生成した時間差分データである「t2-t1」、「t3-t2」、及び「t4-t3」等と、当該時間差分データの基となる各2個の分析対象データの各2個の行情報との組み合わせの情報である(「t2-t1」に対応する)「行情報」=「2」及び「1」、(「t3-t2」に対応する)「行情報」=「3」及び「2」、(「t4-t3」に対応する)「行情報」=「4」及び「3」とを相互に対応付けて、図6のSH1で選択した評価用モデルである図8の「MT11-1」~「MT11-10」が特定する評価用モデル全てに入力し、各評価用モデルから出力される情報を取得し、取得した当該情報に基づいて、各分析対象データについて評価スコアを算出して生成する。ここでは、「t2-t1」(つまり、図2の「行情報」=「2」及び「1」の差分に対応する時間差分データ)に着目して詳細に説明する。具体的には、「t2-t1」の時間差分データを、図8の「MT11-1」~「MT11-10」が特定する10個の評価用モデルに入力し、「MT11-1」~「MT11-9」が特定する9個の評価用モデルにおいて、「t2-t1」の時間差分データを外れ値と検出し、当該9個の評価用モデルが、「t2-t1」の時間差分データを示す情報(例えば、「t2-t1」の基となる分析対象データを特定する情報である「行情報」=「2」及び「1」の情報)を含む情報を出力した場合、当該各分析対象データの時間差分データが入力される評価用モデルの個数である「10個」に対する、当該各分析対象データの時間差分データを外れ値として検出した評価用モデルの個数である「9個」の割合について「9÷10」の演算を行って「90%」を算出し、当該算出した割合である「90%」を、「t2-t1」の評価スコアとする(つまり、「行情報」=「2」及び「1」が特定する分析対象データの時間情報の時間差分データの評価スコアとする)。そして、ここで説明した各処理が、「t3-t2」、及び「t4-t3」等の分析対象データの時間差分データについても、評価スコアが算出されることになる。 Here, for example, "t2-t1", "t3-t2", and "t4-t3" which are the time difference data generated in SG1 of FIG. "Row information" = "2" and "1" (corresponding to "t3-t2"), which is information in combination with each two pieces of row information of the data to be analyzed (corresponding to "t2-t1") “Line information” = “3” and “2”, “Line information” = “4” and “3” (corresponding to “t4-t3”) are associated with each other, and selected in SH1 of FIG. Input to all evaluation models specified by “MT11-1” to “MT11-10” in FIG. 8, which are evaluation models, acquire information output from each evaluation model, and based on the acquired information , an evaluation score is calculated and generated for each analysis target data. Here, a detailed description will be given by focusing on "t2-t1" (that is, time difference data corresponding to the difference between "line information"="2" and "1" in FIG. 2). Specifically, the time difference data of "t2-t1" is input to 10 evaluation models specified by "MT11-1" to "MT11-10" in FIG. In the nine evaluation models specified by "MT11-9", the time difference data of "t2-t1" is detected as an outlier, and the nine evaluation models detect the time difference data of "t2-t1". (for example, the information of "line information" = "2" and "1", which is information specifying the analysis target data that is the basis of "t2-t1") is output, each analysis target The ratio of "9", which is the number of evaluation models for which the time difference data of each analysis target data is detected as an outlier, to "10", which is the number of evaluation models to which the time difference data of the data is input "90%" is calculated by calculating "9/10", and the calculated ratio "90%" is used as the evaluation score of "t2-t1" (that is, "row information" = " 2” and the evaluation score of the time difference data of the time information of the data to be analyzed specified by “1”). Then, each process described here also calculates the evaluation score for the time difference data of the analysis target data such as "t3-t2" and "t4-t3".
図6のSH3において処理部242は、分析対象データの評価結果を格納する。具体的には任意であるが、例えば、各分析対象データの時間差分データについて評価スコアを取得し、取得した評価スコアを当該評価スコアに対応する分析対象データと対応付けた状態で、記録部13に記録する。なお、ここでは、時間差分データについては、2個の分析対象データの時間情報の差分に相当するので、前述の評価スコアを対応付ける分析対象データの候補としては2個考えられるが、両方に対応付けて記録してもよいし、あるいは、一方に対応付けて格納してもよいが、ここでは、例えば、より時間が早い方(つまり、先に通信が行わた方)の一方の分析対象データに対応付ける場合を例示して説明する。ここでは、例えば、「t2-t1」の評価スコア(つまり、「行情報」=「2」及び「1」が特定する分析対象データの時間情報の時間差分データの評価スコア)である「90%」等を取得し、取得した「90%」と「行情報」=「1」の分析対象データ(つまり、「t2-t1」の基となる分析対象データを特定する情報である「行情報」=「2」及び「1」の内のより時間が早い方の分析データを特定する「行情報」=「1」)とが対応付けられた情報を格納する。これにて、評価処理をリターンする。
At SH3 in FIG. 6, the
図11のSF7において処理部242は、処理を終了するか否かを判定する。具体的には任意であるが、例えば、図5のSB5と同様な処理を行う。そして、上述の処理を繰り返し行って、図11のSF2で分類した図2の「データID」=「ID11」に対応するグループ、不図示の「データID」=「ID12」に対応するグループ、及び図2の「データID」=「ID13」に対応するグループ等に対応するグループ全てについて、評価を行った場合、SF8に移行する。
At SF7 in FIG. 11, the
図11のSF8において処理部242は、評価結果を出力する。具体的には任意であるが、例えば、図5のSB6と同様な処理を行う。詳細には、ここでは、例えば、ユーザが入力部21を介して表示閾値スコアとして「80%」を入力した場合、図6のSH3で記録した評価結果である評価スコアの内の当該表示閾値スコア以上の評価スコアである前述の「90%」等を選択して取得し、取得した評価スコアである「90%」を当該評価スコアに対応する分析対象データである「行情報」=「1」に対応付けた情報を、出力部12のディスプレイに表示して出力する。なお、ここでは、例えば、時間差分データの基となる2個の分析対象データである「行情報」=「1」及び「2」と対応付けた状態で「90%」を出力するように構成してもよい。また、図10のSG6にて除外した情報が存在する場合、当該除外した情報を任意の手法(例えば、除外した情報のリストを記録部23に記録しておき、当該リストを参照して特定する手法等)で特定し、特定した除外した情報も出力するように構成してもよい。これにて、分析処理を終了する。
At SF8 in FIG. 11, the
(本実施の形態の効果)
本実施の形態によれば、予め定められているタイミング判定用モデル(判定用モデル)に基づいて解析対象データ(評価関連データ)又は学習用データ(評価関連データ)をモデル生成処理(評価関連処理)及び分析処理(評価関連処理)の対象とするか否かを判定し、評価関連処理の対象とするものと判定した評価関連データに基づいて、評価関連処理を行うことにより、例えば、適切な評価関連データを用いて評価関連処理を行うことが可能となる。
(Effect of this embodiment)
According to the present embodiment, the analysis target data (evaluation related data) or the learning data (evaluation related data) is subjected to model generation processing (evaluation related processing) based on a predetermined timing determination model (determination model). ) and analysis processing (evaluation-related processing), and based on the evaluation-related data determined to be subject to evaluation-related processing, by performing evaluation-related processing, for example, appropriate Evaluation-related processing can be performed using the evaluation-related data.
また、評価対象データに含まれている時間に関する評価を行う処理を行うことにより、例えば、時間に関する評価を行うことが可能となる。 In addition, by performing a process of evaluating the time included in the evaluation target data, it is possible to perform the evaluation of the time, for example.
(実施の形態3)
次に、実施の形態3について説明する。この実施の形態は、評価対象データに含まれているデータ値に関する評価を行う形態であって、複数の評価関連データを相互に関連付けて形態するである。なお、実施の形態1と同様な内容については、説明を適宜省略して、本実施の形態に特徴的な部分についてのみ詳細に説明する。
(Embodiment 3)
Next,
(構成)
まず、本実施の形態に係る情報処理装置について説明する。図12は、本実施の形態に係る情報処理装置を機能概念的に示すブロック図である。情報処理装置3は、処理システムであり、例えば、パーソナルコンピュータであり、一例としては、入力部31、出力部32、記録部33、及び制御部34を備える。なお、入力部21、出力部22は、実施の形態1の同一名称の構成と同様である。
(composition)
First, an information processing apparatus according to this embodiment will be described. FIG. 12 is a block diagram functionally conceptually showing the information processing apparatus according to the present embodiment. The
(構成‐記録部)
記録部33は、情報処理装置3の動作に必要なプログラム及び各種のデータを記録する記録手段であり、実施の形態1の記録部13と同様に構成されており、例えば、分析対象データ特定情報、学習用データ特定情報、及び第3モデル特定情報が格納されている。
(Construction-recording unit)
The
(構成‐記録部‐分析対象データ特定情報、学習用データ特定情報)
図13は、分析対象データ特定情報を例示した図であり、図14は、学習用データ特定情報を例示した図である。図12の記録部33に記録されている分析対象データ特定情報、及び学習用データ特定情報は、基本的には、実施の形態1の同一名称の情報と同様であるが、CAN通信の所定のシーケンス(例えば、2個のデータIDに対応するデータを交互に通信するシーケンス等)に従って送受信されているデータを特定する場合について説明する。具体的には、例えば、図13及び図14に示すように、所定のシーケンスに従って、「データID」=「ID11」に対応するデータと「データID」=「ID21」に対応するデータが交互に送受信されている場合を例示して説明する。なお、実際には、この「データID」=「ID11」及び「ID21」以外にも様々なデータIDのデータが送受信されているが、これらについては説明を省略する。
(Configuration-recording unit-analysis target data identification information, learning data identification information)
FIG. 13 is a diagram exemplifying analysis target data identification information, and FIG. 14 is a diagram exemplifying learning data identification information. The analysis target data specifying information and the learning data specifying information recorded in the
(構成‐記録部‐第3モデル特定情報)
記録部33の「第3モデル特定情報」とは、複数の評価用モデルを特定する情報であり、具体的には、複数のデータID単位でペイロード情報(つまり、データ値)について評価するためのモデルを特定する情報である。図15は、第3モデル特定情報を例示した図である。「第3モデル特定情報」は、例えば、図15に示すように、項目「データID」、及び項目「モデル情報」と、各項目に対応する情報とが相互に関連付けられている情報である。なお、これらの各情報は、図3の同一名称の情報と同様である。なお、本実施の形態では、「評価用モデル」が、複数の関連付けられた分析対象データが入力され、当該入力された複数の関連付けられた分析対象データにおいて、分析対象データのペイロード情報が、学習用データを基準にして比較的大きく外れた値である、いわゆる外れ値に該当するか否かを検出するモデルであって、当該ペイロード情報が外れ値に該当する複数の関連付けられた分析対象データを示す情報を出力するモデルである場合について説明する。なお、この図15では、データIDとしては、1個のデータIDである「ID11」及び1個のデータIDである「ID21」が相互に関連付けられていることを示す「ID11,ID21」等が格納されている。そして、このような第3モデル特定情報の格納手法は任意であるが、例えば、後述するモデル生成処理を実行することにより格納される。
(Configuration-recording unit-third model specific information)
The "third model specifying information" of the
(構成‐制御部)
図12に戻って、制御部34は、情報処理装置3を制御する制御手段であり、実施の形態1の制御部14と同様に構成されており、例えば、機能概念的に、取得部341、及び処理部342を備える。取得部341、及び処理部342は、実施の形態1の同一名称の構成要素と同様である。なお、この制御部34の各部の処理については、後述する。
(Configuration - control unit)
Returning to FIG. 12, the
(処理)
続いて、本実施の形態に係る情報処理装置3によって実行される処理について説明する。具体的には、モデル生成処理、及び分析処理について説明する。
(process)
Next, processing executed by the
(処理‐モデル生成処理)
まず、モデル生成処理について説明する。「モデル生成処理」とは、概略的には、学習用データを用いて評価用モデルを生成する処理であり、例えば、図16の第3モデル特定情報を生成して格納する処理である。図16は、モデル生成処理のフローチャートである。
(Processing - Model generation processing)
First, model generation processing will be described. The "model generation process" is roughly a process of generating an evaluation model using learning data, for example, a process of generating and storing the third model specifying information in FIG. FIG. 16 is a flowchart of model generation processing.
図16のSI1において取得部341は、学習用データを取得する。具体的には任意であるが、例えば、図4のSA1と同様な処理を行う。ここでは、例えば、図14の学習用データ特定情報が特定する学習用データ(つまり、行情報、時間情報、データID、及びペイロード情報)を取得する。
At SI1 in FIG. 16, the
図16のSI2において処理部342は、学習用データをデータIDを基準に分類する。具体的には任意であるが、例えば、図4のSA2と同様な処理を行う。
At SI2 in FIG. 16, the
図16のSI3において処理部342は、学習用データを関連付ける。具体的には任意であるが、例えば、前述の所定のシーケンス(例えば、「データID」=「ID11」に対応するデータと「データID」=「ID21」に対応するデータが交互に送受信されているシーケンス等)を示す情報が記録部33に記録されていることとし、この情報を参照して所定のシーケンスを特定し、特定した所定のシーケンスに従って、SI2で分類した学習用データを相互に異なるデータID間で関連付ける。なお、学習用データを関連付ける手法は任意であるが、例えば、送受信されるデータが要求及び応答に対応していることとし、相互に対応する要求及び応答のデータを関連付ける手法を用いることとし、具体的には、各データIDの学習用データの時間情報に着目して同じ通信順番(各データID内での順番)の学習用データ同士を関連付ける手法を用いる場合について説明する。ここでは、例えば、図14の「データID」=「ID11」及び「ID12」について、「ペイロード情報」=「Dg11」及び「Dg21」が通信順番が各々の学習用データにおいて1番であるので、行番号「1」及び「2」の学習用データを相互に関連付け、同様にして、行番号「3」及び「4」の学習用データ、行番号「5」及び「6」の学習用データ、行番号「7」及び「8」の学習用データを相互に関連付ける。なお、図14では不図示であるが、「データID」=「ID12」、「ID22」等に対応する学習用データも格納されていることとし、所定のシーケンスに従ってこれらのデータも交互に送受信されるものとする。この場合、これらの「データID」=「ID12」及び「ID22」の学習用データについても同様にして相互に関連付ける。
At SI3 in FIG. 16, the
図16のSI4において処理部342は、1つの処理単位のデータを取得する。具体的には任意であるが、例えば、SI3で関連付けたデータIDの組み合わせに対応する学習用データの内の未だ取得されていないデータIDの組み合わせに対応する学習用データを取得する。ここでは、例えば、SI3で関連付けた「データID」=「ID11」及び「ID12」に対応する学習用データを取得する。
At SI4 in FIG. 16, the
図16のSI5において処理部342は、評価用モデルを複数生成する。具体的には任意であるが、例えば、図4のSA4の処理と同様な処理を行う。詳細には、例えば、記録部33の不図示のモデル生成用アルゴリズムを取得し、取得したモデル生成用アルゴリズムのパラメータに、図4のSA4で説明した場合と同様にして値を設定した上で、SI4で取得した学習用データのペイロード情報を当該モデル生成用アルゴリズムに順次適用して機械学習することにより、合計10個の評価用モデルを生成する。なお、ここでモデル生成用アルゴリズムに適用するペイロード情報については、SI4で取得した相互に関連付けられたペイロード情報を任意の手法(例えば、8バイトの16進数表記の各ペイロード情報をつなげる16バイトのペイロード情報にまとめる手法等)で1つにまとめて、1つにまとめたペイロード情報を適用することとする。ここでは、例えば、図14の「Dg11」及び「Dg21」をまとめたペイロード情報、「Dg12」及び「Dg22」をまとめたペイロード情報、「Dg13」及び「Dg23」をまとめたペイロード情報、「Dg14」及び「Dg24」をまとめたペイロード情報等を、モデル生成用アルゴリズムである「OneClassSVMのアルゴリズム」に適用することにより機械学習を行って、図15の「MM11-1」~「MM11-10」が特定する評価用モデルを生成する。
At SI5 in FIG. 16, the
図16のSI6において処理部342は、評価用モデルを格納する。具体的には任意であるが、例えば、図4のSA5の処理と同様な処理を行う。ここでは、例えば、図15の「データID」=「ID11,ID21」、及び「モデル情報」=「MM11-1」~「MM11-10」を格納する。
At SI6 in FIG. 16, the
図16のSI7において処理部342は、処理を終了するか否かを判定する。具体的には任意であるが、例えば、図4のSA6と同様な処理を行う。そして、このようにして、図15の第3モデル特定情報が生成されて格納されることになる。これにて、モデル生成処理を終了する。
At SI7 in FIG. 16, the
(処理‐分析処理)
次に、分析処理について説明する。「分析処理」とは、概略的には、評価用モデルを用いて分析対象データを評価する処理である。図17は、分析処理のフローチャートである。この分析処理を実行するタイミングは任意であるが、例えば、記録部33に分析対象データ及び第3モデル特定情報が記録された後に、入力部31を介してユーザが所定操作を行った場合に起動を開始することとし、起動を開始したところから説明する。
(processing-analytical processing)
Next, analysis processing will be described. "Analysis processing" is roughly a process of evaluating analysis target data using an evaluation model. FIG. 17 is a flowchart of analysis processing. The timing of executing this analysis process is arbitrary, but for example, after the analysis target data and the third model specifying information are recorded in the
図17のSJ1において取得部341は、分析対象データを取得する。具体的には任意であるが、例えば、図5のSB1と同様な処理を行う。ここでは、例えば、図13の分析対象データ特定情報が特定する分析対象データ(つまり、行情報、時間情報、データID、及びペイロード情報)を取得する。
In SJ1 of FIG. 17, the
図17のSJ2において処理部342は、分析対象データをデータIDを基準に分類する。具体的には任意であるが、例えば、図9のSD2と同様な処理を行う。
In SJ2 of FIG. 17, the
図17のSJ3において処理部342は、分析対象データを関連付ける。具体的には任意であるが、例えば、図16のSI3と同様にして、所定のシーケンスに従って、SJ2で分類した分析対象データを相互に異なるデータID間で関連付ける。ここでは、例えば、図13の「データID」=「ID11」及び「ID12」について、「ペイロード情報」=「D11」及び「D21」が通信順番が各々の分析対象データにおいて1番であるので、行番号「1」及び「2」の分析対象データを相互に関連付け、同様にして、行番号「3」及び「4」の分析対象データ、行番号「5」及び「6」の分析対象データ、行番号「7」及び「8」の分析対象データを相互に関連付ける。なお、図13では不図示であるが、「データID」=「ID12」、「ID22」等に対応する分析対象データも格納されていることとし、これらの「データID」=「ID12」及び「ID22」の分析対象データについても同様にして相互に関連付ける。
In SJ3 of FIG. 17, the
図17のSJ4において処理部342は、1つの処理単位のデータを取得する。具体的には任意であるが、例えば、図16のSI4と同様にして、SJ3で関連付けたデータIDの組み合わせに対応する分析対象データの内の未だ取得されていないデータIDの組み合わせに対応する分析対象データを取得する。ここでは、例えば、SJ3で関連付けた「データID」=「ID11」及び「ID12」に対応する分析対象データを取得する。
In SJ4 of FIG. 17, the
図17のSJ5において処理部342は、評価処理を実行する。ここで実行する評価処理については、前述の図5のSB4で実行する評価処理と同様であるので、図6の評価処理の各ステップに「K」という符号を付して、概要のみ説明する。
In SJ5 of FIG. 17, the
図6のSK1において処理部342は、評価用モデルを選択する。具体的には任意であるが、例えば、SC1と同様の処理を行う。詳細には、図17のSJ4で取得した分析対象データに対応するデータIDを特定し、図15の第3モデル特定情報を参照して、当該特定したデータIDに対応するモデル情報を取得し、取得したモデル情報が特定する評価用モデルを選択する。ここでは、例えば、図17のSJ4で取得した分析対象データに対応するデータIDである「ID11」及び「ID12」を特定し、図15の第3モデル特定情報を参照して、当該特定したデータIDである「ID11」及び「ID12」に対応するモデル情報である「MM11-1」~「MM11-10」を取得し、「MM11-1」~「MM11-10」が特定する評価用モデルを選択する。
At SK1 in FIG. 6, the
図6のSK2において処理部342は、分析対象データを評価する。具体的には任意であるが、SC2と同様の処理を行う。例えば、前述したように、「評価用モデル」が、複数の関連付けられた分析対象データが入力され、当該入力された複数の関連付けられた分析対象データにおいて、分析対象データのペイロード情報が、学習用データを基準にして比較的大きく外れた値である、いわゆる外れ値に該当するか否かを検出するモデルであることに着目して、以下の処理を行う。詳細には、図17のSJ4で取得した分析対象データを、図6のSK1で選択した評価用モデル全てに入力し、各評価用モデルから出力される情報を取得し、取得した当該情報に基づいて、各分析対象データについて評価スコアを算出して生成する。なお、ここで評価用モデルに入力する対象データのペイロード情報については、図16のSI5の場合と同様な手法で1つにまとめて、1つにまとめたペイロード情報を入力することとする。
At SK2 in FIG. 6, the
ここでは、例えば、図17のSJ4で取得した分析対象データである図3の「データID」=「ID11」及び「ID21」に対応する分析対象データを、図6のSK1で選択した評価用モデルである図15の「MM11-1」~「MM11-10」が特定する評価用モデル全てに入力し、各評価用モデルから出力される情報を取得し、取得した当該情報に基づいて、各分析対象データについて評価スコアを算出して生成する。 Here, for example, the analysis target data corresponding to "data ID"="ID11" and "ID21" in FIG. 3, which are the analysis target data acquired in SJ4 in FIG. Input to all evaluation models specified by "MM11-1" to "MM11-10" in FIG. 15, acquire information output from each evaluation model, and based on the acquired information, each analysis An evaluation score is calculated and generated for the target data.
図6のSK3において処理部342は、分析対象データの評価結果を格納する。具体的には任意であるが、例えば、SC3と同様の処理を行う。例えば、各分析対象データについて評価スコアを取得し、取得した評価スコアを当該評価スコアに対応する分析対象データと対応付けた状態で、記録部13に記録する。ここでは、例えば、図13の「行情報」=「1」泳ぎ「2」の分析対象データの評価スコアである「90%」等を取得し、取得した「90%」と「行情報」=「1」及び「2」の分析対象データとが対応付けられた情報等を格納する。なお、この場合のペイロード情報については、前述の1つにまとめた形態で格納してもよいし、あるいは、分離された形態で格納してもよい。これにて、評価処理をリターンする。
At SK3 in FIG. 6, the
図17のSJ6において処理部342は、処理を終了するか否かを判定する。具体的には任意であるが、例えば、図5のSB5と同様な処理を行う。そして、図17のSJ3で関連付けた分析対象データについて全て取得して評価を行った場合、SJ7に移行する。
At SJ6 in FIG. 17, the
図17のSJ7において処理部342は、評価結果を出力する。具体的には任意であるが、例えば、図5のSB6と同様な処理を行う。詳細には、ここでは、例えば、ユーザが入力部31を介して表示閾値スコアとして「80%」を入力した場合、図6のSK3で記録した評価結果である評価スコアの内の当該表示閾値スコア以上の評価スコアである前述の「90%」等を選択して取得し、取得した評価スコアである「90%」を当該評価スコアに対応する分析対象データである「行情報」=「1」及び「2」に対応付けた情報を、出力部12のディスプレイに表示して出力する。
At SJ7 in FIG. 17, the
(本実施の形態の効果)
本実施の形態によれば、所定の基準(通信の仕様であり、前述の所定のシーケンス)に基づいて複数の解析対象データ(評価関連データ)又は複数の学習用データ(評価関連データ)を相互に関連付け、関連付けられた複数の評価関連データに基づいて、モデル生成処理(評価関連処理)及び分析処理(評価関連処理)を行うことにより、例えば、所定の基準として評価関連データの通信仕様等の実情に即した基準を採用した場合、当該実情に即して評価関連処理を適切に行うことが可能となる。
(Effect of this embodiment)
According to the present embodiment, a plurality of data to be analyzed (evaluation-related data) or a plurality of learning data (evaluation-related data) are mutually exchanged based on a predetermined standard (a communication specification and the above-described predetermined sequence). and perform model generation processing (evaluation-related processing) and analysis processing (evaluation-related processing) based on the associated multiple evaluation-related data. When a criterion that matches the actual situation is adopted, it becomes possible to appropriately perform the evaluation-related processing in line with the actual situation.
〔III〕実施の形態に対する変形例
以上、本発明に係る実施の形態について説明したが、本発明の具体的な構成及び手段は、特許請求の範囲に記載した各発明の技術的思想の範囲内において、任意に改変及び改良することができる。以下、このような変形例について説明する。
[III] Modifications to the Embodiments Although the embodiments according to the present invention have been described above, specific configurations and means of the present invention are within the scope of the technical ideas of each invention described in the claims. In can be optionally modified and improved. Such modifications will be described below.
(解決しようとする課題や発明の効果について)
まず、発明が解決しようとする課題や発明の効果は、上述の内容に限定されるものではなく、発明の実施環境や構成の細部に応じて異なる可能性があり、上述した課題の一部のみを解決したり、上述した効果の一部のみを奏したりすることがある。
(Problem to be solved and effect of invention)
First, the problems to be solved by the invention and the effects of the invention are not limited to the contents described above, and may differ depending on the details of the implementation environment and configuration of the invention. or only part of the effects described above.
(分散や統合について)
また、上述した各電気的構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各部の分散や統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散又は統合して構成できる。
(Regarding decentralization and integration)
Also, each electrical component described above is functionally conceptual, and does not necessarily need to be physically configured as illustrated. In other words, the specific forms of distribution and integration of each part are not limited to those illustrated, and all or part of them can be functionally or physically distributed or integrated in arbitrary units according to various loads and usage conditions. can be configured as
(形状、数値、構造、時系列について)
実施の形態や図面において例示した構成要素に関して、形状、数値、又は複数の構成要素の構造若しくは時系列の相互関係については、本発明の技術的思想の範囲内において、任意に改変及び改良することができる。
(Regarding shapes, numbers, structures, and time series)
Regarding the components illustrated in the embodiments and drawings, the shape, numerical value, structure of multiple components, or interrelationships in chronological order may be arbitrarily modified and improved within the scope of the technical idea of the present invention. can be done.
(評価結果の出力について)
また、上記実施の形態の1の図5のSB6では、評価スコアを当該評価スコアに対応する分析対象データに対応付けた情報を出力する場合について説明したが、これに限らない。例えば、これらの情報に加えてその他の任意の情報を出力するように構成してもよい。例えば、この出力される評価スコア(つまり、表示閾値スコア以上の評価スコア)に対応する分析対象データにおけるペイロード情報に着目し、図2の分析対象データを参照して、当該ペイロード情報と同じペイロード情報を有する分析対象データの個数を特定し、特定した個数も出力するように構成してもよい。
(Regarding output of evaluation results)
Also, in SB6 of FIG. 5 of the first embodiment, a case has been described in which information in which the evaluation score is associated with the analysis target data corresponding to the evaluation score is output, but the present invention is not limited to this. For example, it may be configured to output any other information in addition to these pieces of information. For example, focusing on the payload information in the analysis target data corresponding to the output evaluation score (that is, the evaluation score equal to or higher than the display threshold score), referring to the analysis target data in FIG. may be configured to specify the number of pieces of analysis target data having and to output the specified number as well.
(フィードバックについて)
また、上記各実施の形態の分析処理で評価スコアが「0%」となった分析対象データを表示し、表示された当該対象データをユーザがテストエンジニア等が視認して、「許可」等の命令を入力した場合に、当該分析対象データが学習用データとして記録されるように構成してもよい。
(About feedback)
In addition, the analysis target data whose evaluation score is "0%" in the analysis processing of each of the above embodiments is displayed, and the user, such as a test engineer, visually recognizes the displayed target data and selects "permit" or the like. The data to be analyzed may be recorded as learning data when a command is input.
(所定のシーケンスについて)
また、上記実施の形態3の図16のSI3及び図17のSJ3で説明したデータの関連付けについては、例えば、図12の記録部33に当該関連付ける基準となる基準情報として、相互に関連付けるべきデータIDの組み合わせを示す情報がユーザからの入力によって記録されていることとし、この基準情報を参照して当該基準情報に沿ってデータの関連付けを行うように構成してもよい。一例としては、「データID」=「ID11」及び「ID21」を関連付け、また、「データID」=「ID11」及び「ID22」を関連付ける等の基準情報が記録されており、この基準情報に基づいてデータの関連付けを行うように構成してもよい。なお、ここで相互に関連付けるデータIDの個数は2個に限らず、通信の使用に基づいて、1個の要求に対して2個機能からの応答が予測される場合等には、3個のデータIDを相互に関連付けるように構成してもよく、通信の実情等を考慮して任意に変更してもよい。
(for a given sequence)
16 and SJ3 of FIG. 17 in the third embodiment, data IDs to be associated with each other are stored in the
(組み合わせについて)
また、各実施の形態及び変形例の技術を任意に組み合わせてもよい。例えば、1つの情報処理システムにおいて、実施の形態1~3の処理を全て、あるいは、ユーザからの命令を受け付けて選択的に実行するように構成してもよい。
(About combination)
Also, the techniques of the embodiments and modifications may be combined arbitrarily. For example, one information processing system may be configured to execute all of the processes of
(付記)
付記1の処理システムは、評価対象データの評価に用いられる複数の評価用モデルを用いて行われる前記評価対象データの評価に関連する処理である評価関連処理を行う処理システムであって、評価関連データを取得する取得手段と、前記取得手段が取得した前記評価関連データに基づいて、前記評価関連処理を行う処理手段と、を備える。
(Appendix)
The processing system of
付記2の処理システムは、付記1に記載の処理システムにおいて、前記処理手段は、前記取得手段が取得した前記評価関連データの属性単位で、前記評価関連処理を行う。
The processing system according to
付記3の処理システムは、付記1又は2に記載の処理システムにおいて、前記処理手段は、所定の基準に基づいて、前記取得手段が取得した複数の前記評価関連データを相互に関連付け、関連付けられた複数の前記評価関連データに基づいて、前記評価関連処理を行う。
The processing system according to
付記4の処理システムは、付記1から3の何れか一項に記載の処理システムにおいて、前記処理手段は、予め定められている判定用モデルに基づいて、前記取得手段が取得した前記評価関連データを前記評価関連処理の対象とするか否かを判定し、前記評価関連処理の対象とするものと判定した前記評価関連データに基づいて、前記評価関連処理を行う。
The processing system according to
付記5の処理システムは、付記1から4の何れか一項に記載の処理システムにおいて、前記取得手段は、前記複数の評価用モデルを生成するための教師データを、前記評価関連データとして取得し、前記処理手段は、前記取得手段が取得した前記教師データと、前記複数の評価用モデルを生成するための機械学習用の所定のアルゴリズムとに基づいて、機械学習により前記複数の評価用モデルを生成する処理を前記評価関連処理として行う。
The processing system according to
付記6の処理システムは、付記5に記載の処理システムにおいて、前記所定のアルゴリズムは、複数のパラメータを有しており、前記処理手段は、前記複数のパラメータの内の一部のパラメータの値を変更することにより、前記複数の評価用モデルを生成する。
The processing system according to
付記7の処理システムは、付記1から4の何れか一項に記載の処理システムにおいて、前記取得手段は、前記評価対象データを、前記評価関連データとして取得し、
前記処理手段は、前記取得手段が取得した前記評価対象データと、前記複数の評価用モデルとに基づいて、前記評価対象データを評価する処理を前記評価関連処理として行う。
The processing system according to
The processing means performs a process of evaluating the evaluation target data based on the evaluation target data acquired by the acquisition means and the plurality of evaluation models as the evaluation related process.
付記8の処理システムは、付記7に記載の処理システムにおいて、前記処理手段は、前記取得手段が取得した前記評価対象データを、前記複数の評価用モデル各々を用いて評価し、前記複数の評価用モデル各々を用いて行われた各評価の結果を示す評価結果情報を生成する処理を前記評価関連処理として行う。
The processing system according to
付記9の処理システムは、付記7又は8に記載の処理システムにおいて、前記処理手段は、前記評価対象データに含まれているデータ値に関する評価を行う処理、又は、前記評価対象データに含まれている時間に関する評価を行う処理を前記評価関連処理として行う。
The processing system of
付記10の処理プログラムは、評価対象データに対応付けられている複数の評価用モデルを用いて前記評価対象データの評価に関連する処理である評価関連処理を行う処理プログラムであって、コンピュータを、評価関連データを取得する取得手段と、前記取得手段が取得した前記評価関連データに基づいて、前記評価関連処理を行う処理手段と、として機能させる。 The processing program of appendix 10 is a processing program that performs evaluation-related processing, which is processing related to evaluation of the evaluation target data, using a plurality of evaluation models associated with the evaluation target data, the program comprising: Acquisition means for acquiring evaluation-related data and processing means for performing the evaluation-related processing based on the evaluation-related data acquired by the acquisition means are caused to function.
(付記の効果)
付記1に記載の処理システム、及び付記10に記載の処理プログラムによれば、複数の評価用モデルを用いて行われる評価に関連する評価関連処理を行うことにより、例えば、複数の評価用モデルを用いて行われる評価対象データの評価を行うことができるので、評価対象データの評価の精度を向上させることが可能となる。
(Effect of Supplementary Note)
According to the processing system described in
付記2に記載の処理システムによれば、評価関連データの属性単位で評価関連処理を行うことにより、例えば、同様な属性を有する評価関連データ単位で評価関連処理を行うことができるので、評価関連処理を効率的且つ適切に行うことが可能となる。
According to the processing system described in
付記3に記載の処理システムによれば、所定の基準に基づいて複数の評価関連データを相互に関連付け、関連付けられた複数の評価関連データに基づいて、評価関連処理を行うことにより、例えば、所定の基準として評価関連データの通信仕様等の実情に即した基準を採用した場合、当該実情に即して評価関連処理を適切に行うことが可能となる。
According to the processing system described in
付記4に記載の処理システムによれば、予め定められている判定用モデルに基づいて評価関連データを評価関連処理の対象とするか否かを判定し、評価関連処理の対象とするものと判定した評価関連データに基づいて、評価関連処理を行うことにより、例えば、適切な評価関連データを用いて評価関連処理を行うことが可能となる。
According to the processing system described in
付記5に記載の処理システムによれば、教師データと機械学習用の所定のアルゴリズムとに基づいて、機械学習により複数の評価用モデルを生成する処理を行うことにより、例えば、複数の評価用モデルを適切に生成することが可能となる。
According to the processing system described in
付記6に記載の処理システムによれば、複数のパラメータの内の一部のパラメータの値を変更することにより、複数の評価用モデルを生成することにより、例えば、複数の評価用モデルをより適切に生成することが可能となる。
According to the processing system described in
付記7に記載の処理システムによれば、評価対象データと複数の評価用モデルとに基づいて、評価対象データを評価する処理を行うことにより、例えば、評価対象データの評価精度を向上させることが可能となる。
According to the processing system described in
付記8に記載の処理システムによれば、評価対象データを複数の評価用モデル各々を用いて評価し、複数の評価用モデル各々を用いて行われた各評価の結果を示す評価結果情報を生成する処理を行うことにより、例えば、複数の評価用モデル各々を用いて行った評価対象データの評価の結果を適切に示すことが可能となる。
According to the processing system described in
付記9に記載の処理システムによれば、評価対象データに含まれているデータ値に関する評価を行う処理、又は、評価対象データに含まれている時間に関する評価を行う処理を行うことにより、例えば、データ値に関する評価、及び時間に関する評価を行うことができるので、評価対象データに対して様々な評価を行うことが可能となる。
According to the processing system described in
1 情報処理装置
2 情報処理装置
3 情報処理装置
11 入力部
12 出力部
13 記録部
14 制御部
21 入力部
22 出力部
23 記録部
24 制御部
31 入力部
32 出力部
33 記録部
34 制御部
141 取得部
142 処理部
241 取得部
242 処理部
341 取得部
342 処理部
1
Claims (5)
評価関連データを取得する取得手段と、
前記取得手段が取得した前記評価関連データに基づいて、前記評価関連処理を行う処理手段と、を備え、
前記処理手段は、
所定の基準に基づいて、前記取得手段が取得した複数の前記評価関連データを相互に関連付ける第1処理と、
前記第1処理で関連付けられた複数の前記評価関連データに基づいて、前記評価関連処理を行う第2処理と、を実行し、
複数の前記評価関連データは、所定の規格の通信で用いられる第1属性の複数のデータと、前記所定の規格の通信で用いられる第2属性の複数のデータと、を含み、
前記第1属性の複数のデータ各々及び前記第2属性の複数のデータ各々は、所定の通信順番で通信されるデータであり、
前記処理手段は、
前記第1処理において、前記評価関連データの通信順番に基づいて、前記第1属性の複数のデータ各々及び前記第2属性の複数のデータ各々を相互に関連付け、
前記第2処理において、前記第1処理で関連付けた前記第1属性の複数のデータ各々と前記第2属性の複数のデータ各々とを含む複数の組み合わせに基づいて、前記評価関連処理を行い、
前記複数の組み合わせ各々に含まれるデータは、前記第1属性及び前記第2属性を含む2種類の属性のデータのみである、
処理システム。 A processing system that performs evaluation-related processing that is processing related to evaluation of evaluation target data performed using a plurality of evaluation models used for evaluation of evaluation target data,
Acquisition means for acquiring evaluation-related data;
a processing means for performing the evaluation-related processing based on the evaluation-related data acquired by the acquisition means;
The processing means
a first process of correlating the plurality of evaluation-related data acquired by the acquisition means based on a predetermined criterion;
a second process of performing the evaluation-related process based on the plurality of evaluation-related data associated in the first process;
The plurality of evaluation-related data includes a plurality of data of a first attribute used in communication conforming to a predetermined standard and a plurality of data of a second attribute used in communication conforming to the predetermined standard,
each of the plurality of data of the first attribute and each of the plurality of data of the second attribute are data communicated in a predetermined communication order;
The processing means
In the first process, each of the plurality of data of the first attribute and each of the plurality of data of the second attribute are associated with each other based on the communication order of the evaluation-related data;
In the second processing, performing the evaluation-related processing based on a plurality of combinations including each of the plurality of data of the first attribute and each of the plurality of data of the second attribute associated in the first processing,
The data included in each of the plurality of combinations is only data of two types of attributes including the first attribute and the second attribute.
processing system.
前記処理手段は、前記取得手段が取得した前記評価対象データと、前記複数の評価用モデルとに基づいて、前記評価対象データを評価する処理を前記評価関連処理として行う、
請求項1に記載の処理システム。 The acquisition means acquires the evaluation target data as the evaluation related data,
The processing means performs, as the evaluation related process, a process of evaluating the evaluation target data based on the evaluation target data acquired by the acquisition means and the plurality of evaluation models.
2. The processing system of claim 1 .
請求項2に記載の処理システム。 The processing means evaluates the evaluation target data acquired by the acquisition means using each of the plurality of evaluation models, and evaluates results of each evaluation performed using each of the plurality of evaluation models. performing a process of generating result information as the evaluation-related process;
3. The processing system of claim 2 .
請求項2又は3に記載の処理システム。 The processing means performs a process of evaluating a data value included in the evaluation target data or a process of evaluating a time included in the evaluation target data as the evaluation-related process.
4. A processing system according to claim 2 or 3 .
コンピュータを、
評価関連データを取得する取得手段と、
前記取得手段が取得した前記評価関連データに基づいて、前記評価関連処理を行う処理手段と、として機能させ、
前記処理手段は、
所定の基準に基づいて、前記取得手段が取得した複数の前記評価関連データを相互に関連付ける第1処理と、
前記第1処理で関連付けられた複数の前記評価関連データに基づいて、前記評価関連処理を行う第2処理と、を実行し、
複数の前記評価関連データは、所定の規格の通信で用いられる第1属性の複数のデータと、前記所定の規格の通信で用いられる第2属性の複数のデータと、を含み、
前記第1属性の複数のデータ各々及び前記第2属性の複数のデータ各々は、所定の通信順番で通信されるデータであり、
前記処理手段は、
前記第1処理において、前記評価関連データの通信順番に基づいて、前記第1属性の複数のデータ各々及び前記第2属性の複数のデータ各々を相互に関連付け、
前記第2処理において、前記第1処理で関連付けた前記第1属性の複数のデータ各々と前記第2属性の複数のデータ各々とを含む複数の組み合わせに基づいて、前記評価関連処理を行い、
前記複数の組み合わせ各々に含まれるデータは、前記第1属性及び前記第2属性を含む2種類の属性のデータのみである、
処理プログラム。 A processing program for performing evaluation-related processing, which is processing related to evaluation of evaluation target data performed using a plurality of evaluation models used for evaluation of evaluation target data,
the computer,
Acquisition means for acquiring evaluation-related data;
functioning as processing means for performing the evaluation-related processing based on the evaluation-related data acquired by the acquisition means;
The processing means
a first process of correlating the plurality of evaluation-related data acquired by the acquisition means based on a predetermined criterion;
a second process of performing the evaluation-related process based on the plurality of evaluation-related data associated in the first process;
The plurality of evaluation-related data includes a plurality of data of a first attribute used in communication conforming to a predetermined standard and a plurality of data of a second attribute used in communication conforming to the predetermined standard,
each of the plurality of data of the first attribute and each of the plurality of data of the second attribute are data communicated in a predetermined communication order;
The processing means
In the first process, each of the plurality of data of the first attribute and each of the plurality of data of the second attribute are associated with each other based on the communication order of the evaluation-related data;
In the second processing, performing the evaluation-related processing based on a plurality of combinations including each of the plurality of data of the first attribute and each of the plurality of data of the second attribute associated in the first processing,
The data included in each of the plurality of combinations is only data of two types of attributes including the first attribute and the second attribute.
processing program.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2019130901A JP7316129B2 (en) | 2019-07-16 | 2019-07-16 | Processing system and processing program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2019130901A JP7316129B2 (en) | 2019-07-16 | 2019-07-16 | Processing system and processing program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2021015535A JP2021015535A (en) | 2021-02-12 |
| JP7316129B2 true JP7316129B2 (en) | 2023-07-27 |
Family
ID=74530785
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2019130901A Active JP7316129B2 (en) | 2019-07-16 | 2019-07-16 | Processing system and processing program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7316129B2 (en) |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2017126978A (en) | 2016-01-08 | 2017-07-20 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | Abnormality detection method, abnormality detection device, and abnormality detection system |
| US20180124080A1 (en) | 2016-11-02 | 2018-05-03 | Qualcomm Incorporated | Methods and Systems for Anomaly Detection Using Functional Specifications Derived from Server Input/Output (I/O) Behavior |
| WO2019102911A1 (en) | 2017-11-27 | 2019-05-31 | 日本電信電話株式会社 | Abnormal communication detection device, abnormal communication detection method, and program |
-
2019
- 2019-07-16 JP JP2019130901A patent/JP7316129B2/en active Active
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2017126978A (en) | 2016-01-08 | 2017-07-20 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | Abnormality detection method, abnormality detection device, and abnormality detection system |
| US20180124080A1 (en) | 2016-11-02 | 2018-05-03 | Qualcomm Incorporated | Methods and Systems for Anomaly Detection Using Functional Specifications Derived from Server Input/Output (I/O) Behavior |
| WO2019102911A1 (en) | 2017-11-27 | 2019-05-31 | 日本電信電話株式会社 | Abnormal communication detection device, abnormal communication detection method, and program |
Non-Patent Citations (2)
| Title |
|---|
| Roberto Perdisci et al.,"Using an Ensemble of One-Class SVM Classifiers to Harden Payload-based Anomaly Detection Systems",Sixth International Conference on Data Mining (ICDM'06) [online],IEEE,2007年01月08日,[令和4年11月29日 検索], インターネット:<URL:https://ieeexplore.ieee.org/abstract/document/4053075>,DOI: 10.1109/ICDM.2006.165 |
| 辻 亮弥 外5名,「マルチモーダル入力に対応した重み付き多数決による識別器」,FIT2011 第10回情報科学技術フォーラム 講演論文集 第3分冊,一般社団法人 情報処理学会,2011年08月22日,pp.123-124 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2021015535A (en) | 2021-02-12 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6880843B2 (en) | Management equipment and management program | |
| CN113792423A (en) | Digital twin behavior constraint method and system for TPM (trusted platform Module) equipment management | |
| JP2019164656A (en) | System, method, and program for inspecting game program, machine leaning support device, and data structure | |
| US10699225B2 (en) | Production management support apparatus, production management support method, and production management support program | |
| JP2018147280A (en) | Data analysis device and data analysis method | |
| JP6937961B1 (en) | Data processing equipment, data processing methods and data processing programs | |
| JP2021174125A (en) | Information processing device and information processing method | |
| CN116525089A (en) | Method for generating an FTA fault tree from an FMEA table of a technical system or vice versa | |
| JP7316129B2 (en) | Processing system and processing program | |
| JP6511333B2 (en) | Decision support system and decision support method | |
| US20200280525A1 (en) | Allocation method, allocating device, and computer-readable recording medium | |
| JP6594555B2 (en) | Analysis system and analysis method | |
| CN115017565A (en) | Batch modeling method suitable for EnergyPlus and related device | |
| TWI829908B (en) | Support system, method and computer program for improving production efficiency | |
| JP7433648B2 (en) | Anomaly detection method | |
| JP7274434B2 (en) | Diversion design support system and diversion design support method | |
| Aslan et al. | Hierarchical ensemble deep learning for data-driven lead time prediction | |
| JP6530559B2 (en) | Optimization system and method | |
| WO2020189132A1 (en) | Learning device, learning method, computer program, and recording medium | |
| JP2021022006A (en) | Information processing device | |
| TWI819436B (en) | Prediction-model-constructing method, state prediction method and devices thereof | |
| WO2021229815A1 (en) | Information processing device, evaluation method, and evaluation program | |
| JP7457063B2 (en) | Digital twin collaboration method, digital twin collaboration system, and digital twin collaboration program | |
| CN114202394A (en) | Intelligent commodity recommendation method, device, equipment and storage medium | |
| JP2006268775A5 (en) |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220117 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221026 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221206 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230111 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230516 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230623 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230711 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230714 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7316129 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |