Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP7634259B2 - Network scanning device, a program for causing a computer to execute the program, and a computer-readable recording medium having the program recorded thereon - Google Patents
[go: Go Back, main page]

JP7634259B2 - Network scanning device, a program for causing a computer to execute the program, and a computer-readable recording medium having the program recorded thereon - Google Patents

Network scanning device, a program for causing a computer to execute the program, and a computer-readable recording medium having the program recorded thereon Download PDF

Info

Publication number
JP7634259B2
JP7634259B2 JP2021052478A JP2021052478A JP7634259B2 JP 7634259 B2 JP7634259 B2 JP 7634259B2 JP 2021052478 A JP2021052478 A JP 2021052478A JP 2021052478 A JP2021052478 A JP 2021052478A JP 7634259 B2 JP7634259 B2 JP 7634259B2
Authority
JP
Japan
Prior art keywords
scan
sample data
network
result
estimation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021052478A
Other languages
Japanese (ja)
Other versions
JP2022035964A (en
Inventor
セグン オジェツンデ ババツンデ
健太 鈴木
一人 矢野
義規 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ATR Advanced Telecommunications Research Institute International
Original Assignee
ATR Advanced Telecommunications Research Institute International
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ATR Advanced Telecommunications Research Institute International filed Critical ATR Advanced Telecommunications Research Institute International
Publication of JP2022035964A publication Critical patent/JP2022035964A/en
Application granted granted Critical
Publication of JP7634259B2 publication Critical patent/JP7634259B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Mobile Radio Communication Systems (AREA)

Description

特許法第30条第2項適用 2019年 電子情報通信学会ソサイエティ大会 通信講演論文集2,BS-4-2,第S-14~S-15頁(令和1年8月27日発行)で公開Article 30, paragraph 2 of the Patent Act applies. Published in Proceedings of the 2019 Institute of Electronics, Information and Communication Engineers Society Conference, Communications Lecture Papers 2, BS-4-2, pages S-14 to S-15 (published August 27, 2019)

特許法第30条第2項適用 2020 IEEE 17th Annual Consumer Communications & Networking Conference(CCNC)(令和2年1月10日発行)で公開Application of Article 30, Paragraph 2 of the Patent Act Published at the 2020 IEEE 17th Annual Consumer Communications & Networking Conference (CCNC) (published on January 10, 2020)

この発明は、ネットワークスキャン装置、コンピュータに実行させるためのプログラムおよびプログラムを記録したコンピュータ読み取り可能な記録媒体に関するものである。 This invention relates to a network scanning device, a program for causing a computer to execute the program, and a computer-readable recording medium on which the program is recorded.

第5世代移動通信(5G)システムの実用化に伴って、携帯端末、コンピュータ、センサおよびウェブカメラ等の多くの物がインターネットに接続されることになる。このようなインターネットに接続された携帯端末およびコンピュータ等は、IoT(Internet of Things)機器と呼ばれている。 As the fifth generation mobile communication (5G) system comes into practical use, many devices, such as mobile terminals, computers, sensors, and webcams, will be connected to the Internet. Such mobile terminals and computers connected to the Internet are called IoT (Internet of Things) devices.

IoT時代には、通信ネットワークに接続されるIoT機器の個数は、急速に増大することが見込まれる。IoT機器のうち、無線通信を行うIoT機器は、十分にセキュリティを確保できないまま、不正使用され、DDoS(Distributed Denial of Service attack)攻撃のようなサイバー攻撃に悪用されるケースが増大すると予想される。 In the IoT era, the number of IoT devices connected to communication networks is expected to increase rapidly. Among these, IoT devices that perform wireless communication are expected to be used illegally without sufficient security measures in order to increase the number of cases where they are exploited in cyber attacks such as distributed denial of service (DDoS) attacks.

このような事態を回避するために、通信ネットワークに接続されたIoT機器に対して、ネットワークスキャンを行い、セキュリティ対策が各IoT機器になされているかを調査する必要がある。 To avoid such a situation, it is necessary to conduct network scans of IoT devices connected to communication networks and investigate whether security measures are in place for each IoT device.

従来、非特許文献1に記載のネットワークスキャンが知られている。非特許文献1に記載されたネットワークスキャンは、IPv4空間のアプリケーションに対してスキャンを行うものであり、次の方法によって行われる。 The network scan described in Non-Patent Document 1 is known. The network scan described in Non-Patent Document 1 scans applications in the IPv4 space, and is performed by the following method.

まず、IPv4空間に対してポートスキャンを行い、レスポンスの有無を調査する。そして、レスポンスのあったホストに対して、様々なプロトコル(HTTP(Hypertext Transfer Protocol)、HTTPS(Hypertext Transfer Protocol Secure)およびPOP3(Post Office Protocol version 3)等)でハンドシェイクを実施し、メッセージを取得する。その後、取得したメッセージから、脆弱性評価に有用なキーワードを抽出する。そして、メタデータやタグ情報をキーワードに付与する。メタデータやタグ情報が付与されたキーワードを構造データとしてデータベースに登録する。 First, a port scan is performed in the IPv4 space to check for responses. Then, for hosts that respond, a handshake is performed using various protocols (HTTP (Hypertext Transfer Protocol), HTTPS (Hypertext Transfer Protocol Secure), POP3 (Post Office Protocol version 3), etc.) to obtain messages. Keywords that are useful for vulnerability assessment are then extracted from the obtained messages. Metadata and tag information are then assigned to the keywords. The keywords with the assigned metadata and tag information are then registered in the database as structured data.

Z. Durumeric, et al., “A Search Engine Backed by Internet-Wide Scanning”, CCS15, October 12-16, 2015.Z. Durumeric, et al., “A Search Engine Backed by Internet-Wide Scanning”, CCS15, October 12-16, 2015. 吉岡 克成、村上 洸介、松本 勉,“マルウェア感染ホスト検出のためのネットワークスキャン手法と検出用シグネチャの自動生成,”情報処理学会論文誌,Vol.51,No.9,1633-1644(Sep.2010).Katsunari Yoshioka, Kosuke Murakami, Tsutomu Matsumoto, "Network Scanning Method for Detecting Malware-Infected Hosts and Automatic Generation of Detection Signatures," Transactions of the Information Processing Society of Japan, Vol. 51, No. 9, pp. 1633-1644 (Sep. 2010).

ネットワークスキャンにおいてスキャン用のパケットを送信してからスキャン応答を受信するまでの時間であるRTT(Round-Trip Time)は、ネットワークが混雑している場合および通信品質が不十分である場合において、端末装置に対する特性が非常に類似している。 In a network scan, the round-trip time (RTT), which is the time between sending a scan packet and receiving a scan response, has very similar characteristics for terminal devices when the network is congested or when communication quality is insufficient.

その結果、実際の通信環境においてネットワークスキャンを実行した場合、ネットワークスキャンを失敗した原因がネットワークの混雑であるにも拘わらず、ネットワークスキャンを失敗した原因を誤って通信品質が不十分であると推定する割合が増加するという問題がある。 As a result, when a network scan is performed in an actual communication environment, there is an increased rate at which the cause of the network scan failure is mistakenly assumed to be insufficient communication quality, even though the cause is in fact network congestion.

そこで、この発明の実施の形態によれば、実際の通信環境において実行されたネットワークスキャンの結果を正確に推定可能なネットワークスキャン装置を提供する。 Therefore, according to an embodiment of the present invention, a network scanning device is provided that can accurately estimate the results of a network scan performed in an actual communication environment.

また、この発明の実施の形態によれば、実際の通信環境において実行されたネットワークスキャンの結果の正確な推定をコンピュータに実行させるためのプログラムを提供する。 In addition, according to an embodiment of the present invention, a program is provided that causes a computer to perform an accurate estimation of the results of a network scan performed in an actual communication environment.

更に、この発明の実施の形態によれば、実際の通信環境において実行されたネットワークスキャンの結果の正確な推定をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体を提供する。 Furthermore, according to an embodiment of the present invention, a computer-readable recording medium is provided that stores a program for causing a computer to perform an accurate estimation of the results of a network scan performed in an actual communication environment.

(構成1)
この発明の実施の形態によれば、ネットワークスキャン装置は、スキャン手段と、検出手段と、生成手段と、更新手段と、推定手段とを備える。スキャン手段は、M(Mは、2以上の整数)個の端末装置に対してネットワークスキャンの結果が不明である第1の通信環境においてネットワークスキャンを実行し、ネットワークスキャンの第1のスキャン応答遅延をM個の端末装置の全てについて取得する。検出手段は、ネットワークスキャンの結果が既知である第2の通信環境において実行されたネットワークスキャンの結果がそれぞれ複数の既知の推定結果であるときに得られる複数組のM’(M’は、2以上の整数)個の第2のスキャン応答遅延のうちでM個の第1のスキャン応答遅延に最も類似したM’個の第2のスキャン応答遅延を類似スキャン応答遅延として検出する検出処理を実行する。生成手段は、類似スキャン応答遅延を構成するM’個の第2のスキャン応答遅延の1つと共に取得された複数の通信特性のうちで既知の推定結果の推定に最も適した通信特性である最適通信特性をM’個の第2のスキャン応答遅延の全てについて取得し、その取得したM’個の最適通信特性とM’個の第2のスキャン応答遅延とからなる類似標準サンプルデータを生成する。更新手段は、類似標準サンプルデータに基づいて、第1の通信環境において実行されたネットワークスキャンの結果を推定する推定アルゴリズムを訓練するとともに評価指数を用いて最適アルゴリズムに近づくように推定アルゴリズムを更新する。推定手段は、更新手段によって更新された推定アルゴリズムを用いて、第1の通信環境において実行されたネットワークスキャンの結果を推定する。そして、最適アルゴリズムは、ネットワークスキャンの結果を推定したときの推定結果が既知の推定結果に一致するようにネットワークスキャンの結果を推定するアルゴリズムからなる。評価指数は、訓練後のアルゴリズムによってネットワークスキャンの結果を推定したときの推定結果の正確性を評価する指数である。
(Configuration 1)
According to an embodiment of the present invention, a network scanning device includes a scanning means, a detecting means, a generating means, an updating means, and an estimating means. The scanning means executes a network scan in a first communication environment where the results of a network scan for M (M is an integer equal to or greater than 2) terminal devices are unknown, and acquires first scan response delays of the network scan for all of the M terminal devices. The detecting means executes a detection process to detect, as similar scan response delays, M' second scan response delays that are most similar to the M first scan response delays among a plurality of sets of M'(M' is an integer equal to or greater than 2) second scan response delays obtained when the results of a network scan executed in a second communication environment where the results of the network scan are known are a plurality of known estimated results. The generating means acquires, for all of the M' second scan response delays, an optimal communication characteristic that is the communication characteristic most suitable for estimating a known estimation result among a plurality of communication characteristics acquired together with one of the M' second scan response delays constituting the similar scan response delay, and generates similar standard sample data consisting of the acquired M' optimal communication characteristics and the M' second scan response delays. The updating means trains an estimation algorithm that estimates a result of a network scan performed in the first communication environment based on the similar standard sample data, and updates the estimation algorithm using an evaluation index so as to approach the optimal algorithm. The estimation means estimates a result of a network scan performed in the first communication environment using the estimation algorithm updated by the updating means. The optimal algorithm is an algorithm that estimates a result of a network scan such that the estimated result when the result of the network scan is estimated matches a known estimation result. The evaluation index is an index that evaluates the accuracy of an estimation result when the result of a network scan is estimated by the trained algorithm.

(構成2)
構成1において、生成手段は、更に、類似標準サンプルデータからトレーニングデータとテストデータとを生成するとともにトレーニングデータからトレーニングセットと検証セットとを生成し、複数の既知の推定結果に対応付けられ、かつ、各々がM’個の第2のスキャン応答遅延とM’個の最適通信特性とからなる複数の標準サンプルデータのそれぞれ一部を結合した初期のサンプルデータを生成し、初期のサンプルデータのうちトレーニングセットと同じ種類の標準サンプルデータからなる一部のサンプルデータをトレーニングセットの一部によって置き換えた仮のサンプルデータを生成する。更新手段は、初期のサンプルデータを用いて推定アルゴリズムを訓練するとともに検証セットを用いて訓練後の推定アルゴリズムによってネットワークスキャンの結果を推定したときの推定結果を評価する第1の評価指数が、仮のサンプルデータを用いて推定アルゴリズムを訓練するとともに検証セットを用いて訓練後の推定アルゴリズムによってネットワークスキャンの結果を推定したときの推定結果を評価する第2の評価指数以下であるとき、仮のサンプルデータで推定アルゴリズムを更新する。
(Configuration 2)
In configuration 1, the generating means further generates training data and test data from the similar standard sample data and generates a training set and a validation set from the training data, generates initial sample data by combining a portion of each of a plurality of standard sample data corresponding to a plurality of known estimation results and each of which consists of M′ second scan response delays and M′ optimal communication characteristics, and generates provisional sample data by replacing a portion of the initial sample data consisting of the same type of standard sample data as the training set with a portion of the training set. The updating means updates the estimation algorithm with the provisional sample data when a first evaluation index for evaluating an estimation result obtained by training the estimation algorithm using the initial sample data and estimating the result of the network scan using the trained estimation algorithm using the validation set is equal to or smaller than a second evaluation index for evaluating an estimation result obtained by training the estimation algorithm using the provisional sample data and estimating the result of the network scan using the trained estimation algorithm using the validation set.

(構成3)
構成2において、複数の既知の推定結果は、ネットワークスキャンの結果が正常であることを示す第1の推定結果と、通信品質が不十分であることによってネットワークスキャンが失敗したことを示す第2の推定結果と、ネットワークが混雑していることによってネットワークスキャンが失敗したことを示す第3の推定結果とを含む。複数の標準サンプルデータは、第1の標準サンプルデータと、第2の標準サンプルデータと、第3の標準サンプルデータとを含む。第1の標準サンプルデータは、ネットワークが正常である通信環境において取得されたM’個の第2のスキャン応答遅延とM’個の最適通信特性とからなり、ネットワークスキャンの結果が第1の推定結果であると推定するための標準サンプルデータである。第2の標準サンプルデータは、ネットワークの通信品質が不十分である通信環境において取得されたM’個の第2のスキャン応答遅延とM’個の最適通信特性とからなり、ネットワークスキャンの結果が第2の推定結果であると推定するための標準サンプルデータである。第3の標準サンプルデータは、ネットワークが混雑している通信環境において取得されたM’個の第2のスキャン応答遅延とM’個の最適通信特性とからなり、ネットワークスキャンの結果が第3の推定結果であると推定するための標準サンプルデータである。第1の推定結果は、第1の標準サンプルデータを用いて推定アルゴリズムによって推定された結果であり、第2の推定結果は、第2の標準サンプルデータを用いて推定アルゴリズムによって推定された結果であり、第3の推定結果は、第3の標準サンプルデータを用いて推定アルゴリズムによって推定された結果である。
(Configuration 3)
In configuration 2, the multiple known estimation results include a first estimation result indicating that the result of the network scan is normal, a second estimation result indicating that the network scan has failed due to insufficient communication quality, and a third estimation result indicating that the network scan has failed due to network congestion. The multiple standard sample data include first standard sample data, second standard sample data, and third standard sample data. The first standard sample data is standard sample data consisting of M' second scan response delays and M' optimal communication characteristics acquired in a communication environment in which the network is normal, and is used to estimate that the result of the network scan is the first estimation result. The second standard sample data is standard sample data consisting of M' second scan response delays and M' optimal communication characteristics acquired in a communication environment in which the network communication quality is insufficient, and is used to estimate that the result of the network scan is the second estimation result. The third standard sample data is standard sample data consisting of M′ second scan response delays and M′ optimal communication characteristics acquired in a communication environment with a congested network, and is used to estimate that the result of the network scan is the third estimated result. The first estimated result is a result estimated by an estimation algorithm using the first standard sample data, the second estimated result is a result estimated by an estimation algorithm using the second standard sample data, and the third estimated result is a result estimated by an estimation algorithm using the third standard sample data.

(構成4)
構成2または構成3において、生成手段は、初期のサンプルデータのうちトレーニングセットと同じ種類の標準サンプルデータからなる一部のサンプルデータをトレーニングセットの複数のサブセットデータのうちの1つのサブセットデータによって置き換えることを複数のサブセットデータの全てについて実行して仮のサンプルデータを構成する複数の仮のサンプルデータを生成する。更新手段は、初期のサンプルデータを用いて推定アルゴリズムを訓練するとともに、検証セットを用いて訓練後の推定アルゴリズムによってネットワークスキャンの結果を推定したときの推定結果に基づいて第1の混同行列を生成する第1の処理と、仮のサンプルデータを構成する複数の仮のサンプルデータのうちの1つの仮のサンプルデータを用いて推定アルゴリズムを訓練するとともに、検証セットを用いて訓練後の推定アルゴリズムによってネットワークスキャンの結果を推定したときの推定結果に基づいて第2の混同行列を生成する処理を複数の仮のサンプルデータの全てについて実行する第2の処理と、第1の混同行列に基づいて算出された第1の評価指数と複数の第2の混同行列に基づいて算出された複数の第2の評価指数とに基づいて、第1の評価指数よりも大きく、かつ、複数の第2の評価指数のうちの最大の評価指数が得られるときの複数の仮のサンプルデータのうちの1つの仮のサンプルデータからなる最適サンプルデータで推定アルゴリズムを更新する第3の処理と、第3の処理の後、テストデータを用いて更新後の推定アルゴリズムによってネットワークスキャンの結果を推定したときの推定結果に基づいて第3の混同行列を生成する第4の処理と、第3の混同行列に基づいて算出された第3の評価指数が最大の評価指数以上であるとき、更新後の推定アルゴリズムおよび最適サンプルデータを承認する第5の処理とを実行する。
(Configuration 4)
In the configuration 2 or 3, the generating means generates a plurality of provisional sample data constituting the provisional sample data by executing, for all of the plurality of subset data, replacing a part of sample data of the initial sample data consisting of standard sample data of the same type as that of the training set with one of the plurality of subset data of the training set. The updating means executes, for all of the plurality of provisional sample data, a first process of training an estimation algorithm using the initial sample data and generating a first confusion matrix based on an estimation result obtained when a result of a network scan is estimated by the estimation algorithm after training using the validation set, a second process of training an estimation algorithm using one of the plurality of provisional sample data constituting the provisional sample data and generating a second confusion matrix based on an estimation result obtained when a result of a network scan is estimated by the estimation algorithm after training using the validation set, and a third process of updating the estimation algorithm with optimal sample data consisting of one provisional sample data among the provisional sample data when the maximum evaluation index of the second evaluation index is obtained, which is greater than the first evaluation index, based on a plurality of second evaluation indexes calculated based on the second confusion matrix; a fourth process of generating a third confusion matrix based on an estimation result obtained when the result of the network scan is estimated by the updated estimation algorithm using test data after the third process; and a fifth process of approving the updated estimation algorithm and the optimal sample data when the third evaluation index calculated based on the third confusion matrix is equal to or greater than the maximum evaluation index.

(構成5)
構成4において、更新手段は、第3の評価指数が最大の評価指数よりも小さいとき、最適サンプルデータで更新された推定アルゴリズムを用いて、第1の処理から第5の処理を第3の評価指数が最大の評価指数以上になるまで繰り返し実行する。
(Configuration 5)
In configuration 4, when the third evaluation index is smaller than the maximum evaluation index, the update means repeatedly executes the first process to the fifth process using the estimation algorithm updated with the optimal sample data until the third evaluation index becomes equal to or larger than the maximum evaluation index.

(構成6)
構成4または構成5において、ネットワークスキャン装置は、評価指数を算出する算出手段を更に備える。第1から第3の混同行列の各々は、想定した事象が発生した場合に、想定した事象の発生を正しく推定した割合を示す第1の要素と、想定した事象が実際には発生しなかった場合に、想定した事象が発生しなかったことを正しく推定した割合を示す第2の要素と、想定した事象が発生した場合に、想定した事象の発生を別の事象に誤って推定した割合を示す第3の要素と、想定した事象が実際には発生しなかった場合に、誤って想定した事象が発生したと推定した割合を示す第4の要素とからなる。そして、算出手段は、第1の要素または第4の要素に分類された割合のうちで実際に第1の要素に分類された割合の比であるPrecisionと、第1の要素または第3の要素に分類された割合のうちで実際に第1の要素に分類された割合の比であるRecallとを算出し、PrecisionおよびRecallに基づいて2×Precision/(Precision+Recall)を算出する第3の算出処理を第1の混同行列に基づいて実行して第1の評価指数を算出し、第3の算出処理を複数の第2の混同行列に基づいて実行して複数の第2の評価指数を算出し、第3の算出処理を第3の混同行列に基づいて実行して第3の評価指数を算出する。
(Configuration 6)
In the configuration 4 or 5, the network scanning device further includes a calculation means for calculating an evaluation index. Each of the first to third confusion matrices includes a first element indicating a rate of correctly estimating the occurrence of an assumed event when the assumed event occurs, a second element indicating a rate of correctly estimating that the assumed event did not occur when the assumed event did not actually occur, a third element indicating a rate of erroneously estimating the occurrence of the assumed event as another event when the assumed event occurs, and a fourth element indicating a rate of erroneously estimating that the assumed event occurred when the assumed event did not actually occur. Then, the calculation means calculates Precision, which is the ratio of the proportion actually classified into the first element among the proportion classified into the first element or the fourth element, and Recall, which is the ratio of the proportion actually classified into the first element among the proportion classified into the first element or the third element, and executes a third calculation process of calculating 2×Precision/(Precision+Recall) based on Precision and Recall based on the first confusion matrix to calculate a first evaluation index, executes the third calculation process based on a plurality of second confusion matrices to calculate a plurality of second evaluation indexes, and executes the third calculation process based on the third confusion matrix to calculate a third evaluation index.

(構成7)
構成4または構成5において、ネットワークスキャン装置は、評価指数を算出する算出手段を更に備える。第1から第3の混同行列の各々は、想定した事象が発生した場合に、想定した事象の発生を正しく推定した割合を示す第1の要素と、想定した事象が実際には発生しなかった場合に、想定した事象が発生しなかったことを正しく推定した割合を示す第2の要素と、想定した事象が発生した場合に、想定した事象の発生を別の事象に誤って推定した割合を示す第3の要素と、想定した事象が実際には発生しなかった場合に、誤って想定した事象が発生したと推定した割合を示す第4の要素とからなる。そして、算出手段は、第1の混同行列の第1の要素、第2の要素、第3の要素および第4の要素を用いてマシューズ相関係数からなる第1の評価指数を算出し、複数の第2の混同行列の第1の要素、第2の要素、第3の要素および第4の要素を用いてマシューズ相関係数からなる複数の第2の評価指数を算出し、第3の混同行列の第1の要素、第2の要素、第3の要素および第4の要素を用いてマシューズ相関係数からなる第3の評価指数を算出する。
(Configuration 7)
In the configuration 4 or 5, the network scanning device further includes a calculation means for calculating an evaluation index. Each of the first to third confusion matrices includes a first element indicating a rate of correctly estimating the occurrence of an assumed event when the assumed event occurs, a second element indicating a rate of correctly estimating that the assumed event did not occur when the assumed event did not actually occur, a third element indicating a rate of erroneously estimating the occurrence of the assumed event as another event when the assumed event occurs, and a fourth element indicating a rate of erroneously estimating that the assumed event occurred when the assumed event did not actually occur. Then, the calculation means calculates a first evaluation index consisting of a Matthews correlation coefficient using the first element, the second element, the third element, and the fourth element of the first confusion matrix, calculates a plurality of second evaluation indexes consisting of a Matthews correlation coefficient using the first element, the second element, the third element, and the fourth element of the plurality of second confusion matrices, and calculates a third evaluation index consisting of a Matthews correlation coefficient using the first element, the second element, the third element, and the fourth element of the third confusion matrix.

(構成8)
構成1から構成7のいずれかにおいて、検出手段は、検出処理において、複数組のM’個の第2のスキャン応答遅延の複数の分布とM個の第1のスキャン応答遅延の分布とに基づいて、M個の第1のスキャン応答遅延の分布に最も類似する分布を有するM’個の第2のスキャン応答遅延を複数組のM’個の第2のスキャン応答遅延から類似スキャン応答遅延として検出する。
(Configuration 8)
In any of configurations 1 to 7, the detection means, in a detection process, detects M' second scan response delays having a distribution most similar to the distribution of the M first scan response delays from the multiple sets of M' second scan response delays as similar scan response delays based on multiple distributions of the multiple sets of M' second scan response delays and the distribution of the M first scan response delays.

(構成9)
構成8において、検出手段は、検出処理において、M個の第1のスキャン応答遅延に基づいて最も生じやすい第1のスキャン応答遅延の値を示す第1のモードを算出し、M個の第1のスキャン応答遅延と第1のモードとの差の絶対値の平均値である第1の平均絶対偏差を算出する第1の算出処理と、第1の算出処理の後、M’個の第2のスキャン応答遅延に基づいて最も生じやすい第2のスキャン応答遅延の値を示す第2のモードを算出し、M’個の第2のスキャン応答遅延と第2のモードとの差の絶対値の平均値である第2の平均絶対偏差を算出し、第1の平均絶対偏差と第2の平均絶対偏差との差の絶対値からなる平均絶対偏差の差を算出し、1から平均絶対偏差の差を減算して類似性を算出する第2の算出処理を複数の既知の推定結果の全てについて実行して複数の類似性を取得し、その取得した複数の類似性のうち、最も高い類似性を算出する元になったM’個の第2のスキャン応答遅延を類似スキャン応答遅延として検出する。
(Configuration 9)
In configuration 8, the detection means performs a first calculation process in the detection process to calculate a first mode indicating a value of the first scan response delay that is most likely to occur based on M first scan response delays, and calculates a first mean absolute deviation that is an average value of absolute values of differences between the M first scan response delays and the first mode, and after the first calculation process, calculates a second mode indicating a value of the second scan response delay that is most likely to occur based on M' second scan response delays, calculates a second mean absolute deviation that is an average value of absolute values of differences between the M' second scan response delays and the second mode, calculates a difference in mean absolute deviation consisting of the absolute value of the difference between the first mean absolute deviation and the second mean absolute deviation, and subtracts the difference in mean absolute deviation from 1 to calculate a similarity, for all of the multiple known estimation results to obtain multiple similarities, and detects the M' second scan response delays that were used to calculate the highest similarity among the multiple obtained similarities as the similar scan response delay.

(構成10)
また、この発明の実施の形態によれば、プログラムは、
スキャン手段が、M(Mは、2以上の整数)個の端末装置に対してネットワークスキャンの結果が不明である第1の通信環境においてネットワークスキャンを実行し、ネットワークスキャンの第1のスキャン応答遅延をM個の端末装置の全てについて取得する第1のステップと、
検出手段が、ネットワークスキャンの結果が既知である第2の通信環境において実行されたネットワークスキャンの結果がそれぞれ複数の既知の推定結果であるときに得られる複数組のM’(M’は、2以上の整数)個の第2のスキャン応答遅延のうちでM個の第1のスキャン応答遅延に最も類似したM’個の第2のスキャン応答遅延を類似スキャン応答遅延として検出する検出処理を実行する第2のステップと、
生成手段が、類似スキャン応答遅延を構成するM’個の第2のスキャン応答遅延の1つと共に取得された複数の通信特性のうちで既知の推定結果の推定に最も適した通信特性である最適通信特性をM’個の第2のスキャン応答遅延の全てについて取得し、その取得したM’個の最適通信特性とM’個の第2のスキャン応答遅延とからなる類似標準サンプルデータを生成する第3のステップと、
更新手段が、類似標準サンプルデータに基づいて、第1の通信環境において実行されたネットワークスキャンの結果を推定する推定アルゴリズムを訓練するとともに評価指数を用いて最適アルゴリズムに近づくように推定アルゴリズムを更新する第4のステップと、
推定手段が、第4のステップにおいて更新された推定アルゴリズムを用いて、第1の通信環境において実行されたネットワークスキャンの結果を推定する第5のステップとをコンピュータに実行させ、
最適アルゴリズムは、ネットワークスキャンの結果を推定したときの推定結果が既知の推定結果に一致するようにネットワークスキャンの結果を推定するアルゴリズムからなり、評価指数は、訓練後のアルゴリズムによってネットワークスキャンの結果を推定したときの推定結果の正確性を評価する指数である。
(Configuration 10)
According to an embodiment of the present invention, the program further comprises:
A first step in which a scanning means executes a network scan in a first communication environment in which the results of a network scan are unknown for M (M is an integer equal to or greater than 2) terminal devices, and acquires a first scan response delay of the network scan for each of the M terminal devices;
a second step of executing a detection process in which the detection means detects, as similar scan response delays, M' second scan response delays most similar to the M first scan response delays among a plurality of sets of M'(M' is an integer equal to or greater than 2) second scan response delays obtained when the results of a network scan executed in a second communication environment in which the results of the network scan are known are a plurality of known estimated results;
a third step in which the generating means acquires, for each of the M' second scan response delays, an optimal communication characteristic that is the communication characteristic most suitable for estimating a known estimation result among a plurality of communication characteristics acquired together with one of the M' second scan response delays constituting the similar scan response delay, and generates similar standard sample data consisting of the acquired M' optimal communication characteristics and the M' second scan response delays;
a fourth step in which an updating means trains an estimation algorithm for estimating a result of a network scan performed in the first communication environment based on similar standard sample data, and updates the estimation algorithm using an evaluation index so as to approach an optimal algorithm;
a fifth step in which the estimation means estimates a result of the network scan performed in the first communication environment using the estimation algorithm updated in the fourth step;
The optimal algorithm is an algorithm that estimates the results of a network scan such that the estimated results match known estimated results, and the evaluation index is an index that evaluates the accuracy of the estimated results when the results of a network scan are estimated by the trained algorithm.

(構成11)
構成10において、生成手段は、第3のステップにおいて、更に、類似標準サンプルデータからトレーニングデータとテストデータとを生成するとともにトレーニングデータからトレーニングセットと検証セットとを生成し、複数の既知の推定結果に対応付けられ、かつ、各々がM’個の第2のスキャン応答遅延とM’個の最適通信特性とからなる複数の標準サンプルデータのそれぞれ一部を結合した初期のサンプルデータを生成し、初期のサンプルデータのうちトレーニングセットと同じ種類の標準サンプルデータからなる一部のサンプルデータをトレーニングセットの一部によって置き換えた仮のサンプルデータを生成し、
更新手段は、第4のステップにおいて、初期のサンプルデータを用いて推定アルゴリズムを訓練するとともに検証セットを用いて訓練後の推定アルゴリズムによってネットワークスキャンの結果を推定したときの推定結果を評価する第1の評価指数が、仮のサンプルデータを用いて推定アルゴリズムを訓練するとともに検証セットを用いて訓練後の推定アルゴリズムによってネットワークスキャンの結果を推定したときの推定結果を評価する第2の評価指数以下であるとき、仮のサンプルデータで推定アルゴリズムを更新する。
(Configuration 11)
In configuration 10, in the third step, the generating means further generates training data and test data from the similar standard sample data, and generates a training set and a validation set from the training data, generates initial sample data by combining a portion of each of a plurality of standard sample data corresponding to a plurality of known estimation results and each of which is composed of M' second scan response delays and M' optimal communication characteristics, and generates provisional sample data by replacing a portion of the initial sample data composed of standard sample data of the same type as the training set with a portion of the training set;
In the fourth step, the updating means updates the estimation algorithm with the hypothetical sample data when a first evaluation index, which evaluates an estimation result when the estimation algorithm is trained using initial sample data and the network scan result is estimated by the trained estimation algorithm using a validation set, is equal to or less than a second evaluation index, which evaluates an estimation result when the estimation algorithm is trained using hypothetical sample data and the network scan result is estimated by the trained estimation algorithm using a validation set.

(構成12)
構成11において、複数の既知の推定結果は、ネットワークスキャンの結果が正常であることを示す第1の推定結果と、通信品質が不十分であることによってネットワークスキャンが失敗したことを示す第2の推定結果と、ネットワークが混雑していることによってネットワークスキャンが失敗したことを示す第3の推定結果とを含む。複数の標準サンプルデータは、第1の標準サンプルデータと、第2の標準サンプルデータと、第3の標準サンプルデータとを含む。
(Configuration 12)
In configuration 11, the plurality of known estimated results include a first estimated result indicating that the result of the network scan is normal, a second estimated result indicating that the network scan has failed due to insufficient communication quality, and a third estimated result indicating that the network scan has failed due to network congestion. The plurality of standard sample data include a first standard sample data, a second standard sample data, and a third standard sample data.

第1の標準サンプルデータは、ネットワークが正常である通信環境において取得されたM’個の第2のスキャン応答遅延とM’個の最適通信特性とからなり、ネットワークスキャンの結果が第1の推定結果であると推定するための標準サンプルデータである。 The first standard sample data consists of M' second scan response delays and M' optimal communication characteristics acquired in a communication environment in which the network is normal, and is standard sample data for estimating that the result of the network scan is the first estimated result.

第2の標準サンプルデータは、ネットワークの通信品質が不十分である通信環境において取得されたM’個の第2のスキャン応答遅延とM’個の最適通信特性とからなり、ネットワークスキャンの結果が第2の推定結果であると推定するための標準サンプルデータである。 The second standard sample data consists of M' second scan response delays and M' optimal communication characteristics obtained in a communication environment where the network communication quality is insufficient, and is standard sample data for estimating that the result of the network scan is the second estimated result.

第3の標準サンプルデータは、ネットワークが混雑している通信環境において取得されたM’個の第2のスキャン応答遅延とM’個の最適通信特性とからなり、ネットワークスキャンの結果が第3の推定結果であると推定するための標準サンプルデータである。 The third standard sample data is composed of M' second scan response delays and M' optimal communication characteristics obtained in a communication environment with a congested network, and is standard sample data for estimating that the result of the network scan is the third estimated result.

第1の推定結果は、第1の標準サンプルデータを用いて推定アルゴリズムによって推定された結果であり、第2の推定結果は、第2の標準サンプルデータを用いて推定アルゴリズムによって推定された結果であり、第3の推定結果は、第3の標準サンプルデータを用いて推定アルゴリズムによって推定された結果である。 The first estimation result is a result estimated by an estimation algorithm using the first standard sample data, the second estimation result is a result estimated by an estimation algorithm using the second standard sample data, and the third estimation result is a result estimated by an estimation algorithm using the third standard sample data.

(構成13)
構成11または構成12において、生成手段は、第3のステップにおいて、初期のサンプルデータのうちトレーニングセットと同じ種類の標準サンプルデータからなる一部のサンプルデータをトレーニングセットの複数のサブセットデータのうちの1つのサブセットデータによって置き換えることを複数のサブセットデータの全てについて実行して仮のサンプルデータを構成する複数の仮のサンプルデータを生成し、
第4のステップは、
更新手段が、初期のサンプルデータを用いて推定アルゴリズムを訓練するとともに、検証セットを用いて訓練後の推定アルゴリズムによってネットワークスキャンの結果を推定したときの推定結果に基づいて第1の混同行列を生成する第1のサブステップと、
更新手段が、仮のサンプルデータを構成する複数の仮のサンプルデータのうちの第1の仮のサンプルデータを用いて推定アルゴリズムを訓練するとともに、検証セットを用いて訓練後の推定アルゴリズムによってネットワークスキャンの結果を推定したときの推定結果に基づいて第2の混同行列を生成する第2のサブステップと、
更新手段が、第2の混同行列に基づいて算出された第2の評価指数が第1の混同行列に基づいて算出された第1の評価指数よりも大きいとき、第2の評価指数を第1の評価指数に設定するとともに第1の仮のサンプルデータで推定アルゴリズムを更新する第3のサブステップと、
更新手段が、第2の評価指数が第1の評価指数よりも大きくないとき第2の評価指数を第1の評価指数に設定せずに第1の仮のサンプルデータと異なる第2の仮のサンプルデータを複数の仮のサンプルデータから選択する第4のサブステップと、
更新手段が、第2のサブステップから第4のサブステップを複数の仮のサンプルデータの全てについて繰り返し実行する第5のサブステップと、
更新手段が、テストデータを用いて、第5のサブステップにおいて最終的に更新された推定アルゴリズムによってネットワークスキャンの結果を推定したときの推定結果に基づいて第3の混同行列を生成する第6のサブステップと、
更新手段が、第3の混同行列に基づいて算出された第3の評価指数が第5のサブステップにおいて最終的に得られた第1の評価指数以上であるとき最終的に更新された推定アルゴリズムと、最終的に得られた第1の評価指数を構成する第2の評価指数が得られるときの第1の仮のサンプルデータとを承認する第7のサブステップとを含む。
(Configuration 13)
In the configuration 11 or 12, in the third step, the generating means generates a plurality of provisional sample data constituting the provisional sample data by executing the replacement of a part of sample data of the initial sample data, which is made of standard sample data of the same type as the training set, with one of the plurality of subset data of the training set for all of the plurality of subset data;
The fourth step is:
A first sub-step in which an update means trains an estimation algorithm using initial sample data and generates a first confusion matrix based on an estimation result when the estimation algorithm after training uses a validation set to estimate a result of a network scan;
a second sub-step in which the update means trains the estimation algorithm using a first set of provisional sample data among a plurality of provisional sample data constituting the provisional sample data, and generates a second confusion matrix based on an estimation result obtained when the result of the network scan is estimated by the trained estimation algorithm using a validation set;
a third sub-step of an update means for setting the second evaluation index to the first evaluation index and updating the estimation algorithm with the first provisional sample data when the second evaluation index calculated based on the second confusion matrix is greater than the first evaluation index calculated based on the first confusion matrix;
a fourth sub-step in which the update means does not set the second evaluation index to the first evaluation index when the second evaluation index is not greater than the first evaluation index, and selects second provisional sample data different from the first provisional sample data from the plurality of provisional sample data;
a fifth substep in which an updating means repeatedly executes the second to fourth substeps for all of the plurality of virtual sample data;
a sixth sub-step of generating a third confusion matrix based on an estimation result when the update means estimates the result of the network scan by the estimation algorithm finally updated in the fifth sub-step using the test data;
The seventh sub-step includes an updating means for approving the finally updated estimation algorithm when the third evaluation index calculated based on the third confusion matrix is equal to or greater than the first evaluation index finally obtained in the fifth sub-step, and the first provisional sample data when the second evaluation index constituting the finally obtained first evaluation index is obtained.

(構成14)
構成13において、第4のステップは、更新手段が、第3の評価指数が第5のサブステップにおいて最終的に得られた第1の評価指数よりも小さいとき、最終的に更新された推定アルゴリズムを用いて、第3の評価指数が第5のサブステップにおいて最終的に得られた第1の評価指数以上になるまで第2のサブステップから第7のサブステップを繰り返し実行する第8のサブステップを更に含む。
(Configuration 14)
In configuration 13, the fourth step further includes an eighth substep in which, when the third evaluation index is smaller than the first evaluation index finally obtained in the fifth substep, the updating means repeatedly executes the second substep to the seventh substep using the finally updated estimation algorithm until the third evaluation index becomes equal to or larger than the first evaluation index finally obtained in the fifth substep.

(構成15)
構成13または構成14において、算出手段が、評価指数を算出する第6のステップを更にコンピュータに実行させ、
第1から第3の混同行列の各々は、想定した事象が発生した場合に、想定した事象の発生を正しく推定した割合を示す第1の要素と、想定した事象が実際には発生しなかった場合に、想定した事象が発生しなかったことを正しく推定した割合を示す第2の要素と、想定した事象が発生した場合に、想定した事象の発生を別の事象に誤って推定した割合を示す第3の要素と、想定した事象が実際には発生しなかった場合に、誤って想定した事象が発生したと推定した割合を示す第4の要素とからなり、
算出手段は、第6のステップにおいて、第1の要素または第4の要素に分類された割合のうちで実際に第1の要素に分類された割合の比であるPrecisionと、第1の要素または第3の要素に分類された割合のうちで実際に第1の要素に分類された割合の比であるRecallとを算出し、PrecisionおよびRecallに基づいて2×Precision/(Precision+Recall)を算出する算出処理を第1の混同行列に基づいて実行して第1の評価指数を算出し、算出処理を複数の第2の混同行列に基づいて実行して複数の第2の評価指数を算出し、算出処理を第3の混同行列に基づいて実行して第3の評価指数を算出する
(構成16)
構成13または構成14において、算出手段が、評価指数を算出する第6のステップを更にコンピュータに実行させ、
第1から第3の混同行列の各々は、想定した事象が発生した場合に、想定した事象の発生を正しく推定した割合を示す第1の要素と、想定した事象が実際には発生しなかった場合に、想定した事象が発生しなかったことを正しく推定した割合を示す第2の要素と、想定した事象が発生した場合に、想定した事象の発生を別の事象に誤って推定した割合を示す第3の要素と、想定した事象が実際には発生しなかった場合に、誤って想定した事象が発生したと推定した割合を示す第4の要素とからなり、
算出手段は、第6のステップにおいて、第1の混同行列の第1の要素、第2の要素、第3の要素および第4の要素を用いてマシューズ相関係数からなる第1の評価指数を算出し、複数の第2の混同行列の第1の要素、第2の要素、第3の要素および第4の要素を用いてマシューズ相関係数からなる複数の第2の評価指数を算出し、第3の混同行列の第1の要素、第2の要素、第3の要素および第4の要素を用いてマシューズ相関係数からなる第3の評価指数を算出する。
(Configuration 15)
In the configuration 13 or 14, the calculation means further causes the computer to execute a sixth step of calculating an evaluation index;
Each of the first to third confusion matrices includes a first element indicating a rate at which the occurrence of an assumed event is correctly estimated when the assumed event occurs, a second element indicating a rate at which the occurrence of an assumed event is correctly estimated when the assumed event does not actually occur, a third element indicating a rate at which the occurrence of an assumed event is erroneously estimated as another event when the assumed event occurs, and a fourth element indicating a rate at which the occurrence of an assumed event is erroneously estimated when the assumed event does not actually occur.
In the sixth step, the calculation means calculates Precision, which is a ratio of the ratio actually classified into the first element among the ratios classified into the first element or the fourth element, and Recall, which is a ratio of the ratio actually classified into the first element among the ratios classified into the first element or the third element, and calculates 2×Precision/(Precision+Recall) based on Precision and Recall based on the first confusion matrix to calculate a first evaluation index, performs the calculation process based on a plurality of second confusion matrices to calculate a plurality of second evaluation indexes, and performs the calculation process based on a third confusion matrix to calculate a third evaluation index (Configuration 16).
In the configuration 13 or 14, the calculation means further causes the computer to execute a sixth step of calculating an evaluation index;
Each of the first to third confusion matrices includes a first element indicating a rate at which the occurrence of an assumed event is correctly estimated when the assumed event occurs, a second element indicating a rate at which the occurrence of an assumed event is correctly estimated when the assumed event does not actually occur, a third element indicating a rate at which the occurrence of an assumed event is erroneously estimated as another event when the assumed event occurs, and a fourth element indicating a rate at which the occurrence of an assumed event is erroneously estimated when the assumed event does not actually occur.
In the sixth step, the calculation means calculates a first evaluation index consisting of a Matthews correlation coefficient using the first element, the second element, the third element, and the fourth element of the first confusion matrix, calculates a plurality of second evaluation indexes consisting of a Matthews correlation coefficient using the first element, the second element, the third element, and the fourth element of the plurality of second confusion matrices, and calculates a third evaluation index consisting of a Matthews correlation coefficient using the first element, the second element, the third element, and the fourth element of the third confusion matrix.

(構成17)
構成10から構成16のいずれかにおいて、検出手段は、第2のステップの検出処理において、複数組のM’個の第2のスキャン応答遅延の複数の分布とM個の第1のスキャン応答遅延の分布とに基づいて、M個の第1のスキャン応答遅延の分布に最も類似する分布を有するM’個の第2のスキャン応答遅延を複数組のM’個の第2のスキャン応答遅延から類似スキャン応答遅延として検出する。
(Configuration 17)
In any of configurations 10 to 16, the detection means, in the second step detection process, detects M' second scan response delays having a distribution most similar to the distribution of the M first scan response delays from the multiple sets of M' second scan response delays as similar scan response delays based on multiple distributions of the multiple sets of M' second scan response delays and the distribution of the M first scan response delays.

(構成18)
構成17において、検出手段は、第2のステップの検出処理において、M個の第1のスキャン応答遅延に基づいて最も生じやすい第1のスキャン応答遅延の値を示す第1のモードを算出し、M個の第1のスキャン応答遅延と第1のモードとの差の絶対値の平均値である第1の平均絶対偏差を算出する第1の算出処理と、第1の算出処理の後、M’個の第2のスキャン応答遅延に基づいて最も生じやすい第2のスキャン応答遅延の値を示す第2のモードを算出し、M’個の第2のスキャン応答遅延と第2のモードとの差の絶対値の平均値である第2の平均絶対偏差を算出し、第1の平均絶対偏差と第2の平均絶対偏差との差の絶対値からなる平均絶対偏差の差を算出し、1から平均絶対偏差の差を減算して類似性を算出する第2の算出処理を複数の既知の推定結果の全てについて実行して複数の類似性を取得し、その取得した複数の類似性のうち、最も高い類似性を算出する元になったM’個の第2のスキャン応答遅延を類似スキャン応答遅延として検出する。
(Configuration 18)
In configuration 17, in the detection process of the second step, the detection means performs a first calculation process to calculate a first mode indicating a value of the first scan response delay that is most likely to occur based on M first scan response delays and calculate a first mean absolute deviation that is an average value of absolute values of differences between the M first scan response delays and the first mode, and after the first calculation process, calculates a second mode indicating a value of the second scan response delay that is most likely to occur based on M' second scan response delays, calculates a second mean absolute deviation that is an average value of absolute values of differences between the M' second scan response delays and the second mode, calculates a difference in mean absolute deviation consisting of the absolute value of the difference between the first mean absolute deviation and the second mean absolute deviation, and subtracts the difference in mean absolute deviation from 1 to calculate a similarity, for all of the multiple known estimation results to obtain multiple similarities, and detects the M' second scan response delays that were the basis for calculating the highest similarity among the multiple obtained similarities as similar scan response delays.

(構成19)
更に、この発明の実施の形態によれば、記録媒体は、構成10から構成18のいずれかに記載のプログラムを記録したコンピュータ読み取り可能な記録媒体である。
(Configuration 19)
Furthermore, according to an embodiment of the present invention, a recording medium is a computer-readable recording medium having the program according to any one of configurations 10 to 18 recorded thereon.

実際の通信環境において実行されたネットワークスキャンの結果を正確に推定できる。 The results of network scans performed in a real communication environment can be accurately estimated.

この発明の実施の形態における通信システムの概略図である。1 is a schematic diagram of a communication system according to an embodiment of the present invention. 図1に示すネットワークスキャン装置の概略図である。FIG. 2 is a schematic diagram of the network scanning device shown in FIG. 1 . 図2に示すホスト情報データベースに格納される対応表TBL1の概念図である。3 is a conceptual diagram of a correspondence table TBL1 stored in the host information database shown in FIG. 2. 図2に示すホスト情報データベースに格納される別の対応表TBL2の概念図である。3 is a conceptual diagram of another correspondence table TBL2 stored in the host information database shown in FIG. 2. 図3に示すホスト情報データベースに格納される更に別の対応表TBL3の概念図である。FIG. 4 is a conceptual diagram of yet another correspondence table TBL3 stored in the host information database shown in FIG. 3. スキャンスケジュールの概念図である。FIG. 2 is a conceptual diagram of a scan schedule. トラヒックの時間依存性を示す図である。FIG. 1 illustrates the time dependency of traffic. 通信特性の相関係数を示す図である。FIG. 13 is a diagram illustrating a correlation coefficient of communication characteristics. 通信特性の別の相関係数を示す図である。FIG. 13 is a diagram illustrating another correlation coefficient of communication characteristics. 通信特性の更に別の相関係数を示す図である。FIG. 13 is a diagram showing still another correlation coefficient of communication characteristics. 通信特性の更に別の相関係数を示す図である。FIG. 13 is a diagram showing still another correlation coefficient of communication characteristics. 通信特性CMbestを選択するときの元データの例を示す図である。FIG. 13 is a diagram showing an example of original data when selecting a communication characteristic CMbest. 通信特性CMbestを選択する方法を説明するための図である。FIG. 13 is a diagram for explaining a method for selecting a communication characteristic CMbest. 通信特性のスコアを求める方法を説明するための図である。FIG. 11 is a diagram for explaining a method for calculating a score of a communication characteristic. 通信特性のスコアを示す図である。FIG. 13 is a diagram showing scores of communication characteristics. ランク重みRの算出結果を示す図である。FIG. 13 is a diagram showing the calculation results of rank weight R k . スキャン応答遅延の具体的な分布を示す図である。FIG. 13 is a diagram showing a specific distribution of scan response delays. スキャン応答遅延の具体的な分布を示す図である。FIG. 13 is a diagram showing a specific distribution of scan response delays. スキャン応答遅延の具体的な分布を示す図である。FIG. 13 is a diagram showing a specific distribution of scan response delays. PDF領域と、生じたサンプル数との対応関係を示す図である。FIG. 13 shows the correspondence between PDF regions and the number of samples generated. スキャン応答遅延の確率密度関数の具体的な分布を示す図である。FIG. 13 is a diagram showing an example distribution of a probability density function of a scan response delay. スキャン応答遅延の別の具体的な分布を示す図である。FIG. 13 illustrates another exemplary distribution of scan response delays. 推定アルゴリズムALGを訓練するときのデータを示す図である。FIG. 1 shows data when training the estimation algorithm ALG. 推定アルゴリズムALGを訓練するときのサンプルデータの概念図である。FIG. 1 is a conceptual diagram of sample data when training the estimation algorithm ALG. モデリング用の仮のサンプルデータの更新を示す概念図である。FIG. 13 is a conceptual diagram showing updating of virtual sample data for modeling. 推定アルゴリズムALGの訓練および評価の概念図である。FIG. 1 is a conceptual diagram of training and evaluation of the estimation algorithm ALG. 図25に示すモデリング用の初期のサンプルデータD_sample_initialの具体例を示す図である。FIG. 26 is a diagram showing a specific example of the initial sample data D_sample_initial for modeling shown in FIG. 25. 図23に示すトレーニングセットの具体例を示す図である。FIG. 24 is a diagram showing a specific example of the training set shown in FIG. 23. 図23に示す検証セットの具体例を示す図である。FIG. 24 is a diagram showing a specific example of the validation set shown in FIG. 23. 図23に示すテストデータの具体例を示す図である。FIG. 24 is a diagram showing a specific example of the test data shown in FIG. 23. 混同行列の概念図である。FIG. 1 is a conceptual diagram of a confusion matrix. 混同行列の生成方法を説明するための図である。FIG. 13 is a diagram for explaining a method for generating a confusion matrix. ネットワークスキャンの動作を説明するためのフローチャートである。10 is a flowchart illustrating a network scan operation. 図33のステップS10の詳細な動作を説明するための第1のフローチャートである。34 is a first flowchart for explaining a detailed operation of step S10 in FIG. 33. 図33のステップS10の詳細な動作を説明するための第2のフローチャートである。34 is a second flowchart for explaining the detailed operation of step S10 in FIG. 33. 図33のステップS11の詳細な動作を説明するための第1のフローチャートである。34 is a first flowchart for explaining a detailed operation of step S11 in FIG. 33. 図33のステップS11の詳細な動作を説明するための第2のフローチャートである。34 is a second flowchart for explaining the detailed operation of step S11 in FIG. 33. 図33のステップS11の詳細な動作を説明するための第3のフローチャートである。34 is a third flowchart for explaining the detailed operation of step S11 in FIG. 33. 図36のステップS130の詳細な動作を説明するためのフローチャートである。37 is a flowchart for explaining a detailed operation of step S130 in FIG. 36. 図37のステップS143の詳細な動作を説明するための第1のフローチャートである。38 is a first flowchart for explaining a detailed operation of step S143 in FIG. 37. 図37のステップS143の詳細な動作を説明するための第2のフローチャートである。38 is a second flowchart for explaining the detailed operation of step S143 in FIG. 37. 図37のステップS143の詳細な動作を説明するための第3のフローチャートである。38 is a third flowchart for explaining the detailed operation of step S143 in FIG. 37. 図40のステップS1432の詳細な動作を説明するためのフローチャートである。41 is a flowchart for explaining detailed operations of step S1432 in FIG. 40. 図40のステップS1436の詳細な動作を説明するためのフローチャートである。41 is a flowchart for explaining detailed operations of step S1436 in FIG. 40. 図37のステップS145の詳細な動作を説明するためのフローチャートである。38 is a flowchart for explaining detailed operations of step S145 in FIG. 37. 図37のステップS145においてマシューズ相関係数MCCが算出されるときのステップS145の詳細な動作を説明するためのフローチャートである。38 is a flowchart for explaining a detailed operation of step S145 in FIG. 37 when the Matthews correlation coefficient MCC is calculated in step S145. 混同行列の例を示す図である。FIG. 13 is a diagram illustrating an example of a confusion matrix. Dスコアのシミュレーション結果を示す図である。FIG. 13 is a diagram showing simulation results of D-score. スキャン応答遅延RTTの確率密度関数を示す図である。FIG. 13 illustrates the probability density function of the scan response delay RTT m .

本発明の実施の形態について図面を参照しながら詳細に説明する。なお、図中同一または相当部分には同一符号を付してその説明は繰返さない。 The embodiment of the present invention will be described in detail with reference to the drawings. Note that the same or corresponding parts in the drawings are given the same reference numerals and their description will not be repeated.

図1は、この発明の実施の形態における通信システムの概略図である。図1を参照して、この発明の実施の形態による通信システム10は、ネットワークスキャン装置1と、基地局BS1,BS2と、インターネットプロバイダISP(Internet Service Provider
)と、端末装置TM1~TM18とを備える。
1 is a schematic diagram of a communication system according to an embodiment of the present invention. Referring to FIG. 1, a communication system 10 according to the embodiment of the present invention includes a network scanning device 1, base stations BS1 and BS2, and an Internet Service Provider (ISP).
) and terminal devices TM1 to TM18.

ネットワークスキャン装置1、基地局BS1,BS2、インターネットプロバイダISPおよび端末装置TM1~TM18は、通信空間に配置される。 The network scanning device 1, base stations BS1 and BS2, the Internet provider ISP, and terminal devices TM1 to TM18 are placed in the communication space.

基地局BS1は、無線通信網CNW1の基地局であり、基地局BS2は、無線通信網CNW2の基地局であり、インターネットプロバイダISPは、有線通信網CNW3の通信事業者である。 Base station BS1 is a base station of wireless communication network CNW1, base station BS2 is a base station of wireless communication network CNW2, and the Internet provider ISP is a communications carrier of wired communication network CNW3.

無線通信網CNW1,CNW2は、相互に異なる無線通信規格に従って無線通信を行う通信網である。 The wireless communication networks CNW1 and CNW2 are communication networks that perform wireless communication according to mutually different wireless communication standards.

この発明の実施の形態においては、端末装置TM1~TM13の各々は、無線端末であり、端末装置TM14~TM18の各々は、有線端末である。 In this embodiment of the invention, each of the terminal devices TM1 to TM13 is a wireless terminal, and each of the terminal devices TM14 to TM18 is a wired terminal.

端末装置TM1~TM6は、無線通信網CNW2の外側であり、かつ、無線通信網CNW1の内部に配置される。 The terminal devices TM1 to TM6 are located outside the wireless communication network CNW2 and inside the wireless communication network CNW1.

端末装置TM7は、無線通信網CNW1と無線通信網CNW2との重複領域内に配置される。 The terminal device TM7 is located within the overlapping area of the wireless communication networks CNW1 and CNW2.

端末装置TM8~TM13は、無線通信網CNW1の外側であり、かつ、無線通信網CNW2の内部に配置される。 Terminal devices TM8 to TM13 are located outside wireless communication network CNW1 and inside wireless communication network CNW2.

端末装置TM14~TM18は、有線通信網CNW3内に配置され、有線を介してインターネットプロバイダISPに接続される。 Terminal devices TM14 to TM18 are placed within the wired communications network CNW3 and are connected to the Internet provider ISP via wires.

端末装置TM1~TM13の各々は、基地局BS1,BS2と無線通信可能な2個の無線通信モジュールを備えている。従って、端末装置TM1~TM13の各々は、基地局BS1または基地局BS2と無線通信可能である。 Each of the terminal devices TM1 to TM13 is equipped with two wireless communication modules capable of wireless communication with base stations BS1 and BS2. Therefore, each of the terminal devices TM1 to TM13 is capable of wireless communication with base station BS1 or base station BS2.

端末装置TM1~TM6は、基地局BS1と無線通信を行い、端末装置TM7は、基地局BS1または基地局BS2と無線通信を行い、端末装置TM8~TM13は、基地局BS2と無線通信を行う。 Terminal devices TM1 to TM6 communicate wirelessly with base station BS1, terminal device TM7 communicates wirelessly with base station BS1 or base station BS2, and terminal devices TM8 to TM13 communicate wirelessly with base station BS2.

端末装置TM14~TM18は、インターネットプロバイダISPを介して有線通信を行う。 Terminal devices TM14 to TM18 communicate via wired connection via an Internet provider (ISP).

ネットワークスキャン装置1は、後述する方法によって、端末装置TM1~TM18に対してネットワークスキャンを行う。 The network scanning device 1 performs network scanning on the terminal devices TM1 to TM18 using the method described below.

図2は、図1に示すネットワークスキャン装置1の概略図である。図2を参照して、ネットワークスキャン装置1は、ネットワークスキャナ11と、スキャン解析マネージャ12と、ホスト情報データベース13と、抽出手段14と、算出手段15と、推定手段16と、スキャンスケジューラ17とを備える。 Figure 2 is a schematic diagram of the network scanning device 1 shown in Figure 1. Referring to Figure 2, the network scanning device 1 includes a network scanner 11, a scan analysis manager 12, a host information database 13, an extraction means 14, a calculation means 15, an estimation means 16, and a scan scheduler 17.

ネットワークスキャナ11は、スキャンスケジューラ17からスキャンタイミングを受け、その受けたスキャンタイミングに基づいて、例えば、公知のNmap(非特許文献2参照)を用いて、スキャン対象のネットワーク20に接続された端末装置のポートに対してネットワークスキャンを行う。 The network scanner 11 receives scan timing from the scan scheduler 17, and based on the received scan timing, performs a network scan on the ports of the terminal devices connected to the network 20 to be scanned, for example, using the well-known Nmap (see non-patent document 2).

そして、ネットワークスキャナ11は、ネットワーク20に接続された端末装置からネットワークスキャンのスキャン応答を受信し、その受信したスキャン応答をユーザ(ネットワークセキュリティ等からなる)30およびスキャン解析マネージャ12へ出力する。 Then, the network scanner 11 receives a scan response of the network scan from a terminal device connected to the network 20, and outputs the received scan response to the user (comprising network security, etc.) 30 and the scan analysis manager 12.

また、ネットワークスキャナ11は、ネットワークスキャンがバックグラウンドトラフィックを監視せずに行われる場合、スキャン応答遅延RTT(mは、1≦m≦Mを満たす整数であり、Mは、端末装置TM1~TM18の総数であり、2以上の整数である。)、パケットロス率PLR、スキャン最大遅延DLmaxおよびスキャン最小遅延DLminを測定し、その測定したスキャン応答遅延RTT、パケットロス率PLR、スキャン最大遅延DLmaxおよびスキャン最小遅延DLminをスキャン解析マネージャ12へ出力する。即ち、ネットワークスキャナ11は、ネットワークスキャンがバックグラウンドトラフィックを監視せずに行われる場合、スキャン応答遅延RTT、パケットロス率PLR、スキャン最大遅延DLmaxおよびスキャン最小遅延DLminからなる通信特性CM1=[スキャン応答遅延RTT/パケットロス率PLR/スキャン最大遅延DLmax/スキャン最小遅延DLmin]を測定し、その測定した通信特性CM1=[スキャン応答遅延RTT/パケットロス率PLR/スキャン最大遅延DLmax/スキャン最小遅延DLmin]をスキャン解析マネージャ12へ出力する。 In addition, when a network scan is performed without monitoring background traffic, the network scanner 11 measures the scan response delay RTT m (m is an integer satisfying 1≦m≦M, M is the total number of terminal devices TM1 to TM18 and is an integer of 2 or more), the packet loss rate PLR m , the maximum scan delay DLmax m and the minimum scan delay DLmin m , and outputs the measured scan response delay RTT m , the packet loss rate PLR m , the maximum scan delay DLmax m and the minimum scan delay DLmin m to the scan analysis manager 12. That is, when a network scan is performed without monitoring background traffic, the network scanner 11 measures communication characteristics CM1 = [scan response delay RTT m / packet loss rate PLR m / maximum scan delay DLmax m / minimum scan delay DLmin m ] consisting of scan response delay RTT m , packet loss rate PLR m , maximum scan delay DLmax m and minimum scan delay DLmin m , and outputs the measured communication characteristics CM1 = [scan response delay RTT m / packet loss rate PLR m / maximum scan delay DLmax m / minimum scan delay DLmin m ] to the scan analysis manager 12.

更に、ネットワークスキャナ11は、ネットワークスキャンがバックグラウンドトラフィックを監視して行われる場合、スキャン応答遅延RTT、パケットロス率PLR、遅延DL、ジッタJT、バックグラウンド最大遅延BGDLmax、およびバックグラウンド最小遅延BGDLminを測定し、その測定したスキャン応答遅延RTT、パケットロス率PLR、遅延DL、ジッタJT、バックグラウンド最大遅延BGDLmax、およびバックグラウンド最小遅延BGDLminをスキャン解析マネージャ12へ出力する。即ち、ネットワークスキャナ11は、ネットワークスキャンがバックグラウンドトラフィックを監視して行われる場合、スキャン応答遅延RTT、パケットロス率PLR、遅延DL、ジッタJT、バックグラウンド最大遅延BGDLmax、およびバックグラウンド最小遅延BGDLminからなる通信特性CM2=[スキャン応答遅延RTT/パケットロス率PLR/遅延DL/ジッタJT/バックグラウンド最大遅延BGDLmax/バックグラウンド最小遅延BGDLmin]を測定し、その測定した通信特性CM2=[スキャン応答遅延RTT/パケットロス率PLR/遅延DL/ジッタJT/バックグラウンド最大遅延BGDLmax/バックグラウンド最小遅延BGDLmin]をスキャン解析マネージャ12へ出力する。 Furthermore, when a network scan is performed by monitoring background traffic, the network scanner 11 measures the scan response delay RTT m , packet loss rate PLR m , delay DL m , jitter JT m , background maximum delay BGDLmax m , and background minimum delay BGDLmin m , and outputs the measured scan response delay RTT m , packet loss rate PLR m , delay DL m , jitter JT m , background maximum delay BGDLmax m , and background minimum delay BGDLmin m to the scan analysis manager 12. That is, when a network scan is performed by monitoring background traffic, the network scanner 11 measures communication characteristics CM2 = [scan response delay RTT m / packet loss rate PLR m / delay DL m / jitter JT m / background maximum delay BGDLmax m / background minimum delay BGDLmin m ] consisting of scan response delay RTT m , packet loss rate PLR m , delay DL m , jitter JT m , background maximum delay BGDLmax m , and background minimum delay BGDLmin m , and outputs the measured communication characteristics CM2 = [scan response delay RTT m / packet loss rate PLR m / delay DL m / jitter JT m / background maximum delay BGDLmax m / background minimum delay BGDLmin m ] to the scan analysis manager 12.

スキャン解析マネージャ12は、ネットワークスキャナ11からスキャン応答を受け、ネットワークスキャン中に通信ログを受ける。また、スキャン解析マネージャ12は、ネットワークスキャナ11から通信特性CM1または通信特性CM2を受ける。 The scan analysis manager 12 receives a scan response from the network scanner 11 and receives a communication log during the network scan. The scan analysis manager 12 also receives communication characteristics CM1 or CM2 from the network scanner 11.

そして、スキャン解析マネージャ12は、スキャン応答および通信特性CM1を受けたとき、スキャン応答および通信特性CM1に基づいてスキャン対象の端末装置のアドレスと、スキャン応答と、通信特性CM1とを対応付けたスキャン結果SC1を生成し、その生成したスキャン結果SC1をホスト情報データベース13に格納することによってホスト情報データベース13を作成または更新する。 Then, when the scan analysis manager 12 receives the scan response and the communication characteristics CM1, it generates a scan result SC1 that associates the address of the terminal device to be scanned, the scan response, and the communication characteristics CM1 based on the scan response and the communication characteristics CM1, and creates or updates the host information database 13 by storing the generated scan result SC1 in the host information database 13.

また、スキャン解析マネージャ12は、スキャン応答および通信特性CM2を受けたとき、スキャン応答および通信特性CM2に基づいてスキャン対象の端末装置のアドレスと、スキャン応答と、通信特性CM2とを対応付けたスキャン結果SC2を生成し、その生成したスキャン結果SC2をホスト情報データベース13に格納することによってホスト情報データベース13を作成または更新する。 In addition, when the scan analysis manager 12 receives the scan response and communication characteristics CM2, it generates a scan result SC2 that associates the address of the terminal device to be scanned, the scan response, and the communication characteristics CM2 based on the scan response and communication characteristics CM2, and creates or updates the host information database 13 by storing the generated scan result SC2 in the host information database 13.

ホスト情報データベース13は、ネットワークスキャンの結果が“正常”である通信環境においてネットワークスキャンを実行した場合に取得されるスキャン応答遅延{RTTm’_known}_1(m’=1’~M’)と、ネットワークスキャンの結果が“正常”であると推定するために最も適した通信特性{CMbestm’_known}_1(m’=1’~M’)とを対応付けて予め記憶している。ここで、m’は、1’≦m’≦M’を満たす整数であり、M’は、ネットワークスキャンの結果が既知である通信環境において実行されたネットワークスキャンの対象となる端末装置の総数である。そして、m’は、mと同じであってもよく、mと異なっていてもよい。 The host information database 13 prestores in association with a scan response delay {RTT m' _known}_1 (m' = 1' to M') acquired when a network scan is performed in a communication environment where the result of the network scan is "normal" and a communication characteristic {CMbest m ' _known}_1 (m' = 1' to M') that is most suitable for estimating that the result of the network scan is "normal". Here, m' is an integer that satisfies 1'≦m'≦M', and M' is the total number of terminal devices that are targets of a network scan performed in a communication environment where the result of the network scan is known. Furthermore, m' may be the same as m or may be different from m.

また、ホスト情報データベース13は、ネットワークスキャンの結果が“通信品質不十分”によって失敗する通信環境においてネットワークスキャンを実行した場合に取得されるスキャン応答遅延{RTTm’_known}_2(m’=1’~M’)と、ネットワークスキャンの結果が“通信品質が不十分”によって失敗したと推定するために最も適した通信特性{CMbestm’_known}_2(m’=1’~M’)とを対応付けて予め記憶している。 In addition, the host information database 13 pre-stores in association with the scan response delay {RTT m' _known}_2 (m' = 1' to M') acquired when a network scan is performed in a communication environment where the network scan fails due to "insufficient communication quality", and the communication characteristic {CMbest m ' _known}_2 (m' = 1' to M') that is most suitable for inferring that the network scan has failed due to "insufficient communication quality".

更に、ホスト情報データベース13は、ネットワークスキャンの結果が“ネットワーク混雑”によって失敗する通信環境においてネットワークスキャンを実行した場合に取得されるスキャン応答遅延{RTTm’_known}_3(m’=1’~M’)と、ネットワークスキャンの結果が“ネットワーク混雑”によって失敗したと推定するために最も適した通信特性{CMbestm’_known}_3(m’=1’~M’)とを対応付けて予め記憶している。 Furthermore, the host information database 13 pre-stores in association with the scan response delay {RTT m' _known}_3 (m' = 1' to M') acquired when a network scan is executed in a communication environment where the network scan result is unsuccessful due to "network congestion" and the communication characteristic {CMbest m ' _known}_3 (m' = 1' to M') that is most suitable for estimating that the network scan result is unsuccessful due to "network congestion".

更に、ホスト情報データベース13は、スキャン結果SC1またはスキャン結果SC2を記憶する。 Furthermore, the host information database 13 stores the scan result SC1 or the scan result SC2.

抽出手段14は、ホスト情報データベース13に格納された通信特性CM1(または通信特性CM2)に基づいて、後述する方法によって、ネットワークスキャンの結果を推定するために最も適した通信特性CMbest_unknownを抽出する抽出処理を実行する。そして、抽出手段14は、通信特性CM1(または通信特性CM2)からスキャン応答遅延RTT(以下、「スキャン応答遅延RTT_unknown」と表記する。)を検出し、その検出したスキャン応答遅延RTT_unknown(m=1~M)と通信特性CMbest_unknown(m=1~M)とからなるサンプルデータD_unknownを生成し、その生成したサンプルデータD_unknownを算出手段15および推定手段16へ出力する。 The extraction means 14 executes an extraction process to extract a communication characteristic CMbest_unknown that is most suitable for estimating the result of a network scan, using a method described later, based on the communication characteristic CM1 (or the communication characteristic CM2) stored in the host information database 13. Then, the extraction means 14 detects a scan response delay RTT m (hereinafter, referred to as "scan response delay RTT m _unknown") from the communication characteristic CM1 (or the communication characteristic CM2), generates sample data D_unknown consisting of the detected scan response delay RTT m _unknown (m = 1 to M) and the communication characteristic CMbest m _unknown (m = 1 to M), and outputs the generated sample data D_unknown to the calculation means 15 and the estimation means 16.

また、抽出手段14は、ホスト情報データベース13に格納された対応表TBL3からネットワークスキャンの結果が“正常”である通信環境において取得されたスキャン応答遅延{RTTm’_known}_1(m’=1’~M’)と通信特性{CMbestm’_known}_1(m’=1’~M’)とを検出し、その検出したスキャン応答遅延{RTTm’_known}_1(m’=1’~M’)と通信特性{CMbestm’_known}_1(m’=1’~M’)とからなる標準サンプルデータD_standard_1を生成し、その生成した標準サンプルデータD_standard_1を算出手段15へ出力する。 In addition, the extraction means 14 detects the scan response delay {RTT m' _known}_1 (m' = 1' to M') and communication characteristics {CMbest m ' _known}_1 (m' = 1' to M') acquired in a communication environment where the result of the network scan is "normal" from the correspondence table TBL3 stored in the host information database 13, generates standard sample data D_standard_1 consisting of the detected scan response delay {RTT m' _known}_1 (m' = 1' to M') and communication characteristics {CMbest m' _known}_1 (m' = 1' to M'), and outputs the generated standard sample data D_standard_1 to the calculation means 15.

更に、抽出手段14は、ホスト情報データベース13に格納された対応表TBL3からネットワークスキャンの結果が“通信品質不十分”である通信環境において取得されたスキャン応答遅延{RTTm’_known}_2(m’=1’~M’)と通信特性{CMbestm’_known}_2(m’=1’~M’)とを検出し、その検出したスキャン応答遅延{RTTm’_known}_2(m’=1’~M’)と通信特性{CMbestm’_known}_2(m’=1’~M’)とからなる標準サンプルデータD_s
tandard_2を生成し、その生成した標準サンプルデータD_standard_2を算出手段15へ出力する。
Furthermore, the extraction means 14 detects the scan response delay {RTT m' _known}_2 (m' = 1' to M') and the communication characteristic {CMbest m ' _known}_2 (m' = 1' to M') acquired in the communication environment where the result of the network scan is "insufficient communication quality" from the correspondence table TBL3 stored in the host information database 13, and extracts standard sample data D_s consisting of the detected scan response delay {RTT m' _known}_2 (m' = 1' to M') and the communication characteristic {CMbest m' _known}_2 (m' = 1' to M').
The standard sample data D_standard_2 is generated, and the generated standard sample data D_standard_2 is output to the calculation means 15.

更に、抽出手段14は、ホスト情報データベース13に格納された対応表TBL3からネットワークスキャンの結果が“ネットワーク混雑”である通信環境において取得されたスキャン応答遅延{RTTm’_known}_3(m’=1’~M’)と通信特性{CMbestm’_known}_3(m’=1’~M’)とを検出し、その検出したスキャン応答遅延{RTTm’_known}_3(m’=1’~M’)と通信特性{CMbestm’_known}_3(m’=1’~M’)とからなる標準サンプルデータD_standard_3を生成し、その生成した標準サンプルデータD_standard_3を算出手段15へ出力する。 Furthermore, the extraction means 14 detects the scan response delay {RTT m' _known}_3 (m' = 1' to M') and communication characteristics {CMbest m ' _known}_3 (m' = 1' to M') acquired in a communication environment where the result of the network scan is "network congestion" from the correspondence table TBL3 stored in the host information database 13, generates standard sample data D_standard_3 consisting of the detected scan response delay {RTT m' _known}_3 (m' = 1' to M') and communication characteristics {CMbest m' _known}_3 (m' = 1' to M'), and outputs the generated standard sample data D_standard_3 to the calculation means 15.

更に、抽出手段14は、標準サンプルデータD_standard_1~D_standard_3に含まれるスキャン応答遅延{RTTm’_known}_1(m’=1’~M’)~{RTTm’_known}_3(m’=1’~M’)の各々とサンプルデータD_unknownに含まれるスキャン応答遅延RTT_unknownとの3個の類似性PS1,PS2,PS3を算出手段15から受け、その受けた3個の類似性PS1,PS2,PS3のうちの最大値(最も高い類似性)が得られるときのスキャン応答遅延{RTTm’_known}_similarity(m’=1’~M’)(=スキャン応答遅延{RTTm’_known}_1(m’=1’~M’)~{RTTm’_known}_3(m’=1’~M’)のいずれか)を検出する。そして、抽出手段14は、スキャン応答遅延{RTTm’_known}_similarity(m’=1’~M’)と、スキャン応答遅延{RTTm’_known}_similarity(m’=1’~M’)に対応する通信特性{CMbestm’_known}similarity(=通信特性{CMbestm’_known}_1(m’=1’~M’)~{CMbestm’_known}_3(m’=1’~M’)のいずれか)とからなる標準サンプルデータD_similarityを推定手段16へ出力する。 Furthermore, the extraction means 14 receives from the calculation means 15 three similarities P S1 , P S2 , and P S3 between each of the scan response delays {RTT m' _known }_1 (m' = 1' to M') to {RTT m' _known}_3 (m' = 1' to M' ) included in the standard sample data D_standard_1 to D_standard_3 and the scan response delay RTT m _known included in the sample data D_unknown, and calculates the scan response delay { RTT m' _known } _similarity (m' = 1' to M') (= the scan response delay {RTT m' _known}_1 (m'=1' to M') to {RTT m' _known}_3 (m'=1' to M') are detected. Then, extraction means 14 outputs to estimation means 16 standard sample data D_similarity consisting of scan response delay {RTT m' _known}_similarity (m' = 1' to M') and communication characteristic {CMbest m ' _known} similarity (= any of communication characteristics {CMbest m' _known}_1 (m' = 1' to M') to {CMbest m ' _known}_3 (m' = 1' to M')) corresponding to the scan response delay {RTT m' _known}_similarity (m' = 1' to M').

算出手段15は、サンプルデータD_unknownと、標準サンプルデータD_standard_1~D_standard_3とを抽出手段14から受ける。そして、算出手段15は、標準サンプルデータD_standard_1~D_standard_3に含まれるスキャン応答遅延{RTTm’_known}_1(m’=1’~M’)~{RTTm’_known}_3(m’=1’~M’)の各々とサンプルデータD_unknownに含まれるスキャン応答遅延RTT_unknown(m=1~M)との3個の類似性PS1,PS2,PS3を後述する方法によって算出し、その算出した3個の類似性PS1,PS2,PS3を抽出手段14へ出力する。 The calculation means 15 receives the sample data D_unknown and the standard sample data D_standard_1 to D_standard_3 from the extraction means 14. Then, the calculation means 15 calculates three similarities P S1 , P S2 , and P S3 between each of the scan response delays {RTT m' _known}_1 (m' = 1' to M') to {RTT m ' _known}_3 (m' = 1' to M') included in the standard sample data D_standard_1 to D_standard_3 and the scan response delay RTT m _known (m = 1 to M) included in the sample data D_unknown by a method described later, and outputs the three calculated similarities P S1 , P S2 , and P S3 to the extraction means 14.

また、算出手段15は、推定アルゴリズムALGを用いてネットワークスキャンの結果を推定した推定結果(混同行列CFM,nCFM,tCFM)を推定手段16から受ける。そして、算出手段15は、後述する方法によって、混同行列CFMに基づいて推定結果の正確性を表す評価指数EVDを算出し、混同行列nCFMに基づいて推定結果の正確性を表す評価指数nEVDを算出し、混同行列tCFMに基づいて推定結果の正確性を表す評価指数tEVDを算出する。そうすると、算出手段15は、評価指数EVD,nEVD,tEVDを推定手段16へ出力する。 The calculation means 15 also receives from the estimation means 16 the estimation results (confusion matrices CFM, nCFM, tCFM) obtained by estimating the results of the network scan using the estimation algorithm ALG. The calculation means 15 then calculates an evaluation index EVD representing the accuracy of the estimation result based on the confusion matrix CFM using a method described below, calculates an evaluation index nEVD representing the accuracy of the estimation result based on the confusion matrix nCFM, and calculates an evaluation index tEVD representing the accuracy of the estimation result based on the confusion matrix tCFM. The calculation means 15 then outputs the evaluation indexes EVD, nEVD, and tEVD to the estimation means 16.

推定手段16は、標準サンプルデータD_standard_1~D_standard_3を結合してモデリング用の初期のサンプルデータD_sample_initialを生成する。 The estimation means 16 combines the standard sample data D_standard_1 to D_standard_3 to generate initial sample data D_sample_initial for modeling.

また、推定手段16は、標準サンプルデータD_similarity(=スキャン応答遅延{RTTm’_known}_similarity(m’=1’~M’)と通信特性{CMbestm’_known}_similarity(m’=1’~M’)とからなる。)を抽出手段14から受ける。そして、推定手段16は、標準サンプルデータD_similarityをトレーニングデータとテストデータとに分割し、トレーニングデータをトレーニングセットと検証セットとに分割する。そして、推定手段16は、後述する方法によって、トレーニングセットおよび初期のサンプルデータD_sample_initialに基づいて複数の仮のサンプルデータD_sample_tentativeを生成する。 The estimation means 16 also receives standard sample data D_similarity (consisting of scan response delay {RTT m' _known}_similarity (m'=1' to M') and communication characteristic {CMbest m' _known}_similarity (m'=1' to M')) from the extraction means 14. Then, the estimation means 16 divides the standard sample data D_similarity into training data and test data, and divides the training data into a training set and a validation set. Then, the estimation means 16 generates a plurality of tentative sample data D_sample_tentative based on the training set and initial sample data D_sample_initial by a method described later.

その後、推定手段16は、初期のサンプルデータD_sample_initialを用いて推定アルゴリズムALGを訓練し、検証セットを用いて推定アルゴリズムALG(訓練後の推定アルゴリズムALG)によってネットワークスキャンの結果を推定し、ネットワークスキャンの推定結果に基づいて混同行列CFMを生成して算出手段15へ出力する。 Then, the estimation means 16 trains the estimation algorithm ALG using the initial sample data D_sample_initial, estimates the results of the network scan by the estimation algorithm ALG (the trained estimation algorithm ALG) using the validation set, and generates a confusion matrix CFM based on the estimated results of the network scan and outputs it to the calculation means 15.

次に、推定手段16は、仮のサンプルデータD_sample_tentativeを用いて推定アルゴリズムALGを訓練し、検証セットを用いて推定アルゴリズムALG(訓練後の推定アルゴリズムALG)によってネットワークスキャンの結果を推定し、ネットワークスキャンの推定結果に基づいて混同行列nCFMを生成して算出手段15へ出力する。 The estimation means 16 then trains the estimation algorithm ALG using the tentative sample data D_sample_tentative, estimates the results of the network scan with the estimation algorithm ALG (the trained estimation algorithm ALG) using the validation set, and generates a confusion matrix nCFM based on the estimated results of the network scan and outputs it to the calculation means 15.

推定手段16は、混同行列CFMを算出手段15へ出力した後、評価指数EVDを算出手段15から受けるとともに、混同行列nCFMを算出手段15へ出力した後、評価指数nEVDを算出手段15から受ける。そして、推定手段16は、評価指数nEVDが評価指数EVDよりも大きいとき、評価指数nEVDを評価指数EVDに設定する。一方、評価指数nEVDが評価指数EVDよりも大きくないとき、評価指数nEVDを評価指数EVDに設定しない。 The estimation means 16 outputs the confusion matrix CFM to the calculation means 15, and then receives the evaluation index EVD from the calculation means 15, and outputs the confusion matrix nCFM to the calculation means 15, and then receives the evaluation index nEVD from the calculation means 15. Then, when the evaluation index nEVD is greater than the evaluation index EVD, the estimation means 16 sets the evaluation index nEVD to the evaluation index EVD. On the other hand, when the evaluation index nEVD is not greater than the evaluation index EVD, the estimation means 16 does not set the evaluation index nEVD to the evaluation index EVD.

推定手段16は、評価指数nEVDと評価指数EVDとの比較を複数の仮のサンプルデータD_sample_tentativeの全てについて実行し、最も大きい評価指数nEVDが得られるときの仮のサンプルデータD_sample_tentativeで推定アルゴリズムALGの変数を置き換える。 The estimation means 16 performs a comparison between the evaluation index nEVD and the evaluation index EVD for all of the multiple tentative sample data D_sample_tentative, and replaces the variables of the estimation algorithm ALG with the tentative sample data D_sample_tentative when the largest evaluation index nEVD is obtained.

その後、推定手段16は、テストデータを用いて推定アルゴリズムALG(変数が置き換えられた推定アルゴリズムALG)によってネットワークスキャンの結果を推定し、ネットワークスキャンの推定結果に基づいて混同行列tCFMを生成して算出手段15へ出力する。そして、推定手段16は、評価指数tEVDを算出手段15から受け、評価指数tEVDが評価指数EVD以上であるとき、変数が置き換えられた推定アルゴリズムALGと、最も大きい評価指数nEVDが得られるときの仮のサンプルデータD_sample_tentativeとを承認する。 Then, the estimation means 16 estimates the results of the network scan by the estimation algorithm ALG (the estimation algorithm ALG with the variables replaced) using the test data, generates a confusion matrix tCFM based on the estimated results of the network scan, and outputs it to the calculation means 15. Then, the estimation means 16 receives the evaluation index tEVD from the calculation means 15, and when the evaluation index tEVD is equal to or greater than the evaluation index EVD, it approves the estimation algorithm ALG with the variables replaced and the tentative sample data D_sample_tentative when the largest evaluation index nEVD is obtained.

このように、推定手段16は、推定アルゴリズムALGを訓練するとともに、訓練後の推定アルゴリズムALGによってネットワークスキャンの結果を推定したときの推定結果の正確性を評価する。 In this way, the estimation means 16 trains the estimation algorithm ALG and evaluates the accuracy of the estimation result when the network scan result is estimated using the trained estimation algorithm ALG.

更に、推定手段16は、推定アルゴリズムALGを用いて、次の方法によって、ネットワークスキャンの結果を推定する。推定手段16は、抽出手段14によって抽出された通信特性CMbest_unknown(m=1~M)を有する端末装置をネットワークスキャンが正常であるグループCLSと、ネットワークスキャンが端末装置との通信チャネルに起因した原因によって失敗したグループCLS,CLSとに分類する。 Furthermore, the estimation means 16 estimates the results of the network scan using the estimation algorithm ALG in the following manner: The estimation means 16 classifies the terminal devices having the communication characteristics CMbest m _unknown (m=1 to M) extracted by the extraction means 14 into a group CLS 1 in which the network scan is normal, and groups CLS 2 and CLS 3 in which the network scan has failed due to a cause attributable to the communication channel with the terminal device.

そして、推定手段16は、グループCLSとグループCLSとを判別するDスコアD_2、またはグループCLSとグループCLSとを判別するDスコアD_3を算出し、その算出したDスコアD_2またはDスコアD_3に基づいてネットワークスキャンが正常または失敗であると推定するとともに、ネットワークスキャンが失敗であると推定したとき、ネットワークスキャンが失敗した原因を推定する推定処理を実行する。そうすると、推定手段16は、推定処理において推定した推定結果をスキャンスケジューラ17へ出力する。 The estimation means 16 then calculates a D-score D_2 for distinguishing between groups CLS 1 and CLS 3 , or a D-score D_3 for distinguishing between groups CLS 2 and CLS 3 , and estimates that the network scan is normal or unsuccessful based on the calculated D-score D_2 or D-score D_3, and when it estimates that the network scan is unsuccessful, executes an estimation process for estimating the cause of the failure of the network scan. The estimation means 16 then outputs the estimation result estimated in the estimation process to the scan scheduler 17.

スキャンスケジューラ17は、ホスト情報データベース13からスキャン結果を読み出し、スキャン要件をユーザ30から受ける。また、スキャンスケジューラ17は、ネットワークスキャンを行う領域(例えば、日本国内)に存在する全ての端末装置のグローバルIPアドレスおよびドメイン名を予め保持している。 The scan scheduler 17 reads the scan results from the host information database 13 and receives scan requirements from the user 30. The scan scheduler 17 also holds in advance the global IP addresses and domain names of all terminal devices present in the area (e.g., Japan) where the network scan is to be performed.

そして、スキャンスケジューラ17は、スキャン要件およびスキャン結果に基づいて、後述する方法によって、ネットワークスキャンのスキャンタイミングと各スキャンタイミングにおけるネットワークスキャンの対象となる端末装置とを対応付けたスキャンスケジュールSCH_scanを生成する。そうすると、スキャンスケジューラ17は、スキャンスケジュールSCH_scanをネットワークスキャナ11へ出力してスキャンスケジュールSCH_scanに従ってネットワークスキャンを実行するようにネットワークスキャナ11を制御する。 Then, based on the scan requirements and the scan results, the scan scheduler 17 generates a scan schedule SCH_scan that associates the scan timings of the network scan with the terminal devices that are the targets of the network scan at each scan timing, using a method described below. The scan scheduler 17 then outputs the scan schedule SCH_scan to the network scanner 11 and controls the network scanner 11 to execute a network scan in accordance with the scan schedule SCH_scan.

また、スキャンスケジューラ17は、推定結果を推定手段16から受けたとき、推定結果のうちのネットワークスキャンが失敗した原因に基づいて、スキャンスケジュールを再スケジュール化し、その再スケジュール化したスキャンスケジュールRESCH_scanをネットワークスキャナ11へ出力してスキャンスケジュールRESCH_scanに従ってネットワークスキャンを実行するようにネットワークスキャナ11を制御する。 In addition, when the scan scheduler 17 receives the estimation result from the estimation means 16, it reschedules the scan schedule based on the cause of the network scan failure in the estimation result, outputs the rescheduled scan schedule RESCH_scan to the network scanner 11, and controls the network scanner 11 to execute the network scan in accordance with the scan schedule RESCH_scan.

図3は、図2に示すホスト情報データベース13に格納される対応表TBL1の概念図である。なお、図3に示す対応表TBL1は、バックグラウンドトラフィックを監視せずにネットワークスキャンが実行されるときの対応表である。 Figure 3 is a conceptual diagram of the correspondence table TBL1 stored in the host information database 13 shown in Figure 2. Note that the correspondence table TBL1 shown in Figure 3 is a correspondence table when a network scan is performed without monitoring background traffic.

図3を参照して、対応表TBL1は、時刻tと、IPアドレスAddb_v(v=1~Vであり、Vは、基地局の総数である。)と、IPアドレスAddと、ドメイン名DNと、ポート番号PN(rは、正の整数)と、スキャン応答SRと、スキャン応答遅延RTTと、パケットロス率PLRと、スキャン最大遅延DLmaxと、スキャン最小遅延DLminとを含む。 Referring to FIG. 3, correspondence table TBL1 includes time t, an IP address Add b_v (v=1 to V, where V is the total number of base stations), an IP address Add m , a domain name DN m , a port number PN r (r is a positive integer), a scan response SR m , a scan response delay RTT m , a packet loss rate PLR m , a scan maximum delay DLmax m , and a scan minimum delay DLmin m .

時刻tは、YYYY/MM/DD/hh/mm/ss(年/月/日/時/分/秒)によって表される。そして、時刻tは、後述する一定の時間長を有する1つのスキャンタイミング内における時刻であり、ネットワークスキャンにおけるテスト入力をネットワークスキャンの対象である端末装置へ送信した時間を表す。 Time t is expressed as YYYY/MM/DD/hh/mm/ss (year/month/day/hour/minute/second). Time t is a time within one scan timing having a certain time length, which will be described later, and represents the time when the test input in the network scan is sent to the terminal device that is the target of the network scan.

IPアドレスAddb_vは、基地局のアドレスである。IPアドレスAddは、ネットワークスキャンの対象である端末装置のグローバルIPアドレスからなる。 The IP address Add b_v is the address of the base station, and the IP address Add m is the global IP address of the terminal device that is the target of the network scan.

ドメイン名DNは、IPアドレスAddに基づいてPTR(PoinTeR record)レコードを用いて変換されたものである。 The domain name DN m is converted based on the IP address Add m using a PTR (Pointer record).

ポート番号PNは、各端末装置が通信に用いるポートの番号である。 The port number PNr is the number of the port that each terminal device uses for communication.

スキャン応答SRは、スキャン応答が返って来たとき、“1”からなり、スキャン応答が返って来なかったとき、“0”からなる。 The scan response SRm is set to "1" when a scan response is returned, and is set to "0" when no scan response is returned.

スキャン応答遅延RTTは、テスト入力を送信した時刻からスキャン応答SRが返って来るまでの時間からなる。 The scan response delay RTT m is the time from the time the test input is transmitted until the scan response SR m is returned.

パケットロス率PLRは、テスト入力からなるパケットを送信してスキャン応答SRを受信する場合にパケットの送受信を失敗する割合である。 The packet loss rate PLR m is the rate at which packets fail to be transmitted and received when a packet consisting of a test input is transmitted and a scan response SR m is received.

スキャン最大遅延DLmaxは、スキャン応答遅延RTTの最大値であり、スキャン最小遅延DLminは、スキャン応答遅延RTTの最小値である。 The scan maximum delay DLmax m is the maximum value of the scan response delay RTT m , and the scan minimum delay DLmin m is the minimum value of the scan response delay RTT m .

そして、スキャン応答SRおよびスキャン応答遅延RTTは、ポート番号PNに対応付けられる。パケットロス率PLR、スキャン最大遅延DLmaxおよびスキャン最小遅延DLminは、ネットワークスキャンの対象となる端末装置のIPアドレスAddに対応付けられる。 The scan response SR m and the scan response delay RTT m are associated with the port number PN r . The packet loss rate PLR m , the scan maximum delay DLmax m and the scan minimum delay DLmin m are associated with the IP address Add m of the terminal device that is the target of the network scan.

また、アドレスAdd~Addは、アドレスAddb_1に対応付けられ、・・・、アドレスAddM-1~Addは、アドレスAddb_Vに対応付けられる。その結果、各基地局に属する端末装置を把握することができる。 Furthermore, addresses Add 1 to Add 3 are associated with address Add b_1 , ..., addresses Add M-1 to Add M are associated with address Add b_V . As a result, it is possible to know the terminal devices belonging to each base station.

図4は、図2に示すホスト情報データベース13に格納される別の対応表TBL2の概念図である。なお、図4に示す対応表TBL2は、バックグラウンドトラフィックを監視してネットワークスキャンが実行されるときの対応表である。 Figure 4 is a conceptual diagram of another correspondence table TBL2 stored in the host information database 13 shown in Figure 2. Note that the correspondence table TBL2 shown in Figure 4 is a correspondence table used when a network scan is performed by monitoring background traffic.

図4を参照して、対応表TBL2は、図3に示す対応表TBL1のスキャン最大遅延DLmaxおよびスキャン最小遅延DLminを遅延DL、ジッタJT、バックグラウンド最大遅延BGDLmaxおよびバックグラウンド最小遅延BGDLminに変えたものであり、その他は、対応表TBL1と同じである。 4, correspondence table TBL2 is the same as correspondence table TBL1, except that the scan maximum delay DLmax m and scan minimum delay DLmin m of correspondence table TBL1 shown in FIG. 3 are replaced with delay DL m , jitter JT m , background maximum delay BGDLmax m and background minimum delay BGDLmin m .

遅延DL、ジッタJT、バックグラウンド最大遅延BGDLmaxおよびバックグラウンド最小遅延BGDLminは、各端末装置のIPアドレスAddに対応付けられる。 The delay DL m , the jitter JT m , the background maximum delay BGDLmax m and the background minimum delay BGDLmin m are associated with the IP address Add m of each terminal device.

遅延DLは、端末装置からの片道の通信における標準的な時間からの遅れである。 The delay DL m is the delay from the standard time in one-way communication from the terminal device.

ジッタJTは、端末装置からの片道の通信におけるパケットの伝送時間の揺らぎである。 Jitter JT m is the fluctuation in the transmission time of a packet in one-way communication from a terminal device.

バックグラウンド最大遅延BGDLmaxは、端末装置からの片道の通信における伝送遅延の最大値であり、バックグラウンド最小遅延BGDLminは、端末装置からの片道の通信における伝送遅延の最小値である。 The background maximum delay BGDLmax m is the maximum value of the transmission delay in one-way communication from the terminal device, and the background minimum delay BGDLmin m is the minimum value of the transmission delay in one-way communication from the terminal device.

そして、対応表TBL2においては、スキャン応答SRおよびスキャン応答遅延RTTは、各端末装置のポート番号PNに対応付けられる。 In the correspondence table TBL2, the scan response SR m and the scan response delay RTT m are associated with the port number PN r of each terminal device.

図5は、図3に示すホスト情報データベース13に格納される更に別の対応表TBL3の概念図である。 Figure 5 is a conceptual diagram of yet another correspondence table TBL3 stored in the host information database 13 shown in Figure 3.

図5を参照して、対応表TBL3は、既知の推定結果と、時刻t’と、IPアドレスAddb’_w(w=1~Wであり、Wは、基地局の総数である。)と、IPアドレスAddm’と、スキャン応答遅延RTTm’_knownと、通信特性CMbestm’_knownとを含む。既知の推定結果、時刻t’、IPアドレスAddb’_w、IPアドレスAddm’、スキャン応答遅延RTTm’_knownおよび通信特性CMbestm’_knownは、相互に対応付けられる。 5, correspondence table TBL3 includes a known estimation result, a time t', an IP address Add b'_w (w=1 to W, where W is the total number of base stations), an IP address Add m' , a scan response delay RTT m' _known, and a communication characteristic CMbest m' _known. The known estimation result, the time t', the IP address Add b'_w , the IP address Add m' , the scan response delay RTT m' _known, and the communication characteristic CMbest m' _known are associated with each other.

既知の推定結果は、ネットワークスキャンの推定結果として、“正常”と、“通信品質不十分”と、“ネットワーク混雑”とからなる。 Known estimated results from network scans include "normal," "poor communication quality," and "network congestion."

時刻t’は、図3において説明した時刻tと同じフォーマットからなる。IPアドレスAddb’_wは、基地局のアドレスである。IPアドレスAddm’は、ネットワークスキャンの対象である端末装置のグローバルIPアドレスからなる。IPアドレスAdd1’~IPアドレスAdd3’は、基地局のIPアドレスAddb’_1に対応付けられ、以下、同様にして、IPアドレスAddM’は、基地局のIPアドレスAddb’_Wに対応付けられる。 The time t' has the same format as the time t described in Fig. 3. The IP address Add b'_w is the address of the base station. The IP address Add m' is the global IP address of the terminal device that is the target of the network scan. The IP addresses Add 1' to Add 3' are associated with the IP address Add b'_1 of the base station, and similarly, the IP address Add M' is associated with the IP address Add b'_W of the base station.

スキャン応答遅延{RTT1’_known}_1、スキャン応答遅延{RTT2’_known}_1、スキャン応答遅延{RTT3’_known}_1、・・・、およびスキャン応答遅延{RTTM’_known}_1は、それぞれ、IPアドレスAdd1’、IPアドレスAdd2’、IPアドレスAdd3’、・・・、IPアドレスAddM’に対応付けられ、ネットワークスキャンの結果が“正常”である通信環境において取得されたスキャン応答遅延RTTである。 The scan response delay {RTT 1' _known}_1, the scan response delay {RTT 2' _known}_1, the scan response delay {RTT 3' _known}_1, ..., and the scan response delay {RTT M' _known}_1 are respectively associated with IP address Add 1' , IP address Add 2' , IP address Add 3' , ..., IP address Add M' , and are scan response delays RTTs obtained in a communication environment where the result of a network scan is "normal".

通信特性{CMbest1’_known}_1、通信特性{CMbest2’_known}_1、通信特性{CMbest3’_known}_1、・・・、および通信特性{CMbestM’_known}_1は、それぞれ、IPアドレスAdd1’、IPアドレスAdd2’、IPアドレスAdd3’、・・・、IPアドレスAddM’に対応付けられ、ネットワークスキャンの結果が“正常”である通信環境において取得された通信特性CMbestである。 Communication characteristic {CMbest 1' _known}_1, communication characteristic {CMbest 2' _known}_1, communication characteristic {CMbest 3' _known}_1, ..., and communication characteristic {CMbest M' _known}_1 are communication characteristics CMbest respectively associated with IP address Add 1' , IP address Add 2' , IP address Add 3' , ..., IP address Add M' , and are obtained in a communication environment where the result of a network scan is "normal".

スキャン応答遅延{RTT1’_known}_2、スキャン応答遅延{RTT2’_known}_2、スキャン応答遅延{RTT3’_known}_2、・・・、およびスキャン応答遅延{RTTM’_known}_2は、それぞれ、IPアドレスAdd1’、IPアドレスAdd2’、IPアドレスAdd3’、・・・、IPアドレスAddM’に対応付けられ、ネットワークスキャンの結果が“通信品質不十分”である通信環境において取得されたスキャン応答遅延RTTである。 The scan response delay {RTT 1' _known}_2, the scan response delay {RTT 2' _known}_2, the scan response delay {RTT 3' _known}_2, ..., and the scan response delay {RTT M' _known}_2 are respectively associated with IP address Add 1' , IP address Add 2' , IP address Add 3' , ..., IP address Add M' , and are scan response delays RTTs obtained in a communication environment where the result of a network scan is "insufficient communication quality."

通信特性{CMbest1’_known}_2、通信特性{CMbest2’_known}_2、通信特性{CMbest3’_known}_2、・・・、および通信特性{CMbestM’_known}_2は、それぞれ、IPアドレスAdd1’、IPアドレスAdd2’、IPアドレスAdd3’、・・・、IPアドレスAddM’に対応付けられ、ネットワークスキャンの結果が“通信品質不十分”である通信環境において取得された通信特性CMbestである。 The communication characteristic {CMbest 1' _known}_2, the communication characteristic {CMbest 2' _known}_2, the communication characteristic {CMbest 3' _known}_2, ..., and the communication characteristic {CMbest M' _known}_2 are communication characteristics CMbest that are associated with IP address Add 1' , IP address Add 2' , IP address Add 3' , ..., IP address Add M' , respectively, and are acquired in a communication environment where the result of a network scan is "insufficient communication quality."

スキャン応答遅延{RTT1’_known}_3、スキャン応答遅延{RTT2’_known}_3、スキャン応答遅延{RTT3’_known}_3、・・・、およびスキャン応答遅延{RTTM’_known}_3は、それぞれ、IPアドレスAdd1’、IPアドレスAdd2’、IPアドレスAdd3’、・・・、IPアドレスAddM’に対応付けられ、ネットワークスキャンの結果が“ネットワーク混雑”である通信環境において取得されたスキャン応答遅延RTTである。 The scan response delay {RTT 1' _known}_3, the scan response delay {RTT 2' _known}_3, the scan response delay {RTT 3' _known}_3, ..., and the scan response delay {RTT M' _known}_3 are scan response delays RTTs associated with IP address Add 1' , IP address Add 2' , IP address Add 3 ', ..., IP address Add M' , respectively, and obtained in a communication environment where the result of a network scan is "network congestion."

通信特性{CMbest1’_known}_3、通信特性{CMbest2’_known}_3、通信特性{CMbest3’_known}_3、・・・、および通信特性{CMbestM’_known}_3は、それぞれ、IPアドレスAdd1’、IPアドレスAdd2’、IPアドレスAdd3’、・・・、IPアドレスAddM’に対応付けられ、ネットワークスキャンの結果が“ネットワーク混雑”である通信環境において取得された通信特性CMbestである。 The communication characteristic {CMbest 1' _known}_3, the communication characteristic {CMbest 2' _known}_3, the communication characteristic {CMbest 3' _known}_3, ..., and the communication characteristic {CMbest M' _known}_3 are communication characteristics CMbest that are associated with IP address Add 1' , IP address Add 2' , IP address Add 3' , ..., IP address Add M' , respectively, and are acquired in a communication environment where the result of a network scan is "network congestion".

スキャン応答遅延{RTT1’_known}_1~{RTTM’_known}_1および通信特性{CMbest1’_known}_1~{CMbestM’_known}_1は、標準サンプルデータD_standard_1を構成する。 The scan response delays {RTT 1 ' _known}_1 to {RTT M'_known }_1 and the communication characteristics {CMbest 1 ' _known}_1 to {CMbest M'_known }_1 constitute standard sample data D_standard_1.

また、スキャン応答遅延{RTT1’_known}_2~{RTTM’_known}_2および通信特性{CMbest1’_known}_2~{CMbestM’_known}_2は、標準サンプルデータD_standard_2を構成する。 Furthermore, the scan response delays {RTT 1 ' _known}_2 to {RTT M'_known }_2 and the communication characteristics {CMbest 1 ' _known}_2 to {CMbest M'_known }_2 constitute standard sample data D_standard_2.

更に、スキャン応答遅延{RTT1’_known}_3~{RTTM’_known}_3および通信特性{CMbest1’_known}_3~{CMbestM’_known}_3は、標準サンプルデータD_standard_3を構成する。 Furthermore, the scan response delays {RTT 1 ' _known}_3 to {RTT M'_known }_3 and the communication characteristics {CMbest 1 ' _known}_3 to {CMbest M'_known }_3 constitute standard sample data D_standard_3.

なお、対応表TBL3に示すスキャン応答遅延{RTT1’_known}_1~{RTTM’_known}_1の各々は、実際には、1つのIPアドレスAddm’内の複数のポートに対応して複数個存在する。また、通信特性{CMbest1’_known}_1~{CMbestM’_known}_1の各々は、実際には、1つのIPアドレスAddm’内の複数のポートに対応して複数個存在する。スキャン応答遅延{RTT1’_known}_2~{RTTM’_known}_2;{RTT1’_known}_3~{RTTM’_known}_3および通信特性{CMbest1’_known}_2~{CMbestM’_known}_2;{CMbest1’_known}_3~{CMbestM’_known}_3についても同様である。 In addition, each of the scan response delays {RTT 1' _known}_1 to {RTT M' _known}_1 shown in the correspondence table TBL3 actually exists in a plurality of pieces corresponding to a plurality of ports in one IP address Add m' . Also, each of the communication characteristics {CMbest 1' _known}_1 to {CMbest M' _known}_1 actually exists in a plurality of pieces corresponding to a plurality of ports in one IP address Add m' . The same is true for the scan response delays {RTT 1 ' _known}_2 to {RTT M'_known }_2; {RTT 1 ' _known}_3 to {RTT M'_known }_3 and the communication characteristics {CMbest 1 ' _known}_2 to {CMbest M'_known }_2; {CMbest 1 ' _known}_3 to {CMbest M'_known }_3.

また、スキャン応答遅延{RTT1’_known}_1~{RTTM’_known}_1の“1”および通信特性{CMbest1’_known}_1~{CMbestM’_known}_1の“1”は、ネットワークスキャンの既知の推定結果である“正常”に付与された識別コードD_code=1を表し、スキャン応答遅延{RTT1’_known}_2~{RTTM’_known}_2の“2”および通信特性{CMbest1’_known}_2~{CMbestM’_known}_2の“2”は、ネットワークスキャンの既知の推定結果である“通信品質不十分”に付与された識別コードD_code=2を表し、スキャン応答遅延{RTT1’_known}_3~{RTTM’_known}_3の“3”および通信特性{CMbest1’_known}_3~{CMbestM’_known}_3の“3”は、ネットワークスキャンの既知の推定結果である“ネットワークが混雑”に付与された識別コードD_code=3を表す。 Further, the “1” of the scan response delays {RTT 1′ _known}_1 to {RTT M′ _known}_1 and the “1” of the communication characteristics {CMbest 1′ _known}_1 to {CMbest M′ _known}_1 represent an identification code D_code=1 assigned to “normal”, which is a known estimated result of the network scan. The “2” of the scan response delays {RTT 1′ _known}_2 to {RTT M′ _known}_2 and the “2” of the communication characteristics {CMbest 1′ _known}_2 to {CMbest M′ _known}_2 represent an identification code D_code=2 assigned to “insufficient communication quality”, which is a known estimated result of the network scan. The "3" in {RTT 1'_known }_3 to {RTT M'_known }_3 and the "3" in {CMbest 1'_known }_3 to {CMbest M'_known }_3 represent the identification code D_code=3 assigned to "network is congested", which is a known estimated result of the network scan.

この発明の実施の形態においては、ネットワークスキャンがバックグラウンドトラフィックを監視せずに行われる場合、対応表TBL1および対応表TBL3がホスト情報データベース13に格納され、ネットワークスキャンがバックグラウンドトラフィックを監視して行われる場合、対応表TBL2および対応表TBL3がホスト情報データベース13に格納される。そして、対応表TBL3は、ネットワークスキャナ11がネットワークスキャンの結果が不明である通信環境においてネットワークスキャンを開始する前にホスト情報データベース13に格納されている。 In this embodiment of the invention, when a network scan is performed without monitoring background traffic, correspondence tables TBL1 and TBL3 are stored in the host information database 13, and when a network scan is performed while monitoring background traffic, correspondence tables TBL2 and TBL3 are stored in the host information database 13. Correspondence table TBL3 is stored in the host information database 13 before the network scanner 11 starts a network scan in a communication environment where the results of the network scan are unknown.

図6は、スキャンスケジュールの概念図である。図6の(a)を参照して、スキャンスケジュールSCH_scanは、スキャン総時間長T_totalを有し、T(Tは、1以上の整数)個のスキャンタイミング1~スキャンタイミングTを含む。 Fig. 6 is a conceptual diagram of a scan schedule. Referring to Fig. 6(a), the scan schedule SCH_scan has a total scan time length T S _total, and includes T (T is an integer equal to or greater than 1) scan timings 1 S to T S.

スキャン総時間長T_totalは、例えば、1日に設定され、スキャンタイミング1~スキャンタイミングTの各々は、例えば、1時間の時間長を有する。スキャンタイミングt(t=1~T)は、開始時刻tstartと、終了時刻tendと、対象アドレスAdd~Addとを含む。 The total scan time length T S _total is set to, for example, one day, and each of scan timings 1 S to TS has a time length of, for example, one hour. The scan timings t S (t S =1 S to TS ) include a start time t start , an end time t end , and target addresses Add 1 to Add M.

開始時刻tstartは、スキャンタイミングtにおいてネットワークスキャンを開始する時刻を表し、終了時刻tendは、スキャンタイミングtにおいてネットワークスキャンを終了する時刻を表す。従って、ネットワークスキャナ11は、スキャンタイミングtにおいて終了時刻tendが到来すると、ネットワークスキャンを終了する。 The start time t start represents the time when the network scan starts at the scan timing t S , and the end time t end represents the time when the network scan ends at the scan timing t S. Therefore, the network scanner 11 ends the network scan when the end time t end arrives at the scan timing t S.

対象アドレスAdd~Addの各々は、グローバルIPアドレスからなる。そして、対象アドレスAdd~Addは、ネットワークスキャンの対象であるM個の端末装置を表す。 Each of the target addresses Add 1 to Add M is a global IP address, and represents M terminal devices that are targets of the network scan.

なお、スキャンタイミングt以外のスキャンタイミング1~(t-1),(t+1)~Tの各々も、図6の(a)に示すスキャンタイミングtと同じ構成からなる。 Each of the scan timings 1 S to (t-1) S and (t+1) S to T S other than the scan timing t S has the same configuration as the scan timing t S shown in FIG. 6( a ).

スキャンタイミング1~Tは、相互に同じ時間長(=tend-tstart)を有していてもよく、相互に異なる時間長(=tend-tstart)を有していてもよい。また、スキャンタイミング1~Tは、相互に同じ個数のIPアドレスを有していてもよく、相互に異なる個数のIPアドレスを有していてもよい。 The scan timings 1S to TS may have the same time length (=t end -t start ) or may have different time lengths (=t end -t start ). Also, the scan timings 1S to TS may have the same number of IP addresses or may have different numbers of IP addresses.

最初にネットワークスキャンを実行する場合、図6の(a)に示すスキャンタイミング1~Tが用いられる。 When a network scan is executed for the first time, the scan timing 1 S to T S shown in FIG. 6(a) is used.

また、通信が空いているタイミングでネットワークスキャンが実行される場合、図6の(b)に示すスキャンタイミング1’~T’(T’は、1以上の整数)が用いられる。図6の(b)においては、スキャンタイミング1’~T’は、時間的に離間して設定される。これは、通信が空いている複数の時間帯が相互に接していることはないからである。 Furthermore, when a network scan is performed during times when communication is not busy, the scan timings 1 'S to T 'S (T' is an integer equal to or greater than 1) shown in Fig. 6(b) are used. In Fig. 6(b), the scan timings 1 'S to T 'S are set to be spaced apart in time, because multiple time periods during which communication is not busy are never adjacent to each other.

なお、スキャンタイミングt’(t’=1’~T’)の構成は、上述したスキャンタイミングtの構成と同じである。 The configuration of the scan timing t' S (t' S =1' S to T' S ) is the same as the configuration of the scan timing t S described above.

また、スキャンタイミングt,t’は、1つの時刻を意味するのではなく、開始時刻tstartから終了時刻tendまでの所定の時間長を有する概念である。 Moreover, the scan timings t S and t' S do not mean a single time, but are a concept having a predetermined time length from the start time t start to the end time t end .

スキャンタイミングt’を決定する方法について説明する。図7は、トラヒックの時間依存性を示す図である。図7において、縦軸は、トラヒックを表し、横軸は、時間を表す。また、曲線k1は、例えば、端末装置Aにおけるトラヒックの時間依存性を示し、曲線k2は、例えば、端末装置Aと異なる端末装置Bにおけるトラヒックの時間依存性を示す。 A method for determining the scan timing t 'S will be described. Fig. 7 is a diagram showing the time dependency of traffic. In Fig. 7, the vertical axis represents traffic and the horizontal axis represents time. Furthermore, curve k1 represents the time dependency of traffic in, for example, terminal device A, and curve k2 represents the time dependency of traffic in, for example, terminal device B different from terminal device A.

図7の(a)を参照して、端末装置Aにおいては、トラヒックは、日中よりも夜間の方が多い(曲線k1参照)。即ち、端末装置Aにおいては、通信は、日中に空いており、夜間に混雑している。図7の(b)を参照して、端末装置Bにおいては、トラヒックは、夜間よりも日中の方が多い(曲線k2参照)。即ち、端末装置Bにおいては、通信は、日中に混雑しており、夜間に空いている。 Referring to (a) of FIG. 7, in terminal device A, traffic is heavier at night than during the day (see curve k1). That is, in terminal device A, communication is less busy during the day and congested at night. Referring to (b) of FIG. 7, in terminal device B, traffic is heavier during the day than at night (see curve k2). That is, in terminal device B, communication is congested during the day and less busy at night.

従って、スキャンスケジューラ17は、ネットワークスキャンの対象となるM個の端末装置について、通信が空いている時間帯を検出し、その検出した時間帯に基づいて、スキャンタイミングt(またはスキャンタイミングt’)を決定する。 Therefore, the scan scheduler 17 detects a time period during which communication is not busy for the M terminal devices that are the targets of the network scan, and determines the scan timing t S (or the scan timing t' S ) based on the detected time period.

ネットワークスキャナ11は、スキャンスケジュールSCH_scanをスキャンスケジューラ17から受け、その受けたスキャンスケジュールSCH_scanに従ってネットワークスキャンをM個の端末装置に対して実行する。 The network scanner 11 receives the scan schedule SCH_scan from the scan scheduler 17 and performs a network scan on M terminal devices in accordance with the received scan schedule SCH_scan.

この場合、ネットワークスキャンは、バックグラウンドトラフィックを監視せずに実行され、またはバックグラウンドトラフィックを監視して実行される。 In this case, network scanning is performed without monitoring background traffic, or with monitoring background traffic.

図8は、通信特性の相関係数を示す図である。なお、図8に示す相関係数は、バックグラウンドトラフィックを監視せずにネットワークスキャンが実行された場合において、通信品質が不十分であるときの通信特性の相関係数である。また、図8に示すスキャン応答遅延RTT、パケットロス率PLR、スキャン最大遅延DLmax、およびスキャン最小遅延DLminは、ネットワークスキャンをM個の端末装置に対して実行したときのM個の端末装置における複数の通信特性である。なお、スキャン応答遅延RTTは、ネットワークスキャンの対象である1つのIPアドレス内における1個のスキャン応答遅延、または複数のスキャン応答遅延の平均値を示す。 Fig. 8 is a diagram showing correlation coefficients of communication characteristics. The correlation coefficients shown in Fig. 8 are correlation coefficients of communication characteristics when communication quality is insufficient when a network scan is performed without monitoring background traffic. The scan response delay RTT m , packet loss rate PLR m , scan maximum delay DLmax m , and scan minimum delay DLmin m shown in Fig. 8 are multiple communication characteristics of M terminal devices when a network scan is performed on M terminal devices. The scan response delay RTT m indicates one scan response delay or an average value of multiple scan response delays within one IP address that is the target of a network scan.

スキャン応答遅延RTT、パケットロス率PLR、スキャン最大遅延DLmax、およびスキャン最小遅延DLminの相互の相関係数を図8に示す。なお、図8において、対角要素よりも上側の非対角要素の相関係数が示されていないのは、対角要素よりも下側の非対角要素の相関係数と同じであるからである。 The correlation coefficients between the scan response delay RTT m , the packet loss rate PLR m , the scan maximum delay DLmax m , and the scan minimum delay DLmin m are shown in Fig. 8. Note that in Fig. 8, the correlation coefficients of the off-diagonal elements above the diagonal elements are not shown because they are the same as the correlation coefficients of the off-diagonal elements below the diagonal elements.

図8を参照して、バックグラウンドトラフィックを監視せずにネットワークスキャンが実行された場合において、通信品質が不十分であるとき、スキャン応答遅延RTTとスキャン最大遅延DLmaxとの相関係数、スキャン応答遅延RTTとスキャン最小遅延DLminとの相関係数およびスキャン最大遅延DLmaxとスキャン最小遅延DLminとの相関係数は、0.5よりも大きい。そして、スキャン応答遅延RTTとスキャン最大遅延DLmaxとの相関係数およびスキャン応答遅延RTTとスキャン最小遅延DLminとの相関係数は、スキャン最大遅延DLmaxとスキャン最小遅延DLminとの相関係数よりも大きい。従って、スキャン応答遅延RTTは、スキャン最大遅延DLmaxおよびスキャン最小遅延DLminと大きな相関を有する。 8, when a network scan is performed without monitoring background traffic and communication quality is insufficient, the correlation coefficient between the scan response delay RTT m and the scan maximum delay DLmax m , the correlation coefficient between the scan response delay RTT m and the scan minimum delay DLmin m , and the correlation coefficient between the scan maximum delay DLmax m and the scan minimum delay DLmin m are greater than 0.5. The correlation coefficient between the scan response delay RTT m and the scan maximum delay DLmax m and the correlation coefficient between the scan response delay RTT m and the scan minimum delay DLmin m are greater than the correlation coefficient between the scan maximum delay DLmax m and the scan minimum delay DLmin m . Therefore, the scan response delay RTT m has a large correlation with the scan maximum delay DLmax m and the scan minimum delay DLmin m .

図9は、通信特性の別の相関係数を示す図である。なお、図9に示す相関係数は、バックグラウンドトラフィックを監視せずにネットワークスキャンが実行された場合において、ネットワークが混雑している(ネットワーク輻輳である)ときの通信特性の相関係数である。また、スキャン応答遅延RTTは、ネットワークスキャンの対象である1つのIPアドレス内における平均値を示す。スキャン応答遅延RTT、パケットロス率PLR、スキャン最大遅延DLmax、およびスキャン最小遅延DLminの相互の相関係数を図9に示す。なお、図9においても、対角要素よりも上側の非対角要素の相関係数が示されていないのは、図8において説明した理由と同じである。また、図9に示すスキャン応答遅延RTT、パケットロス率PLR、スキャン最大遅延DLmax、およびスキャン最小遅延DLminは、ネットワークスキャンをM個の端末装置に対して実行したときのM個の端末装置における複数の通信特性である。 FIG. 9 is a diagram showing another correlation coefficient of communication characteristics. The correlation coefficient shown in FIG. 9 is a correlation coefficient of communication characteristics when a network scan is performed without monitoring background traffic and the network is congested (network congestion). The scan response delay RTT m indicates an average value within one IP address that is a target of a network scan. The mutual correlation coefficients of the scan response delay RTT m , the packet loss rate PLR m , the scan maximum delay DLmax m , and the scan minimum delay DLmin m are shown in FIG. 9. The reason why the correlation coefficients of the off-diagonal elements above the diagonal elements are not shown in FIG. 9 is the same as that explained in FIG. 8. The scan response delay RTT m , the packet loss rate PLR m , the scan maximum delay DLmax m , and the scan minimum delay DLmin m shown in FIG. 9 are a plurality of communication characteristics of M terminal devices when a network scan is performed on M terminal devices.

図9を参照して、バックグラウンドトラフィックを監視せずにネットワークスキャンが実行された場合において、ネットワークが混雑しているとき、スキャン応答遅延RTTとスキャン最大遅延DLmaxとの相関係数、スキャン応答遅延RTTとスキャン最小遅延DLminとの相関係数およびスキャン最大遅延DLmaxとスキャン最小遅延DLminとの相関係数は、0.5よりも大きい。そして、スキャン応答遅延RTTとスキャン最大遅延DLmaxとの相関係数およびスキャン応答遅延RTTとスキャン最小遅延DLminとの相関係数は、同じである。また、スキャン応答遅延RTTとスキャン最大遅延DLmaxとの相関係数およびスキャン応答遅延RTTとスキャン最小遅延DLminとの相関係数は、スキャン最大遅延DLmaxとスキャン最小遅延DLminとの相関係数よりも大きい。従って、ネットワークが混雑しているときも、スキャン応答遅延RTTは、スキャン最大遅延DLmaxおよびスキャン最小遅延DLminと大きな相関を有する。 9, in the case where a network scan is performed without monitoring background traffic, when the network is congested, the correlation coefficient between the scan response delay RTT m and the scan maximum delay DLmax m , the correlation coefficient between the scan response delay RTT m and the scan minimum delay DLmin m , and the correlation coefficient between the scan maximum delay DLmax m and the scan minimum delay DLmin m are greater than 0.5. The correlation coefficient between the scan response delay RTT m and the scan maximum delay DLmax m and the correlation coefficient between the scan response delay RTT m and the scan minimum delay DLmin m are the same. Also, the correlation coefficient between the scan response delay RTT m and the scan maximum delay DLmax m and the correlation coefficient between the scan response delay RTT m and the scan minimum delay DLmin m are greater than the correlation coefficient between the scan maximum delay DLmax m and the scan minimum delay DLmin m . Therefore, even when the network is congested, the scan response delay RTT m has a large correlation with the scan maximum delay DLmax m and the scan minimum delay DLmin m .

図8および図9に示すように、バックグラウンドトラフィックを監視せずにネットワークスキャンが実行された場合、通信品質が不十分なときとネットワークが混雑しているときとでは、スキャン応答遅延RTT、パケットロス率PLR、スキャン最大遅延DLmax、およびスキャン最小遅延DLminの相互の相関係数が異なる。 As shown in Figures 8 and 9 , when a network scan is performed without monitoring background traffic, the correlation coefficients between the scan response delay RTT m , packet loss rate PLR m , scan maximum delay DLmax m , and scan minimum delay DLmin m are different when the communication quality is insufficient and when the network is congested.

図10は、通信特性の更に別の相関係数を示す図である。なお、図10に示す相関係数は、バックグラウンドトラフィックを監視してネットワークスキャンが実行された場合において、通信品質が不十分であるときの通信特性の相関係数である。 Figure 10 is a diagram showing yet another correlation coefficient of communication characteristics. Note that the correlation coefficient shown in Figure 10 is the correlation coefficient of communication characteristics when communication quality is insufficient when a network scan is performed by monitoring background traffic.

スキャン応答遅延RTT、パケットロス率PLR、遅延DL、ジッタJT、バックグラウンド最大遅延BGDLmax、およびバックグラウンド最小遅延BGDLminの相互の相関係数を図10に示す。なお、図10においても、対角要素よりも上側の非対角要素の相関係数が示されていないのは、図8において説明した理由と同じである。また、図10に示すキャン応答遅延RTT、パケットロス率PLR、遅延DL、ジッタJT、バックグラウンド最大遅延BGDLmax、およびバックグラウンド最小遅延BGDLminは、ネットワークスキャンをM個の端末装置に対して実行したときのM個の端末装置における複数の通信特性である。 The correlation coefficients between the scan response delay RTT m , packet loss rate PLR m , delay DL m , jitter JT m , background maximum delay BGDLmax m , and background minimum delay BGDLmin m are shown in Fig. 10. Note that the correlation coefficients of the off-diagonal elements above the diagonal elements are not shown in Fig. 10 for the same reason as explained in Fig. 8. The scan response delay RTT m , packet loss rate PLR m , delay DL m , jitter JT m , background maximum delay BGDLmax m , and background minimum delay BGDLmin m shown in Fig. 10 are multiple communication characteristics of M terminal devices when a network scan is performed on M terminal devices.

図10を参照して、バックグラウンドトラフィックを監視してネットワークスキャンが実行された場合において、通信品質が不十分であるとき、スキャン応答遅延RTTと、パケットロス率PLR、遅延DL、バックグラウンド最大遅延BGDLmaxおよびバックグラウンド最小遅延BGDLminとの相関係数、パケットロス率PLRと、遅延DL、バックグラウンド最大遅延BGDLmaxおよびバックグラウンド最小遅延BGDLminとの相関係数、遅延DLとジッタJT、バックグラウンド最大遅延BGDLmaxおよびバックグラウンド最小遅延BGDLminとの相関係数、ジッタJTとバックグラウンド最大遅延BGDLmaxおよびバックグラウンド最小遅延BGDLminとの相関係数、およびバックグラウンド最大遅延BGDLmaxとバックグラウンド最小遅延BGDLminとの相関係数は、0.5よりも大きい。そして、スキャン応答遅延RTTは、パケットロス率PLRと最も大きい相関係数を有する。 Referring to FIG. 10 , when a network scan is performed by monitoring background traffic and the communication quality is insufficient, the correlation coefficient between the scan response delay RTT m and the packet loss rate PLR m , the delay DL m , the background maximum delay BGDLmax m , and the background minimum delay BGDLmin m , the correlation coefficient between the packet loss rate PLR m and the delay DL m , the background maximum delay BGDLmax m , and the background minimum delay BGDLmin m , the correlation coefficient between the delay DL m and the jitter JT m , the background maximum delay BGDLmax m , and the background minimum delay BGDLmin m , the correlation coefficient between the jitter JT m and the background maximum delay BGDLmax m and the background minimum delay BGDLmin m , and the correlation coefficient between the background maximum delay BGDLmax m and the background minimum delay BGDLmin m are greater than 0.5. The scan response delay RTT m has the largest correlation coefficient with the packet loss rate PLR m .

図11は、通信特性の更に別の相関係数を示す図である。なお、図11に示す相関係数は、バックグラウンドトラフィックを監視してネットワークスキャンが実行された場合において、ネットワークが混雑しているときの通信特性の相関係数である。 Figure 11 is a diagram showing yet another correlation coefficient of communication characteristics. Note that the correlation coefficient shown in Figure 11 is the correlation coefficient of communication characteristics when the network is congested when a network scan is performed by monitoring background traffic.

スキャン応答遅延RTT、パケットロス率PLR、遅延DL、ジッタJT、バックグラウンド最大遅延BGDLmax、およびバックグラウンド最小遅延BGDLminの相互の相関係数を図11に示す。なお、図11においても、対角要素よりも上側の非対角要素の相関係数が示されていないのは、図8において説明した理由と同じである。また、図11に示すスキャン応答遅延RTT、パケットロス率PLR、遅延DL、ジッタJT、バックグラウンド最大遅延BGDLmax、およびバックグラウンド最小遅延BGDLminは、ネットワークスキャンをM個の端末装置に対して実行したときのM個の端末装置における複数の通信特性である。 The correlation coefficients between the scan response delay RTT m , packet loss rate PLR m , delay DL m , jitter JT m , background maximum delay BGDLmax m , and background minimum delay BGDLmin m are shown in Fig. 11. Note that the correlation coefficients of the off-diagonal elements above the diagonal elements are not shown in Fig. 11 for the same reason as explained in Fig. 8. The scan response delay RTT m , packet loss rate PLR m , delay DL m , jitter JT m , background maximum delay BGDLmax m , and background minimum delay BGDLmin m shown in Fig. 11 are a plurality of communication characteristics of M terminal devices when a network scan is performed on the M terminal devices.

図11を参照して、バックグラウンドトラフィックを監視してネットワークスキャンが実行された場合において、ネットワークが混雑しているとき、スキャン応答遅延RTTと、パケットロス率PLR、遅延DL、ジッタJTおよびバックグラウンド最大遅延BGDLmaxとの相関係数、パケットロス率PLRと、遅延DL、バックグラウンド最大遅延BGDLmaxおよびバックグラウンド最小遅延BGDLminとの相関係数、遅延DLと、ジッタJT、バックグラウンド最大遅延BGDLmaxおよびバックグラウンド最小遅延BGDLminとの相関係数、ジッタJTとバックグラウンド最大遅延BGDLmaxおよびバックグラウンド最小遅延BGDLminとの相関係数、およびバックグラウンド最大遅延BGDLmaxとバックグラウンド最小遅延BGDLminとの相関係数は、0.5よりも大きい。そして、スキャン応答遅延RTTは、バックグラウンド最大遅延BGDLmaxと最も大きい相関係数を有する。 Referring to FIG. 11 , when a network scan is performed by monitoring background traffic, when the network is congested, the correlation coefficient between the scan response delay RTT m and the packet loss rate PLR m , the delay DL m , the jitter JT m , and the background maximum delay BGDLmax m , the correlation coefficient between the packet loss rate PLR m and the delay DL m , the background maximum delay BGDLmax m , and the background minimum delay BGDLmin m , the correlation coefficient between the delay DL m and the jitter JT m , the background maximum delay BGDLmax m , and the background minimum delay BGDLmin m , the correlation coefficient between the jitter JT m and the background maximum delay BGDLmax m and the background minimum delay BGDLmin m, and the correlation coefficient between the background maximum delay BGDLmax m and the background minimum delay BGDLmin m are greater than 0.5. And the scan response delay RTT m has the largest correlation coefficient with the background maximum delay BGDLmax m .

図10および図11に示すように、バックグラウンドトラフィックを監視してネットワークスキャンが実行された場合、通信品質が不十分なときとネットワークが混雑しているときとでは、スキャン応答遅延RTT、パケットロス率PLR、遅延DL、ジッタJT、バックグラウンド最大遅延BGDLmax、およびバックグラウンド最小遅延BGDLminの相互の相関係数が異なる。 As shown in Figures 10 and 11, when a network scan is performed by monitoring background traffic, the correlation coefficients between the scan response delay RTT m , packet loss rate PLR m , delay DL m , jitter JT m , background maximum delay BGDLmax m , and background minimum delay BGDLmin m differ when communication quality is insufficient and when the network is congested.

なお、図8から図11に示すスキャン応答遅延RTTと、パケットロス率PLR、遅延DL、ジッタJT、バックグラウンド最大遅延BGDLmaxおよびバックグラウンド最小遅延BGDLminとの相関係数は、図3に示す対応表TBL1または図4に示す対応表TBL2に格納されたスキャン応答遅延RTTを1つの端末装置においてスキャン応答SRがあったポートの個数によって平均化したものをスキャン応答遅延RTTとして用いて算出された相関係数であってもよく、対応表TBL1,TBL2に格納されたスキャン応答遅延RTTおよびパケットロス率PLR等の各通信特性をそのまま用いて(即ち、スキャン応答遅延RTTに関しては、ポートの違いによるスキャン応答遅延RTTの通信特性の違いも考慮して)算出された相関係数であってもよい。 8 to 11 may be correlation coefficients calculated by using the scan response delay RTT m stored in the correspondence table TBL1 shown in FIG . 3 or the correspondence table TBL2 shown in FIG. 4 as the scan response delay RTT m , which is averaged by the number of ports at which a scan response SR m was received in one terminal device, or may be correlation coefficients calculated by using each communication characteristic such as the scan response delay RTT m and the packet loss rate PLR m stored in the correspondence tables TBL1 and TBL2 as they are (i.e., with regard to the scan response delay RTT m , taking into consideration differences in the communication characteristics of the scan response delay RTT m due to differences in ports).

ネットワークスキャンを実行した場合、ネットワークスキャンの結果は、正常および失敗に分類される。そして、ネットワークスキャンが失敗した場合、ネットワークスキャンが失敗した原因として、次の第1の原因、第2の原因、第3の原因および第4の原因が想定される。 When a network scan is performed, the results of the network scan are classified as successful or failed. If the network scan fails, the following first, second, third, and fourth causes are assumed to be the reasons why the network scan failed.

(第1の原因)
ネットワークスキャンの対象である端末装置mとの通信における通信品質が不足していることである。
(First cause)
The communication quality with the terminal device m that is the target of the network scan is insufficient.

(第2の原因)
ネットワークスキャンの対象である端末装置mが接続されているネットワークが混雑していること(即ち、ネットワーク輻輳)である。
(Second cause)
The network to which the terminal device m that is the target of the network scan is connected is congested (i.e., network congestion).

(第3の原因)
ネットワークスキャンの対象である端末装置mがネットワークに接続されていないことである。
(Third cause)
The terminal device m that is the target of the network scan is not connected to the network.

(第4の原因)
ネットワークスキャンの対象である端末装置mのポートが閉塞していることである。
(Fourth cause)
The port of the terminal device m that is the target of the network scan is blocked.

そこで、この発明の実施の形態においては、以下に説明する方法によって、ネットワークスキャンを実行したときに得られるスキャン応答遅延RTT、パケットロス率PLRおよび遅延DL等の通信特性を用いて、ネットワークスキャンが正常であるか失敗であるかを推定するとともに、ネットワークスキャンが失敗であると推定したとき、その失敗の原因(第1の原因、第2の原因、第3の原因および第4の原因のいずれか)を推定する。なお、第1の原因および第2の原因は、端末装置との通信チャネルに起因した原因である。 Therefore, in the embodiment of the present invention, the communication characteristics such as the scan response delay RTT m , packet loss rate PLR m , and delay DL m obtained when a network scan is executed are used to estimate whether the network scan is normal or unsuccessful, and when it is estimated that the network scan has failed, the cause of the failure (any of the first, second, third, or fourth cause) is estimated. Note that the first and second causes are causes attributable to the communication channel with the terminal device.

ネットワークスキャンの結果を推定する方法は、図8から図11に示すスキャン応答遅延RTT、パケットロス率PLRおよび遅延DL等の通信特性のうち、ネットワークスキャンの結果を推定するために最も適した通信特性CMbestを抽出する抽出処理と、抽出処理において抽出された通信特性を有する端末装置をネットワークスキャンが正常であるグループCLSと、ネットワークスキャンが端末装置との通信チャネルに起因した原因によって失敗したグループCLS,CLSとに分類し、グループCLSとグループCLSとを判別するDスコアD_2、またはグループCLSとグループCLSとを判別するDスコアD_3を算出し、その算出したDスコアD_2またはDスコアD_3に基づいてネットワークスキャンが正常または失敗であると推定するとともに、ネットワークスキャンが失敗であると推定したとき、ネットワークスキャンが失敗した原因を推定する推定処理とを含む。 The method for estimating the result of a network scan includes an extraction process for extracting a communication characteristic CMbest that is most suitable for estimating the result of a network scan from communication characteristics such as a scan response delay RTT m , a packet loss rate PLR m , and a delay DL m shown in Figures 8 to 11, and an estimation process for classifying terminal devices having the communication characteristics extracted in the extraction process into a group CLS 1 where the network scan is normal and groups CLS 2 and CLS 3 where the network scan has failed due to a cause caused by the communication channel with the terminal device , calculating a D-score D_2 for distinguishing between groups CLS 1 and CLS 3 , or a D-score D_3 for distinguishing between groups CLS 2 and CLS 3, estimating that the network scan is normal or unsuccessful based on the calculated D-score D_2 or D-score D_3, and estimating the cause of the failure of the network scan when it is estimated that the network scan has failed.

[通信特性CMbest_unknownの抽出]
図6に示すスケジュールSCH_scanに従って、ネットワークスキャンがバックグラウンドトラフィックを監視せずに実行された場合、スキャン解析マネージャ12は、M個の端末装置の各々について、1つのスキャンタイミングtにおけるスキャン応答遅延RTT、パケットロス率PLR、スキャン最大遅延DLmaxおよびスキャン最小遅延DLminをネットワークスキャナ11から受け、その受けたスキャン応答遅延RTT、パケットロス率PLR、スキャン最大遅延DLmaxおよびスキャン最小遅延DLminをホスト情報データベース13の対応表TBL1に格納することによってホスト情報データベース13を作成または更新する。
[Extraction of communication characteristic CMbest m _unknown]
When a network scan is performed without monitoring background traffic according to the schedule SCH_scan shown in FIG. 6 , the scan analysis manager 12 receives the scan response delay RTT m , packet loss rate PLR m , scan maximum delay DLmax m , and scan minimum delay DLmin m at one scan timing ts for each of the M terminal devices from the network scanner 11, and creates or updates the host information database 13 by storing the received scan response delay RTT m , packet loss rate PLR m , scan maximum delay DLmax m , and scan minimum delay DLmin m in the correspondence table TBL1 of the host information database 13.

抽出手段14は、M個のスキャン応答遅延RTT、M個のパケットロス率PLR、M個のスキャン最大遅延DLmaxおよびM個のスキャン最小遅延DLminをホスト情報データベース13の対応表TBL1から読み出し、その読み出したM個のスキャン応答遅延RTT、M個のパケットロス率PLR、M個のスキャン最大遅延DLmaxおよびM個のスキャン最小遅延DLminに基づいて、スキャン応答遅延RTT、パケットロス率PLR、スキャン最大遅延DLmaxおよびスキャン最小遅延DLminの相互の相関係数rijを次式によって算出する。 The extraction means 14 reads out M scan response delays RTT m , M packet loss rates PLR m , M maximum scan delays DLmax m and M minimum scan delays DLmin m from the correspondence table TBL1 of the host information database 13, and calculates the mutual correlation coefficient r ij of the scan response delays RTT m , packet loss rates PLR m , M maximum scan delays DLmax m and M minimum scan delays DLmin m based on the read out M scan response delays RTT m , M packet loss rates PLR m , M maximum scan delays DLmax m and M minimum scan delays DLmin m using the following formula :

Figure 0007634259000001
Figure 0007634259000001

式(1)において、xaiは、相関係数rijを算出する元になる一方の通信特性fのサンプルを表し、yajは、相関係数rijを算出する元になる他方の通信特性fのサンプルを表す。そして、a=1~Mであり、a=1~Mである。 In formula (1), x ai represents a sample of one communication characteristic f i from which the correlation coefficient r ij is calculated, and y aj represents a sample of the other communication characteristic f j from which the correlation coefficient r ij is calculated, where a i =1 to M and a j =1 to M.

抽出手段14は、通信特性f,fの相関係数rijのうち、異なる通信特性f,f(i≠j)の相関係数rij(i≠j)を抽出する。例えば、算出された相関係数rijが図8に示す相関係数からなる場合、通信特性f(i=1~4)は、それぞれ、列方向のスキャン応答遅延RTT、パケットロス率PLR、スキャン最大遅延DLmaxおよびスキャン最小遅延DLminに設定され、通信特性f(j=1~4)は、それぞれ、行方向のスキャン応答遅延RTT、パケットロス率PLR、スキャン最大遅延DLmaxおよびスキャン最小遅延DLminに設定される。 The extraction means 14 extracts correlation coefficients r ij (i≠j) of different communication characteristics f i , f j (i≠j) from among the correlation coefficients r ij of the communication characteristics f i , f j . For example, when the calculated correlation coefficients r ij are those shown in Fig. 8, the communication characteristics f i (i=1 to 4) are set to the scan response delay RTT m , packet loss rate PLR m , scan maximum delay DLmax m and scan minimum delay DLmin m in the column direction, respectively, and the communication characteristics f j (j=1 to 4) are set to the scan response delay RTT m , packet loss rate PLR m , scan maximum delay DLmax m and scan minimum delay DLmin m in the row direction, respectively.

相関係数r11,r22,r33,r44は、対角要素であり、相関係数r21,r31,r41,r32,r42,r43は、非対角要素である。 The correlation coefficients r11 , r22 , r33 , and r44 are diagonal elements, and the correlation coefficients r21 , r31 , r41 , r32 , r42 , and r43 are off-diagonal elements.

抽出手段14は、非対角要素の相関係数r21,r31,r41,r32,r42,r43を順次抽出し、その抽出した各相関係数r21,r31,r41,r32,r42,r43がしきい値Corrよりも大きいか否かを判定する。しきい値Corrは、例えば、0.5~1.0の範囲内の実数に設定される。ここでは、しきい値Corr=0.5とする。 The extraction means 14 sequentially extracts correlation coefficients r21 , r31, r41 , r32 , r42 , and r43 of the off-diagonal elements, and judges whether each of the extracted correlation coefficients r21 , r31 , r41 , r32 , r42 , and r43 is greater than a threshold value Corr r . The threshold value Corr r is set to a real number in the range of 0.5 to 1.0, for example. Here, the threshold value Corr r = 0.5.

まず、抽出手段14は、相関係数r21がしきい値Corrよりも大きいか否かを判定する。そして、抽出手段14は、相関係数r21がしきい値Corr以下であるとき、相関係数r21の算出の元になった2つの通信特性f,fを削除し、相関係数r21がしきい値Corrよりも大きいとき、相関係数r21の算出の元になった2つの通信特性f,fを保存する。 First, the extraction means 14 judges whether the correlation coefficient r21 is greater than a threshold value Corr_r . If the correlation coefficient r21 is equal to or less than the threshold value Corr_r , the extraction means 14 deletes the two communication characteristics f2 and f1 used to calculate the correlation coefficient r21 , and if the correlation coefficient r21 is greater than the threshold value Corr_r , the extraction means 14 stores the two communication characteristics f2 and f1 used to calculate the correlation coefficient r21 .

この場合、相関係数r21(=0.25)がしきい値Corr(=0.5)以下であるので、抽出手段14は、相関係数r21の算出の元になった2つの通信特性f(=パケットロス率PLR)および通信特性f(=スキャン応答遅延RTT)を削除する。 In this case, since the correlation coefficient r21 (=0.25) is less than the threshold value Corr r (=0.5), the extraction means 14 deletes the two communication characteristics f2 (=packet loss rate PLRm ) and communication characteristic f1 (=scan response delay RTTm ) that were used to calculate the correlation coefficient r21 .

次に、抽出手段14は、相関係数r31がしきい値Corrよりも大きいか否かを判定する。相関係数r31が0.80であるので、抽出手段14は、相関係数r31がしきい値Corrよりも大きいと判定し、相関係数r31の算出の元になった2つの通信特性f(=スキャン最大遅延DLmax)および通信特性f(=スキャン応答遅延RTT)を保存する。 Next, the extraction means 14 judges whether the correlation coefficient r31 is greater than the threshold value Corr3r . Since the correlation coefficient r31 is 0.80, the extraction means 14 judges that the correlation coefficient r31 is greater than the threshold value Corr3r , and saves the two communication characteristics f3 (=scan maximum delay DLmaxm ) and f1 (=scan response delay RTTm ) that were used to calculate the correlation coefficient r31 .

引き続いて、抽出手段14は、相関係数r41がしきい値Corrよりも大きいか否かを判定する。相関係数r41が0.97であるので、抽出手段14は、相関係数r41がしきい値Corrよりも大きいと判定し、相関係数r41の算出の元になった2つの通信特性f(=スキャン最小遅延DLmin)および通信特性f(=スキャン応答遅延RTT)を保存する。 Next, the extraction means 14 judges whether the correlation coefficient r41 is greater than the threshold value Corr41 . Since the correlation coefficient r41 is 0.97, the extraction means 14 judges that the correlation coefficient r41 is greater than the threshold value Corr41 , and stores the two communication characteristics f3 (=scan minimum delay DLminm ) and f1 (=scan response delay RTTm ) that were used to calculate the correlation coefficient r41 .

以下、同様にして、抽出手段14は、相関係数r32,r42,r43がしきい値Corrよりも大きいか否かを順次判定する。そして、抽出手段14は、しきい値Corr(=0.5)よりも大きい相関係数r43の算出の元になった2つの通信特性f(=スキャン最小遅延DLmin),f(=スキャン最大遅延DLmax)を保存する。また、抽出手段14は、しきい値Corr(=0.5)以下である相関係数r32,r42の算出の元になった2つの通信特性f(=スキャン最大遅延DLmax),f(=パケットロス率PLR);2つの通信特性f(=スキャン最小遅延DLmin),f(=パケットロス率PLR)を削除する。 Similarly, the extraction means 14 sequentially determines whether the correlation coefficients r32 , r42 , and r43 are greater than the threshold value Corrr . The extraction means 14 then stores the two communication characteristics f4 (=minimum scanning delay DLminm ) and f3 (=maximum scanning delay DLmaxm) that were used to calculate the correlation coefficient r43 that is greater than the threshold value Corrr (=0.5). The extraction means 14 also deletes the two communication characteristics f3 (=maximum scanning delay DLmaxm ) and f2 (=packet loss rate PLRm ) that were used to calculate the correlation coefficients r32 and r42 that are less than the threshold value Corrr (= 0.5 ); and the two communication characteristics f4 (=minimum scanning delay DLminm ) and f2 (=packet loss rate PLRm ).

その結果、2つの通信特性f(=スキャン最大遅延DLmax),f(=スキャン応答遅延RTT);2つの通信特性f(=スキャン最小遅延DLmin),f(=スキャン応答遅延RTT);2つの通信特性f(=スキャン最小遅延DLmin),f(=スキャン最大遅延DLmax)が保存されたので、抽出手段14は、最終的に、スキャン応答遅延RTT、スキャン最大遅延DLmaxおよびスキャン最小遅延DLminの3個の通信特性を保存する。 As a result, two communication characteristics f3 (= maximum scan delay DLmax m ), f1 (= scan response delay RTT m ); two communication characteristics f3 (= minimum scan delay DLmin m ), f1 (= scan response delay RTT m ); and two communication characteristics f4 (= minimum scan delay DLmin m ), f3 (= maximum scan delay DLmax m ) are saved, so the extraction means 14 finally saves three communication characteristics: scan response delay RTT m , maximum scan delay DLmax m and minimum scan delay DLmin m .

なお、抽出手段14は、相関係数rijが図9から図11のいずれかに示す相関係数からなる場合も、同様にして、しきい値Corrよりも大きい相関係数rijの算出の元になった通信特性を保存し、しきい値Corr以下である相関係数rijの算出の元になった通信特性を削除する。 In addition, when the correlation coefficient r ij is the correlation coefficient shown in any one of Figures 9 to 11, the extraction means 14 similarly stores the communication characteristics used to calculate the correlation coefficient r ij that is greater than the threshold value Corr r , and deletes the communication characteristics used to calculate the correlation coefficient r ij that is equal to or smaller than the threshold value Corr r .

スキャン応答遅延RTTは、ネットワークスキャンが正常である場合におけるテスト入力からなるパケットを送信してからスキャン応答が帰って来るまでのRTTnormalに対する遅れを表すので、ネットワークスキャンの結果を最も良く表すものである。 The scan response delay RTT m represents the delay from sending a packet of test input to receiving a scan response in a normal network scan, relative to the RTT normal , and therefore best represents the results of a network scan.

そこで、抽出手段14は、最終的に保存された通信特性(上記の例では、スキャン応答遅延RTT、スキャン最大遅延DLmaxおよびスキャン最小遅延DLmin)から、スキャン最大遅延DLmaxおよびスキャン最小遅延DLminを説明変数として抽出するとともにスキャン応答遅延RTTを目的変数として抽出し、重回帰分析を実行して重回帰分析における寄与率(=R)を求める。 Therefore, the extraction means 14 extracts the maximum scan delay DLmax m and the minimum scan delay DLmin m as explanatory variables from the finally saved communication characteristics (in the above example, scan response delay RTT m , maximum scan delay DLmax m , and minimum scan delay DLmin m ), and extracts the scan response delay RTT m as a response variable, and performs multiple regression analysis to find the contribution rate (= R2 ) in the multiple regression analysis.

その後、抽出手段14は、寄与率Rがしきい値Sよりも小さいか否かを判定する。しきい値Sは、例えば、0.5~1.0の範囲の実数に設定される。 Thereafter, the extraction means 14 judges whether the contribution rate R2 is smaller than a threshold value Sr. The threshold value Sr is set to a real number in the range of 0.5 to 1.0, for example.

抽出手段14は、寄与率Rがしきい値Sよりも小さいと判定したとき、ネットワークスキャンの結果を推定する推定アルゴリズムALGのモードを“無相関”に設定し、寄与率Rがしきい値Sよりも小さくないと判定したとき、推定アルゴリズムALGのモードを“相関”に設定する。 When the extraction means 14 determines that the contribution rate R2 is smaller than the threshold value Sr , it sets the mode of the estimation algorithm ALG that estimates the results of the network scan to "uncorrelated," and when it determines that the contribution rate R2 is not smaller than the threshold value Sr , it sets the mode of the estimation algorithm ALG to "correlated."

推定アルゴリズムALGのモードが“無相関”に設定されたとき、最終的に保存された通信特性がやや重要であることを意味する。一方、推定アルゴリズムALGのモードが“相関”に設定されたとき、最終的に保存された通信特性が非常に重要であることを意味する。 When the mode of the estimation algorithm ALG is set to "uncorrelated", it means that the communication characteristics finally saved are somewhat important. On the other hand, when the mode of the estimation algorithm ALG is set to "correlated", it means that the communication characteristics finally saved are very important.

引き続いて、抽出手段14は、機械学習アルゴリズム“SelectKbest”を用いて、ネットワークスキャンの結果を推定するために最も適した通信特性CMbestをK個の通信特性から選択する。 The extraction means 14 then uses the machine learning algorithm "SelectKbest" to select the communication characteristic CMbest that is most suitable for estimating the results of the network scan from the K communication characteristics.

通信特性CMbestを選択する方法を説明する。図12は、通信特性CMbestを選択するときの元データの例を示す図である。図13は、通信特性CMbestを選択する方法を説明するための図である。 A method for selecting the communication characteristic CMbest will be described. FIG. 12 is a diagram showing an example of the original data when selecting the communication characteristic CMbest. FIG. 13 is a diagram for explaining the method for selecting the communication characteristic CMbest.

ネットワークスキャンのスキャン応答から得られる複数の通信特性として、パケットロス率PLR、ジッタJT、スキャン最大遅延DLmax、スキャン最小遅延DLminおよび遅延DLを図12に示す。図12においては、パケットロス率PLR、ジッタJT、スキャン最大遅延DLmax、スキャン最小遅延DLminおよび遅延DLは、8個の端末装置について示されている。 As multiple communication characteristics obtained from the scan response of the network scan, the packet loss rate PLR m , jitter JT m , scan maximum delay DLmax m , scan minimum delay DLmin m , and delay DL m are shown in Fig. 12. In Fig. 12, the packet loss rate PLR m , jitter JT m , scan maximum delay DLmax m , scan minimum delay DLmin m , and delay DL m are shown for eight terminal devices.

そして、抽出手段14は、上述した方法によって、しきい値Corrよりも大きい相関係数rijを有する通信特性として、図13に示すように、例えば、パケットロス率PLR、ジッタJT、スキャン最大遅延DLmaxおよびスキャン最小遅延DLminを選択する。 Then, the extraction means 14 selects, by the above -mentioned method, for example, a packet loss rate PLR m , a jitter JT m , a scanning maximum delay DLmax m , and a scanning minimum delay DLmin m as shown in FIG. 13 as communication characteristics having a correlation coefficient r ij greater than the threshold value Corr r.

その後、抽出手段14は、図13の各行の合計および各列の合計を算出し、各行の合計と各列の合計との合計である総合計を算出する。 Then, the extraction means 14 calculates the sum of each row and the sum of each column in FIG. 13, and calculates a grand total, which is the sum of the sum of each row and the sum of each column.

引き続いて、抽出手段14は、次式によって、r行c列の期待値Ercを全ての行および全ての列について算出する。 Next, the extraction means 14 calculates the expected value E rc of row r and column c for all rows and all columns by the following formula:

Figure 0007634259000002
Figure 0007634259000002

式(2)において、eは、r番目の行の合計を表し、eは、c番目の列の合計を表す。また、Ngrandは、総合計を表す。 In formula (2), e r represents the sum of the rth row, e c represents the sum of the cth column, and N grand represents the grand total.

図14は、通信特性のスコアを求める方法を説明するための図である。図15は、通信特性のスコアを示す図である。なお、図14においては、スキャン最大遅延DLmaxのスコアQを求める方法を説明する。 Fig. 14 is a diagram for explaining a method for calculating a score of a communication characteristic. Fig. 15 is a diagram showing the score of a communication characteristic. Note that Fig. 14 explains a method for calculating a score Q of a maximum scan delay DLmax m .

図14を参照して、左端の列は、図13の右端の列の合計および総合計であり、左端から2番目の列は、図12に示すスキャン最大遅延DLmaxのサンプルである。 14, the leftmost column is the sum and grand total of the rightmost column of FIG. 13, and the second leftmost column is a sample of the scan maximum delay DLmax m shown in FIG.

抽出手段14は、図14に示す各行の合計(=0.049,0.034,0.023,0.038,0.022,0.022,0.021,0.023)を式(2)のeに順次代入し、図14に示すc番目の列の合計(=0.232)を式(2)のeに代入し、図14の総合計を式(2)のNgrandに代入して期待値Ercを算出する。 The extraction means 14 sequentially substitutes the sum of each row shown in FIG. 14 (=0.049, 0.034, 0.023, 0.038, 0.022, 0.022, 0.021, 0.023) into e r of formula (2), substitutes the sum of the c-th column shown in FIG. 14 (=0.232) into e c of formula (2), and substitutes the grand total of FIG. 14 into N grand of formula (2) to calculate the expected value E rc .

そして、抽出手段14は、次式によってスコアQを算出する。 Then, the extraction means 14 calculates the score Q using the following formula:

Figure 0007634259000003
Figure 0007634259000003

式(3)において、Oは、図14に示すスキャン最大遅延DLmaxの各値であり、Eは、式(2)によって算出される期待値Ercである。 In equation (3), O is each value of the maximum scan delay DLmax m shown in FIG. 14, and E is the expected value E rc calculated by equation (2).

スコアQは、1つの通信特性(例えば、スキャン最大遅延DLmax)において、各サンプルOの期待値Eからのずれ量の大きさを表すものである。式(3)においては、各サンプルOが期待値Eよりも大きい方に大きくずれている場合、または各サンプルOが期待値Eよりも小さい方に大きくずれている場合、スコアQが大きくなり、各サンプルOが期待値Eよりも大きい方に小さくずれている場合、または各サンプルOが期待値Eよりも小さい方に小さくずれている場合、スコアQが小さくなる。従って、スコアQは、1つの通信特性(例えば、スキャン最大遅延DLmax)の特徴を表すものである。 The score Q represents the magnitude of deviation of each sample O from the expected value E in one communication characteristic (e.g., maximum scan delay DLmax m ). In formula (3), when each sample O is significantly deviated from the expected value E toward the larger side or when each sample O is significantly deviated from the expected value E toward the smaller side, the score Q is large, and when each sample O is slightly deviated from the expected value E toward the larger side or when each sample O is slightly deviated from the expected value E toward the smaller side. Thus, the score Q represents the characteristics of one communication characteristic (e.g., maximum scan delay DLmax m ).

抽出手段14は、期待値Eを算出すると、O-Eを算出し、続いて、(O-E)を算出し、その算出した(O-E)を期待値Eで除算して(O-E)/Eを算出する。 After calculating the expected value E, the extraction means 14 calculates O−E, then calculates (O−E) 2 , and divides the calculated (O−E) 2 by the expected value E to calculate (O−E) 2 /E.

そうすると、抽出手段14は、各行の(O-E)/Eの和をスキャン最大遅延DLmaxのスコアQとして算出する。つまり、抽出手段14は、式(3)によって、スキャン最大遅延DLmaxのスコアQを算出する。 Then, the extraction unit 14 calculates the sum of (OE) 2 /E for each row as the score Q of the scan maximum delay DLmax m . That is, the extraction unit 14 calculates the score Q of the scan maximum delay DLmax m by the formula (3).

また、抽出手段14は、図13に示すパケットロス率PLR、ジッタJTおよびスキャン最小遅延DLminについても、上述した方法によってスコアQを算出する。その結果、図15に示すように、パケットロス率PLR、ジッタJT、スキャン最大遅延DLmaxおよびスキャン最小遅延DLminのスコアQが得られる。 The extraction means 14 also calculates the score Q by the above-mentioned method for the packet loss rate PLR m , jitter JT m , and scan minimum delay DLmin m shown in Fig. 13. As a result, the score Q for the packet loss rate PLR m , jitter JT m , scan maximum delay DLmax m , and scan minimum delay DLmin m is obtained as shown in Fig. 15.

そうすると、抽出手段14は、パケットロス率PLR、ジッタJT、スキャン最大遅延DLmaxおよびスキャン最小遅延DLminのスコアQから、スコアQの大きい順にK(Kは、正の整数)個の通信特性を選択する。 Then, the extraction means 14 selects K (K is a positive integer) communication characteristics in descending order of score Q from the scores Q of the packet loss rate PLR m , jitter JT m , scan maximum delay DLmax m , and scan minimum delay DLmin m .

例えば、K=3である場合、図15に示す例においては、抽出手段14は、ジッタJT、スキャン最小遅延DLminおよびスキャン最大遅延DLmaxを選択する。 For example, when K=3, in the example shown in FIG. 15, the extraction means 14 selects a jitter JT m , a scan minimum delay DLmin m and a scan maximum delay DLmax m .

抽出手段14は、K個の通信特性を選択すると、次の方法によって、通信特性CMbestをK個の通信特性から選択する。 After selecting K communication characteristics, the extraction means 14 selects a communication characteristic CMbest from the K communication characteristics by the following method.

まず、抽出手段14は、LR(Linear Regression)およびSVM(Support Vector Machine)等の分類アルゴリズムを用いてK個の通信特性を、ネットワークスキャンの結果を推定するために重要な通信特性のグループGP1と、ネットワークスキャンの結果を推定するために重要でない通信特性のグループGP2とに分類する。 First, the extraction means 14 classifies the K communication characteristics using classification algorithms such as LR (Linear Regression) and SVM (Support Vector Machine) into a group GP1 of communication characteristics that are important for estimating the results of a network scan and a group GP2 of communication characteristics that are not important for estimating the results of a network scan.

ここでは、分類アルゴリズムとしてサポートベクターマシン(SVM-train)を用いるものとする。 Here, we use a support vector machine (SVM-train) as the classification algorithm.

SVMは、教師有り学習を用いるパターン認識モデルの一つであり、教師データX=[x01,x02,・・・,x0M(Tは、転置を表す)を最も大胆に区切る境界を学習する。この境界を学習するために2個以上のパラメータによって構成される2次元以上の空間が設定される。 The SVM is one of the pattern recognition models that uses supervised learning and learns the boundary that most boldly divides the training data X 0 = [x 01 , x 02 , ..., x 0M ] T (T represents transposition). In order to learn this boundary, a two- or more-dimensional space composed of two or more parameters is set.

そして、2次元以上の空間に配置された学習用サンプルを用いて学習を行った結果、教師データX=[x01,x02,・・・,x0Mを最も大胆に区切る境界は、境界に最も近いサンプル(データ)との距離(マージン)が最大となるように決定される。この決定された境界は、最大マージン超平面と呼ばれる。なお、この境界を決定する具体的な方法は、周知であるので、省略する。 As a result of learning using learning samples arranged in a two- or more-dimensional space, the boundary that most boldly divides the teacher data X0 = [ x01 , x02 , ..., x0M ] T is determined so as to maximize the distance (margin) between the boundary and the sample (data) closest to the boundary. This determined boundary is called a maximum margin hyperplane. Note that a specific method for determining this boundary is well known and will not be described here.

抽出手段14は、教師データX=[x01,x02,・・・,x0M(Tは、転置を表す)を用いてサポートベクターマシン(SVM-train)の学習を実行し、学習によって決定された境界を用いて、M個のサンプルベクトルx(m=1~M)の各々が次式を満たすように、各サンプルベクトルxをグループGP1,GP2のいずれかに分類する。ここで、サンプルベクトルxは、x=[CM1m,CM2m,・・・,CMkm,・・・,CMKm]である。即ち、サンプルベクトルxは、K個の通信特性CM1m~CMKmを要素として含む。その結果、グループGP1,GP2のいずれかに分類する対象となるデータは、式(5)によって表わされる。 The extraction means 14 executes learning of a support vector machine (SVM-train) using teacher data X 0 = [x 01 , x 02 , ..., x 0M ] T (T represents transposition), and classifies each of M sample vectors x m (m = 1 to M) into one of groups GP1 and GP2 using the boundaries determined by the learning, so that each of the M sample vectors x m (m = 1 to M) satisfies the following formula. Here, the sample vector x m is x m = [CM 1m , CM 2m , ..., CM km , ..., CM Km ]. That is, the sample vector x m includes K communication characteristics CM 1m to CM Km as elements. As a result, the data to be classified into one of groups GP1 and GP2 is expressed by formula (5).

Figure 0007634259000004
Figure 0007634259000004

Figure 0007634259000005
Figure 0007634259000005

式(5)において、通信特性CMkm(k=1~K,m=1~M)は、端末装置mにおけるk番目の通信特性を表す。 In formula (5), communication characteristic CM km (k=1 to K, m=1 to M) represents the k-th communication characteristic of terminal device m.

式(4)において、zは、ウェイトベクトルであり、bは、予め決定された定数である。 In equation (4), z is a weight vector and b is a predetermined constant.

グループGP1は、ネットワークスキャンの結果を推定するための重要な通信特性からなるグループである。また、グループGP2は、ネットワークスキャンの結果を推定するための重要でない通信特性からなるグループである。サンプルベクトルxがグループGP1に分類されたとき、yは、“1”からなり、サンプルベクトルxがグループGP2に分類されたとき、yは、“-1”からなる。 Group GP1 is a group consisting of important communication characteristics for estimating the results of a network scan. Group GP2 is a group consisting of unimportant communication characteristics for estimating the results of a network scan. When sample vector x m is classified into group GP1, y m is "1", and when sample vector x m is classified into group GP2, y m is "-1".

抽出手段14は、式(4)によってウェイトベクトルzを算出することによって、次式の分類指標αを決定する。 The extraction means 14 calculates the weight vector z using equation (4) to determine the classification index α in the following equation.

Figure 0007634259000006
Figure 0007634259000006

式(6)において、X=[x,x,・・・,x(Tは、転置を表す)であり、y=[y,y,・・・,y(Tは、転置を表す)である。 In formula (6), X = [ x1 , x2 , ..., xM ] T (T represents transposition), and y = [ y1 , y2 , ..., yM ] T (T represents transposition).

抽出手段14は、サンプルベクトルxがグループGP1に分類されたとき(即ち、yが“1”からなるとき)、z・x-b=1によってウェイトベクトルzを算出し、その算出したウェイトベクトルzを分類指標αとする。また、抽出手段14は、サンプルxがグループGP2に分類されたとき(即ち、yが“-1”からなるとき)、z・x-b=-1によってウェイトベクトルzを算出し、その算出したウェイトベクトルzを分類指標αとする。 When sample vector xm is classified into group GP1 (i.e., when ym is "1"), extraction means 14 calculates weight vector z by z· xm -b=1 and sets the calculated weight vector z as classification index α. When sample vector xm is classified into group GP2 (i.e., when ym is "-1"), extraction means 14 calculates weight vector z by z· xm -b=-1 and sets the calculated weight vector z as classification index α.

抽出手段14は、k番目の通信特性CMkmに関する分類指標αを決定すると、その決定した分類指標α(=α)、サンプルベクトルxkm、およびy(=“1”または“-1”)を次式に代入して、ネットワークスキャンの結果を推定するための通信特性の重要性を示す重みwを算出する。 When the extraction means 14 determines the classification index α for the kth communication characteristic CM km , it substitutes the determined classification index α (= α k ), the sample vector x km , and y m (= “1” or “−1”) into the following equation to calculate a weight w k indicating the importance of the communication characteristic for estimating the results of the network scan.

Figure 0007634259000007
Figure 0007634259000007

式(7)において、xkmは、端末装置mにおけるサンプルベクトルxのk番目の通信特性のサンプルCMkmを表す。従って、式(7)の右辺は、式(5)に示すM個のk番目の通信特性CMk1,CMk2,・・・,CMkm,・・・,CMkMを用いて重みwを算出することを意味する。 In formula (7), x km represents the k-th communication characteristic sample CM km of the sample vector x m in the terminal device m. Therefore, the right side of formula (7) means that the weight w k is calculated using M k-th communication characteristics CM k1 , CM k2 , ..., CM km , ..., CM kM shown in formula (5).

その後、抽出手段14は、式(7)によって算出した重みwを次式に代入し、ランクを決定するためのランク重みRを算出する。 Thereafter, the extraction means 14 substitutes the weight w k calculated by the formula (7) into the following formula to calculate the rank weight R k for determining the rank.

Figure 0007634259000008
Figure 0007634259000008

抽出手段14は、上述した方法によって、K個の通信特性の全てについてランク重みRを算出する。 The extraction means 14 calculates the rank weights R k for all of the K communication characteristics by the above-mentioned method.

図16は、ランク重みRの算出結果を示す図である。図16を参照して、スキャン最大遅延DLmax、ジッタJT、スキャン最小遅延DLminおよびパケットロス率PLRに対して、ランク重みRおよびランクが対応付けられる。 Fig. 16 is a diagram showing the calculation result of the rank weight Rk . Referring to Fig. 16, the rank weight Rk and the rank are associated with the maximum scan delay DLmaxm , the jitter JTm , the minimum scan delay DLminm , and the packet loss rate PLRm .

そして、抽出手段14は、最もランクが低い(即ち、最も小さいランク重みRを与える)通信特性(ここでは、パケットロス率PLR)を、削除する通信特性に決定する。その後、抽出手段14は、当該通信特性のサンプルをサンプルベクトルx~xから削除し、式(4),(6)~(8)の計算と、削除する通信特性の決定とを全ての通信特性が削除されるまで繰り返し実行する。なお、最も小さいランク重みRを与える通信特性が複数個存在する場合、抽出手段14は、これらのうちの任意の通信特性を削除する。また、最も小さいランク重みRを与える通信特性が複数個存在する場合、抽出手段14は、スキャン応答遅延RTTとの相関係数rijが最も小さい通信特性を、削除する通信特性としてもよい。 Then, the extraction means 14 determines the communication characteristic (here, the packet loss rate PLR m ) with the lowest rank (i.e., with the smallest rank weight R k ) as the communication characteristic to be deleted. Thereafter, the extraction means 14 deletes samples of the communication characteristic from the sample vectors x 1 to x M , and repeats the calculations of the equations (4), (6) to (8) and the determination of the communication characteristic to be deleted until all communication characteristics are deleted. Note that, if there are multiple communication characteristics with the smallest rank weight R k , the extraction means 14 deletes any one of these communication characteristics. Also, if there are multiple communication characteristics with the smallest rank weight R k , the extraction means 14 may determine the communication characteristic with the smallest correlation coefficient r ij with the scan response delay RTT m as the communication characteristic to be deleted.

そうすると、抽出手段14は、最後に削除した通信特性を通信特性CMbest_unknownとして検出し、その検出した通信特性CMbest_unknownと、スキャン応答遅延RTT_unknownとを結合して推定手段16へ出力する。 Then, the extraction means 14 detects the last deleted communication characteristic as the communication characteristic CMbest m _unknown, combines the detected communication characteristic CMbest m _unknown with the scan response delay RTT m _unknown, and outputs the combined result to the estimation means 16 .

なお、図6に示すスケジュールSCH_scanに従って、ネットワークスキャンがバックグラウンドトラフィックを監視して実行された場合、抽出手段14は、上述したM個のスキャン応答遅延RTT、M個のパケットロス率PLR、M個のスキャン最大遅延DLmaxおよびM個のスキャン最小遅延DLminに代えて、M個のスキャン応答遅延RTT、M個のパケットロス率PLR、M個の遅延DL、M個のジッタJT、M個のバックグラウンド最大遅延BGDLmaxおよびM個のバックグラウンド最小遅延BGDLminに基づいて、上述した方法によって、通信特性CMbest_unknownを選択する。 In addition, when a network scan is performed by monitoring background traffic according to the schedule SCH_scan shown in Figure 6, the extraction means 14 selects the communication characteristic CMbest m _unknown by the above-mentioned method based on the M scan response delays RTT m , M packet loss rates PLR m , M delays DL m, M jitters JT m , M background maximum delays BGDLmax m , and M background minimum delays BGDLmin m , instead of the above-mentioned M scan response delays RTT m , M packet loss rates PLR m , M scan maximum delays DLmax m , and M scan minimum delays DLmin m .

[スキャン応答遅延RTT_unknownに最も類似するスキャン応答遅延RTT_knownの選択]
抽出手段14は、ホスト情報データベース13に格納された対応表TBL1(または対応表TBL2)からスキャン応答遅延RTT~RTTをスキャン応答遅延RTT_unknown~RTT_unknownとして検出する。この場合、スキャン応答遅延RTT~RTTの各々は、1つのIPアドレスAdd内における1個のスキャン応答遅延、または複数のスキャン応答遅延の平均値からなる。
[Selection of the scan response delay RTT m _known that is most similar to the scan response delay RTT m _unknown]
The extraction means 14 detects the scan response delays RTT 1 to RTT M as scan response delays RTT 1 _unknown to RTT M _unknown from the correspondence table TBL1 (or correspondence table TBL2) stored in the host information database 13. In this case, each of the scan response delays RTT 1 to RTT M is composed of one scan response delay or an average value of multiple scan response delays within one IP address Add m .

また、抽出手段14は、ホスト情報データベース13に格納された対応表TBL3からスキャン応答遅延{RTTm’}_known_1(m’=1’~M’)、スキャン応答遅延{RTTm’}_known_2(m’=1’~M’)およびスキャン応答遅延{RTTm’}_known_3(m’=1’~M’)を検出する。 In addition, the extraction means 14 detects scan response delay {RTT m' } _known _1 (m' = 1' to M'), scan response delay {RTT m' } _known _2 (m' = 1' to M') and scan response delay {RTT m' } _known _3 (m' = 1' to M') from the correspondence table TBL3 stored in the host information database 13.

その後、抽出手段14は、スキャン応答遅延RTT_unknown~RTT_unknown、スキャン応答遅延{RTTm’_known}_1(m’=1’~M’)、スキャン応答遅延{RTTm’_known}_2(m’=1’~M’)およびスキャン応答遅延{RTTm’_known}_3(m’=1’~M’)を算出手段15へ出力する。 Then, the extraction means 14 outputs the scan response delays RTT 1 _unknown to RTT M _unknown, the scan response delay {RTT m' _known} _1 (m'=1' to M'), the scan response delay {RTT m' _known} _2 (m'=1' to M') and the scan response delay {RTT m' _known} _3 (m'=1' to M') to the calculation means 15.

算出手段15は、スキャン応答遅延RTT_unknown~RTT_unknown、スキャン応答遅延{RTTm’_known}_1(m’=1’~M’)、スキャン応答遅延{RTTm’_known}_2(m’=1’~M’)およびスキャン応答遅延{RTTm’_known}_3(m’=1’~M’)を抽出手段14から受ける。 Calculation means 15 receives scan response delays RTT 1 _unknown to RTT M _unknown, scan response delay {RTT m' _known} _1 (m'=1' to M'), scan response delay {RTT m' _known} _2 (m'=1' to M') and scan response delay {RTT m' _known} _3 (m'=1' to M') from extraction means 14 .

算出手段15は、スキャン応答遅延RTTに基づいて、最も生じ易いスキャン応答遅延の値であるモードm(Mo)を取得する。なお、最も生じ易いスキャン応答遅延の値が2つ存在する場合、算出手段15は、次式によって、最も生じ易いスキャン応答遅延の値であるモードm(Mo)を算出する。また、最も生じ易いスキャン応答遅延の値が3つ以上存在する場合、算出手段15は、最も生じ易い3つ以上のスキャン応答遅延から最小値と最大値を検出し、その検出した最小値および最大値に基づいて、次式によって、最も生じ易いスキャン応答遅延の値であるモードm(Mo)を算出する。 Calculation means 15 acquires mode m (Mo), which is the most likely value of the scan response delay, based on scan response delay RTT m . When there are two most likely values of the scan response delay, calculation means 15 calculates mode m (Mo), which is the most likely value of the scan response delay, by the following formula. When there are three or more most likely values of the scan response delay, calculation means 15 detects minimum and maximum values from the three or more most likely scan response delays, and calculates mode m (Mo), which is the most likely value of the scan response delay, by the following formula based on the detected minimum and maximum values.

Figure 0007634259000009
Figure 0007634259000009

式(9)において、Lは、ネットワークスキャンの結果が不明である場合またはネットワークスキャンの結果が既知である場合における最も生じ易いスキャン応答遅延の2つの値を含む確率密度関数の領域(=PDF(Probability Density Function)領域)の低い境界を示す。また、rは、ネットワークスキャンの結果が不明である場合またはネットワークスキャンの結果が既知である場合における最も生じ易いPDF領域のサンプル数(=スキャン応答遅延の数)を示す。更に、rは、ネットワークスキャンの結果が不明である場合またはネットワークスキャンの結果が既知である場合における最も生じ易いPDF領域よりもスキャン応答遅延RTTが小さい方向に1つ前のPDF領域のサンプル数(=スキャン応答遅延の数)を示す。更に、rは、ネットワークスキャンの結果が不明である場合またはネットワークスキャンの結果が既知である場合における最も生じ易いPDF領域よりもスキャン応答遅延RTTが大きい方向に1つ次のPDF領域のサンプル数(=スキャン応答遅延の数)を示す。更に、hは、各PDF領域間のインターバル(即ち、各PDF領域の幅)を示す。 In formula (9), L indicates the lower boundary of the probability density function region (=PDF (Probability Density Function) region) including two values of the most likely scan response delay when the result of the network scan is unknown or when the result of the network scan is known. Furthermore, r indicates the number of samples (=the number of scan response delays) of the most likely PDF region when the result of the network scan is unknown or when the result of the network scan is known. Furthermore, r 1 indicates the number of samples (=the number of scan response delays) of the previous PDF region in the direction where the scan response delay RTT m is smaller than the most likely PDF region when the result of the network scan is unknown or when the result of the network scan is known. Furthermore, r 2 indicates the number of samples (=the number of scan response delays) of the next PDF region in the direction where the scan response delay RTT m is larger than the most likely PDF region when the result of the network scan is unknown or when the result of the network scan is known. Furthermore, h indicates the interval between each PDF region (i.e., the width of each PDF region).

図17から図19は、スキャン応答遅延の具体的な分布を示す図である。図20は、PDF領域と、生じたサンプル数との対応関係を示す図である。図21は、スキャン応答遅延の確率密度関数の具体的な分布を示す図である。 Figures 17 to 19 show specific distributions of scan response delays. Figure 20 shows the correspondence between PDF regions and the number of samples generated. Figure 21 shows a specific distribution of the probability density function of scan response delays.

図17に示すスキャン応答遅延の具体的な分布における各具体値のサンプル数をカウントし、各具体値に対するサンプル数を表示すると、図18に示すようになる。その結果、図18から、スキャン応答遅延が0.41および0.6の確率密度値で最も生じ易いことがわかる。 When the number of samples for each specific value in the specific distribution of scan response delay shown in Figure 17 is counted and the number of samples for each specific value is displayed, the result is as shown in Figure 18. As a result, Figure 18 shows that scan response delay is most likely to occur at probability density values of 0.41 and 0.6.

そして、図19に示すように、0.0~0.2のPDF領域、0.21~0.4のPDF領域、0.41~0.6のPDF領域、0.61~0.8のPDF領域および0.81~1.0のPFD領域の各領域において生じたサンプル数は、それぞれ、“5”、“5”、“14”、“4”、および“2”となる。 As shown in Figure 19, the number of samples generated in the PDF region of 0.0 to 0.2, the PDF region of 0.21 to 0.4, the PDF region of 0.41 to 0.6, the PDF region of 0.61 to 0.8, and the PFD region of 0.81 to 1.0 are "5", "5", "14", "4", and "2", respectively.

PDF領域と、各領域において生じたサンプル数との対応関係は、図20に示すようになる。そして、0.41~0.6のPDF領域において生じたサンプル数(=14)がrであり、0.41~0.6のインターバル(=0.2)がhであり、0.41がLであり、0.21~0.4のPDF領域において生じたサンプル数(=5)がrであり、0.61~0.8のPDF領域において生じたサンプル数(=4)がrである。従って、r(=14)、r(=5)、r(=4)、h(=0.2)およびL(=0.41)を式(9)に代入することによってモードm(Mo)を算出することができる。 The correspondence between the PDF regions and the number of samples generated in each region is as shown in Figure 20. The number of samples generated in the PDF region of 0.41 to 0.6 (=14) is r, the interval of 0.41 to 0.6 (=0.2) is h, 0.41 is L, the number of samples generated in the PDF region of 0.21 to 0.4 (=5) is r1 , and the number of samples generated in the PDF region of 0.61 to 0.8 (=4) is r2 . Therefore, the mode m (Mo) can be calculated by substituting r (=14), r1 (=5), r2 (=4), h (=0.2), and L (=0.41) into formula (9).

図21に示すように、rは、スキャン応答遅延の最も生じ易い2つの値(=0.41と0.6)と確率密度関数を示す曲線とによって囲まれたPDF領域REGPDFにおけるスキャン応答遅延のサンプル数からなる。また、Lは、スキャン応答遅延の最も生じ易い2つの値(=0.41と0.6)のうち、低い方の値(=0.41)からなる。更に、hは、2つの値(=0.41と0.6)のインターバルからなる。rは、PDF領域REGPDFよりもスキャン応答遅延が小さい側の、PDF領域REGPDFに隣接した幅hの領域におけるサンプル数からなり、rは、PDF領域REGPDFよりもスキャン応答遅延が大きい側の、PDF領域REGPDFに隣接した幅hの領域におけるサンプル数からなる。 As shown in FIG. 21, r is the number of samples of the scan response delay in the PDF region REG PDF surrounded by the two values (=0.41 and 0.6) that are most likely to cause the scan response delay and the curve showing the probability density function. Furthermore, L is the lower value (=0.41) of the two values (=0.41 and 0.6) that are most likely to cause the scan response delay. Furthermore, h is the interval between the two values (=0.41 and 0.6). r 1 is the number of samples in a region of width h adjacent to the PDF region REG PDF on the side where the scan response delay is smaller than the PDF region REG PDF , and r 2 is the number of samples in a region of width h adjacent to the PDF region REG PDF on the side where the scan response delay is larger than the PDF region REG PDF .

図22は、スキャン応答遅延の別の具体的な分布を示す図である。図22を参照して、最も生じ易いスキャン応答遅延の値が3つ存在する。この場合、最も生じ易い3つのスキャン応答遅延の値を含むPDF領域の幅にインターバルhを調整する。そして、最も生じ易い3つのスキャン応答遅延の値から最小値(=0.35)と最大値(=0.6)とを検出する。その後、最小値(=0.35)および最大値(=0.6)を最も生じ易い2つのスキャン応答遅延の値として用いて、図17から図21において説明した方法によってr、r、r、Lおよびhを決定し、その決定したr、r、r、Lおよびhを式(9)に代入してモードm(Mo)を算出する。 FIG. 22 is a diagram showing another specific distribution of scan response delay. Referring to FIG. 22, there are three most likely scan response delay values. In this case, the interval h is adjusted to the width of the PDF region including the three most likely scan response delay values. Then, the minimum value (=0.35) and the maximum value (=0.6) are detected from the three most likely scan response delay values. After that, the minimum value (=0.35) and the maximum value (=0.6) are used as the two most likely scan response delay values to determine r, r 1 , r 2 , L and h by the method described in FIG. 17 to FIG. 21, and the determined r, r 1 , r 2 , L and h are substituted into formula (9) to calculate the mode m (Mo).

なお、最も生じ易いスキャン応答遅延の値が4個以上存在する場合も、最も生じ易いスキャン応答遅延の値が3つである場合と同様にしてモードm(Mo)を算出する。 When there are four or more most likely scan response delay values, the mode m (Mo) is calculated in the same manner as when there are three most likely scan response delay values.

以下、スキャン応答遅延RTT_unknown~RTT_unknownに基づいて、式(9)によって算出したモードm(Mo)を「m(Mo)_unknown」と表記し、スキャン応答遅延{RTTm’_known}_1(m’=1’~M’)に基づいて、式(9)によって算出したモードm(Mo)を「m(Mo)_known_1」と表記し、スキャン応答遅延{RTTm’_known}_2(m’=1’~M’)に基づいて、式(9)によって算出したモードm(Mo)を「m(Mo)_known_2」と表記し、スキャン応答遅延{RTTm’_known}_3(m’=1’~M’)に基づいて、式(9)によって算出したモードm(Mo)を「m(Mo)_known_3」と表記する。 Hereinafter, the mode m(Mo) calculated using equation (9) based on the scan response delays RTT 1 _unknown to RTT M _unknown will be denoted as “m(Mo)_unknown”, the mode m(Mo) calculated using equation (9) based on the scan response delays {RTT m′ _known} _1 (m′=1′ to M′) will be denoted as “m(Mo)_known_1”, the mode m(Mo) calculated using equation (9) based on the scan response delays {RTT m′ _known} _2 (m′=1′ to M′) will be denoted as “m(Mo)_known_2”, and the mode m(Mo) calculated using equation (9) based on the scan response delays {RTT m′ _known}_3 (m'=1' to M'), the mode m(Mo) calculated by equation (9) is represented as "m(Mo)_known_3".

算出手段15は、上述した方法によって、モードm(Mo)_unknown,m(Mo)_known_1,m(Mo)_known_2,m(Mo)_known_3を算出した後、次式によって、スキャン応答遅延RTT_unknown~RTT_unknownの平均絶対偏差Wunknownを算出する。 The calculation means 15 calculates the modes m(Mo)_unknown, m(Mo)_known_1, m(Mo)_known_2, and m(Mo)_known_3 by the above-mentioned method, and then calculates the mean absolute deviation W unknown of the scan response delays RTT 1 _unknown to RTT M _unknown by the following equation.

Figure 0007634259000010
Figure 0007634259000010

式(10A)におけるC(xi_unknown)は、式(10B)によって表され、xi_unknownには、スキャン応答遅延RTT_unknown~RTT_unknownが代入される。 C(x i — unknown ) in equation (10A) is expressed by equation (10B), and scan response delays RTT 1 _unknown to RTT M _unknown are substituted for x i _unknown .

算出手段15は、平均絶対偏差Wunknownを算出すると、次式によって、スキャン応答遅延{RTTm’_known}_z(m’=1’~M’)の平均絶対偏差Wknown_zを算出する。 After calculating the mean absolute deviation W unknown , the calculation means 15 calculates the mean absolute deviation W known_z of the scan response delay {RTT m' _known}_z (m'=1' to M') by the following equation.

Figure 0007634259000011
Figure 0007634259000011

式(11)において、zは、ネットワークスキャンの既知の推定結果を示す引数であり、1≦z≦Zを満たす整数である。また、Zは、ネットワークスキャンの既知の推定結果の総数である。この発明の実施の形態においては、ネットワークスキャンの既知の推定結果は、“正常”、“通信品質不十分”および“ネットワーク混雑”の3個であるので、式(11)において、z=1,2,3である。 In formula (11), z is an argument indicating the known estimated results of the network scan, and is an integer satisfying 1≦z≦Z. Furthermore, Z is the total number of known estimated results of the network scan. In this embodiment of the invention, the known estimated results of the network scan are "normal", "poor communication quality", and "network congestion", so in formula (11), z = 1, 2, 3.

なお、ネットワークスキャンの既知の推定結果である“正常”、“通信品質不十分”および“ネットワーク混雑”にそれぞれ対応するスキャン応答遅延は、1種類のデータからなることもあれば、複数種類のデータからなることもある。 The scan response delays corresponding to the known estimated network scan results of "normal", "poor communication quality" and "network congestion" may consist of one type of data or multiple types of data.

算出手段15は、モードm(Mo)_known_1を式(11B)のm(Mo)_known_zに代入し、スキャン応答遅延{RTT1’_known}_1~{RTTM’_known}_1を式(11B)のxi_known_zに代入して、式(11A)によって平均絶対偏差Wknown_1を算出する。 The calculation means 15 substitutes the mode m(Mo)_known_1 into m(Mo)_known_z in equation (11B), and substitutes the scan response delays {RTT 1′ _known}_1 to {RTT M′ _known}_1 into x i _known_z in equation (11B), to calculate the mean absolute deviation W known_1 according to equation (11A).

また、算出手段15は、モードm(Mo)_known_2を式(11B)のm(Mo)_known_zに代入し、スキャン応答遅延{RTT1’_known}_2~{RTTM’_known}_2を式(11B)のxi_known_zに代入して、式(11A)によって平均絶対偏差Wknown_2を算出する。 In addition, the calculation means 15 substitutes the mode m(Mo)_known_2 into m(Mo)_known_z in equation (11B) and substitutes the scan response delays {RTT 1′ _known}_2 to {RTT M′ _known}_2 into x i _known_z in equation (11B) to calculate the mean absolute deviation W known_2 by equation (11A).

更に、算出手段15は、モードm(Mo)_known_3を式(11B)のm(Mo)_known_zに代入し、{RTT1’_known}_3~{RTTM’_known}_3を式(11B)のxi_known_zに代入して、式(11A)によって平均絶対偏差Wknown_3を算出する。 Furthermore, the calculation means 15 substitutes the mode m(Mo)_known_3 into m(Mo)_known_z in equation (11B), and substitutes {RTT 1 ' _known}_3 to {RTT M'_known }_3 into x i _known_z in equation (11B), to calculate the mean absolute deviation W known_3 according to equation (11A).

即ち、算出手段15は、モードm(Mo)_known_1,m(Mo)_known_2,m(Mo)_known_3と、スキャン応答遅延{RTT1’_known}_1~{RTTM’_known}_1,{RTT1’_known}_2~{RTTM’_known}_2,{RTT1’_known}_3~{RTTM’_known}_3とに基づいて、式(11)によって、平均絶対偏差Wknown_1,Wknown_2,Wknown_3を算出する。 That is, the calculation means 15 calculates the mean absolute deviations W known_1, W known_2, and W known_3 based on the modes m(Mo)_known_1, m(Mo)_known_2, and m(Mo)_known_3 and the scan response delays {RTT 1 ' _known}_1 to {RTT M' _known}_1, {RTT 1' _known}_2 to { RTT M' _known}_2, and {RTT 1' _known }_3 to {RTT M' _known} _3 using equation (11).

その後、算出手段14は、平均絶対偏差Wunknown,Wknown_1,Wknown_2,Wknown_3を次式に代入して平均絶対偏差の差SS1,SS2,SS3を算出する。 Thereafter, the calculation means 14 substitutes the mean absolute deviations W unknown , W known — 1 , W known — 2 , and W known — 3 into the following equation to calculate the differences S S1 , S S2 , and S S3 in the mean absolute deviations.

Figure 0007634259000012
Figure 0007634259000012

この場合、算出手段15は、平均絶対偏差Wknown_1を式(12)のWknown_zに代入し、平均絶対偏差Wunknownを式(12)のWunknownに代入して平均絶対偏差の差SS1を算出する。 In this case, the calculation means 15 substitutes the mean absolute deviation W known — 1 for W known — z in equation (12) and substitutes the mean absolute deviation W unknown for W unknown in equation (12) to calculate the difference S S1 in the mean absolute deviations.

また、算出手段15は、平均絶対偏差Wknown_2を式(12)のWknown_zに代入し、平均絶対偏差Wunknownを式(12)のWunknownに代入して平均絶対偏差の差SS2を算出する。 Furthermore, the calculation means 15 substitutes the mean absolute deviation W known — 2 into W known — z in equation (12) and substitutes the mean absolute deviation W unknown into W unknown in equation (12) to calculate the difference S S2 in the mean absolute deviations.

更に、算出手段15は、平均絶対偏差Wknown_3を式(12)のWknown_zに代入し、平均絶対偏差Wunknownを式(12)のWunknownに代入して平均絶対偏差の差SS3を算出する。 Furthermore, the calculation means 15 substitutes the mean absolute deviation W known — 3 into W known — z in equation (12) and substitutes the mean absolute deviation W unknown into W unknown in equation (12) to calculate the difference S S3 in the mean absolute deviations.

算出手段15は、平均絶対偏差の差SS1,SS2,SS3を算出すると、その算出した平均絶対偏差の差SS1,SS2,SS3を次式に代入して類似性PSzを算出する。 After calculating the differences S S1 , S S2 , and S S3 in the mean absolute deviations, the calculation means 15 substitutes the calculated differences S S1 , S S2 , and S S3 in the mean absolute deviations into the following equation to calculate the similarity P Sz .

Figure 0007634259000013
Figure 0007634259000013

この場合、算出手段15は、平均絶対偏差の差SS1を式(13)のSSzに代入して類似性PS1を算出し、平均絶対偏差の差SS2を式(13)のSSzに代入して類似性PS2を算出し、平均絶対偏差の差SS3を式(13)のSSzに代入して類似性PS3を算出する。 In this case, the calculation means 15 calculates the similarity P S1 by substituting the difference S S1 in the mean absolute deviations into S Sz in formula (13), calculates the similarity P S2 by substituting the difference S S2 in the mean absolute deviations into S Sz in formula (13), and calculates the similarity P S3 by substituting the difference S S3 in the mean absolute deviations into S Sz in formula (13 ) .

算出手段15は、類似性PS1,PS2,PS3を算出すると、その算出した類似性PS1,PS2,PS3を抽出手段14へ出力する。 After calculating the similarities P S1 , P S2 , and P S3 , the calculation means 15 outputs the calculated similarities P S1 , P S2 , and P S3 to the extraction means 14 .

抽出手段14は、類似性PS1,PS2,PS3を算出手段15から受けると、類似性PS1,PS2,PS3のうちの最も高い類似性PS_highestを検出する。そして、抽出手段14は、ホスト情報データベース13に格納された対応表TBL3を参照して、最も高い類似性PS_highestが得られるときのスキャン応答遅延{RTTm’_known}_similarity(m’=1’~M’)(=スキャン応答遅延{RTTm’_known}_1(m’=1’~M’)、スキャン応答遅延{RTTm’_known}_2(m’=1’~M’)、およびスキャン応答遅延{RTTm’_known}_3(m’=1’~M’)のいずれか)を検出する。また、抽出手段14は、スキャン応答遅延{RTTm’_known}_similarity(m’=1’~M’)とともにネットワークスキャンの既知の推定結果を推定するために用いられる通信特性{CMbestm’_known}_similarity(m’=1’~M’)(=通信特性{CMbestm’_known}_1(m’=1’~M’)、通信特性{CMbestm’_known}_2(m’=1’~M’)、および通信特性{CMbestm’_known}_3(m’=1’~M’)のいずれか)を検出する。 When the extraction means 14 receives the similarities P S1 , P S2 , and P S3 from the calculation means 15, it detects the highest similarity P S_highest among the similarities P S1 , P S2 , and P S3 . Then, the extraction means 14 refers to the correspondence table TBL3 stored in the host information database 13 and detects the scan response delay {RTT m' _known}_similarity (m'=1' to M') (= any of scan response delay {RTT m' _known}_1 (m'=1' to M'), scan response delay {RTT m' _known}_2 (m'=1' to M'), and scan response delay {RTT m' _known}_3 (m'=1' to M')) when the highest similarity P S_highest is obtained. In addition, the extraction means 14 detects a communication characteristic {CMbest m' _known} _similarity (m' = 1' to M') (= any one of communication characteristic {CMbest m' _known} _1 (m' = 1' to M'), communication characteristic {CMbest m' _known} _2 (m' = 1' to M'), and communication characteristic {CMbest m' _known} _3 (m' = 1' to M')) used to estimate a known estimation result of a network scan together with a scan response delay {RTT m' _known} _similarity (m' = 1' to M').

そうすると、抽出手段14は、スキャン応答遅延{RTTm’_known}_similarity(m’=1’~M’)と通信特性{CMbestm’_known}_similarity(m’=1’~M’)とからなる標準サンプルデータD_similarityを生成し、その生成した標準サンプルデータD_similarityを推定手段16へ出力する。 Then, the extraction means 14 generates standard sample data D_similarity consisting of the scan response delay {RTT m' _known}_similarity (m' = 1' to M') and the communication characteristic {CMbest m' _known}_similarity (m' = 1' to M'), and outputs the generated standard sample data D_similarity to the estimation means 16.

また、抽出手段14は、ホスト情報データベース13に格納された対応表TBL1(または対応表TBL2)を参照してスキャン応答遅延RTT_unknown~RTT_unknown(=スキャン応答遅延RTT(m=1~M))を検出し、その検出したスキャン応答遅延RTT_unknown~RTT_unknown(=スキャン応答遅延RTT(m=1~M))と、通信特性CMbest_unknown_m(m=1~M)とからなるサンプルデータD_unknownを生成し、その生成したサンプルデータD_unknownを推定手段16へ出力する。 In addition, the extraction means 14 detects scan response delays RTT 1 _unknown to RTT M _unknown (= scan response delays RTT m (m = 1 to M)) by referring to correspondence table TBL1 (or correspondence table TBL2) stored in the host information database 13, generates sample data D_unknown consisting of the detected scan response delays RTT 1 _unknown to RTT M _unknown (= scan response delays RTT m (m = 1 to M)) and communication characteristics CMbest_unknown_m (m = 1 to M), and outputs the generated sample data D_unknown to the estimation means 16.

推定手段16は、標準サンプルデータD_similarityおよびサンプルデータD_unknownを抽出手段14から受ける。 The estimation means 16 receives the standard sample data D_similarity and the sample data D_unknown from the extraction means 14.

そして、推定手段16は、以下に説明する方法によって、標準サンプルデータD_similarityを用いて推定アルゴリズムALGを最適アルゴリズムに更新する。 The estimation means 16 then updates the estimation algorithm ALG to the optimal algorithm using the standard sample data D_similarity in the manner described below.

図23は、推定アルゴリズムALGを訓練するときのデータを示す図である。図23を参照して、推定手段16は、標準サンプルデータD_similarityを用いて推定アルゴリズムALGを訓練するとき、標準サンプルデータD_similarityをトレーニングデータとテストデータとに分割する。この場合、推定手段16は、例えば、トレーニングデータの割合が80%になり、テストデータの割合が20%になるように標準サンプルデータD_similarityをトレーニングデータとテストデータとに分割する。なお、標準サンプルデータD_similarityをトレーニングデータとテストデータとに分割するときのトレーニングデータの割合は、80%以外であってもよく、テストデータの割合は、20%以外であってもよい。 Figure 23 is a diagram showing data when training the estimation algorithm ALG. With reference to Figure 23, when training the estimation algorithm ALG using the standard sample data D_similarity, the estimation means 16 divides the standard sample data D_similarity into training data and test data. In this case, the estimation means 16 divides the standard sample data D_similarity into training data and test data so that the proportion of training data is 80% and the proportion of test data is 20%, for example. Note that when dividing the standard sample data D_similarity into training data and test data, the proportion of training data may be other than 80%, and the proportion of test data may be other than 20%.

その後、推定手段16は、トレーニングデータをトレーニングセットと検証セットとに分割する。この場合、推定手段16は、例えば、トレーニングセットの割合が50%になり、検証セットの割合が50%になるようにトレーニングデータをトレーニングセットと検証セットとに分割する。なお、トレーニングセットの割合および検証セットの割合は、50%以外であってもよい。 Then, the estimation means 16 divides the training data into a training set and a validation set. In this case, the estimation means 16 divides the training data into a training set and a validation set so that the proportion of the training set is 50% and the proportion of the validation set is 50%, for example. Note that the proportions of the training set and the validation set may be other than 50%.

推定手段16は、トレーニングデータをトレーニングセットと検証セットとに分割した後、トレーニングセットをU個のサブセットd~dに分割する。サブセットd~dの各々は、nサイズのデータからなる。なお、nは、例えば、8である。また、推定手段16は、検証セットをU’個のサブセットV1’~VU’に分割する。そして、トレーニングセットのデータサイズをDとすると、U=INT(D/n)である。 The estimation means 16 divides the training data into a training set and a validation set, and then divides the training set into U subsets d 1 to d U. Each of the subsets d 1 to d U is made up of data of size n. Here, n is, for example, 8. The estimation means 16 also divides the validation set into U' subsets V 1' to V U' . Then, if the data size of the training set is D S , then U=INT(D S /n).

図24は、推定アルゴリズムALGを訓練するときのサンプルデータの概念図である。図24を参照して、推定アルゴリズムALGを訓練するとき、推定手段16は、モデリング用の初期のサンプルデータを作成する。より具体的には、推定手段16は、図3に示す対応表TBL3からスキャン応答遅延{RTT1’_known}_1~{RTTM’_known}_1および通信特性{CMbest1’_known}_1~{CMbestM’_known}_1を読み出し、その読み出したスキャン応答遅延{RTT1’_known}_1~{RTTM’_known}_1および通信特性{CMbest1’_known}_1~{CMbestM’_known}_1から標準サンプルデータD_standard_1を生成する。 Fig. 24 is a conceptual diagram of sample data when training the estimation algorithm ALG. Referring to Fig. 24, when training the estimation algorithm ALG, the estimation means 16 creates initial sample data for modeling. More specifically, estimation means 16 reads out scan response delays {RTT 1' _known}_1 to {RTT M' _known}_1 and communication characteristics {CMbest 1' _known}_1 to {CMbest M' _known}_1 from correspondence table TBL3 shown in FIG. 3, and generates standard sample data D_standard_1 from the read scan response delays {RTT 1' _known}_1 to {RTT M' _known}_1 and communication characteristics {CMbest 1' _known}_1 to {CMbest M' _known}_1.

また、推定手段16は、対応表TBL3からスキャン応答遅延{RTT1’_known}_2~{RTTM’_known}_2および通信特性{CMbest’_known}_2~{CMbestM’_known}_2を読み出し、その読み出したスキャン応答遅延{RTT1’_known}_2~{RTTM’_known}_2および通信特性{CMbest1’_known}_2~{CMbestM’_known}_2から標準サンプルデータD_standard_2を生成する。 In addition, estimation means 16 reads out scan response delays {RTT 1' _known}_2 to {RTT M' _known}_2 and communication characteristics {CMbest 1 ' _known}_2 to {CMbest M' _known}_2 from correspondence table TBL3, and generates standard sample data D_standard_2 from the read scan response delays {RTT 1' _known}_2 to {RTT M' _known}_2 and communication characteristics {CMbest 1' _known}_2 to {CMbest M' _known}_2.

更に、推定手段16は、対応表TBL3からスキャン応答遅延{RTT1’_known}_3~{RTTM’_known}_3および通信特性{CMbest1’_known}_3~{CMbestM’_known}_3を読み出し、その読み出したスキャン応答遅延{RTT1’_known}_3~{RTTM’_known}_3および通信特性{CMbest1’_known}_3~{CMbestM’_known}_3から標準サンプルデータD_standard_3を生成する。 Furthermore, estimation means 16 reads out scan response delays {RTT 1' _known}_3 to {RTT M' _known}_3 and communication characteristics {CMbest 1' _known}_3 to {CMbest M' _known}_3 from correspondence table TBL3, and generates standard sample data D_standard_3 from the read scan response delays {RTT 1' _known}_3 to {RTT M' _known}_3 and communication characteristics {CMbest 1' _known}_3 to {CMbest M' _known}_3.

そして、推定手段16は、次のようにして初期のサンプルデータD_sample_initialを生成する(図24の(a)参照)。この場合、推定手段16は、標準サンプルデータD_standard_1の複数のサブセットd1_1~dU_1から1つのサブセットd1_initialを選択し、標準サンプルデータD_standard_2の複数のサブセットd1_2~dU_2から1つのサブセットd2_initialを選択し、標準サンプルデータD_standard_3の複数のサブセットd1_3~dU_3から1つのサブセットd3_initialを選択する。そして、標準サンプルデータD_standard_1、標準サンプルデータD_standard_2、および標準サンプルデータD_standard_3における“1”,“2”,“3”は、それぞれ、ネットワークスキャンの結果が“正常”であることを示す識別コードID_code=1、ネットワークスキャンの結果が“通信品質不十分”であることを示す識別コードID_code=2、およびネットワークスキャンの結果が“ネットワーク混雑”であることを示す識別コードID_code=3を表すので、推定手段16は、サブセットd1_initial,d2_initial,d3_initialを選択すると、この識別コードID_code=1,2,3を介してサブセットd1_initial,d2_initial,d3_initialを結合して初期のサンプルデータD_sample_initialを生成する。 Then, the estimation means 16 generates the initial sample data D_sample_initial as follows (see FIG. 24(a)). In this case, the estimation means 16 selects one subset d 1 _initial from the multiple subsets d 1 _1 to d U _1 of the standard sample data D_standard_1, selects one subset d 2 _initial from the multiple subsets d 1 _2 to d U _2 of the standard sample data D_standard_2 , and selects one subset d 3 _initial from the multiple subsets d 1 _3 to d U _3 of the standard sample data D_standard_3. Then, "1", "2", and "3" in the standard sample data D_standard_1, D_standard_2, and D_standard_3 respectively represent the identification code ID_code=1 indicating that the result of the network scan is "normal", the identification code ID_code=2 indicating that the result of the network scan is "insufficient communication quality", and the identification code ID_code=3 indicating that the result of the network scan is "network congestion", and therefore the estimation means 16 selects the subsets d1_initial , d2_initial , and d3_initial , and combines the subsets d1_initial , d2_initial, and d3_initial via the identification codes ID_code=1, 2 , and 3 to generate initial sample data D_sample_initial.

なお、複数のサブセットd1_1~dU_1の“1”は、標準サンプルデータD_standard_1の“1”に対応し、複数のサブセットd1_2~dU_2の“2”は、標準サンプルデータD_standard_2の“2”に対応し、複数のサブセットd1_3~dU_3の“3”は、標準サンプルデータD_standard_3の“3”に対応している。また、複数のサブセットd1_1~dU_1、複数のサブセットd1_2~dU_2および複数のサブセットd1_3~dU_3からそれぞれ1つのサブセットd1_initial,d2_initial,d3_initialをランダムに選択してもよく、何からの選択方法に従って選択してもよい。 In addition, "1" of the multiple subsets d 1_1 to d U_1 corresponds to "1" of the standard sample data D_standard_1, "2" of the multiple subsets d 1_2 to d U_2 corresponds to "2" of the standard sample data D_standard_2, and "3" of the multiple subsets d 1_3 to d U_3 corresponds to "3" of the standard sample data D_standard_3. In addition, one subset d 1_initial , d 2_initial , d 3_initial may be selected randomly from the multiple subsets d 1_1 to d U_1 , the multiple subsets d 1_2 to d U_2 , and the multiple subsets d 1_3 to d U_3 , respectively, or may be selected according to any selection method.

図23に示すように、サブセットd~dは、標準サンプルデータD_similarityから生成される。そして、標準サンプルデータD_similarityは、標準サンプルデータD_standard_1~標準サンプルデータD_standard_3のうちでサンプルデータD_unknownと最も高い類似性を有するサンプルデータである。 23, the subsets d 1 to d U are generated from the standard sample data D_similarity. The standard sample data D_similarity is the sample data that has the highest similarity to the sample data D_unknown among the standard sample data D_standard_1 to D_standard_3.

その結果、サブセットd~dは、標準サンプルデータD_standard_1がサンプルデータD_unknownと最も高い類似性を有するとき、図23において説明した方法によって標準サンプルデータD_standard_1から生成される。また、サブセットd~dは、標準サンプルデータD_standard_2がサンプルデータD_unknownと最も高い類似性を有するとき、図23において説明した方法によって標準サンプルデータD_standard_2から生成される。更に、サブセットd~dは、標準サンプルデータD_standard_3がサンプルデータD_unknownと最も高い類似性を有するとき、図23において説明した方法によって標準サンプルデータD_standard_3から生成される。 As a result, the subsets d 1 to d U are generated from the standard sample data D_standard_1 by the method described in Fig. 23 when the standard sample data D_standard_1 has the highest similarity to the sample data D_unknown. Also, the subsets d 1 to d U are generated from the standard sample data D_standard_2 by the method described in Fig. 23 when the standard sample data D_standard_2 has the highest similarity to the sample data D_unknown. Furthermore, the subsets d 1 to d U are generated from the standard sample data D_standard_3 by the method described in Fig. 23 when the standard sample data D_standard_3 has the highest similarity to the sample data D_unknown.

サブセットd~dが標準サンプルデータD_standard_1から生成されたとき、モデリング用の初期のサンプルデータD_sample_initialにおける標準サンプルデータD_standard_1をサブセットdによって置き換えることによって、モデリング用の仮のサンプルデータD_sample_tentative(D1)が生成される(図24の(b)参照)。なお、D_sample_tentative(D1)の“D1”は、初期のサンプルデータD_sample_initialにおける標準サンプルデータD_standard_1がサブセットdによって置き換えられたことを表す。 When the subsets d 1 to d U are generated from the standard sample data D_standard_1, the standard sample data D_standard_1 in the initial sample data D_sample_initial for modeling is replaced by the subset d u to generate tentative sample data D_sample_tentative (D1) for modeling (see FIG. 24B). Note that "D1" in D_sample_tentative (D1) indicates that the standard sample data D_standard_1 in the initial sample data D_sample_initial has been replaced by the subset d u .

また、サブセットd~dが標準サンプルデータD_standard_2から生成されたとき、モデリング用の初期のサンプルデータD_sample_initialにおける標準サンプルデータD_standard_2をサブセットdによって置き換えることによって、モデリング用の仮のサンプルデータD_sample_tentative(D2)が生成される(図24の(c)参照)。なお、D_sample_tentative(D2)の“D2”は、初期のサンプルデータD_sample_initialにおける標準サンプルデータD_standard_2がサブセットdによって置き換えられたことを表す。 Furthermore, when the subsets d 1 to d U are generated from the standard sample data D_standard_2, the standard sample data D_standard_2 in the initial sample data D_sample_initial for modeling is replaced by the subset d u to generate tentative sample data D_sample_tentative (D2) for modeling (see FIG. 24(c)). Note that "D2" in D_sample_tentative (D2) indicates that the standard sample data D_standard_2 in the initial sample data D_sample_initial has been replaced by the subset d u .

更に、サブセットd~dが標準サンプルデータD_standard_3から生成されたとき、モデリング用の初期のサンプルデータD_sample_initialにおける標準サンプルデータD_standard_3をサブセットdによって置き換えることによって、モデリング用の仮のサンプルデータD_sample_tentative(D3)が生成される(図24の(d)参照)。なお、D_sample_tentative(D3)の“D3”は、初期のサンプルデータD_sample_initialにおける標準サンプルデータD_standard_3がサブセットdによって置き換えられたことを表す。 Furthermore, when the subsets d 1 to d U are generated from the standard sample data D_standard_3, the standard sample data D_standard_3 in the initial sample data D_sample_initial for modeling is replaced by the subset d u to generate tentative sample data D_sample_tentative (D3) for modeling (see FIG. 24(d)). Note that "D3" in D_sample_tentative (D3) indicates that the standard sample data D_standard_3 in the initial sample data D_sample_initial has been replaced by the subset d u .

図25は、モデリング用の仮のサンプルデータの更新を示す概念図である。なお、図25においては、サブセットd~dが標準サンプルデータD_standard_1から生成された場合を例にしてモデリング用の仮のサンプルデータD_sample_tentative(D1)を更新する方法について説明する。 Fig. 25 is a conceptual diagram showing an update of tentative sample data for modeling. In Fig. 25, a method of updating tentative sample data for modeling D_sample_tentative (D1) is described using an example in which subsets d 1 to d U are generated from standard sample data D_standard_1.

図25を参照して、推定手段16は、最初に、上述した方法によって、モデリング用の初期のサンプルデータD_sample_initialを作成する。その後、推定手段16は、サンプルデータD_sample_initialの標準サンプルデータD_standard_1をサブセットdによって置き換えて初期のサンプルデータD_sample_initialをモデリング用の仮のサンプルデータD_sample_tentative_1に更新する。そして、初期のサンプルデータD_sample_initialを仮のサンプルデータD_sample_tentative_1に更新することによって、初期のサンプルデータD_sample_initialは、「古いトレーニングサンプル」になり、仮のサンプルデータD_sample_tentative_1は、「新しいトレーニングサンプル」になる。 25, the estimation means 16 first creates initial sample data D_sample_initial for modeling by the above-mentioned method. After that, the estimation means 16 replaces the standard sample data D_standard_1 of the sample data D_sample_initial by the subset d 1 to update the initial sample data D_sample_initial to tentative sample data D_sample_tentative_1 for modeling. Then, by updating the initial sample data D_sample_initial to the tentative sample data D_sample_tentative_1, the initial sample data D_sample_initial becomes the "old training sample" and the tentative sample data D_sample_tentative_1 becomes the "new training sample".

その後、推定手段16は、仮のサンプルデータD_sample_tentative_1(=「新しいトレーニングサンプル」)を用いてネットワークスキャンの結果を推定したときの評価指数が初期のサンプルデータD_sample_initial(=「古いトレーニングサンプル」)を用いてネットワークスキャンの結果を推定したときの評価指数よりも良かった場合、仮のサンプルデータD_sample_tentative_1は、「古いトレーニングサンプル」になる。 Then, if the estimation means 16 determines that the evaluation index when estimating the results of the network scan using the tentative sample data D_sample_tentative_1 (= "new training sample") is better than the evaluation index when estimating the results of the network scan using the initial sample data D_sample_initial (= "old training sample"), the tentative sample data D_sample_tentative_1 becomes the "old training sample."

引き続いて、推定手段16は、仮のサンプルデータD_sample_tentative_1のサブセットdをサブセットdによって置き換えることによって仮のサンプルデータD_sample_tentative_1を仮のサンプルデータD_sample_tentative_2に更新する。そして、仮のサンプルデータD_sample_tentative_2(=「新しいトレーニングサンプル」)を用いてネットワークスキャンの結果を推定したときの評価指数が「古いトレーニングサンプル」を用いてネットワークスキャンの結果を推定したときの評価指数よりも良かった場合、仮のサンプルデータD_sample_tentative_2は、「古いトレーニングサンプル」になる。なお、仮のサンプルデータD_sample_tentative_2(=「新しいトレーニングサンプル」)と「古いトレーニングサンプル」との間で評価指数を比較する場合、「古いトレーニングサンプル」は、前回の評価指数の比較において、仮のサンプルデータD_sample_tentative_1を用いてネットワークスキャンの結果を推定したときの評価指数が初期のサンプルデータD_sample_initialを用いてネットワークスキャンの結果を推定したときの評価指数よりも良かったとき、仮のサンプルデータD_sample_tentative_1からなり、初期のサンプルデータD_sample_initialを用いてネットワークスキャンの結果を推定したときの評価指数が仮のサンプルデータD_sample_tentative_1を用いてネットワークスキャンの結果を推定したときの評価指数よりも良かったとき、初期のサンプルデータD_sample_initialからなる。つまり、評価指数が良かった方のサンプルデータが、次回の評価指数の比較において、比較対象の「古いトレーニングサンプル」になる。 Next, the estimation means 16 updates the tentative sample data D_sample_tentative_1 to tentative sample data D_sample_tentative_2 by replacing the subset d 1 of the tentative sample data D_sample_tentative_1 with the subset d 2. Then, if the evaluation index when the result of the network scan is estimated using the tentative sample data D_sample_tentative_2 (= "new training sample") is better than the evaluation index when the result of the network scan is estimated using the "old training sample", the tentative sample data D_sample_tentative_2 becomes the "old training sample". In addition, when comparing the evaluation index between the tentative sample data D_sample_tentative_2 (= "new training sample") and the "old training sample", the "old training sample" is made up of the tentative sample data D_sample_tentative_1 if, in the previous comparison of evaluation indices, the evaluation index when the result of the network scan was estimated using the tentative sample data D_sample_tentative_1 was better than the evaluation index when the result of the network scan was estimated using the initial sample data D_sample_initial, and is made up of the initial sample data D_sample_initial if the evaluation index when the result of the network scan was estimated using the initial sample data D_sample_initial was better than the evaluation index when the result of the network scan was estimated using the tentative sample data D_sample_tentative_1. In other words, the sample data with the better evaluation index will become the "old training sample" to be compared in the next comparison of evaluation indexes.

更に引き続いて、推定手段16は、仮のサンプルデータD_sample_tentative_2のサブセットdをサブセットdによって置き換えることによって仮のサンプルデータD_sample_tentative_2を仮のサンプルデータD_sample_tentative_3に更新する。そして、仮のサンプルデータD_sample_tentative_3を用いてネットワークスキャンの結果を推定したときの評価指数が「古いトレーニングサンプル」を用いてネットワークスキャンの結果を推定したときの評価指数よりも良かった場合、仮のサンプルデータD_sample_tentative_3は、「古いトレーニングサンプル」になる。 Furthermore, the estimation means 16 continues by replacing the subset d 2 of the tentative sample data D_sample_tentative_2 with the subset d 3 , thereby updating the tentative sample data D_sample_tentative_2 to the tentative sample data D_sample_tentative_3. Then, if the evaluation index when the result of the network scan is estimated using the tentative sample data D_sample_tentative_3 is better than the evaluation index when the result of the network scan is estimated using the "old training sample", the tentative sample data D_sample_tentative_3 becomes the "old training sample".

以下、同様にして、推定手段16は、仮のサンプルデータD_sample_tentative_uを仮のサンプルデータD_sample_tentative_u+1に更新する処理を繰り返し、最終的に、仮のサンプルデータD_sample_tentative_Uに更新する。 The estimation means 16 then repeats the process of updating the provisional sample data D_sample_tentative_u to the provisional sample data D_sample_tentative_u+1 in a similar manner, and finally updates it to the provisional sample data D_sample_tentative_U.

このように、推定手段16は、初期のサンプルデータD_sample_initialの標準サンプルデータD_standard_1をU個のサブセットd~dによって順次置き換えることによって、初期のサンプルデータD_sample_initialを仮のサンプルデータD_sample_tentative_1~D_sample_tentative_Uに順次更新する。 In this way, the estimation means 16 successively replaces the standard sample data D_standard — 1 of the initial sample data D_sample_initial with U subsets d 1 to d U , thereby successively updating the initial sample data D_sample_initial to tentative sample data D_sample_tentative — 1 to D_sample_tentative_U.

そして、標準サンプルデータD_standard_1がサンプルデータD_unknownと最も高い類似性を有するとき、初期のサンプルデータD_sample_initialおよび仮のサンプルデータD_sample_tentative_1~D_sample_tentative_Uが推定アルゴリズムALGの訓練に用いられる。 Then, when the standard sample data D_standard_1 has the highest similarity to the sample data D_unknown, the initial sample data D_sample_initial and the tentative sample data D_sample_tentative_1 to D_sample_tentative_U are used to train the estimation algorithm ALG.

なお、標準サンプルデータD_standard_2がサンプルデータD_unknownと最も高い類似性を有するとき、図24の(c)に示す仮のサンプルデータD_sample_tentative(D2)が仮のサンプルデータD_sample_tentative_1を構成し、推定手段16は、図25において説明した方法によって、初期のサンプルデータD_sample_initialを仮のサンプルデータD_sample_tentative_1~D_sample_tentative_Uに順次更新する。 When the standard sample data D_standard_2 has the highest similarity to the sample data D_unknown, the tentative sample data D_sample_tentative (D2) shown in (c) of FIG. 24 constitutes the tentative sample data D_sample_tentative_1, and the estimation means 16 sequentially updates the initial sample data D_sample_initial to tentative sample data D_sample_tentative_1 to D_sample_tentative_U by the method described in FIG. 25.

また、標準サンプルデータD_standard_3がサンプルデータD_unknownと最も高い類似性を有するとき、図24の(d)に示す仮のサンプルデータD_sample_tentative(D3)が仮のサンプルデータD_sample_tentative_1を構成し、推定手段16は、図25において説明した方法によって、初期のサンプルデータD_sample_initialを仮のサンプルデータD_sample_tentative_1~D_sample_tentative_Uに順次更新する。 Furthermore, when the standard sample data D_standard_3 has the highest similarity to the sample data D_unknown, the tentative sample data D_sample_tentative (D3) shown in (d) of Figure 24 constitutes the tentative sample data D_sample_tentative_1, and the estimation means 16 sequentially updates the initial sample data D_sample_initial to the tentative sample data D_sample_tentative_1 to D_sample_tentative_U by the method described in Figure 25.

上述したように、初期のサンプルデータD_sample_initialは、標準サンプルデータD_standard_1~D_standard_3を結合した構成からなり、仮のサンプルデータD_sample_tentative_1~D_sample_tentative_Uは、標準サンプルデータD_similarityが標準サンプルデータD_standard_1~D_standard_3のうちのいずれから構成されるかに応じて、それぞれ、初期のサンプルデータD_sample_initialにおける標準サンプルデータD_standard_1~D_standard_3のいずれかがサブセットd~dによって置き換えられた構成からなる。そして、サブセットd~dは、標準サンプルデータD_similarityを構成する標準サンプルデータD_standard_1~D_standard_3のうちのいずれから構成される。 As described above, the initial sample data D_sample_initial is composed of the standard sample data D_standard_1 to D_standard_3 combined, and the tentative sample data D_sample_tentative_1 to D_sample_tentative_U are composed of any of the standard sample data D_standard_1 to D_standard_3 in the initial sample data D_sample_initial replaced by a subset d 1 to d U , depending on which of the standard sample data D_standard_1 to D_standard_3 the standard sample data D_similarity is composed of. The subsets d 1 to d U are each composed of any one of the standard sample data D_standard_ 1 to D_standard_ 3 that make up the standard sample data D_similarity.

従って、初期のサンプルデータD_sample_initialおよび仮のサンプルデータD_sample_tentative_1~D_sample_tentative_Uは、基本的に、標準サンプルデータD_standard_1~D_standard_3のそれぞれ一部を結合した構成からなる。 Therefore, the initial sample data D_sample_initial and the tentative sample data D_sample_tentative_1 to D_sample_tentative_U are basically composed of a combination of parts of the standard sample data D_standard_1 to D_standard_3.

そして、初期のサンプルデータD_sample_initialおよび仮のサンプルデータD_sample_tentative_1~D_sample_tentative_Uが標準サンプルデータD_standard_1~D_standard_3を結合した構成からなるのは、次の理由による。 The initial sample data D_sample_initial and the tentative sample data D_sample_tentative_1 to D_sample_tentative_U are composed of the standard sample data D_standard_1 to D_standard_3 combined for the following reasons.

後述するように、推定アルゴリズムALGは、ネットワークスキャンの結果が“正常”であるグループCLSと、ネットワークスキャンの結果が“通信品質不十分”であるグループCLSと、ネットワークスキャンの結果が“ネットワーク混雑”であるグループCLSとを扱うので、推定アルゴリズムALGを訓練するときのデータである初期のサンプルデータD_sample_initialおよび仮のサンプルデータD_sample_tentative_1~D_sample_tentative_Uを、ネットワークスキャンの結果が“正常”である通信環境において取得された標準サンプルデータD_standard_1と、ネットワークスキャンの結果が“通信品質不十分”である通信環境において取得された標準サンプルデータD_standard_2と、ネットワークスキャンの結果が“ネットワーク混雑”である通信環境において取得された標準サンプルデータD_standard_3とによって構成し、ネットワークスキャンの結果を“正常”、“通信品質不十分”および“ネットワーク混雑”のいずれにも正確に推定できるようにする必要があるからである。 As described later, the estimation algorithm ALG classifies a group CLS1 in which the result of the network scan is “normal”, a group CLS2 in which the result of the network scan is “inadequate communication quality”, and a group CLS3 in which the result of the network scan is “network congestion”. 3 , the initial sample data D_sample_initial and the tentative sample data D_sample_tentative_1 to D_sample_tentative_U, which are data used when training the estimation algorithm ALG, are composed of standard sample data D_standard_1 acquired in a communications environment where the network scan result is "normal", standard sample data D_standard_2 acquired in a communications environment where the network scan result is "inadequate communication quality", and standard sample data D_standard_3 acquired in a communications environment where the network scan result is "network congestion", so that the network scan result can be accurately estimated as any of "normal", "inadequate communication quality", and "network congestion".

図26は、推定アルゴリズムALGの訓練および評価の概念図である。図26を参照して、推定手段16は、初期のサンプルデータD_sample_initialを用いて推定アルゴリズムALGを訓練する。この場合、推定手段16は、初期のサンプルデータD_sample_initialを用いて推定アルゴリズムALGによってネットワークスキャンの結果を推定することを繰り返し実行するによって推定アルゴリズムALGを訓練する。 Figure 26 is a conceptual diagram of training and evaluation of the estimation algorithm ALG. Referring to Figure 26, the estimation means 16 trains the estimation algorithm ALG using the initial sample data D_sample_initial. In this case, the estimation means 16 trains the estimation algorithm ALG by repeatedly estimating the results of the network scan by the estimation algorithm ALG using the initial sample data D_sample_initial.

そして、推定手段16は、検証セットを用いてネットワークスキャンの結果を推定する。その後、推定手段16は、ネットワークスキャンの推定結果を評価指数EVDによって評価する。 Then, the estimation means 16 estimates the results of the network scan using the validation set. After that, the estimation means 16 evaluates the estimated results of the network scan using the evaluation index EVD.

引き続いて、推定手段16は、(I)仮のサンプルデータD_sample_tentative_uを用いて推定アルゴリズムALGを訓練すること、(II)検証セット(=サブセットV1’~VU’の全体)を用いてネットワークスキャンの結果を推定すること、および(III)ネットワークスキャンの推定結果を評価指数nEVD_uによって評価することを仮のサンプルデータD_sample_tentative_1~D_sample_tentative_Uの全てについて実行する。この場合、推定手段16は、(I)~(III)を1回実行する毎に、評価指数nEVD_uが評価指数EVDよりも大きいか否かを判定し、評価指数nEVD_uが評価指数EVDよりも大きいとき、評価指数nEVD_uを評価指数EVDに設定して評価指数EVDを評価指数nEVD_uによって更新し、評価指数nEVD_uが評価指数EVDよりも大きくないとき、評価指数EVDを更新しない(即ち、評価指数EVDを維持する)。そして、推定手段16は、初期のサンプルデータD_sample_initialを用いてネットワークスキャンの結果を推定したときの評価指数EVDが最も良かったとき、推定アルゴリズムALGの変数を維持し、仮のサンプルデータ(仮のサンプルデータD_sample_tentative_1~D_sample_tentative_Uのいずれか)を用いてネットワークスキャンの結果を推定したときの評価指数nEVD_uが最も良かったとき、最も大きい評価指数nEVD_uが得られるときの仮のサンプルデータ(仮のサンプルデータD_sample_tentative_1~D_sample_tentative_Uのいずれか)によって推定アルゴリズムALGの変数を置き換える。 Subsequently, the estimation means 16 performs the following steps for all of the tentative sample data D_sample_tentative_1 to D_sample_tentative_U: (I) training the estimation algorithm ALG using the tentative sample data D_sample_tentative_u; (II) estimating the results of the network scan using a validation set (= the entire subsets V1 ' to VU ' ); and (III) evaluating the estimated results of the network scan using an evaluation index nEVD_u. In this case, the estimation means 16 determines whether the evaluation index nEVD_u is greater than the evaluation index EVD each time it executes (I) to (III), and when the evaluation index nEVD_u is greater than the evaluation index EVD, it sets the evaluation index nEVD_u to the evaluation index EVD and updates the evaluation index EVD with the evaluation index nEVD_u, and when the evaluation index nEVD_u is not greater than the evaluation index EVD, it does not update the evaluation index EVD (i.e., it maintains the evaluation index EVD). Then, the estimation means 16 maintains the variables of the estimation algorithm ALG when the evaluation index EVD is the best when the result of the network scan is estimated using the initial sample data D_sample_initial, and when the evaluation index nEVD_u is the best when the result of the network scan is estimated using the hypothetical sample data (any of the hypothetical sample data D_sample_tentative_1 to D_sample_tentative_U), replaces the variables of the estimation algorithm ALG with the hypothetical sample data (any of the hypothetical sample data D_sample_tentative_1 to D_sample_tentative_U) when the largest evaluation index nEVD_u is obtained.

その後、推定手段16は、テストデータを用いてネットワークスキャンの結果を推定し、訓練モデル(訓練後の推定アルゴリズムALG)および訓練用のデータセットを承認するかを評価指数tEVDによって評価する。より具体的には、推定手段16は、評価指数tEVDが評価指数EVD(最終的に更新された評価指数EVD)以上であるとき、訓練モデル(訓練後の推定アルゴリズムALG)および訓練用のデータセットを承認し、評価指数tEVDが評価指数EVD(最終的に更新された評価指数EVD)以上でないとき、訓練モデル(訓練後の推定アルゴリズムALG)および訓練用のデータセットを承認しない。そして、推定手段16が訓練モデル(訓練後の推定アルゴリズムALG)および訓練用のデータセットを承認しないとき、変数が最終的に置き換えられた推定アルゴリズムALGを用いて、図26に示す(I)~(IV)が繰り返し実行される。 Then, the estimation means 16 estimates the results of the network scan using the test data, and evaluates whether to approve the training model (estimation algorithm ALG after training) and the training dataset based on the evaluation index tEVD. More specifically, when the evaluation index tEVD is equal to or greater than the evaluation index EVD (finally updated evaluation index EVD), the estimation means 16 approves the training model (estimation algorithm ALG after training) and the training dataset, and when the evaluation index tEVD is not equal to or greater than the evaluation index EVD (finally updated evaluation index EVD), the estimation means 16 does not approve the training model (estimation algorithm ALG after training) and the training dataset. Then, when the estimation means 16 does not approve the training model (estimation algorithm ALG after training) and the training dataset, (I) to (IV) shown in FIG. 26 are repeatedly executed using the estimation algorithm ALG with the variables finally replaced.

なお、承認された訓練用のデータセットは、次回の訓練および評価の実行時における初期のサンプルデータD_sample_initialになる。また、評価指数EVDは、後述するF1スコアFまたはマシューズ相関係数MCCからなり、評価指数nEVD_uは、後述するF1スコアnFまたはマシューズ相関係数nMCCからなり、評価指数tEVDは、後述するF1スコアtFまたはマシューズ相関係数tMCCからなる。 The approved training data set becomes the initial sample data D_sample_initial when the next training and evaluation are performed. The evaluation index EVD is composed of the F1 score F1 or the Matthews correlation coefficient MCC described later, the evaluation index nEVD_u is composed of the F1 score nF1 or the Matthews correlation coefficient nMCC described later, and the evaluation index tEVD is composed of the F1 score tF1 or the Matthews correlation coefficient tMCC described later.

このように、推定手段16は、初期のサンプルデータD_sample_initialおよび仮のサンプルデータD_sample_tentative_1~D_sample_tentative_Uを用いて推定アルゴリズムALGを訓練するとともに、検証セット(=サブセットV1’~VU’の全てからなる。)を用いて、訓練後の推定アルゴリズムALGによってネットワークスキャンの結果を推定したときの推定結果を評価指数EVD,nEVDによって評価し、最終的に、テストデータを用いて、訓練後の推定アルゴリズムALGおよび訓練用のデータセットを承認するかを評価指数tEVDによって評価する。 In this way, the estimation means 16 trains the estimation algorithm ALG using the initial sample data D_sample_initial and the tentative sample data D_sample_tentative_1 to D_sample_tentative_U, and evaluates the estimation results when the network scan results are estimated by the trained estimation algorithm ALG using a validation set (= consisting of all of the subsets V1 ' to VU ' ) using the evaluation indexes EVD and nEVD, and finally, uses the test data to evaluate whether the trained estimation algorithm ALG and the training data set are to be approved using the evaluation index tEVD.

図27は、図25に示すモデリング用の初期のサンプルデータD_sample_initialの具体例を示す図である。図28は、図23に示すトレーニングセットの具体例を示す図である。図29は、図23に示す検証セットの具体例を示す図である。図30は、図23に示すテストデータの具体例を示す図である。 Figure 27 is a diagram showing a specific example of the initial sample data D_sample_initial for modeling shown in Figure 25. Figure 28 is a diagram showing a specific example of the training set shown in Figure 23. Figure 29 is a diagram showing a specific example of the validation set shown in Figure 23. Figure 30 is a diagram showing a specific example of the test data shown in Figure 23.

なお、図27から図30においては、ネットワークスキャンの対象である端末装置の個数が8個(即ち、M’=8)であり、標準サンプルデータD_similarityのサンプル数が1個のIPアドレスAddm’について20個である場合を例にして、それぞれ、初期のサンプルデータD_sample_initialの具体例、トレーニングセットの具体例、検証セットの具体例およびテストデータの具体例を示す。 27 to 30, a specific example of the initial sample data D_sample_initial , a specific example of the training set, a specific example of the validation set, and a specific example of the test data are shown, using an example in which the number of terminal devices to be subjected to the network scan is 8 (i.e., M′=8) and the number of samples of the standard sample data D_similarity is 20 for one IP address Add m′.

図27を参照して、標準サンプルデータD_standard_1は、ネットワークスキャンの結果が“正常”である通信環境においてネットワークスキャンが実行されたときのスキャン応答遅延RTTm’と通信特性CMbestm’とからなる。従って、標準サンプルデータD_standard_1において、8個のスキャン応答遅延RTTm’の具体値および8個の通信特性CMbestm’の具体値は、図5に示す対応表TBL3に格納されたスキャン応答遅延{RTT1’_known}_1~{RTTM’_known}_1においてM’=8である場合の標準サンプルデータD_standard_1のサブセットである。 27, the standard sample data D_standard_1 is composed of scan response delays RTT m' and communication characteristics CMbest m' when a network scan is performed in a communication environment where the result of the network scan is "normal." Therefore, in the standard sample data D_standard_1, the eight specific values of the scan response delays RTT m' and the eight specific values of the communication characteristics CMbest m' are a subset of the standard sample data D_standard_1 when M'=8 in the scan response delays {RTT 1' _known}_1 to {RTT M' _known}_1 stored in the correspondence table TBL3 shown in FIG.

また、標準サンプルデータD_standard_2は、ネットワークスキャンの結果が“通信品質不十分”である通信環境においてネットワークスキャンが実行されたときのスキャン応答遅延RTTm’と通信特性CMbestm’とからなる。従って、標準サンプルデータD_standard_2において、8個のスキャン応答遅延RTTm’の具体値および8個の通信特性CMbestm’の具体値は、対応表TBL3に格納されたスキャン応答遅延{RTT1’_known}_2~{RTTM’_known}_2においてM’=8である場合の標準サンプルデータD_standard_2のサブセットである。 Moreover, the standard sample data D_standard_2 is composed of scan response delays RTT m' and communication characteristics CMbest m' when a network scan is performed in a communication environment where the result of the network scan is "insufficient communication quality." Therefore, in the standard sample data D_standard_2, the eight specific values of the scan response delays RTT m' and the eight specific values of the communication characteristics CMbest m' are a subset of the standard sample data D_standard_2 when M'=8 in the scan response delays {RTT 1' _known}_2 to {RTT M' _known}_2 stored in the correspondence table TBL3.

更に、標準サンプルデータD_standard_3は、ネットワークスキャンの結果が“ネットワーク混雑”である通信環境においてネットワークスキャンが実行されたときのスキャン応答遅延RTTm’と通信特性CMbestm’とからなる。従って、標準サンプルデータD_standard_3において、8個のスキャン応答遅延RTTm’の具体値および8個の通信特性CMbestm’の具体値は、対応表TBL3に格納されたスキャン応答遅延{RTT1’_known}_3~{RTTM’_known}_3においてM’=8である場合の標準サンプルデータD_standard_3のサブセットである。 Furthermore, the standard sample data D_standard_3 is composed of scan response delays RTT m' and communication characteristics CMbest m' when a network scan is performed in a communication environment where the result of the network scan is "network congestion." Therefore, in the standard sample data D_standard_3, the eight specific values of the scan response delays RTT m' and the eight specific values of the communication characteristics CMbest m' are a subset of the standard sample data D_standard_3 when M'=8 in the scan response delays {RTT 1' _known}_3 to {RTT M' _known}_3 stored in the correspondence table TBL3.

その結果、モデリング用の初期のサンプルデータD_sample_initialは、ネットワークスキャンの結果である“正常”に付与された識別コードD_code=1、ネットワークスキャンの結果である“通信品質不十分”に付与された識別コードD_code=2、およびネットワークスキャンの結果である“ネットワーク混雑”に付与された識別コードD_code=3によって、標準サンプルデータD_standard_1~D_standard_3を結合した構成からなる。 As a result, the initial sample data D_sample_initial for modeling is composed of the standard sample data D_standard_1 to D_standard_3 combined with the identification code D_code=1 assigned to the network scan result "normal," the identification code D_code=2 assigned to the network scan result "poor communication quality," and the identification code D_code=3 assigned to the network scan result "network congestion."

図28を参照して、トレーニングセットは、8個のサブセットd~dからなる。サブセットd~dの各々は、M’=8であるので、8個のスキャン応答遅延RTT1’~RTT8’と、8個の通信特性CMbest1’~CMbest8’とからなる。従って、サブセットd~dの各々において、縦方向は、8個の端末装置に対応した8個のスキャン応答遅延RTT1’~RTT8’と、8個の通信特性CMbest1’~CMbest8’とを示す。 28, the training set consists of eight subsets d 1 to d 8. Since M′=8, each of the subsets d 1 to d 8 consists of eight scan response delays RTT 1′ to RTT 8′ and eight communication characteristics CMbest 1′ to CMbest 8′ . Therefore, in each of the subsets d 1 to d 8 , the vertical direction indicates eight scan response delays RTT 1′ to RTT 8′ corresponding to eight terminal devices and eight communication characteristics CMbest 1′ to CMbest 8′ .

また、サブセットd~dの個数が8個であるのは、標準サンプルデータD_similarityのサンプル数が20個であるので、20×0.8×0.5=8となるからである。 The number of subsets d 1 to d 8 is eight because the number of samples in the standard sample data D_similarity is 20, which is 20×0.8×0.5=8.

更に、サブセットd~dの各々は、標準サンプルデータD_similarityが標準サンプルデータD_standard_1からなる場合、図5に示す対応表TBL3に格納されたスキャン応答遅延{RTT1’_known}_1~{RTTM’_known}_1および通信特性{CMbest1’_known}_1~{CMbestM’_known}_1からなり、標準サンプルデータD_similarityが標準サンプルデータD_standard_2からなる場合、図5に示す対応表TBL3に格納されたスキャン応答遅延{RTT1’_known}_2~{RTTM’_known}_2および通信特性{CMbest1’_known}_2~{CMbestM’_known}_2からなり、標準サンプルデータD_similarityが標準サンプルデータD_standard_3からなる場合、図5に示す対応表TBL3に格納されたスキャン応答遅延{RTT1’_known}_3~{RTTM’_known}_3および通信特性{CMbest1’_known}_3~{CMbestM’_known}_3からなる。 5. Furthermore, when the standard sample data D_similarity is made up of the standard sample data D_standard_1, each of the subsets d 1 to d 8 is made up of the scan response delays {RTT 1 ′ _known}_1 to {RTT M′ _known}_1 and the communication characteristics {CMbest 1 ′ _known}_1 to {CMbest M′ _known}_1 stored in the correspondence table TBL3 shown in FIG. 5. When the standard sample data D_similarity is made up of the standard sample data D_standard_2, each of the subsets d 1 to d 8 is made up of the scan response delays {RTT 1 ′ _known}_2 to {RTT M′ _known}_2 and the communication characteristics {CMbest 1 ′ _known}_2 to {CMbest M′ _known}_2 and the standard sample data D_similarity is standard sample data D_standard_3, the correspondence table TBL3 shown in FIG. 5 contains scan response delays {RTT 1' _known}_3 to {RTT M' _known}_3 and communication characteristics {CMbest 1' _known}_3 to {CMbest M' _known}_3.

更に、サブセットd~dの各々がスキャン応答遅延{RTT1’_known}_1~{RTT8’_known}_1および通信特性{CMbest1’_known}_1~{CMbest8’_known}_1からなる場合、図27に示す初期のサンプルデータD_sample_initialの標準サンプルデータD_standard_1をサブセットd~dで順次置き換えることによって図25に示す仮のサンプルデータD_sample_tentative_1~D_sample_tentative_U(U=8)が順次生成される。 Furthermore, when the subsets d 1 to d 8 each consist of scan response delays {RTT 1′ _known}_1 to {RTT 8′ _known}_1 and communication characteristics {CMbest 1′ _known}_1 to {CMbest 8′ _known}_1, the standard sample data D_standard_1 of the initial sample data D_sample_initial shown in FIG. 27 is sequentially replaced with the subsets d 1 to d 8 , thereby sequentially generating tentative sample data D_sample_tentative_1 to D_sample_tentative_U (U=8) shown in FIG. 25.

更に、サブセットd~dの各々がスキャン応答遅延{RTT1’_known}_2~{RTT8’_known}_2および通信特性{CMbest’_known}_22~{CMbest8’_known}_2からなる場合、図27に示す初期のサンプルデータD_sample_initialの標準サンプルデータD_standard_2をサブセットd~dで順次置き換えることによって図25に示す仮のサンプルデータD_sample_tentative_1~D_sample_tentative_U(U=8)が順次生成される。 Furthermore, when the subsets d 1 to d 8 each consist of scan response delays {RTT 1 ' _known} _2 to {RTT 8 ' _known} _2 and communication characteristics {CMbest 1 '_known} _22 to {CMbest 8 ' _known} _2, the standard sample data D_standard_2 of the initial sample data D_sample_initial shown in FIG. 27 is replaced sequentially with the subsets d 1 to d 8 , thereby sequentially generating tentative sample data D_sample_tentative_1 to D_sample_tentative_U (U = 8) shown in FIG. 25.

更に、サブセットd~dの各々がスキャン応答遅延{RTT1’_known}_3~{RTT8’_known}_3および通信特性{CMbest1’_known}_3~{CMbest8’_known}_3からなる場合、図27に示す初期のサンプルデータD_sample_initialの標準サンプルデータD_standard_3をサブセットd~dで順次置き換えることによって図25に示す仮のサンプルデータD_sample_tentative_1~D_sample_tentative_U(U=8)が順次生成される。 Furthermore, when the subsets d 1 to d 8 each consist of scan response delays {RTT 1′ _known} _3 to {RTT 8′ _known} _3 and communication characteristics {CMbest 1′ _known} _3 to {CMbest 8′ _known} _3, the standard sample data D_standard_3 of the initial sample data D_sample_initial shown in FIG. 27 is sequentially replaced with the subsets d 1 to d 8 , thereby sequentially generating tentative sample data D_sample_tentative_1 to D_sample_tentative_U (U=8) shown in FIG. 25.

図29を参照して、検証セットは、8個のサブセットV1’~V8’からなる。サブセットV1’~V8’の各々は、M’=8であるので、8個のスキャン応答遅延RTT1’~RTT8’と、8個の通信特性CMbest1’~CMbest8’とからなる。従って、サブセットV1’~V8’の各々において、縦方向は、8個の端末装置に対応した8個のスキャン応答遅延RTT1’~RTT8’と、8個の通信特性CMbest1’~CMbest8’とを示す。 29, the validation set consists of eight subsets V 1 ' to V 8 ' . Since M'=8, each of the subsets V 1 ' to V 8 ' consists of eight scan response delays RTT 1 ' to RTT 8 ' and eight communication characteristics CMbest 1 ' to CMbest 8 ' . Therefore, in each of the subsets V 1 ' to V 8 ' , the vertical direction indicates eight scan response delays RTT 1 ' to RTT 8 ' corresponding to eight terminal devices and eight communication characteristics CMbest 1 ' to CMbest 8 ' .

また、サブセットV1’~V8’の個数が8個である理由は、サブセットd~dの個数が8個である理由と同じである。 The reason why the number of subsets V 1 ' to V 8 ' is eight is the same as the reason why the number of subsets d 1 to d 8 is eight.

更に、サブセットV1’~V8’の各々は、標準サンプルデータD_similarityが標準サンプルデータD_standard_1からなる場合、図5に示す対応表TBL3に格納されたスキャン応答遅延{RTT1’_known}_1~{RTTM’_known}_1の一部および通信特性{CMbest1’_known}_1~{CMbestM’_known}_1の一部からなり、標準サンプルデータD_similarityが標準サンプルデータD_standard_2からなる場合、図5に示す対応表TBL3に格納されたスキャン応答遅延{RTT1’_known}_2~{RTTM’_known}_2の一部および通信特性{CMbest1’_known}_2~{CMbestM’_known}_2の一部からなり、標準サンプルデータD_similarityが標準サンプルデータD_standard_3からなる場合、図5に示す対応表TBL3に格納されたスキャン応答遅延{RTT1’_known}_3~{RTTM’_known}_3の一部および通信特性{CMbest1’_known}_3~{CMbestM’_known}_3の一部からなる。 5. Furthermore, when the standard sample data D_similarity is made up of the standard sample data D_standard_1, each of the subsets V 1 ′ to V 8 ′ is made up of a part of the scan response delays {RTT 1 ′ _known} _1 to {RTT M′ _known} _1 and a part of the communication characteristics {CMbest 1 ′ _known} _1 to {CMbest M′ _known} _1 stored in the correspondence table TBL3 shown in FIG. 5. When the standard sample data D_similarity is made up of the standard sample data D_standard_2, each of the subsets V 1 ′ to V 8 ′ is made up of a part of the scan response delays {RTT 1 ′ _known} _2 to {RTT M′ _known} _2 and a part of the communication characteristics { CMbest 5. When the standard sample data D_similarity consists of a portion of the scan response delays {RTT 1' _known}_3 to {RTT M' _known}_3 and a portion of the communication characteristics {CMbest 1' _known}_3 to {CMbest M' _known}_3, and when the standard sample data D_similarity consists of the standard sample data D_standard_3, the standard sample data D_similarity consists of a portion of the scan response delays {RTT 1' _known}_3 to {RTT M ' _known}_3 and a portion of the communication characteristics {CMbest 1' _known}_3 to {CMbest M' _known}_3.

図30を参照して、テストデータは、4個のサブセットTD~TDからなる。サブセットTD~TDの各々は、M’=8であるので、8個のスキャン応答遅延RTT1’~RTT8’と、8個の通信特性CMbest1’~CMbest8’とからなる。従って、サブセットTD~TDの各々において、縦方向は、8個の端末装置に対応した8個のスキャン応答遅延RTT1’~RTT8’と、8個の通信特性CMbest1’~CMbest8’とを示す。 30, the test data consists of four subsets TD 1 to TD 4. Since M'=8, each of the subsets TD 1 to TD 4 consists of eight scan response delays RTT 1' to RTT 8' and eight communication characteristics CMbest 1' to CMbest 8' . Therefore, in each of the subsets TD 1 to TD 4 , the vertical direction indicates eight scan response delays RTT 1' to RTT 8' corresponding to eight terminal devices and eight communication characteristics CMbest 1' to CMbest 8' .

また、サブセットTD~TDの個数が4個である理由は、標準サンプルデータD_similarityのサンプル数が1個のIPアドレスAddm’について20個であり、テストデータが標準サンプルデータD_similarityのサンプル数(=20)の20%(20×0.2=4)からなるからである。 The reason why the number of subsets TD 1 to TD 4 is four is that the number of samples of the standard sample data D_similarity is 20 for one IP address Add m' , and the test data consists of 20% (20×0.2=4) of the number of samples of the standard sample data D_similarity (=20).

更に、サブセットTD~TDの各々は、標準サンプルデータD_similarityが標準サンプルデータD_standard_1からなる場合、図5に示す対応表TBL3に格納されたスキャン応答遅延{RTT1’_known}_1~{RTTM’_known}_1の一部および通信特性{CMbest1’_known}_1~{CMbestM’_known}_1の一部からなり、標準サンプルデータD_similarityが標準サンプルデータD_standard_2からなる場合、図5に示す対応表TBL3に格納されたスキャン応答遅延{RTT1’_known}_2~{RTTM’_known}_2の一部および通信特性{CMbest1’_known}_2~{CMbestM’_known}_2の一部からなり、標準サンプルデータD_similarityが標準サンプルデータD_standard_3からなる場合、図5に示す対応表TBL3に格納されたスキャン応答遅延{RTT1’_known}_3~{RTTM’_known}_3の一部および通信特性{CMbest1’_known}_3~{CMbestM’_known}_3の一部からなる。 5. Furthermore, when the standard sample data D_similarity is made up of the standard sample data D_standard_1, each of the subsets TD 1 to TD 4 is made up of a part of the scan response delays {RTT 1 ' _known}_1 to {RTT M'_known }_1 and a part of the communication characteristics {CMbest 1 ' _known}_1 to {CMbest M'_known }_1 stored in the correspondence table TBL3 shown in FIG. 5. When the standard sample data D_similarity is made up of the standard sample data D_standard_2, each of the subsets TD 1 to TD 4 is made up of a part of the scan response delays {RTT 1 ' _known}_2 to {RTT M'_known }_2 and a part of the communication characteristics {CMbest 1 ' _known}_3 stored in the correspondence table TBL3 shown in FIG. 5. When the standard sample data D_similarity consists of a portion of the scan response delays {RTT 1' _known}_3 to {RTT M' _known}_3 and a portion of the communication characteristics {CMbest 1' _known}_3 to {CMbest M' _known}_3, and when the standard sample data D_similarity consists of the standard sample data D_standard_3, the standard sample data D_similarity consists of a portion of the scan response delays {RTT 1' _known}_3 to {RTT M ' _known}_3 and a portion of the communication characteristics {CMbest 1' _known}_3 to {CMbest M' _known}_3.

推定手段16は、初期のサンプルデータD_sample_initialおよび仮のサンプルデータD_sample_tentative_1~D_sample_tentative_Uを用いて推定アルゴリズムALGを訓練する。推定手段16は、仮のサンプルデータD_sample_tentative_1~D_sample_tentative_Uを用いて推定アルゴリズムALGを訓練する場合、図25および図28において説明した方法によって、サブセットd~dをそれぞれ含む仮のサンプルデータD_sample_tentative_1~D_sample_tentative_U(U=8)を順次生成し、その生成した仮のサンプルデータD_sample_tentative_1~D_sample_tentative_U(U=8)を用いて推定アルゴリズムALGよってネットワークスキャンの結果を推定することを繰り返し実行することによって推定アルゴリズムALGを訓練する。 The estimation means 16 trains an estimation algorithm ALG using the initial sample data D_sample_initial and the tentative sample data D_sample_tentative_1 to D_sample_tentative_U. When training the estimation algorithm ALG using the tentative sample data D_sample_tentative_1 to D_sample_tentative_U, the estimation means 16 sequentially generates tentative sample data D_sample_tentative_1 to D_sample_tentative_U (U=8) including subsets d 1 to d 8 , respectively, by the method described in Figures 25 and 28, and trains the estimation algorithm ALG by repeatedly estimating the results of the network scan by the estimation algorithm ALG using the generated tentative sample data D_sample_tentative_1 to D_sample_tentative_U (U=8).

推定手段16は、初期のサンプルデータD_sample_initialを用いて推定アルゴリズムALGを訓練した後、検証セットを用いて推定アルゴリズムALGによってネットワークスキャンの結果を推定し、ネットワークスキャンの推定結果に基づいて混同行列CFMを生成する。 The estimation means 16 trains the estimation algorithm ALG using the initial sample data D_sample_initial, then estimates the results of the network scan by the estimation algorithm ALG using the validation set, and generates a confusion matrix CFM based on the estimated results of the network scan.

また、推定手段16は、仮のサンプルデータD_sample_tentative_uを用いて推定アルゴリズムALGを訓練した後、検証セットを用いて推定アルゴリズムALGによってネットワークスキャンの結果を推定し、ネットワークスキャンの推定結果に基づいて混同行列nCFMを生成する。推定手段16は、この動作を仮のサンプルデータD_sample_tentative_1~D_sample_tentative_Uの全てについて実行する。 The estimation means 16 also trains the estimation algorithm ALG using the tentative sample data D_sample_tentative_u, and then estimates the results of the network scan with the estimation algorithm ALG using the validation set, and generates a confusion matrix nCFM based on the estimated results of the network scan. The estimation means 16 performs this operation for all of the tentative sample data D_sample_tentative_1 to D_sample_tentative_U.

図31は、混同行列の概念図である。ネットワークスキャンの結果を推定したときの既知の推定結果が“正常”、“通信品質不十分”および“ネットワーク混雑”の3種類であるので、図31においては、既知の推定結果が“正常”、“通信品質不十分”および“ネットワーク混雑”の3種類である場合について混同行列を示す。 Figure 31 is a conceptual diagram of a confusion matrix. When estimating the results of a network scan, there are three known estimated results: "normal", "inadequate communication quality", and "network congestion". Therefore, in Figure 31, a confusion matrix is shown for the three known estimated results: "normal", "inadequate communication quality", and "network congestion".

図31を参照して、TPは、想定した事象が発生した場合に、その発生(想定した事象の発生)を正しく推定した割合を示し、TNは、想定した事象が実際には発生しなかった場合に、そのこと(想定した事象が発生しなかったこと)を正しく推定した割合を示し、FNは、想定した事象が発生した場合に、その発生(想定した事象の発生)を別の事象に誤って推定した割合を示し、FPは、想定した事象が実際には発生しなかった場合に、誤って想定した事象が発生したと推定した割合を示す。また、図31の(a),(b),(c)において、列方向(縦方向)の“正常”、“通信品質不十分”および“ネットワーク混雑”は、実際に発生した事象を表し、行方向(横方向)の“正常”、“通信品質不十分”および“ネットワーク混雑”は、推定した事象を表す。更に、図31の(a)は、ネットワークスキャンの結果が“正常”であるときの混同行列を表し、図31の(b)は、ネットワークスキャンの結果が“通信品質不十分”であるときの混同行列を表し、図31の(c)は、ネットワークスキャンの結果が“ネットワーク混雑”であるときの混同行列を表す。 With reference to Fig. 31, TP indicates the percentage of cases where an assumed event occurred and the occurrence of the assumed event (occurrence of the assumed event) was correctly estimated, TN indicates the percentage of cases where an assumed event did not actually occur and the occurrence of the assumed event (non-occurrence of the assumed event) was correctly estimated, FN indicates the percentage of cases where an assumed event occurred and the occurrence of the assumed event (occurrence of the assumed event) was incorrectly estimated as another event, and FP indicates the percentage of cases where an assumed event did not actually occur and the occurrence of the assumed event was incorrectly estimated as occurring. Also, in Fig. 31 (a), (b), and (c), "Normal", "Insufficient communication quality", and "Network congestion" in the column direction (vertical direction) represent events that actually occurred, and "Normal", "Insufficient communication quality", and "Network congestion" in the row direction (horizontal direction) represent estimated events. Furthermore, (a) in FIG. 31 shows the confusion matrix when the result of the network scan is "normal," (b) in FIG. 31 shows the confusion matrix when the result of the network scan is "inadequate communication quality," and (c) in FIG. 31 shows the confusion matrix when the result of the network scan is "network congestion."

図31の(a)において、“正常”の行と“正常”の列との交差部のTPは、想定した“正常”の事象が発生した場合に、その発生(想定した“正常”の事象の発生)を正しく“正常”の事象に推定した割合を示し、“正常”の行と“通信品質不十分”の列との交差部のFNは、想定した“正常”の事象が発生した場合に、その“正常”の事象の発生を別の“通信品質不十分”の事象に誤って推定した割合を示し、“正常”の行と“ネットワーク混雑”の列との交差部のFNは、想定した“正常”の事象が発生した場合に、その“正常”の事象の発生を別の“ネットワーク混雑”の事象に誤って推定した割合を示す。 In FIG. 31(a), the TP at the intersection of the "Normal" row and the "Normal" column indicates the percentage of cases where an assumed "normal" event (the occurrence of an assumed "normal" event) is correctly estimated as a "normal" event, the FN at the intersection of the "Normal" row and the "Poor communication quality" column indicates the percentage of cases where an assumed "normal" event is incorrectly estimated as a different "poor communication quality" event, and the FN at the intersection of the "Normal" row and the "Network congestion" column indicates the percentage of cases where an assumed "normal" event is incorrectly estimated as a different "network congestion" event.

また、“通信品質不十分”の行と“正常”の列との交差部のFPは、想定した“正常”の事象ではない“通信品質不十分”の事象が発生した(即ち、想定した“正常”の事象が実際には発生しなかった)場合に、誤って想定した“正常”の事象が発生したと推定した割合を示し、“通信品質不十分”の行と“通信品質不十分”の列との交差部のTNは、想定した“正常”の事象ではない“通信品質不十分”の事象が発生した場合に、“通信品質不十分”の事象が発生したと推定した(即ち、想定した“正常”の事象が実際には発生しなかった場合に、そのこと(想定した“正常”の事象が発生しなかったこと)を正しく推定した)割合を示し、“通信品質不十分”の行と“ネットワーク混雑”の列との交差部のTNは、想定した“正常”の事象ではない“通信品質不十分”の事象が発生した場合に、“ネットワーク混雑”の事象が発生したと推定した(即ち、想定した“正常”の事象が実際には発生しなかった場合に、そのこと(想定した“正常”の事象が発生しなかったこと)を正しく推定した)割合を示す。 In addition, the FP at the intersection of the row of "inadequate communication quality" and the column of "normal" indicates the percentage of cases where an event of "inadequate communication quality" that is not an assumed "normal" event occurred (i.e., the assumed "normal" event did not actually occur), and the TN at the intersection of the row of "inadequate communication quality" and the column of "inadequate communication quality" indicates the percentage of cases where an event of "inadequate communication quality" that is not an assumed "normal" event occurred, and the TN at the intersection of the row of "inadequate communication quality" and the column of "network congestion ...network congestion" that is not an assumed "normal" event occurred, and the TN at the intersection of the row of "inadequate communication quality" and the column of "network congestion" indicates the percentage of cases where an event of "inadequate communication quality" that is not an assumed "normal" event occurred, and the

更に、“ネットワーク混雑”の行と“正常”の列との交差部のFPは、想定した“正常”の事象ではない“ネットワーク混雑”の事象が発生した(即ち、想定した“正常”の事象が実際には発生しなかった)場合に、誤って想定した“正常”の事象が発生したと推定した割合を示し、“ネットワーク混雑”の行と“通信品質不十分”の列との交差部のTNは、想定した“正常”の事象ではない“ネットワーク混雑”の事象が発生した場合に、“通信品質不十分”の事象が発生したと推定した(即ち、想定した“正常”の事象が実際には発生しなかった場合に、そのこと(想定した“正常”の事象が発生しなかったこと)を正しく推定した)割合を示し、“ネットワーク混雑”の行と“ネットワーク混雑”の列との交差部のTNは、想定した“正常”の事象ではない“ネットワーク混雑”の事象が発生した場合に、“ネットワーク混雑”の事象が発生したと推定した(即ち、想定した“正常”の事象が実際には発生しなかった場合に、そのこと(想定した“正常”の事象が発生しなかったこと)を正しく推定した)割合を示す。 Furthermore, the FP at the intersection of the "Network Congestion" row and the "Normal" column indicates the percentage of cases where a "Network Congestion" event that is not an assumed "normal" event occurred (i.e., the assumed "normal" event did not actually occur) was incorrectly estimated to have occurred as an assumed "normal" event, the TN at the intersection of the "Network Congestion" row and the "Inadequate Communication Quality" column indicates the percentage of cases where a "Network Congestion" event that is not an assumed "normal" event occurred was incorrectly estimated to have occurred as an "Inadequate Communication Quality" event (i.e., the assumed "normal" event did not actually occur) was correctly estimated, and the TN at the intersection of the "Network Congestion" row and the "Network Congestion" column indicates the percentage of cases where a "Network Congestion" event that is not an assumed "normal" event occurred was incorrectly estimated to have occurred (i.e., the assumed "normal" event did not actually occur) was correctly estimated.

図31の(b)において、“正常”の行と“正常”の列との交差部のTNは、想定した“通信品質不十分”ではない“正常”の事象が発生した場合に、“正常”の事象が発生したと推定した(即ち、想定した“通信品質不十分”の事象が実際には発生しなかった場合に、そのこと(想定した“通信品質不十分”の事象が発生しなかったこと)を正しく推定した)割合を示し、“正常”の行と“通信品質不十分”の列との交差部のFPは、想定した“通信品質不十分”ではない“正常”の事象が発生した(即ち、想定した“通信品質不十分”の事象が実際には発生しなかった)場合に、誤って想定した“通信品質不十分”の事象が発生したと推定した割合を示し、“正常”の行と“ネットワーク混雑”の列との交差部のTNは、想定した“通信品質不十分”ではない“正常”の事象が発生した場合に、“ネットワーク混雑”の事象が発生したと推定した(即ち、想定した“通信品質不十分”の事象が実際には発生しなかった場合に、そのこと(想定した“通信品質不十分”の事象が発生しなかったこと)を正しく推定した)割合を示す。 In FIG. 31(b), the TN at the intersection of the “Normal” row and the “Normal” column indicates the percentage of cases where a “normal” event occurred that was not the assumed “inadequate communication quality” but a “normal” event occurred (i.e., when the assumed “inadequate communication quality” event did not actually occur, the percentage of cases where the assumption (the assumed “inadequate communication quality” event did not occur) was correctly assumed), and the FP at the intersection of the “Normal” row and the “inadequate communication quality” column indicates the percentage of cases where a “normal” event occurred that was not the assumed “inadequate communication quality” but a “normal” event occurred (i.e., when the assumed “inadequate communication quality” event did not actually occur, the percentage of cases where the assumption The TN at the intersection of the "Normal" row and the "Network Congestion" column indicates the percentage of cases where a "Network Congestion" event was incorrectly assumed to have occurred when a "Normal" event occurred that was not the assumed "Inadequate Communication Quality" (i.e., the percentage of cases where a "Inadequate Communication Quality" event did not actually occur but was correctly assumed to have occurred ...)).

また、“通信品質不十分”の行と“正常”の列との交差部のFNは、想定した“通信品質不十分”の事象が発生した場合に、その想定した“通信品質不十分”の事象の発生を別の“正常”の事象に誤って推定した割合を示し、“通信品質不十分”の行と“通信品質不十分”の列との交差部のTPは、想定した“通信品質不十分”の事象が発生した場合に、その想定した“通信品質不十分”の事象の発生を正しく“通信品質不十分”の事象に推定した割合を示し、“通信品質不十分”の行と“ネットワーク混雑”の列との交差部のFNは、想定した“通信品質不十分”の事象が発生した場合に、その想定した“通信品質不十分”の事象の発生を別の“ネットワーク混雑”の事象に誤って推定した割合を示す。 FN at the intersection of the row "inadequate communication quality" and the column "normal" indicates the percentage of cases where the occurrence of the assumed "inadequate communication quality" event was incorrectly estimated as a different "normal" event when the assumed "inadequate communication quality" event occurred, TP at the intersection of the row "inadequate communication quality" and the column "inadequate communication quality" indicates the percentage of cases where the occurrence of the assumed "inadequate communication quality" event was correctly estimated as a "inadequate communication quality" event when the assumed "inadequate communication quality" event occurred, and FN at the intersection of the row "inadequate communication quality" and the column "network congestion" indicates the percentage of cases where the occurrence of the assumed "inadequate communication quality" event was incorrectly estimated as a different "network congestion" event when the assumed "inadequate communication quality" event occurred.

更に、“ネットワーク混雑”の行と“正常”の列との交差部のTNは、想定した“通信品質不十分”ではない“ネットワーク混雑”の事象が発生した場合に、“正常”の事象が発生したと推定した(即ち、想定した“通信品質不十分”の事象が実際には発生しなかった場合に、そのこと(想定した“通信品質不十分”の事象が発生しなかったこと)を正しく推定した)割合を示し、“ネットワーク混雑”の行と“通信品質不十分”の列との交差部のFPは、想定した“通信品質不十分”ではない“ネットワーク混雑”の事象が発生した場合に、誤って想定した“通信品質不十分”の事象が発生したと推定した割合を示し、“ネットワーク混雑”の行と“ネットワーク混雑”の列との交差部のTNは、想定した“通信品質不十分”ではない“ネットワーク混雑”の事象が発生した場合に、“ネットワーク混雑”の事象が発生したと推定した(即ち、想定した“通信品質不十分”の事象が実際には発生しなかった場合に、そのこと(想定した“通信品質不十分”の事象が発生しなかったこと)を正しく推定した)割合を示す。 Furthermore, the TN at the intersection of the "Network Congestion" row and the "Normal" column indicates the percentage of cases where a "normal" event was estimated to have occurred when a "network congestion" event occurred that was not the assumed "inadequate communication quality" (i.e., when the assumed "inadequate communication quality" event did not actually occur, the percentage of cases where the fact (the assumed "inadequate communication quality" event did not occur) was correctly estimated), the FP at the intersection of the "Network Congestion" row and the "inadequate communication quality" column indicates the percentage of cases where a "network congestion" event occurred that was not the assumed "inadequate communication quality" and the percentage of cases where the incorrectly estimated fact (the assumed "inadequate communication quality" event did not occur) was correctly estimated), the TN at the intersection of the "Network Congestion" row and the "Network Congestion" column indicates the percentage of cases where a "network congestion" event occurred that was not the assumed "inadequate communication quality" and the percentage of cases where the "network congestion" event occurred that was not the assumed "inadequate communication quality" (i.e., when the assumed "inadequate communication quality" event did not actually occur, the percentage of cases where the correct estimation (the assumed "inadequate communication quality" event did not occur) was correctly estimated).

図31の(c)において、“正常”の行と“正常”の列との交差部のTNは、想定した“ネットワーク混雑”ではない“正常”の事象が発生した場合に、“正常”の事象が発生したと推定した(即ち、想定した“ネットワーク混雑”の事象が実際には発生しなかった場合に、そのこと(“ネットワーク混雑”の事象が発生しなかったこと)を正しく推定した)割合を示し、“正常”の行と“通信品質不十分”の列との交差部のTNは、想定した“ネットワーク混雑”ではない“正常”の事象が発生した場合に、“通信品質不十分”の事象が発生したと推定した(即ち、想定した“ネットワーク混雑”の事象が実際には発生しなかった場合に、そのこと(想定した“ネットワーク混雑”の事象が発生しなかったこと)を正しく推定した)割合を示し、“正常”の行と“ネットワーク混雑”の列との交差部のFPは、想定した“ネットワーク混雑”ではない“正常”の事象が発生した(即ち、想定した“ネットワーク混雑”の事象が実際には発生しなかった)場合に、誤って想定した“ネットワーク混雑”の事象が発生したと推定した割合を示す。 In FIG. 31(c), the TN at the intersection of the "Normal" row and the "Normal" column indicates the percentage of cases where a "normal" event other than the assumed "network congestion" occurred and the assumption that the "normal" event occurred was assumed (i.e., when the assumed "network congestion" event did not actually occur, the assumption (the assumption that the "network congestion" event did not occur) was correctly assumed), the TN at the intersection of the "Normal" row and the "Inadequate communication quality" column indicates the percentage of cases where a "normal" event other than the assumed "network congestion" occurred and the assumption (the assumption that the "network congestion" event did not occur) was correctly assumed), and the FP at the intersection of the "Normal" row and the "Network congestion" column indicates the percentage of cases where a "normal" event other than the assumed "network congestion" occurred and the assumption (the assumption that the "network congestion" event did not actually occur) was incorrectly assumed to have occurred.

また、“通信品質不十分”の行と“正常”の列との交差部のTNは、想定した“ネットワーク混雑”ではない“通信品質不十分”の事象が発生した場合に、“正常”の事象が発生したと推定した(即ち、想定した“ネットワーク混雑”の事象が実際には発生しなかった場合に、そのこと(想定した“ネットワーク混雑”の事象が発生しなかったこと)を正しく推定した)割合を示し、“通信品質不十分”の行と“通信品質不十分”の列との交差部のTNは、想定した“ネットワーク混雑”ではない“通信品質不十分”の事象が発生した場合に、“通信品質不十分”の事象が発生したと推定した(即ち、想定した“ネットワーク混雑”の事象が実際には発生しなかった場合に、そのこと(想定した“ネットワーク混雑”の事象が発生しなかったこと)を正しく推定した)割合を示し、“通信品質不十分”の行と“ネットワーク混雑”の列との交差部のFPは、想定した“ネットワーク混雑”ではない“通信品質不十分”の事象が発生した(即ち、想定した“ネットワーク混雑”の事象が実際には発生しなかった)場合に、誤って想定した“ネットワーク混雑”の事象が発生したと推定した割合を示す。 In addition, the TN at the intersection of the row of "inadequate communication quality" and the column of "normal" indicates the percentage of cases where a "normal" event was assumed to have occurred when an "inadequate communication quality" event occurred that was not the assumed "network congestion" (i.e., when the assumed "network congestion" event did not actually occur, the percentage of cases where the event was correctly assumed to have occurred (i.e., the assumed "network congestion" event did not occur)). In addition, the TN at the intersection of the row of "inadequate communication quality" and the column of "inadequate communication quality" indicates the percentage of cases where a "normal" event was assumed to have occurred when an "inadequate communication quality" event occurred that was not the assumed "network congestion" (i.e., when the assumed The FP at the intersection of the "inadequate communication quality" row and the "network congestion" column indicates the percentage of cases where an "inadequate communication quality" event, which is not the assumed "network congestion", was correctly estimated to have occurred (i.e., when the assumed "network congestion" event did not actually occur, the percentage of cases where the FP correctly estimated that the assumed "network congestion" event had occurred) when an "inadequate communication quality" event, which is not the assumed "network congestion" event, occurred (i.e., when the assumed "network congestion" event did not actually occur), the percentage of cases where the FP correctly estimated that the assumed "network congestion" event had occurred.

更に、“ネットワーク混雑”の行と“正常”の列との交差部のFNは、想定した“ネットワーク混雑”の事象が発生した場合に、その想定した“ネットワーク混雑”の事象の発生を別の“正常”の事象に誤って推定した割合を示し、“ネットワーク混雑”の行と“通信品質不十分”の列との交差部のFNは、想定した“ネットワーク混雑”の事象が発生した場合に、その想定した“ネットワーク混雑”の事象の発生を別の“通信品質不十分”の事象に誤って推定した割合を示し、“ネットワーク混雑”の行と“ネットワーク混雑”の列との交差部のTPは、想定した“ネットワーク混雑”の事象が発生した場合に、その想定した“ネットワーク混雑”の事象の発生を正しく“ネットワーク混雑”の事象に推定した割合を示す。 Furthermore, the FN at the intersection of the "Network Congestion" row and the "Normal" column indicates the percentage of cases where the occurrence of the assumed "Network Congestion" event was mistakenly estimated as a different "Normal" event when the assumed "Network Congestion" event occurred, the FN at the intersection of the "Network Congestion" row and the "Poor Communication Quality" column indicates the percentage of cases where the occurrence of the assumed "Network Congestion" event was mistakenly estimated as a different "Poor Communication Quality" event when the assumed "Network Congestion" event occurred, and the TP at the intersection of the "Network Congestion" row and the "Network Congestion" column indicates the percentage of cases where the occurrence of the assumed "Network Congestion" event was correctly estimated as a "Network Congestion" event when the assumed "Network Congestion" event occurred.

混同行列の生成方法を説明する。図32は、混同行列の生成方法を説明するための図である。なお、図32においては、図31の(a)に示すネットワークスキャンの結果が“正常”であるときの混同行列を生成する場合を例にして混同行列の生成方法を説明する。 The method of generating a confusion matrix will be explained. Figure 32 is a diagram for explaining the method of generating a confusion matrix. Note that in Figure 32, the method of generating a confusion matrix will be explained using as an example the case of generating a confusion matrix when the result of the network scan shown in Figure 31 (a) is "normal".

図32を参照して、ネットワークスキャンの結果が“正常”であるので、列方向において、“正常”は、想定される事象であり、“通信品質不十分”および“ネットワーク混雑”は、想定外の事象である。 Referring to FIG. 32, since the result of the network scan is "normal," in the column direction, "normal" is an expected event, while "poor communication quality" and "network congestion" are unexpected events.

推定手段16は、初期のサンプルデータD_sample_initialからなる古いトレーニングデータを用いて推定アルゴリズムALGを訓練した後、検証セット(=図29に示すサブセットV1’~V8’の1つの行からなる。)を用いて推定アルゴリズムALGによってネットワークスキャンの結果を推定し、その推定したネットワークスキャンの推定結果に基づいて、想定される事象(=“正常”)が発生した場合に、想定される事象(=“正常”)を正しく推定した個数であるAと、想定される事象(=“正常”)が発生した場合に、想定される事象(=“正常”)を想定外の事象(=“通信品質不十分”)に誤って推定した個数であるBと、想定される事象(=“正常”)が発生した場合に、想定される事象(=“正常”)を想定外の事象(=“ネットワーク混雑”)に誤って推定した個数であるCとをカウントする処理を図29に示すサブセットV1’~V8’の全ての行について実行する。 The estimation means 16 trains the estimation algorithm ALG using old training data consisting of initial sample data D_sample_initial, and then estimates the results of the network scan using the estimation algorithm ALG using a validation set (= consisting of one row of the subsets V 1' to V 8' shown in FIG. 29 ). Based on the estimated network scan results, the estimation means 16 executes a process of counting A, which is the number of correctly estimated expected events (= "normal") when an expected event (= "normal") occurs, B, which is the number of erroneously estimated expected events (= "normal") as unexpected events (= "poor communication quality") when an expected event (= "normal") occurs, and C, which is the number of erroneously estimated expected events (= "normal") as unexpected events (= "network congestion") when an expected event (= "normal") occurs, for all rows of the subsets V 1' to V 8' shown in FIG. 29 .

図29に示すサブセットV1’~V8’の1つの行は、スキャン応答遅延RTTm’と通信特性CMbestm’との組{RTTm’,CMbestm’}が8組であるので、想定される事象(=“正常”)が正しく推定された場合、A=8、B=C=0が得られる。その結果、A,B,Cのカウントを図29に示すサブセットV1’~V’の全ての行について実行したときに、いずれのサブセットにおいても想定される事象(=“正常”)が正しく推定された場合、A=64、B=C=0が得られる。 29 , there are eight pairs {RTT m' , CMbest m' } of scan response delay RTT m' and communication characteristic CMbest m ' , so if the expected event (="normal" ) is correctly estimated, A = 8 and B = C = 0 are obtained. As a result, when counting A, B, and C is performed for all rows of subsets V 1' to V 8 ' shown in FIG. 29, if the expected event (="normal") is correctly estimated in each subset, A = 64 and B = C = 0 are obtained.

推定手段16は、検証セット(=図29に示すサブセットV1’~V8’の1つの行からなる。)を用いて推定アルゴリズムALGによってネットワークスキャンの結果を推定する処理を図29に示すサブセットV1’~V8’の全ての行について実行して、A,B,Cをカウントすると、そのカウントしたA,B,Cを図32に示すように混同行列表に割り当てる。 The estimation means 16 uses the validation set (= consisting of one row of the subsets V1 ' to V8 ' shown in FIG. 29) to execute a process of estimating the results of the network scan by the estimation algorithm ALG for all rows of the subsets V1 ' to V8 ' shown in FIG. 29, counts A, B, and C, and assigns the counted A, B, and C to a confusion matrix table as shown in FIG. 32.

その後、推定手段16は、AをOEとして取得し、B+CをOIEとして取得し、A+B+CをECEとして取得する。 Then, the estimation means 16 obtains A as OE, B+C as OIE, and A+B+C as ECE.

ここで、OEは、想定通りに発生した事象を正しく推定した総数を表し、ECEは、想定通りに発生した事象の総数を表し、OIEは、想定通りに発生した事象を誤って想定外の事象と推定した総数を表す。 Here, OE represents the total number of events that occurred as expected but were correctly estimated, ECE represents the total number of events that occurred as expected, and OIE represents the total number of events that occurred as expected but were incorrectly estimated as unexpected.

そして、推定手段16は、その取得したOE,OIE,ECEに基づいて、次式によってTP,FNを算出する。 The estimation means 16 then calculates TP and FN based on the acquired OE, OIE, and ECE using the following formula.

Figure 0007634259000014
Figure 0007634259000014

式(14)によって、OE,OIE,ECEに基づいてTP,FNを算出することによって、図31の(a)に示す混同行列CFMにおける第1行のTP,FNが取得される。この場合、図31の(a)に示すように、FNは、混同行列における“通信品質不十分”および“ネットワーク混雑”の2要素分の合算値として取得される。このように、TP,FNは、ネットワークスキャンの推定結果に基づいて取得される。 By calculating TP and FN based on OE, OIE, and ECE using equation (14), TP and FN in the first row of the confusion matrix CFM shown in FIG. 31(a) are obtained. In this case, as shown in FIG. 31(a), FN is obtained as the combined value of the two elements "inadequate communication quality" and "network congestion" in the confusion matrix. In this way, TP and FN are obtained based on the estimated results of the network scan.

その後、推定手段16は、算出したTP,FNに基づいて、次式によってFP,TNを算出する。 Then, the estimation means 16 calculates FP and TN based on the calculated TP and FN using the following formula.

Figure 0007634259000015
Figure 0007634259000015

図31の(a)に示す“正常”の行と“正常”の列との交差部のTPは、想定通りに発生した“正常”の事象を正しく推定した総数OEと、想定通りに発生した“正常”の事象の総数ECEとを式(14A)に代入して算出される。そして、図31の(a)に示す“通信品質不十分”の行と“正常”の列との交差部のFPおよび“ネットワーク混雑”の行と“正常”の列との交差部のFPは、式(14A)によって算出したTPを式(15A)に代入して算出される。 The TP at the intersection of the "Normal" row and the "Normal" column shown in FIG. 31(a) is calculated by substituting the total number of correctly estimated "normal" events that occurred as expected, OE, and the total number of "normal" events that occurred as expected, ECE, into formula (14A).The FP at the intersection of the "Insufficient communication quality" row and the "Normal" column shown in FIG. 31(a) and the FP at the intersection of the "Network congestion" row and the "Normal" column are calculated by substituting the TP calculated by formula (14A) into formula (15A).

更に、図31の(a)に示す“正常”の行と“通信品質不十分”の列との交差部のFN(=FN1)は、想定通りに発生した“正常”の事象を誤って想定外の“通信品質不十分”の事象と推定した総数OIEと、想定通りに発生した“正常”の事象の総数ECEとを式(14B)に代入して算出される。そして、図31の(a)に示す“通信品質不十分”の行と“通信品質不十分”の列との交差部のTNおよび“ネットワーク混雑”の行と“通信品質不十分”の列との交差部のTNは、式(14B)によって算出されたFN(=FN1)を式(15B)に代入して算出される。 Furthermore, FN (=FN1) at the intersection of the "Normal" row and the "Insufficient communication quality" column shown in FIG. 31(a) is calculated by substituting the total number OIE of "Normal" events that occurred as expected but were erroneously estimated as "Insufficient communication quality" events that occurred unexpectedly, and the total number ECE of "Normal" events that occurred as expected, into formula (14B). Then, TN at the intersection of the "Insufficient communication quality" row and the "Insufficient communication quality" column shown in FIG. 31(a) and TN at the intersection of the "Network congestion" row and the "Insufficient communication quality" column are calculated by substituting FN (=FN1) calculated by formula (14B) into formula (15B).

更に、図31の(a)に示す“正常”の行と“ネットワーク混雑”の列との交差部のFN(=FN2)は、想定通りに発生した“正常”の事象を誤って想定外の“ネットワーク混雑”の事象と推定した総数OIEと、想定通りに発生した“正常”の事象の総数ECEとを式(14B)に代入して算出される。そして、図31の(a)に示す“通信品質不十分”の行と“ネットワーク混雑”の列との交差部のTNおよび“ネットワーク混雑”の行と“ネットワーク混雑”の列との交差部のTNは、式(14B)によって算出されたFN(=FN2)を式(15B)に代入して算出される。 Furthermore, FN (=FN2) at the intersection of the "Normal" row and the "Network Congestion" column shown in FIG. 31(a) is calculated by substituting the total number OIE of "Normal" events that occurred as expected but were erroneously estimated as "Network Congestion" events that occurred unexpectedly, and the total number ECE of "Normal" events that occurred as expected, into formula (14B). Then, TN at the intersection of the "Insufficient Communication Quality" row and the "Network Congestion" column shown in FIG. 31(a) and TN at the intersection of the "Network Congestion" row and the "Network Congestion" column are calculated by substituting FN (=FN2) calculated by formula (14B) into formula (15B).

推定手段16は、上述した方法によって、TP,FN,TN,FPを算出すると、その算出したTP,FN,TN,FPからなる図31の(a)に示す混同行列CFMを生成する。 When the estimation means 16 calculates TP, FN, TN, and FP using the method described above, it generates a confusion matrix CFM shown in FIG. 31(a) consisting of the calculated TP, FN, TN, and FP.

なお、推定手段16は、同様にして、図31の(b),(c)に示す混同行列CFMを生成する。この場合、図31の(b)に示す混同行列CFMは、ネットワークスキャンの結果が“通信品質不十分”であるため、列方向において、“通信品質不十分”が想定される事象であり、“正常”および“ネットワーク混雑”が想定外の事象である。その結果、上述した方法によって、図31の(b)に示す混同行列CFMの第2行のTP,FNがOE,OIE,ECEに基づいて算出され、その後、第1行および第3行のFP,TNがTP,FNに基づいて算出される。 The estimation means 16 generates the confusion matrix CFM shown in (b) and (c) of FIG. 31 in a similar manner. In this case, since the result of the network scan is "inadequate communication quality" in the confusion matrix CFM shown in (b) of FIG. 31, in the column direction, "inadequate communication quality" is an expected event, and "normal" and "network congestion" are unexpected events. As a result, by the above-mentioned method, TP and FN in the second row of the confusion matrix CFM shown in (b) of FIG. 31 are calculated based on OE, OIE, and ECE, and then FP and TN in the first and third rows are calculated based on TP and FN.

また、図31の(c)に示す混同行列CFMは、ネットワークスキャンの結果が“ネットワーク混雑”であるため、列方向において、“ネットワーク混雑”が想定される事象であり、“正常”および“通信品質不十分”が想定外の事象である。その結果、上述した方法によって、図31の(c)に示す混同行列CFMの第3行のTP,FNがOE,OIE,ECEに基づいて算出され、その後、第1行および第2行のFP,TNがTP,FNに基づいて算出される。 In addition, in the confusion matrix CFM shown in FIG. 31(c), since the result of the network scan is "network congestion", in the column direction, "network congestion" is an expected event, and "normal" and "poor communication quality" are unexpected events. As a result, by the above-mentioned method, TP and FN in the third row of the confusion matrix CFM shown in FIG. 31(c) are calculated based on OE, OIE, and ECE, and then FP and TN in the first and second rows are calculated based on TP and FN.

このように、推定手段16は、ネットワークスキャンの推定結果からTP,FNを取得し、その取得したTP,FNに基づいてFP,TNを算出してTP,FN,FP,TNからなる混同行列CFMを生成する。また、推定手段16は、FN,FP,TNについて、混同行列内の複数の要素分を合算して算出する。 In this way, the estimation means 16 acquires TP and FN from the estimation results of the network scan, calculates FP and TN based on the acquired TP and FN, and generates a confusion matrix CFM consisting of TP, FN, FP, and TN. In addition, the estimation means 16 calculates FN, FP, and TN by adding up multiple elements in the confusion matrix.

この混同行列CFMの生成方法は、混同行列を生成する対象の観察に基づいてTP,FN,FP,TNを取得して混同行列を生成する一般的な混同行列の生成方法と異なるものである。 This method of generating the confusion matrix CFM differs from the general method of generating a confusion matrix, in which TP, FN, FP, and TN are obtained based on the observation of the subject for which the confusion matrix is to be generated, and a confusion matrix is generated.

上述したように、推定手段16は、初期のサンプルデータD_sample_initialからなる古いトレーニングデータを用いて推定アルゴリズムALGを訓練した後、検証セット(=図29に示すサブセットV1’~V8’の全ての行からなる。)を用いて推定アルゴリズムALGによってネットワークスキャンの結果を推定したとき、混同行列CFMを生成する。 As described above, the estimation means 16 trains the estimation algorithm ALG using old training data consisting of the initial sample data D_sample_initial, and then generates a confusion matrix CFM when estimating the results of the network scan by the estimation algorithm ALG using the validation set (= consisting of all rows of the subsets V 1 ' to V 8 ' shown in FIG. 29 ).

また、推定手段16は、仮のサンプルデータD_sample_tentative_uを用いて推定アルゴリズムALGを訓練した後、同様にして、検証セット(=図29に示すサブセットV1’~V8’の全ての行からなる。)を用いて推定アルゴリズムALGによってネットワークスキャンの結果を推定し、ネットワークスキャンの結果を推定したときの混同行列nCFMを混合行列CFMと同じ方法によって生成する。 In addition, the estimation means 16 trains the estimation algorithm ALG using the tentative sample data D_sample_tentative_u, and then similarly estimates the results of the network scan using the estimation algorithm ALG using a validation set (= consisting of all rows of the subsets V1 ' to V8 ' shown in Figure 29), and generates a confusion matrix nCFM when the results of the network scan are estimated in the same manner as the confusion matrix CFM.

更に、推定手段16は、混同行列nCFMを生成した後、テストデータ(=図30に示すサブセットTD~TDの全てからなる。)を用いて推定アルゴリズムALGによってネットワークスキャンの結果を推定し、ネットワークスキャンの結果を推定したときの混同行列tCFMを混合行列CFMと同じ方法によって生成する。 Furthermore, after generating the confusion matrix nCFM, the estimation means 16 estimates the result of the network scan by the estimation algorithm ALG using the test data (=consisting of all of the subsets TD 1 to TD 4 shown in FIG. 30 ), and generates a confusion matrix tCFM when the result of the network scan is estimated by the same method as the confusion matrix CFM.

この場合、推定手段16は、テストデータ(=図30に示すサブセットTD~TDの1つの行からなる。)を用いて推定アルゴリズムALGによってネットワークスキャンの結果を推定し、その推定したネットワークスキャンの推定結果に基づいて、A,B,Cをカウントする処理を図30に示すサブセットTD~TDの全ての行について実行する。 In this case, the estimation means 16 estimates the results of the network scan using the test data (= consisting of one row of the subsets TD 1 to TD 4 shown in FIG. 30) with the estimation algorithm ALG, and executes the process of counting A, B, and C for all rows of the subsets TD 1 to TD 4 shown in FIG. 30 based on the estimated results of the network scan.

図30に示すサブセットTD~TDの1つの行は、スキャン応答遅延RTTm’と通信特性CMbestm’との組{RTTm’,CMbestm’}が4組であるので、想定される事象(=“正常”)が正しく推定された場合、A=4、B=C=0が得られる。その結果、A,B,Cのカウントを図30に示すサブセットTD~TDの全ての行について実行したときに、いずれのサブセットにおいても想定される事象(=“正常”)が正しく推定された場合、A=32、B=C=0が得られる。想定される事象が“通信品質不十分”または“ネットワーク混雑”である場合も同様である。 In one row of subsets TD 1 to TD 4 shown in Fig. 30, there are four pairs {RTT m' , CMbest m' } of scan response delay RTT m' and communication characteristic CMbest m ' , so if the expected event (="normal") is correctly estimated, A = 4 and B = C = 0 are obtained. As a result, when counting A, B, and C is performed for all rows of subsets TD 1 to TD 4 shown in Fig. 30, if the expected event (="normal") is correctly estimated in all subsets, A = 32 and B = C = 0 are obtained. The same applies when the expected event is "poor communication quality" or "network congestion".

推定手段16は、混同行列CFM,nCFM,tCFMを生成すると、その生成した混同行列CFM,nCFM,tCFMを算出手段15へ出力する。 When the estimation means 16 generates the confusion matrices CFM, nCFM, and tCFM, it outputs the generated confusion matrices CFM, nCFM, and tCFM to the calculation means 15.

算出手段15は、推定手段16から混同行列CFM,nCFM,tCFMを受ける。そして、算出手段15は、混同行列CFM,nCFM,tCFMの要素TP,TN,FP,FNを用いて、TPまたはFPに分類された割合のうちで実際にTPに分類された割合の比であるPrecisionと、TPまたはFNに分類された割合のうちで実際にTPに分類された割合の比であるRecallとを算出する。 The calculation means 15 receives the confusion matrices CFM, nCFM, and tCFM from the estimation means 16. Then, the calculation means 15 uses the elements TP, TN, FP, and FN of the confusion matrices CFM, nCFM, and tCFM to calculate Precision, which is the ratio of the proportion actually classified as TP among the proportion classified as TP or FP, and Recall, which is the ratio of the proportion actually classified as TP among the proportion classified as TP or FN.

Precisionは、式(16)によって算出され、Recallは、式(17)によって算出される。 Precision is calculated using equation (16), and Recall is calculated using equation (17).

Figure 0007634259000016
Figure 0007634259000016

Figure 0007634259000017
Figure 0007634259000017

そして、算出手段15は、PrecisionおよびRecallを算出すると、その算出したPrecisionおよびRecallを次式に代入してF1スコアFを算出する。 Then, after calculating Precision and Recall, the calculation means 15 calculates the F1 score F1 by substituting the calculated Precision and Recall into the following equation.

Figure 0007634259000018
Figure 0007634259000018

算出手段15は、混同行列CFMのTP,TN,FP,FNに基づいて式(16)~式(18)によってF1スコアFを算出する。また、算出手段15は、混同行列nCFMのTP,TN,FP,FNに基づいて式(16)~式(18)によってF1スコアnF_uを算出する。更に、算出手段15は、混同行列tCFMのTP,TN,FP,FNに基づいて式(16)~式(18)によってF1スコアtFを算出する。そして、算出手段15は、F1スコアF,nF_u,tFを推定手段16へ出力する。 The calculation means 15 calculates an F1 score F 1 by equations (16) to (18) based on the TP, TN, FP, and FN of the confusion matrix CFM. The calculation means 15 also calculates an F1 score nF 1 _u by equations (16) to (18) based on the TP, TN, FP, and FN of the confusion matrix nCFM. The calculation means 15 also calculates an F1 score tF 1 by equations (16) to (18) based on the TP, TN, FP, and FN of the confusion matrix tCFM. The calculation means 15 then outputs the F1 scores F 1 , nF 1 _u, and tF 1 to the estimation means 16.

F1スコアFは、初期のサンプルデータD_sample_initialを用いて推定アルゴリズムALGを訓練し、検証セット(=図29に示すサブセットV1’~V8’の全ての行からなる。)を用いて推定アルゴリズムALG(訓練後の推定アルゴリズムALG)によってネットワークスキャンの結果を推定したときの推定結果の正確性を表す評価指数EVDである。 The F1 score F1 is an evaluation index EVD that represents the accuracy of the estimation result when the estimation algorithm ALG is trained using the initial sample data D_sample_initial and the network scan result is estimated by the estimation algorithm ALG (the estimation algorithm ALG after training) using the validation set (= consisting of all rows of the subsets V1 ' to V8 ' shown in Figure 29).

また、F1スコアnF_uは、仮のサンプルデータD_sample_tentative_uを用いて推定アルゴリズムALGを訓練し、検証セット(=図29に示すサブセットV1’~V8’の全ての行からなる。)を用いて推定アルゴリズムALG(訓練後の推定アルゴリズムALG)によってネットワークスキャンの結果を推定したときの推定結果の正確性を表す評価指数nEVD_uである。 In addition, the F1 score nF 1 _u is an evaluation index nEVD_u that represents the accuracy of the estimation result when the estimation algorithm ALG is trained using the tentative sample data D_sample_tentative_u and the network scan result is estimated by the estimation algorithm ALG (the estimation algorithm ALG after training) using the validation set (= consisting of all rows of the subsets V 1' to V 8' shown in Figure 29).

更に、F1スコアtFは、テストデータ(=図30に示すサブセットTD~TDの全ての行からなる。)を用いて推定アルゴリズムALG(訓練後の推定アルゴリズムALG)によってネットワークスキャンの結果を推定したときの推定結果の正確性を表す評価指数tEVDである。 Furthermore, the F1 score tF1 is an evaluation index tEVD that represents the accuracy of the estimation result when the network scan result is estimated by the estimation algorithm ALG (the estimation algorithm ALG after training) using the test data (= consisting of all rows of the subsets TD1 to TD4 shown in Figure 30).

この発明の実施の形態においては、F1スコアF,nF_u,tFに代えてマシューズ相関係数MCC,nMCC_u,tMCCをそれぞれ評価指数EVD,nEVD_u,tEVDとして用いてもよい。この場合、算出手段15は、混同行列CFMのTP,TN,FP,FNに基づいて式(19)によってマシューズ相関係数MCCを算出し、混同行列nCFMのTP,TN,FP,FNに基づいて式(19)によってマシューズ相関係数nMCC_uを算出し、混同行列tCFMのTP,TN,FP,FNに基づいて式(19)によってマシューズ相関係数tMCCを算出する。 In an embodiment of the present invention, the Matthews correlation coefficients MCC, nMCC_u, and tMCC may be used as the evaluation indices EVD, nEVD_u, and tEVD, respectively, instead of the F1 scores F 1 , nF 1 _u, and tF 1. In this case, the calculation means 15 calculates the Matthews correlation coefficient MCC by equation (19) based on the TP, TN, FP, and FN of the confusion matrix CFM, calculates the Matthews correlation coefficient nMCC_u by equation (19) based on the TP, TN, FP, and FN of the confusion matrix nCFM, and calculates the Matthews correlation coefficient tMCC by equation (19) based on the TP, TN, FP, and FN of the confusion matrix tCFM.

Figure 0007634259000019
Figure 0007634259000019

なお、式(19)によって算出されるマシューズ相関係数MCCは、最も良いトレーニングデータを用いたとき、“+1”からなり、最も悪いトレーニングデータを用いたとき、“-1”からなり、ニュートラル(“最も良い”および“最も悪い”のいずれでもない)なトレーニングデータを用いたとき、“0”からなる。 The Matthews correlation coefficient MCC calculated by formula (19) is "+1" when the best training data is used, "-1" when the worst training data is used, and "0" when neutral (neither "best" nor "worst") training data is used.

算出手段15は、マシューズ相関係数MCC,nMCC_u,tMCCを算出すると、マシューズ相関係数MCCを評価指数EVDとして推定手段16へ出力し、マシューズ相関係数nMCC_uを評価指数nEVD_uとして推定手段16へ出力し、マシューズ相関係数tMCCを評価指数tEVDとして推定手段16へ出力する。 When the calculation means 15 calculates the Matthews correlation coefficients MCC, nMCC_u, and tMCC, it outputs the Matthews correlation coefficient MCC to the estimation means 16 as an evaluation index EVD, outputs the Matthews correlation coefficient nMCC_u to the estimation means 16 as an evaluation index nEVD_u, and outputs the Matthews correlation coefficient tMCC to the estimation means 16 as an evaluation index tEVD.

推定手段16は、F1スコアnF_1からなる評価指数nEVD_uおよびF1スコアFからなる評価指数EVDを算出手段15から受けると、F1スコアnF_1がF1スコアFよりも大きいか否かを判定する。 Upon receiving the evaluation index nEVD_u consisting of the F1 score nF 1 _1 and the evaluation index EVD consisting of the F1 score F 1 from the calculation means 15, the estimation means 16 determines whether the F1 score nF 1 _1 is greater than the F1 score F 1 .

推定手段16は、F1スコアnF_1がF1スコアFよりも大きいと判定したとき、F1スコアnF_1をF1スコアFに設定し、F1スコアnF_1が得られたときのサブセットdを含む仮のサンプルデータD_sample_tentative_1をトレーニングデータに設定する。そして、推定手段16は、後述する方法によって、トレーニングデータを用いて推定アルゴリズムALGの変数を置き換える。その後、推定手段16は、次のサブセットdを用いて推定アルゴリズムALGを訓練し、検証セット(=サブセットV1’~V8’の全てからなる。)を用いて推定アルゴリズムALG(訓練後の推定アルゴリズムALG)によってネットワークスキャンの結果を推定し、ネットワークスキャンの結果を推定したときの混同行列nCFM_2を生成する。そして、推定手段16は、その生成した混同行列nCFM_2を算出手段15へ出力する。 When the estimation means 16 determines that the F1 score nF 1 _1 is greater than the F1 score F 1 , the estimation means 16 sets the F1 score nF 1 _1 to the F1 score F 1 , and sets the tentative sample data D_sample_tentative_1 including the subset d 1 when the F1 score nF 1 _1 is obtained as the training data. Then, the estimation means 16 replaces the variables of the estimation algorithm ALG using the training data by a method described later. After that, the estimation means 16 trains the estimation algorithm ALG using the next subset d 2 , estimates the result of the network scan by the estimation algorithm ALG (the estimation algorithm ALG after training) using the validation set (=consisting of all of the subsets V 1' to V 8'), and generates a confusion matrix nCFM_2 when the result of the network scan is estimated. Then, the estimation means 16 outputs the generated confusion matrix nCFM_2 to the calculation means 15.

一方、推定手段16は、F1スコアnF_1がF1スコアFよりも大きくないと判定したとき、F1スコアnF_1をF1スコアFに設定せずに、次のサブセットdを含む仮のサンプルデータD_sample_tentative_2を用いて推定アルゴリズムALGを訓練し、検証セット(=サブセットV1’~V8’の全てからなる。)を用いて推定アルゴリズムALG(訓練後の推定アルゴリズムALG)によってネットワークスキャンの結果を推定し、ネットワークスキャンの結果を推定したときの混同行列nCFM_2を生成して混同行列nCFM_2を算出手段15へ出力する。 On the other hand, when the estimation means 16 determines that the F1 score nF 1 _1 is not greater than the F1 score F 1 , it does not set the F1 score nF 1 _1 to the F1 score F 1 , but trains the estimation algorithm ALG using tentative sample data D_sample_tentative_2 including the next subset d 2 , estimates the result of the network scan with the estimation algorithm ALG (the estimation algorithm ALG after training) using the validation set (=consisting of all of the subsets V 1 ' to V 8' ), generates a confusion matrix nCFM_2 when the result of the network scan is estimated, and outputs the confusion matrix nCFM_2 to the calculation means 15.

その後、推定手段16は、F1スコアnF_2からなる評価指数nEVD_uを算出手段15から受けると、F1スコアnF_2がF1スコアFよりも大きいか否かを判定する。 Thereafter, when the estimation means 16 receives the evaluation index nEVD_u consisting of the F1 score nF 1 _2 from the calculation means 15, the estimation means 16 determines whether or not the F1 score nF 1 _2 is greater than the F1 score F 1 .

推定手段16は、F1スコアnF_2がF1スコアFよりも大きいと判定したとき、F1スコアnF_2をF1スコアFに設定し、F1スコアnF_2が得られたときのサブセットdを含む仮のサンプルデータD_sample_tentative_2をトレーニングデータに設定する。そして、推定手段16は、後述する方法によって、トレーニングデータを用いて推定アルゴリズムALGの変数を置き換える。その後、推定手段16は、次のサブセットdを含む仮のサンプルデータD_sample_tentative_3を用いて推定アルゴリズムALGを訓練し、検証セット(=サブセットV1’~V8’の全てからなる。)を用いて推定アルゴリズムALG(訓練後の推定アルゴリズムALG)によってネットワークスキャンの結果を推定し、ネットワークスキャンの結果を推定したときの混同行列nCFM_3を生成する。そして、推定手段16は、その生成した混同行列nCFM_3を算出手段15へ出力する。 When the estimation means 16 determines that the F1 score nF 1 _2 is greater than the F1 score F 1 , it sets the F1 score nF 1 _2 to the F1 score F 1 , and sets the tentative sample data D_sample_tentative_2 including the subset d 2 when the F1 score nF 1 _2 is obtained as the training data. Then, the estimation means 16 replaces the variables of the estimation algorithm ALG using the training data by a method described later. After that, the estimation means 16 trains the estimation algorithm ALG using the tentative sample data D_sample_tentative_3 including the next subset d 3 , estimates the result of the network scan by the estimation algorithm ALG (the estimation algorithm ALG after training) using the validation set (=consisting of all of the subsets V 1' to V 8' ), and generates a confusion matrix nCFM_3 when the result of the network scan is estimated. Then, the estimation means 16 outputs the generated confusion matrix nCFM_3 to the calculation means 15.

一方、推定手段16は、F1スコアnF_2がF1スコアFよりも大きくないと判定したとき、F1スコアnF_2をF1スコアFに設定せずに、次のサブセットdを含む仮のサンプルデータD_sample_tentative_3を用いて推定アルゴリズムALGを訓練し、検証セット(=サブセットV1’~V8’の全てからなる。)を用いて推定アルゴリズムALG(訓練後の推定アルゴリズムALG)によってネットワークスキャンの結果を推定し、ネットワークスキャンの結果を推定したときの混同行列nCFM_3を生成する。そして、推定手段16は、その生成した混同行列nCFM_3を算出手段15へ出力する。 On the other hand, when the estimation means 16 determines that the F1 score nF 1 _2 is not greater than the F1 score F 1 , it does not set the F1 score nF 1 _2 to the F1 score F 1 , but trains the estimation algorithm ALG using tentative sample data D_sample_tentative_3 including the next subset d 3 , estimates the result of the network scan by the estimation algorithm ALG (the estimation algorithm ALG after training) using the validation set (=consisting of all of the subsets V 1' to V 8' ), and generates a confusion matrix nCFM_3 when the result of the network scan is estimated. Then, the estimation means 16 outputs the generated confusion matrix nCFM_3 to the calculation means 15.

以後、推定手段16は、F1スコアF,nF_uを用いて、サブセットd~dの全てについて、上述した動作を繰り返し実行する。 Thereafter, the estimation means 16 repeatedly executes the above-mentioned operations for all of the subsets d 3 to d U using the F1 scores F 1 and nF 1 _u.

また、推定手段16は、マシューズ相関係数MCCからなる評価指数EVDおよびマシューズ相関係数nMCC_1からなる評価指数nEVD_1を算出手段15から受けたとき、マシューズ相関係数nMCC_1がマシューズ相関係数MCCよりも大きいか否かを判定する。 In addition, when the estimation means 16 receives an evaluation index EVD consisting of the Matthews correlation coefficient MCC and an evaluation index nEVD_1 consisting of the Matthews correlation coefficient nMCC_1 from the calculation means 15, it determines whether the Matthews correlation coefficient nMCC_1 is greater than the Matthews correlation coefficient MCC.

推定手段16は、マシューズ相関係数nMCC_1がマシューズ相関係数MCCよりも大きいと判定したとき、マシューズ相関係数nMCC_1をマシューズ相関係数MCCに設定し、マシューズ相関係数nMCC_1が得られたときのサブセットdを含む仮のサンプルデータD_sample_tentative_1をトレーニングデータに設定する。そして、推定手段16は、後述する方法によって、トレーニングデータを用いて推定アルゴリズムALGの変数を置き換える。その後、推定手段16は、次のサブセットdを含む仮のサンプルデータD_sample_tentative_2を用いて推定アルゴリズムALGを訓練し、検証セット(=サブセットV1’~V8’の全てからなる。)を用いて推定アルゴリズムALGによってネットワークスキャンの結果を推定し、ネットワークスキャンの結果を推定したときの混同行列nCFM_2を生成する。そして、推定手段16は、その生成した混同行列nCFM_2を算出手段15へ出力する。 When the estimation means 16 determines that the Matthews correlation coefficient nMCC_1 is greater than the Matthews correlation coefficient MCC, it sets the Matthews correlation coefficient nMCC_1 to the Matthews correlation coefficient MCC, and sets the tentative sample data D_sample_tentative_1 including the subset d 1 when the Matthews correlation coefficient nMCC_1 is obtained as the training data. Then, the estimation means 16 replaces the variables of the estimation algorithm ALG using the training data by a method described later. After that, the estimation means 16 trains the estimation algorithm ALG using tentative sample data D_sample_tentative_2 including the next subset d 2 , estimates the result of the network scan by the estimation algorithm ALG using the validation set (=consisting of all of the subsets V 1' to V 8' ), and generates a confusion matrix nCFM_2 when the result of the network scan is estimated. Then, the estimation means 16 outputs the generated confusion matrix nCFM_2 to the calculation means 15.

一方、推定手段16は、マシューズ相関係数nMCC_1がマシューズ相関係数MCCよりも大きくないと判定したとき、マシューズ相関係数nMCC_1をマシューズ相関係数MCCに設定せずに、次のサブセットdを含む仮のサンプルデータD_sample_tentative_2を用いて推定アルゴリズムALGを訓練し、検証セット(=サブセットV1’~V8’の全てからなる。)を用いて推定アルゴリズムALGによってネットワークスキャンの結果を推定し、ネットワークスキャンの結果を推定したときの混同行列nCFM_2を生成する。そして、推定手段16は、その生成した混同行列nCFM_2を算出手段15へ出力する。 On the other hand, when the estimation means 16 determines that the Matthews correlation coefficient nMCC_1 is not greater than the Matthews correlation coefficient MCC, it does not set the Matthews correlation coefficient nMCC_1 to the Matthews correlation coefficient MCC, but trains the estimation algorithm ALG using the tentative sample data D_sample_tentative_2 including the next subset d2 , estimates the result of the network scan by the estimation algorithm ALG using the validation set (=consisting of all of the subsets V1 ' to V8 ' ), and generates a confusion matrix nCFM_2 when the result of the network scan is estimated. Then, the estimation means 16 outputs the generated confusion matrix nCFM_2 to the calculation means 15.

その後、推定手段16は、マシューズ相関係数nMCC_2からなる評価指数nEVD_2を算出手段15から受けると、マシューズ相関係数nMCC_2がマシューズ相関係数MCCよりも大きいか否かを判定する。 Then, when the estimation means 16 receives the evaluation index nEVD_2 consisting of the Matthews correlation coefficient nMCC_2 from the calculation means 15, it determines whether the Matthews correlation coefficient nMCC_2 is greater than the Matthews correlation coefficient MCC.

推定手段16は、マシューズ相関係数nMCC_2がマシューズ相関係数MCCよりも大きいと判定したとき、マシューズ相関係数nMCC_2をマシューズ相関係数MCCに設定し、マシューズ相関係数nMCC_2が得られたときのサブセットdを含む仮のサンプルデータD_sample_tentative_2をトレーニングデータに設定する。そして、推定手段16は、後述する方法によって、トレーニングデータを用いて推定アルゴリズムALGの変数を置き換える。その後、推定手段16は、次のサブセットdを含む仮のサンプルデータD_sample_tentative_3を用いて推定アルゴリズムALGを訓練し、検証セット(=サブセットV1’~V8’の全てからなる。)を用いて推定アルゴリズムALGによってネットワークスキャンの結果を推定し、ネットワークスキャンの結果を推定したときの混同行列nCFM_3を生成する。そして、推定手段16は、その生成した混同行列nCFM_3を算出手段15へ出力する。 When the estimation means 16 determines that the Matthews correlation coefficient nMCC_2 is greater than the Matthews correlation coefficient MCC, it sets the Matthews correlation coefficient nMCC_2 to the Matthews correlation coefficient MCC, and sets the tentative sample data D_sample_tentative_2 including the subset d 2 when the Matthews correlation coefficient nMCC_2 is obtained as the training data. Then, the estimation means 16 replaces the variables of the estimation algorithm ALG using the training data by a method described later. After that, the estimation means 16 trains the estimation algorithm ALG using tentative sample data D_sample_tentative_3 including the next subset d 3 , estimates the result of the network scan by the estimation algorithm ALG using the validation set (=consisting of all of the subsets V 1' to V 8' ), and generates a confusion matrix nCFM_3 when the result of the network scan is estimated. Then, the estimation means 16 outputs the generated confusion matrix nCFM_3 to the calculation means 15.

一方、推定手段16は、マシューズ相関係数nMCC_2がマシューズ相関係数MCCよりも大きくないと判定したとき、マシューズ相関係数nMCC_2をマシューズ相関係数MCCに設定せずに、次のサブセットdを含む仮のサンプルデータD_sample_tentative_3を用いて推定アルゴリズムALGを訓練し、検証セット(=サブセットV1’~V8’の全てからなる。)を用いて推定アルゴリズムALGによってネットワークスキャンの結果を推定し、ネットワークスキャンの結果を推定したときの混同行列nCFM_3を生成する。そして、推定手段16は、その生成した混同行列nCFM_3を算出手段15へ出力する。 On the other hand, when the estimation means 16 determines that the Matthews correlation coefficient nMCC_2 is not greater than the Matthews correlation coefficient MCC, it does not set the Matthews correlation coefficient nMCC_2 to the Matthews correlation coefficient MCC, but trains the estimation algorithm ALG using the tentative sample data D_sample_tentative_3 including the next subset d3 , estimates the result of the network scan by the estimation algorithm ALG using the validation set (=consisting of all of the subsets V1 ' to V8 ' ), and generates a confusion matrix nCFM_3 when the result of the network scan is estimated. Then, the estimation means 16 outputs the generated confusion matrix nCFM_3 to the calculation means 15.

以後、推定手段16は、マシューズ相関係数MCC,nMCC_uを用いて、サブセットd~dの全てについて、上述した動作を繰り返し実行する。 Thereafter, the estimation means 16 repeatedly executes the above-mentioned operations for all of the subsets d 3 to d U using the Matthews correlation coefficients MCC and nMCC_u.

[ネットワークスキャンの結果の推定]
推定手段16は、上述した推定アルゴリズムALGの訓練において、初期のサンプルデータD_sample_initialと、標準サンプルデータD_similarityから生成されたサブセットd~dをそれぞれ含む仮のサンプルデータD_sample_tentative_1~D_sample_tentative_Uとを用いて、以下の方法によって、ネットワークスキャンの結果を推定する。
[Estimated network scan results]
In training the above-mentioned estimation algorithm ALG, the estimation means 16 uses the initial sample data D_sample_initial and tentative sample data D_sample_tentative_1 to D_sample_tentative_U each including a subset d 1 to d U generated from the standard sample data D_similarity to estimate the result of the network scan by the following method.

なお、ネットワークスキャンの結果の推定方法の説明においては、仮のサンプルデータD_sample_tentative_1~D_sample_tentative_Uの各々に含まれるスキャン応答遅延{RTT1’_known}_z~{RTTM’_known}_zを“スキャン応答遅延RTTm”と表記し、仮のサンプルデータD_sample_tentative_1~D_sample_tentative_Uの各々に含まれる通信特性CMbest_unknown、および標準サンプルデータD_similarityに含まれる通信特性{CMbest’_known}_z~{CMbestM’_known}_zを“通信特性CMbest”と表記する。 In addition, in explaining the method of estimating the results of a network scan, the scan response delays {RTT 1' _known}_z to {RTT M' _known}_z contained in each of the hypothetical sample data D_sample_tentative_1 to D_sample_tentative_U are denoted as "scan response delays RTT m" , and the communication characteristic CMbest m _unknown contained in each of the hypothetical sample data D_sample_tentative_1 to D_sample_tentative_U and the communication characteristics {CMbest 1 ' _known}_z to {CMbest M' _known}_z contained in the standard sample data D_similarity are denoted as "communication characteristic CMbest".

推定手段16は、スキャン応答遅延RTTおよび通信特性CMbestを抽出手段14から受ける。そして、推定手段16は、LDA(Liner Discriminant Analysis)アルゴリズムを用いて、通信特性CMbestを有する端末装置をG(Gは、3以上の整数)個のグループCLS~CLSに分類する。 The estimation means 16 receives the scan response delay RTT m and the communication characteristic CMbest from the extraction means 14. Then, the estimation means 16 classifies the terminal devices having the communication characteristic CMbest into G groups CLS 1 to CLS G (G is an integer equal to or greater than 3) using an LDA (Linear Discriminant Analysis) algorithm.

LDAアルゴリズムは、グループ間の分散とグループ内の分散との比率を最大化するように、通信特性CMbestを有する端末装置をG個のグループCLS~CLSに分類する。従って、グループCLS~CLSの相互間の最大の分離が保証される。 The LDA algorithm classifies terminal devices having communication characteristics CMbest into G groups CLS 1 to CLS G so as to maximize the ratio of between-group variance and within-group variance, thus ensuring maximum separation between the groups CLS 1 to CLS G from each other.

LDAアルゴリズムは、共通共分散に基づいてデータ(通信特性CMbestを有する端末装置)を球体化し、変換された空間で最も近いグループ重心にデータ(通信特性CMbestを有する端末装置)を分類する。 The LDA algorithm spheres the data (terminal devices with communication characteristics CMbest) based on the common covariance and classifies the data (terminal devices with communication characteristics CMbest) into the closest group centroid in the transformed space.

これを実現するために、異なるグループの平均間の距離である異なるグループ間の分離可能性(「グループ間共分散」とも言う。)が計算される。その後、各グループの平均とサンプルとの間の距離(「グループ内共分散」とも言う。)が計算される。これによって、グループ間の共分散を最大化し、かつ、グループ内の共分散を最小化する低次元空間が構築される。そして、構築された低次元空間において、最も近いグループ重心にデータ(通信特性CMbestを有する端末装置)を分類する。なお、LDAアルゴリズムは、”T. Hastie, R. Tibshirani, and J. H. Friedman, “The elements of statistical learning: data mining, inference, and prediction,” 2nd ed. Chapter 4. pp.106 - 118,New York: Springer, 2009.”に記載されており、公知である。従って。LDAアルゴリズムによる詳細な分類方法は、省略する。 To achieve this, the separability between different groups (also called "intergroup covariance"), which is the distance between the means of different groups, is calculated. Then, the distance between the mean and the sample of each group (also called "intragroup covariance") is calculated. This allows a low-dimensional space to be constructed that maximizes the intergroup covariance and minimizes the intragroup covariance. Then, in the constructed low-dimensional space, data (terminal devices having communication characteristics CMbest) are classified into the closest group centroid. The LDA algorithm is described in "T. Hastie, R. Tibshirani, and J. H. Friedman, "The elements of statistical learning: data mining, inference, and prediction," 2nd ed. Chapter 4. pp.106-118, New York: Springer, 2009." and is publicly known. Therefore, a detailed classification method using the LDA algorithm will be omitted.

また、グループCLS~CLSの個数Gは、ネットワークスキャンの推定される結果のうち、ネットワークスキャンの結果が端末装置との通信チャネルに起因する原因の数と同じ個数に設定される。即ち、「正常」、「通信品質不十分」および「ネットワークが混雑」の3個の結果が端末装置との通信チャネルに起因する原因であるので、グループCLS~CLSの個数Gは、“3”に設定される。その結果、推定手段16は、LDAアルゴリズムを用いて、通信特性CMbestを有する端末装置を3個のグループCLS~CLSに分類する。そして、グループCLSは、“正常”のグループであり、グループCLSは、「通信品質不十分」のグループであり、グループCLSは、「ネットワークが混雑」のグループである。 Moreover, the number G of the groups CLS 1 to CLS G is set to the same number as the number of causes of the network scan results attributable to the communication channel with the terminal device among the estimated results of the network scan. That is, since the three results of "normal", "inadequate communication quality" and "network congestion" are causes attributable to the communication channel with the terminal device, the number G of the groups CLS 1 to CLS G is set to "3". As a result, the estimation means 16 classifies the terminal devices having the communication characteristic CMbest into three groups CLS 1 to CLS 3 using the LDA algorithm. Then, the group CLS 1 is a "normal" group, the group CLS 2 is a "inadequate communication quality" group, and the group CLS 3 is a "network congestion" group.

推定手段16は、通信特性CMbestを有する端末装置をグループCLS~CLSに分類するとき、ネットワークスキャンが“ネットワークが混雑”であるときのスキャンデータ(“ネットワークが混雑”であるときの通信特性CMbest)を用いてLDAアルゴリズムを学習し、その学習した学習済のLDAアルゴリズムを用いて、通信特性CMbestを有する端末装置を3個のグループCLS~CLSに分類する。これによって、ネットワークスキャンが失敗した原因としての“ネットワークが混雑”を最も精度良く推定できる。 When classifying terminal devices having communication characteristics CMbest into groups CLS1 to CLS3 , the estimation means 16 learns an LDA algorithm using scan data when the network scan is "network congested" (communication characteristics CMbest when "network is congested"), and classifies terminal devices having communication characteristics CMbest into three groups CLS1 to CLS3 using the learned LDA algorithm. This makes it possible to most accurately estimate that "network congestion" is the cause of the failure of the network scan.

推定手段16は、ネットワークスキャンの結果を推定するためのModel1、Model2およびModel3を使用する。Model1は、グループCLSとグループCLSとを扱い、Model2は、グループCLSとグループCLSとを扱い、Model3は、グループCLSとグループCLSとを扱う。 The estimation means 16 uses Model1, Model2 and Model3 for estimating the results of a network scan. Model1 handles groups CLS1 and CLS2 , Model2 handles groups CLS1 and CLS3 , and Model3 handles groups CLS2 and CLS3 .

そして、推定手段16は、Model1を使用するとき、グループCLSとグループCLSを判別するDスコアD_1を算出し、Model2を使用するとき、グループCLSとグループCLSを判別するDスコアD_2を算出し、Model3を使用するとき、グループCLSとグループCLSを判別するDスコアD_3を算出する。 Then, when Model 1 is used, the estimation means 16 calculates a D score D_1 that discriminates between groups CLS 1 and CLS 2 , when Model 2 is used, calculates a D score D_2 that discriminates between groups CLS 1 and CLS 3 , and when Model 3 is used, calculates a D score D_3 that discriminates between groups CLS 2 and CLS 3 .

DスコアD_1~D_3が算出されるとき、次式によって表わされる判別関数δpq(x)が用いられる。 When the D scores D_1 to D_3 are calculated, a discriminant function δ pq (x) expressed by the following equation is used.

Figure 0007634259000020
Figure 0007634259000020

式(20A)のxには、スキャン応答遅延RTTと通信特性CMbestとからなるベクトルが代入される。そして、xは、ネットワークスキャンの結果が既知である場合のスキャン応答遅延RTTおよび通信特性CMbest(最適トレーニングデータ)、またはネットワークスキャンの結果が不明である場合のスキャン応答遅延RTTおよび通信特性CMbestからなる。また、式(20A)のμには、グループpの判別関数を算出するとき、式(20C)に示す通信特性の平均μが代入され、グループqの判別関数を算出するとき、式(20D)に示す通信特性の平均μqが代入される。更に、式(20A)の事前平均Πには、グループpの判別関数を算出するとき、式(20E)に示す通信特性の事前平均Πが代入され、グループqの判別関数を算出するとき、式(20F)に示す通信特性の事前平均Πqが代入される。式(20A)の合併共分散行列Cpqは、式(20B)によって表される。式(20B)の右辺において、第1項は、グループpにおける共分散行列であり、第2項は、グループqにおける共分散行列である。そして、式(20B)のxmpには、グループpに分類された通信特性(スキャン応答遅延RTTと通信特性CMbestとからなるベクトル)が代入され、式(20B)のxmqには、グループqに分類された通信特性(スキャン応答遅延RTTと通信特性CMbestとからなるベクトル)が代入される。 A vector consisting of the scan response delay RTT m and the communication characteristic CMbest is substituted for x in formula (20A). Then, x consists of the scan response delay RTT m and the communication characteristic CMbest (optimum training data) when the result of the network scan is known, or the scan response delay RTT m and the communication characteristic CMbest when the result of the network scan is unknown. Furthermore, the average μ p of the communication characteristic shown in formula (20C) is substituted for μ g in formula (20A) when calculating the discriminant function of group p, and the average μ q of the communication characteristic shown in formula (20D) is substituted for μ g in formula (20A) when calculating the discriminant function of group q. Furthermore, the prior average Π p of the communication characteristic shown in formula (20E) is substituted for the prior average Π g in formula (20A) when calculating the discriminant function of group p, and the prior average Π q of the communication characteristic shown in formula (20F) is substituted for the prior average Π g in formula (20A). The joint covariance matrix C pq of formula (20A) is represented by formula (20B). On the right side of formula (20B), the first term is a covariance matrix in group p, and the second term is a covariance matrix in group q. Then, the communication characteristics classified into group p (a vector consisting of scan response delay RTT m and communication characteristics CMbest) are substituted into x mp of formula (20B), and the communication characteristics classified into group q (a vector consisting of scan response delay RTT m and communication characteristics CMbest) are substituted into x mq of formula (20B).

式(20B),(20C),(20D)において、Mは、グループpに分類された通信特性(スキャン応答遅延RTTと通信特性CMbestとからなるベクトル)の総数であり、Mは、グループqに分類された通信特性(スキャン応答遅延RTTと通信特性CMbestとからなるベクトル)の総数であり、mは、グループpに分類された1つの通信特性(スキャン応答遅延RTTと通信特性CMbestとからなるベクトル)を示す引数であり、mは、グループqに分類された1つの通信特性(スキャン応答遅延RTTと通信特性CMbestとからなるベクトル)を示す引数である。式(20E),(20F)において、Mは、通信特性(スキャン応答遅延RTTと通信特性CMbesttとからなるベクトル)の総数である。式(20C)は、グループpに分類された通信特性(スキャン応答遅延RTTと通信特性CMbestとからなるベクトル)の平均μを表し、式(20D)は、グループqに分類された通信特性(スキャン応答遅延RTTと通信特性CMbestとからなるベクトル)の平均μを表す。式(20E)は、グループpに分類された通信特性(スキャン応答遅延RTTと通信特性CMbestとからなるベクトル)の事前平均Πを表し、式(20F)は、グループqに分類された通信特性(スキャン応答遅延RTTと通信特性CMbestとからなるベクトル)の事前平均Πを表す。 In formulas (20B), (20C), and (20D), M p is the total number of communication characteristics (vectors consisting of scan response delay RTT m and communication characteristics CMbest) classified into group p, M q is the total number of communication characteristics (vectors consisting of scan response delay RTT m and communication characteristics CMbest) classified into group q, m p is an argument indicating one communication characteristic (vectors consisting of scan response delay RTT m and communication characteristics CMbest) classified into group p, and m q is an argument indicating one communication characteristic (vectors consisting of scan response delay RTT m and communication characteristics CMbest) classified into group q. In formulas (20E) and (20F), M is the total number of communication characteristics (vectors consisting of scan response delay RTT m and communication characteristics CMbestt). Formula (20C) represents the average μ p of the communication characteristics (vector consisting of scan response delay RTT m and communication characteristic CMbest) classified into group p, formula (20D) represents the average μ q of the communication characteristics (vector consisting of scan response delay RTT m and communication characteristic CMbest) classified into group q, formula (20E) represents the prior average Π p of the communication characteristics (vector consisting of scan response delay RTT m and communication characteristic CMbest) classified into group p, and formula (20F) represents the prior average Π q of the communication characteristics (vector consisting of scan response delay RTT m and communication characteristic CMbest) classified into group q.

式(20B)は、2つのグループ(2つのグループCLS,CLS;2つのグループCLS,CLS;2つのグループCLS,CLSのいずれか)における2つの共分散行列を合併した合併共分散行列Cpqを表す。2つのグループCLS,CLSにおける2つの共分散行列を合併した合併共分散行列C12を算出するとき、式(20A)において、pは、グループCLSを表し、qは、グループCLSを表す。また、2つのグループCLS,CLSにおける2つの共分散行列を合併した合併共分散行列C13を算出するとき、式(20A)において、pは、グループCLSを表し、qは、グループCLSを表す。更に、2つのグループCLS,CLSにおける2つの共分散行列を合併した合併共分散行列C23を算出するとき、式(20A)において、pは、グループCLSを表し、qは、グループCLSを表す。 Equation (20B) represents a merged covariance matrix C pq obtained by merging two covariance matrices in two groups (two groups CLS 1 and CLS 2 ; two groups CLS 1 and CLS 3 ; or two groups CLS 2 and CLS 3 ). When calculating a merged covariance matrix C 12 obtained by merging two covariance matrices in two groups CLS 1 and CLS 2 , in equation (20A), p represents group CLS 1 , and q represents group CLS 2. Furthermore, when calculating a merged covariance matrix C 13 obtained by merging two covariance matrices in two groups CLS 1 and CLS 3 , in equation (20A), p represents group CLS 1 , and q represents group CLS 3 . Furthermore, when calculating a merged covariance matrix C23 by merging the two covariance matrices in the two groups CLS2 and CLS3 , p represents group CLS2 and q represents group CLS3 in formula (20A).

Model1における合併共分散行列C12は、次式によって表わされる。 The joint covariance matrix C 12 in Model 1 is expressed by the following equation.

Figure 0007634259000021
Figure 0007634259000021

式(21)において、Mは、式(20B)におけるMに相当し、Mは、式(20B)におけるMに相当し、mは、式(20B)におけるmに相当し、mは、式(20B)におけるmに相当する。また、μは、Mを式(20C)のMに代入し、グループCLSに分類された通信特性(スキャン応答遅延RTTと通信特性CMbestとからなるベクトル)を式(20C)のxmpに代入して算出され、μは、Mを式(20D)のMに代入し、グループCLSに分類された通信特性(スキャン応答遅延RTTと通信特性CMbestとからなるベクトル)を式(20D)のxmqに代入して算出される。合併共分散行列C12は、グループCLSにおける共分散行列とグループCLSにおける共分散行列との和によって表わされる。 In formula (21), M1 corresponds to Mp in formula (20B), M2 corresponds to Mq in formula (20B), m1 corresponds to mp in formula (20B), and m2 corresponds to mq in formula (20B). Also, μ1 is calculated by substituting M1 for Mp in formula (20C) and substituting the communication characteristic classified into group CLS1 (a vector consisting of scan response delay RTT m and communication characteristic CMbest) into xmp in formula (20C), and μ2 is calculated by substituting M2 for Mq in formula (20D) and substituting the communication characteristic classified into group CLS2 (a vector consisting of scan response delay RTT m and communication characteristic CMbest) into xmq in formula (20D). The joint covariance matrix C12 is represented by the sum of the covariance matrix in group CLS1 and the covariance matrix in group CLS2 .

Model2における合併共分散行列C13は、次式によって表わされる。 The joint covariance matrix C 13 in Model 2 is expressed by the following equation.

Figure 0007634259000022
Figure 0007634259000022

式(22)において、Mは、式(20B)におけるMに相当し、Mは、式(20B)におけるMに相当し、mは、式(20B)におけるmに相当し、mは、式(20B)におけるmに相当する。また、μは、Mを式(20C)のMに代入し、グループCLSに分類された通信特性(スキャン応答遅延RTTと通信特性CMbestとからなるベクトル)を式(20C)のxmpに代入して算出され、μは、Mを式(20D)のMに代入し、グループCLSに分類された通信特性(スキャン応答遅延RTTと通信特性CMbestとからなるベクトル)を式(20D)のxmqに代入して算出される。合併共分散行列C13は、グループCLSにおける共分散行列とグループCLSにおける共分散行列との和によって表わされる。 In formula (22), M1 corresponds to Mp in formula (20B), M3 corresponds to Mq in formula (20B), m1 corresponds to mp in formula (20B), and m3 corresponds to mq in formula (20B). Also, μ1 is calculated by substituting M1 for Mp in formula (20C) and substituting the communication characteristic classified into group CLS1 (a vector consisting of scan response delay RTT m and communication characteristic CMbest) into xmp in formula (20C), and μ3 is calculated by substituting M3 for Mq in formula (20D) and substituting the communication characteristic classified into group CLS3 (a vector consisting of scan response delay RTT m and communication characteristic CMbest) into xmq in formula (20D). The joint covariance matrix C13 is represented by the sum of the covariance matrix in group CLS1 and the covariance matrix in group CLS3 .

Model3における合併共分散行列C23は、次式によって表わされる。 The joint covariance matrix C 23 in Model 3 is expressed by the following equation.

Figure 0007634259000023
Figure 0007634259000023

式(23)において、Mは、式(20B)におけるMに相当し、Mは、式(20B)におけるMに相当し、mは、式(20B)におけるmに相当し、mは、式(20B)におけるmに相当する。また、μは、Mを式(20C)のMに代入し、グループCLSに分類された通信特性(スキャン応答遅延RTTと通信特性CMbestとからなるベクトル)を式(20C)のxmpに代入して算出され、μは、Mを式(20D)のMに代入し、グループCLSに分類された通信特性(スキャン応答遅延RTTと通信特性CMbestとからなるベクトル)を式(20D)のxmqに代入して算出される。合併共分散行列C23は、グループCLSにおける共分散行列とグループCLSにおける共分散行列との和によって表わされる。 In formula (23), M2 corresponds to Mp in formula (20B), M3 corresponds to Mq in formula (20B), m2 corresponds to mp in formula (20B), and m3 corresponds to mq in formula (20B). μ2 is calculated by substituting M2 for Mp in formula (20C) and substituting the communication characteristic classified into group CLS2 (a vector consisting of scan response delay RTT m and communication characteristic CMbest) into xmp in formula (20C), and μ3 is calculated by substituting M3 for Mq in formula (20D) and substituting the communication characteristic classified into group CLS3 (a vector consisting of scan response delay RTT m and communication characteristic CMbest) into xmq in formula (20D). The joint covariance matrix C23 is represented by the sum of the covariance matrix in group CLS2 and the covariance matrix in group CLS3 .

Model1におけるDスコアD_1を算出するとき、グループCLSにおける判別関数fおよびグループCLSにおける判別関数fは、次式によって表わされる。 When calculating the D score D_1 in Model 1, the discriminant function f1 in group CLS 1 and the discriminant function f2 in group CLS 2 are expressed by the following equations.

Figure 0007634259000024
Figure 0007634259000024

式(24A)において、事前平均Πは、Mを式(20E)のMに代入し、通信特性(スキャン応答遅延RTTと通信特性CMbestとからなるベクトル)の総数を式(20E)のMに代入して算出される。また、式(24B)において、事前平均Πは、Mを式(20F)のMに代入し、通信特性(スキャン応答遅延RTTと通信特性CMbestとからなるベクトル)の総数を式(20F)のMに代入して算出される。また、式(24A)における平均μおよび式(24B)における平均μは、式(21)において説明した方法によって算出される。 In formula (24A), the prior average Π 1 is calculated by substituting M 1 into M p in formula (20E) and substituting the total number of communication characteristics (vectors consisting of scan response delay RTT m and communication characteristics CMbest) into M in formula (20E). In formula (24B), the prior average Π 2 is calculated by substituting M 2 into M q in formula (20F) and substituting the total number of communication characteristics (vectors consisting of scan response delay RTT m and communication characteristics CMbest) into M in formula (20F). In addition, the average μ 1 in formula (24A) and the average μ 2 in formula (24B) are calculated by the method described in formula (21).

また、Model2におけるDスコアD_2を算出するとき、グループCLSにおける判別関数fおよびグループCLSにおける判別関数fは、次式によって表わされる。 Furthermore, when calculating the D score D_2 in Model 2, the discriminant function f1 in group CLS 1 and the discriminant function f2 in group CLS 3 are expressed by the following equations.

Figure 0007634259000025
Figure 0007634259000025

式(25A)において、事前平均Πは、Mを式(20E)のMに代入し、通信特性(スキャン応答遅延RTTと通信特性CMbestとからなるベクトル)の総数を式(20E)のMに代入して算出される。また、式(25B)において、事前平均Πは、Mを式(20F)のMに代入し、通信特性(スキャン応答遅延RTTと通信特性CMbestとからなるベクトル)の総数を式(20F)のMに代入して算出される。また、式(25A)における平均μおよび式(25B)における平均μは、式(22)において説明した方法によって算出される。 In formula (25A), the prior average Π 1 is calculated by substituting M 1 into M p in formula (20E) and substituting the total number of communication characteristics (vectors consisting of scan response delay RTT m and communication characteristics CMbest) into M in formula (20E). In formula (25B), the prior average Π 2 is calculated by substituting M 3 into M q in formula (20F) and substituting the total number of communication characteristics (vectors consisting of scan response delay RTT m and communication characteristics CMbest) into M in formula (20F). In addition, the average μ 1 in formula (25A) and the average μ 3 in formula (25B) are calculated by the method described in formula (22).

更に、Model3におけるDスコアD_3を算出するとき、グループCLSにおける判別関数fおよびグループCLSにおける判別関数fは、次式によって表わされる。 Furthermore, when calculating the D score D_3 in Model 3, the discriminant function f1 in group CLS 2 and the discriminant function f2 in group CLS 3 are expressed by the following equations.

Figure 0007634259000026
Figure 0007634259000026

式(26A)において、事前平均Πは、Mを式(20E)のMに代入し、通信特性(スキャン応答遅延RTTと通信特性CMbestとからなるベクトル)の総数を式(20E)のMに代入して算出される。また、式(26B)において、事前平均Πは、Mを式(20F)のMに代入し、通信特性(スキャン応答遅延RTTと通信特性CMbestとからなるベクトル)の総数を式(20F)のMに代入して算出される。また、式(26A)における平均μおよび式(26B)における平均μは、式(23)において説明した方法によって算出される。 In formula (26A), the prior average Π 2 is calculated by substituting M 2 into M p in formula (20E) and substituting the total number of communication characteristics (vectors consisting of scan response delay RTT m and communication characteristics CMbest) into M in formula (20E). In formula (26B), the prior average Π 3 is calculated by substituting M 3 into M q in formula (20F) and substituting the total number of communication characteristics (vectors consisting of scan response delay RTT m and communication characteristics CMbest) into M in formula (20F). In addition, the average μ 2 in formula (26A) and the average μ 3 in formula (26B) are calculated by the method described in formula (23).

そして、DスコアD_1は、式(24A)に示す判別関数fと式(24B)に示す判別関数fとの差=f-fによって表わされる。 The D score D_1 is expressed by the difference between the discriminant function f1 shown in equation (24A) and the discriminant function f2 shown in equation (24B), that is, f1 - f2 .

また、DスコアD_2は、式(25A)に示す判別関数fと式(25B)に示す判別関数fとの差=f-fによって表わされる。 Also, the D score D_2 is represented by the difference between the discriminant function f1 shown in the formula (25A) and the discriminant function f2 shown in the formula (25B), that is, f1 - f2 .

更に、DスコアD_3は、式(26A)に示す判別関数fと式(26B)に示す判別関数fとの差=f-fによって表わされる。 Furthermore, the D score D_3 is represented by the difference between the discriminant function f1 shown in equation (26A) and the discriminant function f2 shown in equation (26B), that is, f1 - f2 .

従って、式(20)~(26)を用いることによってDスコアD_1~D_3を算出できる。 Therefore, the D scores D_1 to D_3 can be calculated by using equations (20) to (26).

推定手段16は、Model1~Model3のいずれかを用いて、Dスコア(D_1~D_3のいずれか)を算出する。 The estimation means 16 uses one of Model1 to Model3 to calculate the D score (one of D_1 to D_3).

そして、推定手段16は、Dスコアが零(=0)よりも小さいか否かを判定する。そして、推定手段16は、Dスコアが零(=0)よりも小さいと判定したとき、零(=0)よりも小さいDスコアの個数を表すカウント値DS_countを“1”だけインクリメントする。 Then, the estimation means 16 judges whether the D score is less than zero (=0). When the estimation means 16 judges that the D score is less than zero (=0), it increments the count value DS_count, which indicates the number of D scores less than zero (=0), by "1".

一方、推定手段16は、Dスコアが零(=0)以上であると判定したとき、カウント値DS_countを変更せずに保持する。 On the other hand, when the estimation means 16 determines that the D score is equal to or greater than zero (=0), it keeps the count value DS_count unchanged.

推定手段16は、この処理を1つの基地局に属する全ての端末装置について実行する。 The estimation means 16 performs this process for all terminal devices that belong to one base station.

推定手段16は、Dスコアのカウント値DS_countをカウントした後、カウント値DS_countに基づいて、ネットワークスキャンの結果を推定するModelをModel2またはModel3に設定する。 After counting the count value DS_count of the D score, the estimation means 16 sets the Model for estimating the results of the network scan to Model2 or Model3 based on the count value DS_count.

より具体的には、推定手段16は、最初、Modelを“1”に設定し(即ち、Model1に設定し)、カウント値DS_countが零(=0)であるとき、またはカウント値DS_countが(Nterminal×D_thres)よりも大きいとき、モデルModelを“2”に設定する(即ち、Model2に設定する)。なお、Nterminalは、1つの基地局に属する端末装置の総数である。また、D_thresは、0~1の範囲の実数に設定される。 More specifically, the estimation means 16 first sets Model to "1" (i.e., Model1), and when the count value DS_count is zero (=0) or is greater than (N terminal ×D_thres), sets the model Model to "2" (i.e., Model2). Note that N terminal is the total number of terminal devices belonging to one base station. Also, D_thres is set to a real number in the range of 0 to 1.

また、推定手段16は、カウント値DS_countが零(=0)でなく、かつ、カウント値DS_countが(Nterminal×D_thres)以下であるとき、モデルModelを“3”に設定する(即ち、Model3に設定する)。 Furthermore, when the count value DS_count is not zero (=0) and is equal to or less than (N terminal ×D_thres), the estimation means 16 sets the model Model to "3" (i.e., Model 3).

そして、推定手段16は、モデルModelが“1”でないとき(即ち、モデルModelが“2”または“3”であるとき)、カウント値DS_countが零(=0)であるか否かを判定する。 Then, when the model Model is not "1" (i.e., when the model Model is "2" or "3"), the estimation means 16 determines whether the count value DS_count is zero (=0).

カウント値DS_countが零(=0)であると判定されたとき、推定手段16は、“正常”なスキャンデータを端末装置について決定する。 When it is determined that the count value DS_count is zero (=0), the estimation means 16 determines that the scan data for the terminal device is "normal."

一方、カウント値DS_countが零(=0)でないと判定されたとき、推定手段16は、カウント値DS_countが(Nterminal×D_thres)よりも小さいか否かを判定する。 On the other hand, when it is determined that the count value DS_count is not zero (=0), the estimation means 16 determines whether or not the count value DS_count is smaller than (N terminal ×D_thres).

そして、カウント値DS_countが(Nterminal×D_thres)よりも小さいと判定されたとき、推定手段16は、“0”よりも小さいDスコアを有する端末装置について、ネットワークスキャンを失敗した原因を「通信品質が不十分である」と推定する。 Then, when it is determined that the count value DS_count is smaller than (N terminal ×D_thres), the estimation means 16 estimates that the cause of the failure of the network scan for a terminal device having a D score smaller than "0" is "insufficient communication quality."

一方、カウント値DS_countが(Nterminal×D_thres)よりも小さくないと判定されたとき(即ち、カウント値DS_countが(Nterminal×D_thres)以上であると判定されたとき)、推定手段16は、基地局に属する全ての端末装置について、ネットワークスキャンが失敗した原因を「ネットワークが混雑している(即ち、ネットワーク輻輳)」と推定する。 On the other hand, when it is determined that the count value DS_count is not smaller than (N terminal × D_thres) (i.e., when it is determined that the count value DS_count is greater than or equal to (N terminal × D_thres)), the estimation means 16 estimates that the cause of the failure of the network scan for all terminal devices belonging to the base station is "network congestion" (i.e., network congestion).

また、カウント値DS_countが零(=0)であると判定され、更に、端末装置の全てのポートでスキャン応答があったと判定されたとき、推定手段16は、端末装置について、ネットワークスキャンが「正常」であると推定する。 In addition, when it is determined that the count value DS_count is zero (=0) and further that there has been a scan response from all ports of the terminal device, the estimation means 16 estimates that the network scan for the terminal device is "normal."

一方、カウント値DS_countが零(=0)であると判定され、更に、端末装置の一部のポートから応答があったと判定されたとき、推定手段16は、端末装置について、ネットワークスキャンが失敗した原因を「ポート閉」と推定する。 On the other hand, when it is determined that the count value DS_count is zero (=0) and further that a response has been received from some of the ports of the terminal device, the estimation means 16 estimates that the cause of the failure of the network scan for the terminal device is a "closed port."

更に、カウント値DS_countが零(=0)であると判定され、更に、端末装置の全てのポートでスキャン応答が無いと判定されたとき、端末装置について、ネットワークスキャンが失敗した原因を「ネットワーク接続無し」と推定する。 Furthermore, when it is determined that the count value DS_count is zero (=0) and furthermore that there is no scan response from all ports of the terminal device, it is estimated that the cause of the failure of the network scan for the terminal device is "no network connection."

推定アルゴリズムALGは、上述した方法によって、ネットワークスキャンの結果を推定するアルゴリズムである。 The estimation algorithm ALG is an algorithm that estimates the results of a network scan using the method described above.

[推定アルゴリズムの変数の置き換え]
推定手段16は、標準サンプルデータD_similarityから生成した検証セット(=サブセットV1’~VU’の全てからなる。)を用いて推定アルゴリズムALGによってネットワークスキャンの結果を推定したときのF1スコアnFがF1スコアFよりも大きいとき、または検証セット(=サブセットV1’~VU’の全てからなる。)を用いて推定アルゴリズムALGによってネットワークスキャンの結果を推定したときのマシューズ相関係数nMCC_uがマシューズ相関係数MCCよりも大きいとき、最終的にF1スコアFよりも大きいと判定されたF1スコアnFが得られるときのサブセットdmax(サブセットd~dのいずれか)を含む仮のサンプルデータD_sample_tentative_maxを用いて推定アルゴリズムALGの変数を置き換え、または最終的にマシューズ相関係数MCCよりも大きいと判定されたマシューズ相関係数nMCC_maxが得られるときのサブセットdmax(サブセットd~dのいずれか)を含む仮のサンプルデータD_sample_tentative_maxを用いて推定アルゴリズムALGの変数を置き換える。
[Variable replacement in estimation algorithm]
When the F1 score nF 1 when the result of the network scan is estimated by the estimation algorithm ALG using a validation set (=consisting of all of the subsets V 1 ′ to V U ′ ) generated from the standard sample data D_similarity is larger than the F1 score F 1 , or when the Matthews correlation coefficient nMCC_u when the result of the network scan is estimated by the estimation algorithm ALG using the validation set (=consisting of all of the subsets V 1 ′ to V U ′ ) is larger than the Matthews correlation coefficient MCC, the estimation means 16 replaces variables of the estimation algorithm ALG using tentative sample data D_sample_tentative_max including a subset d max (any of the subsets d 1 to d U) when the F1 score nF 1 determined to be larger than the F1 score F 1 is finally obtained, or replaces variables of the estimation algorithm ALG using a subset d max (any of the subsets d 1 to d U ) when the Matthews correlation coefficient nMCC_max determined to be larger than the Matthews correlation coefficient MCC is finally obtained. 1. The variables of the estimation algorithm ALG are replaced with tentative sample data D_sample_tentative_max including any of the data D_sample_tentative_max, ...

上述した式(20)において説明したように、式(20A)のxは、スキャン応答遅延RTTと通信特性CMbestとからなるベクトルである。また、式(20C)のμは、グループpに分類された通信特性(スキャン応答遅延RTTと通信特性CMbestとからなるベクトル)の平均μであり、式(20D)のμは、グループqに分類された通信特性(スキャン応答遅延RTTと通信特性CMbestとからなるベクトル)の平均μである。更に、式(20E)の事前平均Πは、グループpに分類された通信特性(スキャン応答遅延RTTと通信特性CMbestとからなるベクトル)の事前平均であり、式(20F)の事前平均Πは、グループqに分類された通信特性(スキャン応答遅延RTTと通信特性CMbestとからなるベクトル)の事前平均である。 As described in the above formula (20), x in formula (20A) is a vector consisting of the scan response delay RTT m and the communication characteristic CMbest. Furthermore, μ p in formula (20C) is the average μ p of the communication characteristics classified into group p (vector consisting of the scan response delay RTT m and the communication characteristic CMbest), and μ q in formula (20D) is the average μ q of the communication characteristics classified into group q (vector consisting of the scan response delay RTT m and the communication characteristic CMbest). Furthermore, the prior average Π p in formula (20E) is the prior average of the communication characteristics classified into group p (vector consisting of the scan response delay RTT m and the communication characteristic CMbest), and the prior average Π q in formula (20F) is the prior average of the communication characteristics classified into group q (vector consisting of the scan response delay RTT m and the communication characteristic CMbest).

ここで、最終的にF1スコアFよりも大きいと判定されたF1スコアnFが得られるときのnサイズのデータ(データd~dのいずれか)、または最終的にマシューズ相関係数MCCよりも大きいと判定されたマシューズ相関係数nMCC_uが得られるときのサブセットdmax(サブセットd~dのいずれか)を含む仮のサンプルデータD_sample_tentative_maxを「サンプルデータD_sample_optimum」と表記する。 Here, the tentative sample data D_sample_tentative_max including data of size n (any of data d 1 to d U ) when an F1 score nF 1 that is ultimately determined to be greater than the F1 score F 1 is obtained, or a subset d max (any of subsets d 1 to d U ) when a Matthews correlation coefficient nMCC_u that is ultimately determined to be greater than the Matthews correlation coefficient MCC is obtained, is denoted as "sample data D_sample_optimum".

推定手段16は、サンプルデータD_sample_optimumを式(20A)のxに代入し、サンプルデータD_sample_optimumを構成するスキャン応答遅延RTTおよび通信特性CMbestのうち、グループpに分類されたスキャン応答遅延RTTと通信特性CMbestとからなるベクトルの平均を平均μとして算出し、サンプルデータD_sample_optimumを構成するスキャン応答遅延RTTおよび通信特性CMbestのうち、グループqに分類されたスキャン応答遅延RTTと通信特性CMbestとからなるベクトルの平均を平均μとして算出し、サンプルデータD_sample_optimumを構成するスキャン応答遅延RTTおよび通信特性CMbestのうち、グループpに分類されたスキャン応答遅延RTTと通信特性CMbestとからなるベクトルの事前平均を事前平均Πとして算出し、サンプルデータD_sample_optimumを構成するスキャン応答遅延RTTおよび通信特性CMbestのうち、グループqに分類されたスキャン応答遅延RTTと通信特性CMbestとからなるベクトルの事前平均を事前平均Πとして算出することによって推定アルゴリズムALGの変数をサンプルデータD_sample_optimumで置き換える。 The estimation means 16 substitutes the sample data D_sample_optimum for x in the formula (20A), calculates an average of a vector consisting of the scan response delay RTT m and communication characteristic CMbest classified into group p among the scan response delay RTT m and communication characteristic CMbest constituting the sample data D_sample_optimum as an average μ p , calculates an average of a vector consisting of the scan response delay RTT m and communication characteristic CMbest classified into group q among the scan response delay RTT m and communication characteristic CMbest constituting the sample data D_sample_optimum as an average μ q , and calculates an average of a vector consisting of the scan response delay RTT m and communication characteristic CMbest classified into group p among the scan response delay RTT m and communication characteristic CMbest constituting the sample data D_sample_optimum as an average μ q. The prior average of a vector consisting of scan response delays RTT m and communication characteristics CMbest classified into group q among the scan response delays RTT m and communication characteristics CMbest constituting the sample data D_sample_optimum is calculated as the prior average Π q , thereby replacing the variables of the estimation algorithm ALG with the sample data D_sample_optimum.

これによって、推定アルゴリズムALGによってネットワークスキャンの結果を推定するときの推定の正確性を向上できる。 This improves the accuracy of estimation when estimating the results of a network scan using the estimation algorithm ALG.

[テストデータを用いた検証]
推定手段16は、最適なトレーニングデータによってモデル変数が置き換えられた後、テストデータ(=サブセットTD~TDの全てからなる。)を用いて、モデル変数が置き換えられたモデル(推定アルゴリズムALG)によってネットワークスキャンの結果を推定し、ネットワークスキャンの推定結果に基づいて混同行列tCFMを生成して算出手段15へ出力する。
[Verification using test data]
After the model variables are replaced by the optimal training data, the estimation means 16 uses the test data (=consisting of all of the subsets TD 1 to TD 4 ) to estimate the results of the network scan with the model (estimation algorithm ALG) in which the model variables have been replaced, and generates a confusion matrix tCFM based on the estimated results of the network scan and outputs it to the calculation means 15.

算出手段15は、混同行列tCFMを推定手段16から受け、その受けた混同行列tCFMの要素TP,TN,FP,FNに基づいて、式(16)~式(18)によってF1スコアtFを算出し、その算出したF1スコアtFを推定手段16へ出力する。 The calculation means 15 receives the confusion matrix tCFM from the estimation means 16, calculates the F1 score tF1 based on the elements TP, TN, FP, and FN of the received confusion matrix tCFM using equations (16) to (18), and outputs the calculated F1 score tF1 to the estimation means 16.

推定手段16は、F1スコアtFを算出手段15から受け、F1スコアtFがF1スコアF以上であるか否かを判定する。 The estimation means 16 receives the F1 score tF1 from the calculation means 15 and determines whether the F1 score tF1 is equal to or greater than the F1 score F1 .

推定手段16は、F1スコアtFがF1スコアF以上であると判定したとき、モデル変数が置き換えられたモデル(推定アルゴリズムALG)およびトレーニングデータ(最適なトレーニングデータ)を承認する。 When the estimation means 16 determines that the F1 score tF 1 is equal to or greater than the F1 score F 1 , it approves the model (estimation algorithm ALG) in which the model variables have been replaced and the training data (optimal training data).

なお、F1スコアtFがF1スコアF以上でないと判定されたとき、推定手段16は、モデル変数が置き換えられたモデル(推定アルゴリズムALG)およびトレーニングデータ(最適なトレーニングデータ)を承認しない。 When it is determined that the F1 score tF1 is not equal to or greater than the F1 score F1 , the estimation means 16 does not approve the model (estimation algorithm ALG) and training data (optimum training data) in which the model variables have been replaced.

このように、推定手段16は、テストデータ(=サブセットTD~TDの全てからなる。)を用いて、モデル変数が置き換えられたモデル(推定アルゴリズムALG)によってネットワークスキャンの結果を推定し、F1スコアtFがF1スコアF以上であることを確認することによって、モデル変数が置き換えられたモデル(推定アルゴリズムALG)およびトレーニングデータ(最適なトレーニングデータ)を検証する。即ち、推定手段16は、テストデータ(=サブセットTD~TDの全てからなる。)を用いて、モデル変数が置き換えられたモデル(推定アルゴリズムALG)によって、ネットワークスキャンの結果が未知である通信環境において実行されたネットワークスキャンの結果を、モデル変数が置き換えられる前のモデル(推定アルゴリズムALG)と比べてより正しく推定可能であることを検証する。 In this way, the estimation means 16 uses the test data (=consisting of all of the subsets TD 1 to TD 4 ) to estimate the results of a network scan using the model (estimation algorithm ALG) in which the model variables have been replaced, and verifies the model (estimation algorithm ALG) in which the model variables have been replaced and the training data (optimum training data) by confirming that the F1 score tF 1 is equal to or greater than the F1 score F 1. That is, the estimation means 16 uses the test data (=consisting of all of the subsets TD 1 to TD 4 ) to verify that the model (estimation algorithm ALG) in which the model variables have been replaced can more accurately estimate the results of a network scan performed in a communication environment in which the results of the network scan are unknown, compared to the model (estimation algorithm ALG) before the model variables were replaced.

図33は、ネットワークスキャンの動作を説明するためのフローチャートである。図33を参照して、ネットワークスキャンの動作が開始されると、ネットワークスキャナ11は、ネットワークスキャンの対象となる端末装置のアドレスAdd~Addおよびポート番号PNを含むスキャンリストと、スキャンスケジュールとをスキャンスケジューラ17から取得する(ステップS1)。 33 is a flow chart for explaining the operation of a network scan. When the operation of a network scan is started, the network scanner 11 obtains a scan list including addresses Add 1 to Add M and port numbers PN r of terminal devices to be the targets of the network scan, and a scan schedule from the scan scheduler 17 (step S1).

そして、ネットワークスキャナ11は、m=1を設定し(ステップS2)、PN=1を設定する(ステップS3)。 Then, the network scanner 11 sets m=1 (step S2), and sets PN r =1 (step S3).

その後、ネットワークスキャナ11は、バックグラウンドトラフィックを監視して、またはバックグラウンドトラフィックを監視せずに、ネットワークスキャンを実行する(ステップS4)。そして、ネットワークスキャナ11は、スキャン応答および待ち時間を取得する(ステップS5)。 Then, the network scanner 11 performs a network scan with or without monitoring background traffic (step S4). Then, the network scanner 11 obtains a scan response and a latency (step S5).

そうすると、ネットワークスキャナ11は、PN=PN_MAX(ポート番号PNの最大値)であるか否かを判定する(ステップS6)。 Then, the network scanner 11 determines whether PN r =PN r _MAX (the maximum value of the port number PN r ) is satisfied (step S6).

ステップS6において、PN=PN_MAXでないと判定されたとき、ネットワークスキャナ11は、PN=PN+1を設定する(ステップS7)。その後、一連の動作は、ステップS4へ移行し、ステップS6において、PN=PN_MAXであると判定されるまで、ステップS4~ステップS7が繰り返し実行される。 When it is determined in step S6 that PNr is not equal to PNr_MAX , the network scanner 11 sets PNr to PNr +1 (step S7). After that, the series of operations proceeds to step S4, and steps S4 to S7 are repeatedly executed until it is determined in step S6 that PNr is equal to PNr_MAX .

そして、ステップS6において、PN=PN_MAXであると判定されると、ネットワークスキャナ11は、m=Mであるか否かを判定する(ステップS8)。 Then, if it is determined in step S6 that PN r =PN r _MAX, the network scanner 11 determines whether or not m =M (step S8).

ステップS8において、m=Mでないと判定されたとき、ネットワークスキャナ11は、m=m+1を設定する(ステップS9)。その後、一連の動作は、ステップS3へ移行し、ステップS8において、m=Mであると判定されるまで、ステップS3~ステップS9が繰り返し実行される。 If it is determined in step S8 that m is not equal to M, the network scanner 11 sets m to m+1 (step S9). After that, the series of operations proceeds to step S3, and steps S3 to S9 are repeatedly executed until it is determined in step S8 that m is equal to M.

そして、ステップS8において、m=Mであると判定されると、ネットワークスキャナ11は、スキャン応答から通信特性(スキャン応答遅延RTT等の複数の通信特性)を抽出し(ステップS10)、その抽出した通信特性とスキャン応答とをスキャン解析マネージャ12へ出力する。 Then, in step S8, if it is determined that m=M, the network scanner 11 extracts communication characteristics (multiple communication characteristics such as scan response delay RTT m ) from the scan response (step S10), and outputs the extracted communication characteristics and the scan response to the scan analysis manager 12.

スキャン解析マネージャ12は、スキャン応答および通信特性をネットワークスキャナ11から受け、その受けたスキャン応答および通信特性に基づいてホスト情報データベース13を作成または更新する。 The scan analysis manager 12 receives scan responses and communication characteristics from the network scanner 11, and creates or updates the host information database 13 based on the received scan responses and communication characteristics.

その後、推定手段16は、ネットワークスキャンの結果を推定する推定アルゴリズムALGをトレーニングし、トレーニングデータを選択する(ステップS11)。この場合、推定手段16は、標準サンプルデータD_similarityを用いてネットワークスキャンの結果を推定し、その推定した推定結果の正確性を評価することによって推定アルゴリズムALGをトレーニングする。また、推定手段16は、推定結果の正確性が最も高くなるときのサンプルデータ(サンプルデータD_sample_optimum)をトレーニングデータとして選択する。 Then, the estimation means 16 trains the estimation algorithm ALG that estimates the results of the network scan, and selects training data (step S11). In this case, the estimation means 16 estimates the results of the network scan using the standard sample data D_similarity, and trains the estimation algorithm ALG by evaluating the accuracy of the estimated results. In addition, the estimation means 16 selects the sample data (sample data D_sample_optimum) when the accuracy of the estimated results is the highest as the training data.

スキャンスケジューラ17は、ステップS11において、正確性が最も高くなるときのネットワークスキャンの推定結果を推定手段16から受け、その受けたネットワークスキャンの推定結果に基づいて再スキャンリストを作成し(ステップS12)、その作成した再スキャンリストをネットワークスキャナ11へ出力する。 In step S11, the scan scheduler 17 receives from the estimation means 16 the estimated results of the network scan when accuracy is highest, creates a rescan list based on the received estimated results of the network scan (step S12), and outputs the created rescan list to the network scanner 11.

なお、再スキャンリストを作成するのは、ネットワークスキャンの結果が「通信品質不十分」または「ネットワーク混雑」である場合、別のスキャンタイミングでネットワークスキャンを実行すれば、ネットワークスキャンの結果が「正常」になる可能性があるからである。 The reason for creating a rescan list is that if the result of a network scan is "insufficient communication quality" or "network congestion," running a network scan at a different time may result in the network scan being "normal."

ステップS12の後、ネットワークスキャナ11は、再スキャンリストが空であるか否かを判定する(ステップS13)。 After step S12, the network scanner 11 determines whether the rescan list is empty (step S13).

ステップS13において、再スキャンリストが空でないと判定されたとき、一連の動作は、ステップS2へ移行し、ステップS13において、再スキャンリストが空であると判定されるまで、ステップS2~ステップS13が繰り返し実行される。 When it is determined in step S13 that the rescan list is not empty, the series of operations proceeds to step S2, and steps S2 to S13 are repeatedly executed until it is determined in step S13 that the rescan list is empty.

そして、ステップS13において、再スキャンリストが空であると判定されると、ネットワークスキャンの動作が終了する。 Then, in step S13, if it is determined that the rescan list is empty, the network scan operation ends.

図34および図35は、それぞれ、図33のステップS10の詳細な動作を説明するための第1および第2のフローチャートである。 Figures 34 and 35 are first and second flowcharts, respectively, for explaining the detailed operation of step S10 in Figure 33.

図34を参照して、図33のステップS8において、m=Mであると判定されると、抽出手段14は、ネットワークスキャンによって取得されたM個の端末装置における全ての通信特性について、上述した方法によって、相関係数rijを算出する(ステップS100)。なお、iは、図8から図11における列方向の引数であり、jは、図8から図11における行方向の引数である。 34, when it is determined in step S8 of Fig. 33 that m = M, the extraction means 14 calculates correlation coefficients r ij for all communication characteristics of M terminal devices acquired by network scanning by the above-mentioned method (step S100), where i is an argument in the column direction in Figs. 8 to 11, and j is an argument in the row direction in Figs. 8 to 11.

そして、抽出手段14は、j=1を設定し(ステップS101)、i=1を設定する(ステップS102)。その後、抽出手段14は、通信特性f,fの相関係数rijを抽出し(ステップS103)、その抽出した相関係数rijがしきい値Corrよりも大きいか否かを判定する(ステップS104)。 Then, the extraction means 14 sets j=1 (step S101), and sets i=1 (step S102). After that, the extraction means 14 extracts a correlation coefficient r ij between the communication characteristics f i and f j (step S103), and determines whether the extracted correlation coefficient r ij is greater than a threshold value Corr r (step S104).

ステップS104において、相関係数rijがしきい値Corrよりも大きくないと判定されたとき、抽出手段14は、通信特性f,fを削除する(ステップS105)。 When it is determined in step S104 that the correlation coefficient r ij is not greater than the threshold value Corr r , the extracting means 14 deletes the communication characteristics f i and f j (step S105).

一方、ステップS104において、相関係数rijがしきい値Corrよりも大きいと判定されたとき、抽出手段14は、通信特性f,fを保存する(ステップS106)。 On the other hand, when it is determined in step S104 that the correlation coefficient r ij is greater than the threshold value Corr r , the extracting means 14 stores the communication characteristics f i and f j (step S106).

そして、ステップS105またはステップS106の後、抽出手段14は、i=I(Iは、図8から図11における列方向の通信特性の最大個数)であるか否かを判定する(ステップS107)。 Then, after step S105 or step S106, the extraction means 14 determines whether i=I (I is the maximum number of communication characteristics in the column direction in Figures 8 to 11) (step S107).

ステップS107において、i=Iでないと判定されたとき、抽出手段14は、i=i+1を設定する(ステップS108)。その後、一連の動作は、ステップS103へ移行し、ステップS107において、i=Iであると判定されるまで、ステップS103~ステップS108が繰り返し実行される。 If it is determined in step S107 that i is not equal to I, the extraction means 14 sets i to i+1 (step S108). After that, the series of operations proceeds to step S103, and steps S103 to S108 are repeatedly executed until it is determined in step S107 that i is equal to I.

そして、ステップS107において、i=Iであると判定されると、抽出手段14は、j=J(Jは、図8から図11における行方向の通信特性の最大個数)であるか否かを判定する(ステップS109)。 If it is determined in step S107 that i=I, the extraction means 14 determines whether j=J (J is the maximum number of communication characteristics in the row direction in Figures 8 to 11) (step S109).

ステップS109において、j=Jでないと判定されたとき、抽出手段14は、j=j+1を設定する(ステップS110)。その後、一連の動作は、ステップS102へ移行し、ステップS109において、j=Jであると判定されるまで、ステップS102~ステップS110が繰り返し実行される。 When it is determined in step S109 that j is not equal to J, the extraction means 14 sets j to j + 1 (step S110). After that, the series of operations proceeds to step S102, and steps S102 to S110 are repeatedly executed until it is determined in step S109 that j is equal to J.

そして、ステップS109において、j=Iであると判定されると、抽出手段14は、保存された全ての通信特性に基づいて、上述した方法によって、保存された全ての通信特性を説明変数とし、スキャン応答遅延RTTを目的変数とする多重線形回帰を算出し(ステップS111)、寄与率Rを取得する。 Then, when it is determined in step S109 that j=I, the extraction means 14 calculates a multiple linear regression based on all the stored communication characteristics by the above-mentioned method, with all the stored communication characteristics as explanatory variables and the scan response delay RTT m as a response variable (step S111), and obtains the contribution rate R2 .

その後、抽出手段14は、寄与率Rがしきい値Sよりも小さいか否かを判定する(ステップS112)。 Thereafter, the extraction means 14 determines whether the contribution rate R2 is smaller than a threshold value Sr (step S112).

ステップS112において、寄与率Rがしきい値Sよりも小さいと判定されたとき、抽出手段14は、推定アルゴリズムALGのモードを“無相関”に設定する(ステップS113)。 When it is determined in step S112 that the contribution rate R2 is smaller than the threshold value Sr , the extraction means 14 sets the mode of the estimation algorithm ALG to "uncorrelation" (step S113).

一方、ステップS112において、寄与率Rがしきい値S以上であると判定されたとき、抽出手段14は、推定アルゴリズムALGのモードを“相関”に設定する(ステップS114)。 On the other hand, when it is determined in step S112 that the contribution rate R2 is equal to or greater than the threshold value Sr , the extraction means 14 sets the mode of the estimation algorithm ALG to "correlation" (step S114).

そして、ステップS113またはステップS114の後、抽出手段14は、ネットワークスキャンにおける待ち時間および通信特性と、推定アルゴリズムALGのモードとを保存する(ステップS115)。 Then, after step S113 or step S114, the extraction means 14 saves the waiting time and communication characteristics in the network scan and the mode of the estimation algorithm ALG (step S115).

図35を参照して、図34のステップS115の後、抽出手段14は、しきい値Corrよりも大きい相関係数rijを有する複数の通信特性の複数のスコアQを算出し、スコアQの大きい順にK個の通信特性を複数の通信特性から選択する(ステップS116)。 35, after step S115 in FIG. 34, the extraction means 14 calculates a plurality of scores Q of a plurality of communication characteristics having a correlation coefficient r ij larger than a threshold value Corr r , and selects K communication characteristics from the plurality of communication characteristics in descending order of score Q (step S116).

そして、抽出手段14は、教師データを用いて分類アルゴリズム(例えば、SVM-train)の学習を実行する(ステップS117)。 Then, the extraction means 14 uses the training data to perform learning of a classification algorithm (e.g., SVM-train) (step S117).

その後、抽出手段14は、k=Kを設定する(ステップS118)。引き続いて、抽出手段14は、学習済の分類アルゴリズムを用いて、通信特性の(k×M)個のサンプルベクトルx11~xkMを2つのグループGP1,GP2に分類する(ステップS119)。 Thereafter, the extraction means 14 sets k=K (step S118). Subsequently, the extraction means 14 classifies the (k×M) sample vectors x 11 to x kM of the communication characteristics into two groups GP1 and GP2 using the trained classification algorithm (step S119).

そして、抽出手段14は、式(4),(6),(7)によって、k個の通信特性のk個の重みw~wを算出する(ステップS120)。 Then, the extraction means 14 calculates k weights w 1 to w k of the k communication characteristics by using the equations (4), (6), and (7) (step S120).

その後、抽出手段14は、k個の重みw~wに基づいて、式(8)によってk個のランク重みR~Rを算出する(ステップS121)。 Thereafter, the extraction means 14 calculates k rank weights R 1 to R k based on the k weights w 1 to w k using equation (8) (step S121).

そして、抽出手段14は、k個のランク重みR~Rに基づいて、最も小さいランク重みRk_minが付与された通信特性のサンプルを、削除する通信特性として決定する(ステップS122)。その後、抽出手段14は、最も小さいランク重みRk_minが付与された通信特性のサンプルをサンプルベクトルx11~xkMから削除する(ステップS123)。 Then, the extraction means 14 determines the communication characteristic sample to which the smallest rank weight R k_min is assigned based on the k rank weights R 1 to R k as the communication characteristic to be deleted (step S122). After that, the extraction means 14 deletes the communication characteristic sample to which the smallest rank weight R k_min is assigned from the sample vectors x 11 to x kM (step S123).

そうすると、抽出手段14は、通信特性のサブセットが空であるか否かを判定する(ステップS124)。 Then, the extraction means 14 determines whether the subset of communication characteristics is empty (step S124).

ステップS124において、通信特性のサブセットが空でないと判定されたとき、抽出手段14は、k=k-1を設定する(ステップS125)。即ち、抽出手段14は、通信特性のサブセットにおけるサンプルの個数を“1”だけ減少する。その後、一連の動作は、ステップS119へ移行し、ステップS124において、通信特性のサブセットが空であると判定されるまで、ステップS119~ステップS125が繰り返し実行される。 When it is determined in step S124 that the subset of communication characteristics is not empty, the extraction means 14 sets k=k-1 (step S125). That is, the extraction means 14 decreases the number of samples in the subset of communication characteristics by "1". After that, the series of operations proceeds to step S119, and steps S119 to S125 are repeatedly executed until it is determined in step S124 that the subset of communication characteristics is empty.

そして、ステップS124において、通信特性のサブセットが空であると判定されると、抽出手段14は、最後に削除した通信特性を通信特性CMbestとして検出する(ステップS126)。そして、一連の動作は、図33のステップS11へ移行する。 Then, when it is determined in step S124 that the subset of communication characteristics is empty, the extraction means 14 detects the last deleted communication characteristic as the communication characteristic CMbest m (step S126).Then, the series of operations proceeds to step S11 in FIG.

ステップS119~ステップS125を1回目に実行した後に、通信特性のサブセットが空になるまで、ステップS119~ステップS125を繰り返し実行することによって、ネットワークスキャンの結果を推定するために最も重要でない通信特性のサンプルを順次削除する。このとき、通信特性の1個のサンプルを削除した後、学習済の分類アルゴリズムを用いて、残ったサンプルを2つのグループGP1,GP2に分類し直す(ステップS119参照)。そして、上述したように、グループGP1は、ネットワークスキャンの結果を推定するために重要な通信特性が分類されるグループであり、グループGP2は、ネットワークスキャンの結果を推定するために重要でない通信特性が分類されるグループである。従って、各サンプルについて、ネットワークスキャンの結果を推定するために重要な通信特性であるか否かの判定の精度を高くして、ネットワークスキャンの結果を推定するために最も重要でないサンプルを削除できる。 After steps S119 to S125 are performed for the first time, steps S119 to S125 are repeatedly performed until the subset of communication characteristics is empty, thereby sequentially deleting samples of communication characteristics that are least important for estimating the results of a network scan. At this time, after deleting one sample of a communication characteristic, the remaining samples are reclassified into two groups GP1 and GP2 using the learned classification algorithm (see step S119). As described above, group GP1 is a group into which communication characteristics that are important for estimating the results of a network scan are classified, and group GP2 is a group into which communication characteristics that are not important for estimating the results of a network scan are classified. Therefore, the accuracy of determining whether or not each sample is a communication characteristic that is important for estimating the results of a network scan is improved, and the sample that is least important for estimating the results of a network scan can be deleted.

なお、図34および図35に示すフローチャートに従って通信特性CMbestを検出する処理は、「検出処理」を構成する。 The process of detecting the communication characteristic CMbest m in accordance with the flowcharts shown in FIGS. 34 and 35 constitutes a "detection process."

また、図34および図35に示すフローチャートに従って通信特性CMbestを検出する抽出手段14は、「検出手段」を構成する。 Moreover, the extraction means 14 that detects the communication characteristic CMbest m in accordance with the flowcharts shown in FIG. 34 and FIG. 35 constitutes the "detection means."

図36から図38は、それぞれ、図33のステップS11の詳細な動作を説明するための第1から第3のフローチャートである。 Figures 36 to 38 are first to third flowcharts, respectively, for explaining the detailed operation of step S11 in Figure 33.

図36を参照して、図33のステップS10の後、抽出手段14は、ホスト情報データベース13に格納された対応表TBL3からネットワークスキャンの複数の既知の推定結果を推定するために用いた標準サンプルデータD_standard_z(z=1~Z)を検出し(ステップS127)、その検出した標準サンプルデータD_standard_z(z=1~Z)を算出手段15へ出力する。 Referring to FIG. 36, after step S10 in FIG. 33, the extraction means 14 detects the standard sample data D_standard_z (z = 1 to Z) used to estimate multiple known estimation results of the network scan from the correspondence table TBL3 stored in the host information database 13 (step S127), and outputs the detected standard sample data D_standard_z (z = 1 to Z) to the calculation means 15.

そして、抽出手段14は、ホスト情報データベース13に格納された対応表TBL1(または対応表TBL2)からネットワークスキャンの結果が不明である通信環境において取得されたサンプルデータxi_unknownを検出する(ステップS128)。より具体的には、抽出手段14は、図34および図35に示すフローチャートに従って通信特性CMbestを検出し、対応表TBL1(または対応表TBL2)から通信特性CMbestに結合されるスキャン応答遅延RTTを検出することによってサンプルデータxi_unknownを検出する。その後、抽出手段14は、その検出したサンプルデータxi_unknownを算出手段15へ出力する。 Then, the extraction means 14 detects sample data x i_unknown acquired in a communication environment where the result of the network scan is unknown from the correspondence table TBL1 (or the correspondence table TBL2) stored in the host information database 13 (step S128). More specifically, the extraction means 14 detects the communication characteristic CMbest m according to the flowcharts shown in Figures 34 and 35, and detects the scan response delay RTT m associated with the communication characteristic CMbest m from the correspondence table TBL1 (or the correspondence table TBL2), thereby detecting the sample data x i_unknown . After that, the extraction means 14 outputs the detected sample data x i_unknown to the calculation means 15.

算出手段15は、標準サンプルデータD_standard_z(z=1~Z)およびサンプルデータxi_unknownを抽出手段14から受ける。そして、算出手段15は、標準サンプルデータD_standard_z(z=1~Z)のスキャン応答遅延{RTTm’_known}_z(m’=1’~M’,z=1~Z)とサンプルデータxi_unknownのスキャン応答遅延RTT_unknown(m=1~M)の確率密度関数PDFを算出する(ステップS129)。 The calculation means 15 receives the standard sample data D_standard_z (z = 1 to Z) and the sample data x i _unknown from the extraction means 14. Then, the calculation means 15 calculates a probability density function PDF of the scan response delay {RTT m' _known}_z (m' = 1' to M', z = 1 to Z) of the standard sample data D_standard_z (z = 1 to Z) and the scan response delay RTT m _unknown (m = 1 to M) of the sample data x i _unknown (step S129).

その後、算出手段15は、サンプルデータxi_unknownの平均絶対偏差Wunknownを算出する(ステップS130)。 After that, the calculation means 15 calculates the mean absolute deviation W unknown of the sample data x i _ unknown (step S130).

そして、算出手段15は、z=1を設定し(ステップS131)、標準サンプルデータD_standard_zの確率密度関数に基づいて式(9)によってモードm(Mo)_knownを算出する(ステップS132)。この場合、算出手段15は、最も生じ易いスキャン応答遅延の値が2つ存在する場合、その最も生じ易いスキャン応答遅延の2つの値を式(9)のr,rに代入してモードm(Mo)_knownを算出し、最も生じ易いスキャン応答遅延の値が3つ以上存在する場合、最も生じ易い3つ以上のスキャン応答遅延から最小値と最大値を検出し、その検出した最小値および最大値を式(9)のr,rに代入してモードm(Mo)_knownを算出する。 Then, the calculation means 15 sets z=1 (step S131), and calculates the mode m(Mo)_known by equation (9) based on the probability density function of the standard sample data D_standard_z (step S132). In this case, when there are two most likely scan response delay values, the calculation means 15 substitutes the two most likely scan response delay values into r1 and r2 in equation (9) to calculate the mode m(Mo)_known, and when there are three or more most likely scan response delay values, the calculation means 15 detects the minimum and maximum values from the three or more most likely scan response delays, and substitutes the detected minimum and maximum values into r1 and r2 in equation (9) to calculate the mode m(Mo)_known.

その後、算出手段15は、サンプルデータxi_known_zとモードm(Mo)_known_zとに基づいて、式(11B)によって相対サンプルデータC(xi_known_z)を算出し(ステップS133)、その算出した相対サンプルデータC(xi_known_z)を式(11A)に代入して平均絶対偏差Wknown_zを算出する(ステップS134)。即ち、算出手段15は、サンプルデータxi_known_zとモードm(Mo)_known_zとに基づいて、式(11)によって平均絶対偏差Wknown_zを算出する。 Thereafter, the calculation means 15 calculates the relative sample data C(x i _known_z ) by equation (11B) based on the sample data x i _known_z and the mode m(Mo)_known_z (step S133), and calculates the mean absolute deviation W known_z by substituting the calculated relative sample data C(x i _known_z ) into equation (11A) (step S134). That is, the calculation means 15 calculates the mean absolute deviation W known_z by equation (11) based on the sample data x i _known_z and the mode m(Mo)_known_z.

引き続いて、算出手段15は、平均絶対偏差Wunknownおよび平均絶対偏差Wknown_zに基づいて、式(12)によって、平均絶対偏差の差SSzを算出する(ステップS135)。 Next, the calculation means 15 calculates the difference S Sz of the mean absolute deviations based on the mean absolute deviation W unknown and the mean absolute deviation W known_z by the formula (12) (step S135).

そして、算出手段15は、平均絶対偏差の差SSzに基づいて、式(13)によって、類似性PSzを算出する(ステップS136)。 Then, the calculation means 15 calculates the similarity P Sz based on the difference S Sz of the mean absolute deviations by using the formula (13) (step S136).

その後、算出手段15は、z=Zであるか否かを判定する(ステップS137)。ステップS137において、z=Zでないと判定されたとき、算出手段15は、z=z+1を設定する(ステップS138)。その後、一連の動作は、ステップS132へ移行し、ステップS137において、z=Zであると判定されるまで、ステップS132~ステップS138が繰り返し実行される。 Then, the calculation means 15 judges whether z=Z or not (step S137). When it is judged in step S137 that z=Z is not true, the calculation means 15 sets z=z+1 (step S138). Then, the series of operations proceeds to step S132, and steps S132 to S138 are repeatedly executed until it is judged in step S137 that z=Z.

そして、ステップS137において、z=Zであると判定されると、一連の動作は、図37のステップS139へ移行する。 If it is determined in step S137 that z=Z, the process proceeds to step S139 in FIG. 37.

図36に示すフローチャートにおいては、Z=3であるとき、ステップS133~ステップS136は、次のように実行される。 In the flowchart shown in FIG. 36, when Z=3, steps S133 to S136 are executed as follows:

図36のステップS133においては、算出手段15は、z=1であるとき、スキャン応答遅延{RTTm’_known}_1(m’=1’~M’)をxi_known_zに代入し、モードm(Mo)_known_1をm(Mo)_known_zに代入して式(11B)によって相対サンプルデータC(xi_known_1)を算出し、z=2であるとき、スキャン応答遅延{RTTm’_known}_2(m’=1’~M’)をxi_known_zに代入し、モードm(Mo)_known_2をm(Mo)_known_zに代入して式(11B)によって相対サンプルデータC(xi_known_2)を算出し、z=3であるとき、スキャン応答遅延{RTTm’_known}_3(m’=1’~M’)をxi_known_zに代入し、モードm(Mo)_known_3をm(Mo)_known_zに代入して式(11B)によって相対サンプルデータC(xi_known_3)を算出する。 In step S133 of FIG. 36, when z=1, the calculation means 15 assigns the scan response delay {RTT m' _known}_1 (m'=1' to M') to x i _known_z , assigns the mode m(Mo)_known_1 to m(Mo)_known_z, and calculates the relative sample data C(x i _known_1 ) by the formula (11B); when z=2, the calculation means 15 assigns the scan response delay {RTT m' _known}_2 (m'=1' to M') to x i _known_z , assigns the mode m(Mo)_known_2 to m(Mo)_known_z, and calculates the relative sample data C(x i _known_2 ) by the formula (11B). ) is calculated, and when z=3, the scan response delay {RTT m' _known}_3 (m'=1' to M') is substituted into x i _known_z , and the mode m(Mo)_known_3 is substituted into m(Mo)_known_z to calculate the relative sample data C(x i _known_3 ) according to equation (11B).

また、図36のステップS134においては、算出手段15は、z=1であるとき、相対サンプルデータC(xi_known_1)をC(xi_known_z)に代入して式(11A)によって平均絶対偏差Wknown_1を算出し、z=2であるとき、相対サンプルデータC(xi_known_2)をC(xi_known_z)に代入して式(11A)によって平均絶対偏差Wknown_2を算出し、z=3であるとき、相対サンプルデータC(xi_known_3)をC(xi_known_z)に代入して式(11A)によって平均絶対偏差Wknown_3を算出する。 Also, in step S134 of FIG. 36 , when z=1, the calculation means 15 substitutes the relative sample data C(x i _known — 1 ) for C(x i _known — z ) to calculate the mean absolute deviation W known — 1 according to equation (11A); when z=2, the calculation means 15 substitutes the relative sample data C(x i _known — 2 ) for C(x i _known — z ) to calculate the mean absolute deviation W known — 2 according to equation (11A); and when z=3, the calculation means 15 substitutes the relative sample data C(x i _known — 3 ) for C(x i _known — z ) to calculate the mean absolute deviation W known — 3 according to equation (11A).

更に、図36のステップS135においては、算出手段15は、z=1であるとき、平均絶対偏差Wknown_1をWknown_zに代入し、平均絶対偏差WunknownをWunknownに代入して式(12)によって平均絶対偏差の差SS1を算出し、z=2であるとき、平均絶対偏差Wknown_2をWknown_zに代入し、平均絶対偏差WunknownをWunknownに代入して式(12)によって平均絶対偏差の差SS2を算出し、z=3であるとき、平均絶対偏差Wknown_3をWknown_zに代入し、平均絶対偏差WunknownをWunknownに代入して式(12)によって平均絶対偏差の差SS3を算出する。 Furthermore, in step S135 of FIG. 36, when z=1, the calculation means 15 assigns the mean absolute deviation W known — 1 to W known_z , assigns the mean absolute deviation W unknown to W unknown , and calculates the difference S S1 of the mean absolute deviations by equation (12), when z=2, assigns the mean absolute deviation W known — 2 to W known_z , assigns the mean absolute deviation W unknown to W unknown , and calculates the difference S S2 of the mean absolute deviations by equation (12), when z=3, assigns the mean absolute deviation W known — 3 to W known_z , assigns the mean absolute deviation W unknown to W unknown , and calculates the difference S S3 of the mean absolute deviations by equation (12). Calculate S3 .

更に、図36のステップS136においては、算出手段15は、z=1であるとき、平均絶対偏差の差SS1をSSzに代入して式(13)によって類似性PS1を算出し、z=2であるとき、平均絶対偏差の差SS2をSSzに代入して式(13)によって類似性PS2を算出し、z=3であるとき、平均絶対偏差の差SS3をSSzに代入して式(13)によって類似性PS3を算出する。 Furthermore, in step S136 of FIG. 36, when z=1, the calculation means 15 substitutes the difference S 2 S1 in the mean absolute deviations into S 2 Sz to calculate the similarity P 2 S1 by equation (13), when z=2, substitutes the difference S 2 S2 in the mean absolute deviations into S 2 Sz to calculate the similarity P 2 S2 by equation (13), and when z=3, substitutes the difference S 2 S3 in the mean absolute deviations into S 2 Sz to calculate the similarity P 2 S3 by equation (13).

図37を参照して、図36のステップS137において、z=Zであると判定されると、算出手段15は、類似性PS1,PS2,・・・,PSZを抽出手段14へ出力する。 37, when it is determined in step S137 of FIG. 36 that z=Z, the calculation means 15 outputs the similarities P S1 , P S2 , . . . , P SZ to the extraction means 14.

抽出手段14は、算出手段15から類似性PS1,PS2,・・・,PSZを受け、その受けた類似性PS1,PS2,・・・,PSZのうちの最も高い類似性PS_highestを検出し、最も高い類似性PS_highestが得られるときの標準サンプルデータD_similarityを検出する(ステップS139)。この場合、複数個の最も高い類似性PS_highestが存在するとき、抽出手段14は、複数個の最も高い類似性PS_highestのうちの任意の類似性PS_highestを検出し、最も高い類似性PS_highestが得られるときの標準サンプルデータD_similarityを検出する。 The extraction means 14 receives the similarities P S1 , P S2 , ..., P SZ from the calculation means 15, detects the highest similarity P S_highest among the received similarities P S1 , P S2 , ..., P SZ , and detects the standard sample data D_similarity when the highest similarity P S_highest is obtained (step S139). In this case, when there are multiple highest similarities P S_highest , the extraction means 14 detects an arbitrary similarity P S_highest among the multiple highest similarities P S_highest , and detects the standard sample data D_similarity when the highest similarity P S_highest is obtained.

そして、抽出手段14は、類似性PS_highestが得られるときの標準サンプルデータD_similarityを推定手段16へ出力する。 Then, the extraction means 14 outputs the standard sample data D_similarity when the similarity P S_highest is obtained to the estimation means 16 .

推定手段16は、抽出手段14から標準サンプルデータD_similarityを受ける。その後、推定手段16は、F1スコアFを“0”に設定する(ステップS140)。 The estimation means 16 receives the standard sample data D_similarity from the extraction means 14. After that, the estimation means 16 sets the F1 score F1 to "0" (step S140).

そして、推定手段16は、標準サンプルデータD_similarityをトレーニングデータとテストデータとに分割し(ステップS141)、トレーニングデータをトレーニングセットと検証セットとに分割する(ステップS142)。 Then, the estimation means 16 divides the standard sample data D_similarity into training data and test data (step S141), and divides the training data into a training set and a validation set (step S142).

そうすると、推定手段16は、上述した方法によってモデリング用の初期のサンプルデータD_sample_initialを生成し、その生成した初期のサンプルデータD_sample_initialからなる古いトレーニングデータを用いて推定アルゴリズムALGを訓練する(ステップS143)。 Then, the estimation means 16 generates initial sample data D_sample_initial for modeling using the above-mentioned method, and trains the estimation algorithm ALG using old training data consisting of the generated initial sample data D_sample_initial (step S143).

そして、推定手段16は、検証セットを用いて推定アルゴリズムALG(訓練後の推定アルゴリズムALG)によってネットワークスキャンの結果を推定し(ステップS144)、ネットワークスキャンの推定結果に基づいて混同行列CFMを生成して算出手段15へ出力する。 Then, the estimation means 16 estimates the results of the network scan by the estimation algorithm ALG (the estimation algorithm ALG after training) using the validation set (step S144), generates a confusion matrix CFM based on the estimated results of the network scan, and outputs it to the calculation means 15.

算出手段15は、混同行列CFMを推定手段16から受け、その受けた混同行列CFMの要素TP,TN,FP,FNに基づいて、式(16)~式(18)によってF1スコアFを算出し(ステップS145)、その算出したF1スコアFを推定手段16へ出力する。 The calculation means 15 receives the confusion matrix CFM from the estimation means 16, calculates the F1 score F1 using equations (16) to (18) based on the elements TP, TN, FP, and FN of the received confusion matrix CFM (step S145), and outputs the calculated F1 score F1 to the estimation means 16.

推定手段16は、算出手段15からF1スコアFを受ける。そして、推定手段16は、トレーニングセットをサブセットd~dに分割する(ステップS146)。その後、一連の動作は、図38のステップS147へ移行する。 The estimation means 16 receives the F1 score F 1 from the calculation means 15. Then, the estimation means 16 divides the training set into subsets d 1 to d U (step S146). After that, the series of operations proceeds to step S147 in FIG.

図38を参照して、図37のステップS146の後、推定手段16は、u=1を設定し(ステップS147)、サブセットdを含む仮のサンプルデータD_sample_tentative_uを用いて推定アルゴリズムALGを訓練する(ステップS148)。 38, after step S146 in FIG. 37, the estimation means 16 sets u=1 (step S147) and trains the estimation algorithm ALG using tentative sample data D_sample_tentative_u including the subset d u (step S148).

そして、推定手段16は、検証セット(=サブセットV1’~VU’の全てからなる。)を用いて推定アルゴリズムALGによってネットワークスキャンの結果を推定し(ステップS149)、ネットワークスキャンの推定結果に基づいて混同行列nCFM_uを生成して算出手段15へ出力する。 Then, the estimation means 16 estimates the results of the network scan using the validation set (=consisting of all of the subsets V 1 ' to V U ' ) with the estimation algorithm ALG (step S149), and generates a confusion matrix nCFM_u based on the estimated results of the network scan and outputs it to the calculation means 15.

算出手段15は、混同行列nCFM_uを推定手段16から受け、その受けた混同行列nCFM_uの要素TP,TN,FP,FNに基づいて、式(16)~式(18)によってF1スコアnF_uを算出し(ステップS150)、その算出したF1スコアnF_uを推定手段16へ出力する。 The calculation means 15 receives the confusion matrix nCFM_u from the estimation means 16, calculates the F1 score nF 1 _u based on the elements TP, TN, FP, and FN of the received confusion matrix nCFM_u using equations (16) to (18) (step S150), and outputs the calculated F1 score nF 1 _u to the estimation means 16.

推定手段16は、算出手段15からF1スコアnF_uを受ける。そして、推定手段16は、F1スコアnF_uがF1スコアFよりも大きいか否かを判定する(ステップS151)。 The estimation means 16 receives the F1 score nF 1 _u from the calculation means 15. Then, the estimation means 16 determines whether or not the F1 score nF 1 _u is greater than the F1 score F 1 (step S151).

ステップS151において、F1スコアnF_uがF1スコアFよりも大きくないと判定されたとき、一連の動作は、ステップS155へ移行する。 When it is determined in step S151 that the F1 score nF 1 _u is not greater than the F1 score F 1 , the series of operations proceeds to step S155.

一方、ステップS151において、F1スコアnF_uがF1スコアFよりも大きいと判定されたとき、推定手段16は、F1スコアnF_uをFに設定する(ステップS152)。 On the other hand, when it is determined in step S151 that the F1 score nF 1 _u is greater than the F1 score F 1 , the estimation means 16 sets the F1 score nF 1 _u to F 1 (step S152).

そして、推定手段16は、F1スコアnF_uが得られたときのサブセットdを含む仮のサンプルデータD_sample_tentative_uをトレーニングデータに設定し(ステップS153)、上述した方法によって、モデル変数(推定アルゴリズムALGの変数)をトレーニングデータで置き換える(ステップS154)。 Then, the estimation means 16 sets tentative sample data D_sample_tentative_u including the subset d u when the F1 score nF 1 _u is obtained as training data (step S153), and replaces the model variables (variables of the estimation algorithm ALG) with the training data by the above-mentioned method (step S154).

そうすると、ステップS151において、F1スコアnF_uがF1スコアFよりも大きくないと判定されたとき、またはステップS154の後、推定手段16は、u=Uであるか否かを判定する(ステップS155)。 Then, when it is determined in step S151 that the F1 score nF 1 _u is not greater than the F1 score F 1 , or after step S154, the estimation means 16 determines whether or not u=U (step S155).

ステップS155において、u=Uでないと判定されたとき、推定手段16は、u=u+1を設定する(ステップS156)。その後、一連の動作は、ステップS148へ移行し、ステップSS155において、u=Uであると判定されるまで、ステップS148~ステップS156が繰り返し実行される。 When it is determined in step S155 that u is not equal to U, the estimation means 16 sets u to u+1 (step S156). After that, the series of operations proceeds to step S148, and steps S148 to S156 are repeatedly executed until it is determined in step S155 that u is equal to U.

そして、ステップS155において、u=Uであると判定されると、推定手段16は、テストデータ(=サブセットTD~TDの全てからなる。)を用いて、モデル変数が置き換えられたモデル(推定アルゴリズムALG)によってネットワークスキャンの結果を推定し(ステップS157)、ネットワークスキャンの推定結果に基づいて混同行列tCFMを生成して算出手段15へ出力する。 Then, when it is determined in step S155 that u = U, the estimation means 16 uses the test data (= consisting of all of the subsets TD 1 to TD 4 ) to estimate the results of the network scan with a model (estimation algorithm ALG) in which the model variables have been replaced (step S157), and generates a confusion matrix tCFM based on the estimated results of the network scan and outputs it to the calculation means 15.

算出手段15は、混同行列tCFMを推定手段16から受け、その受けた混同行列tCFMの要素TP,TN,FP,FNに基づいて、式(16)~式(18)によってF1スコアtFを算出し(ステップS158)、その算出したF1スコアtFを推定手段16へ出力する。 The calculation means 15 receives the confusion matrix tCFM from the estimation means 16, calculates the F1 score tF1 using equations (16) to (18) based on the elements TP, TN, FP, and FN of the received confusion matrix tCFM (step S158), and outputs the calculated F1 score tF1 to the estimation means 16.

推定手段16は、F1スコアtFを算出手段15から受け、F1スコアtFがF1スコアF以上であるか否かを判定する(ステップS159)。 The estimation means 16 receives the F1 score tF1 from the calculation means 15 and determines whether the F1 score tF1 is equal to or greater than the F1 score F1 (step S159).

ステップS159において、F1スコアtFがF1スコアF以上でないと判定されたとき、一連の動作は、ステップS147へ移行し、ステップS159において、F1スコアtFがF1スコアF以上であると判定されるまで、ステップステップS147~ステップS159が繰り返し実行される。 When it is determined in step S159 that the F1 score tF1 is not equal to or greater than the F1 score F1, the series of operations proceeds to step S147, and steps S147 to S159 are repeatedly executed until it is determined in step S159 that the F1 score tF1 is equal to or greater than the F1 score F1 .

そして、ステップS159において、F1スコアtFがF1スコアF以上であると判定されると、推定手段16は、モデル変数が置き換えられたモデル(推定アルゴリズムALG)およびトレーニングデータ(最終的に、F<nF_uを満たすサブセットdを含む仮のサンプルデータD_sample_tentative_u)を承認する(ステップS160)。なお、ステップS160において承認された仮のサンプルデータD_sample_tentative_uは、図33のステップS11が2回目以降に実行されるときのデータサンプルD_sample_initialになる。 Then, when it is determined in step S159 that the F1 score tF1 is equal to or greater than the F1 score F1 , the estimation means 16 approves the model (estimation algorithm ALG) in which the model variables have been replaced and the training data (finally, tentative sample data D_sample_tentative_u including a subset d u that satisfies F1 < nF1_u ) (step S160). Note that the tentative sample data D_sample_tentative_u approved in step S160 becomes the data sample D_sample_initial when step S11 in FIG. 33 is executed for the second or subsequent times.

そして、ステップS160の後、推定手段16は、ネットワークスキャンの結果が不明である通信環境におけるネットワークスキャンによって取得されたサンプルデータxunknownを用いて、モデル変数が置き換えられたモデル(推定アルゴリズムALG)によってネットワークスキャンの結果を推定する(ステップS161)。その後、一連の動作は、図33のステップS12へ移行する。 Then, after step S160, the estimation means 16 estimates the result of the network scan by using the sample data x unknown acquired by the network scan in the communication environment where the result of the network scan is unknown, with the model (estimation algorithm ALG) in which the model variables have been replaced (step S161). After that, the series of operations proceeds to step S12 in FIG. 33.

なお、図37のステップS140,S145および図38のS150,S151,S152,S153,S158,S159においては、F1スコアF,nF_u,tFに代えてそれぞれマシューズ相関係数MCC,nMCC_u,tMCCが用いられてもよい。 In steps S140 and S145 in FIG. 37 and S150, S151, S152, S153, S158 and S159 in FIG. 38, Matthews correlation coefficients MCC, nMCC_u and tMCC may be used instead of the F1 scores F 1 , nF 1 _u and tF 1 , respectively.

図38のステップS148~ステップS156のループが1回目に実行された後に、ステップS159において、F1スコアtFがF1スコアF以上でないと判定され、ステップS148~ステップS156のループが2回目に実行される場合、ステップS148,S149においては、ステップS148~ステップS156のループが1回目に実行されたときに、最終的に、モデル変数が最適なトレーニングデータで置き換えられた推定アルゴリズムALGが用いられる。その結果、ステップS148~ステップS156のループが2回目に実行される場合、ステップS150において算出されるF1スコアnF_uは、ステップS148~ステップS156のループが1回目に実行されたときのステップS150において算出されたF1スコアnF_uよりも大きくなる。同様に、ステップS148~ステップS156のループが3回目、4回目、・・・に実行されるときのステップS150において算出されるF1スコアnF_uは、それぞれ、ステップS148~ステップS156のループが2回目、3回目、・・・に実行されるときのステップS150において算出されるF1スコアnF_uよりも大きくなる。 38 is executed for the first time, in step S159, if it is determined that the F1 score tF 1 is not equal to or greater than the F1 score F 1 , and the loop of steps S148 to S156 is executed for the second time, the estimation algorithm ALG in which the model variables have been replaced with optimal training data when the loop of steps S148 to S156 is executed for the first time is used in steps S148 and S149. As a result, when the loop of steps S148 to S156 is executed for the second time, the F1 score nF 1 _u calculated in step S150 is greater than the F1 score nF 1 _u calculated in step S150 when the loop of steps S148 to S156 was executed for the first time. Similarly, the F1 score nF 1 _u calculated in step S150 when the loop from step S148 to step S156 is executed a third, fourth, ... will be greater than the F1 score nF 1 _u calculated in step S150 when the loop from step S148 to step S156 is executed a second, third, ....

従って、ステップS148~ステップS156のループの実行回数が増加するに伴って、ステップS148~ステップS156のループのR(Rは、2以上の整数である。)回目の実行においてステップS150で算出されたF1スコアnF_uは、ステップS148~ステップS156のループの(R-1)回目の実行においてステップS150で算出されたF1スコアnF_uよりも大きくなる。そして、ステップS154において、モデル変数を最適なトレーニングデータで置き換えることによって、推定アルゴリズムALGは、ネットワークスキャンの結果が既知の推定結果(“正常”、“通信品質不十分”および“ネットワーク混雑”のいずれか)であると推定したときの推定アルゴリズムに近づく。つまり、推定アルゴリズムALGは、最適なアルゴリズムに近づく。 Therefore, as the number of times the loop of steps S148 to S156 is executed increases, the F1 score nF 1 _u calculated in step S150 in the Rth (R is an integer equal to or greater than 2) execution of the loop of steps S148 to S156 becomes larger than the F1 score nF 1 _u calculated in step S150 in the (R- 1 )th execution of the loop of steps S148 to S156. Then, in step S154, by replacing the model variables with optimal training data, the estimation algorithm ALG approaches an estimation algorithm when it is estimated that the result of the network scan is a known estimation result (any of "normal", "inadequate communication quality", and "network congestion"). In other words, the estimation algorithm ALG approaches an optimal algorithm.

そうすると、ステップS159において、F1スコアtFがF1スコアF以上になる可能性が高くなり、ステップS160において、モデル変数が置き換えられたモデル(推定アルゴリズムALG)およびトレーニングデータ(最終的に、F<nF_uを満たすサブセットdを含む仮のサンプルデータD_sample_tentative_u)を承認する可能性も高くなる。 This increases the likelihood that in step S159, the F1 score tF1 will be greater than or equal to the F1 score F1 , and also increases the likelihood that in step S160, the model (estimation algorithm ALG) and training data in which the model variables have been replaced (finally, tentative sample data D_sample_tentative_u including a subset d u that satisfies F 1 < nF 1 _u) will be approved.

よって、ステップS159において、F1スコアtFがF1スコアF以上でないと判定された後に、検証セットおよびテストデータを変更しなくても、推定アルゴリズムALGが最適なアルゴリズム(ネットワークスキャンの推定結果が既知の推定結果(“正常”、“通信品質不十分”および“ネットワーク混雑”のいずれか)になるアルゴリズム)に近づくので、ステップS160において、モデル変数が置き換えられたモデル(推定アルゴリズムALG)およびトレーニングデータ(最終的に、F<nF_uを満たすサブセットdを含む仮のサンプルデータD_sample_tentative_u)を承認する可能性を高くできる。 Therefore, after it is determined in step S159 that the F1 score tF1 is not greater than or equal to the F1 score F1 , the estimation algorithm ALG approaches an optimal algorithm (an algorithm in which the estimation result of the network scan becomes a known estimation result (any of "normal", "poor communication quality", and "network congestion")) without changing the validation set and test data, so that in step S160, the model (estimation algorithm ALG) and training data in which the model variables have been replaced (finally, tentative sample data D_sample_tentative_u including a subset d u that satisfies F1 < nF1_u ) are likely to be approved.

そして、図38のステップS147~ステップS160は、ネットワークスキャンの結果が不明である通信環境において実行されたネットワークスキャンの結果を推定する推定アルゴリズムALGを最適アルゴリズムに近づくように更新することに相当する。ここで、最適アルゴリズムは、ネットワークスキャンの結果を推定したときの推定結果が既知の推定結果になるようにネットワークスキャンの結果を推定するアルゴリズムである。 Steps S147 to S160 in FIG. 38 correspond to updating the estimation algorithm ALG, which estimates the results of a network scan performed in a communication environment where the results of the network scan are unknown, to approach the optimal algorithm. Here, the optimal algorithm is an algorithm that estimates the results of a network scan such that the estimated results when the results of the network scan are estimated become known estimated results.

推定アルゴリズムALGが最適アルゴリズムに近づいた後に、ステップS161において、ネットワークスキャンの結果が不明である通信環境におけるネットワークスキャンによって取得されたサンプルデータxunknownを用いて、最適アルゴリズムに近づいた推定アルゴリズムALGによってネットワークスキャンの結果を推定するので、ネットワークスキャンの結果を正確に推定できる。 After the estimation algorithm ALG approaches the optimal algorithm, in step S161, the result of the network scan is estimated by the estimation algorithm ALG that has approached the optimal algorithm using sample data x unknown acquired by a network scan in a communication environment where the result of the network scan is unknown, so that the result of the network scan can be accurately estimated.

図36のステップS127においては、抽出手段14は、標準サンプルデータD_standard_z(z=1~Z)を抽出する。そして、算出手段15は、ステップS131~S138において、Z個の標準サンプルデータD_standard_1~D_standard_Zとサンプルデータxi_unknownとのZ個の類似性PS1~PSZを算出する。 36, the extraction means 14 extracts standard sample data D_standard_z (z=1 to Z). Then, in steps S131 to S138, the calculation means 15 calculates Z similarities P S1 to P SZ between the Z standard sample data D_standard_1 to D_standard_Z and the sample data x i _unknown .

その後、抽出手段14は、図37のステップS139において、Z個の類似性PS1~PSZのうちの最も高い類似性PS_highestを検出する。 Thereafter, in step S139 of FIG. 37, the extraction means 14 detects the highest similarity P S_highest among the Z similarities P S1 to P SZ .

従って、ステップS127~ステップS139が実行されることによって、抽出手段14は、サンプルデータxi_unknownの確率密度関数に最も類似する確率密度関数を有する標準サンプルデータD_similarity(=最も高い類似性PS_highestが得られるときの標準サンプルデータD_standard_z)をZ個の標準サンプルデータD_standard_1~標準サンプルデータD_standard_Zから検出する。 Therefore, by executing steps S127 to S139, the extraction means 14 detects the standard sample data D_similarity (= the standard sample data D_standard_z when the highest similarity P S_highest is obtained) having the probability density function most similar to the probability density function of the sample data x i _unknown from the Z standard sample data D_standard_1 to standard sample data D_standard_Z.

その後、推定手段16は、古いトレーニングデータ(=初期のサンプルデータD_sample_initial)を用いて推定アルゴリズムALGを訓練し(ステップS143参照)、算出手段15は、検証セットを用いて、訓練後の推定アルゴリズムALGによってネットワークスキャンの結果を推定したときのF1スコアFを算出する(ステップS144,S145参照)。 Thereafter, the estimation means 16 trains the estimation algorithm ALG using old training data (=initial sample data D_sample_initial) (see step S143), and the calculation means 15 uses the validation set to calculate the F1 score F1 when the results of the network scan are estimated by the trained estimation algorithm ALG (see steps S144 and S145).

また、算出手段15および推定手段16が、U個のサブセットd~dをそれぞれ含むU個の仮のサンプルデータD_sample_tentative_1~D_sample_tentative_Uの全てについてステップS147~ステップS156を実行することによって、推定手段16は、U個のF1スコアnF_1~nF_Uのうちで最も大きいF1スコアnF_highestを取得する。ステップS151において、F1スコアnF_uがF1スコアFよりも大きいと判定されたとき、F1スコアFよりも大きいF1スコアnF_uがF1スコアFとして設定されるので(ステップS152参照)、ステップS151がu回目に実行されるときのF1スコアFは、ステップS151が(u-1)回目に実行されるときのF1スコアFよりも大きくなっている。その結果、u回目のステップS151の実行によってF1スコアFよりも大きいと判定されたF1スコアnF_uは、(u-1)回目のステップS151の実行によってF1スコアFよりも大きいと判定されたF1スコアnF_uよりも大きい。従って、U個のサブセットd~dをそれぞれ含むU個の仮のサンプルデータD_sample_tentative_1~D_sample_tentative_Uの全てについてステップS147~ステップS156を実行することによって、U個のF1スコアnF_1~nF_Uのうちで最も大きいF1スコアnF_highestが得られる。 Furthermore, the calculation means 15 and the estimation means 16 execute steps S147 to S156 for all of the U pieces of provisional sample data D_sample_tentative_1 to D_sample_tentative_U, each of which includes the U subsets d 1 to d U , so that the estimation means 16 acquires the largest F1 score nF 1 _highest among the U pieces of F1 scores nF 1 _1 to nF 1 _U. When it is determined in step S151 that the F1 score nF 1 _u is greater than the F1 score F 1 , the F1 score nF 1 _u greater than the F1 score F 1 is set as the F1 score F 1 (see step S152), so that the F1 score F 1 when step S151 is executed for the uth time is greater than the F1 score F 1 when step S151 is executed for the (u-1)th time. As a result, the F1 score nF 1 _u determined to be greater than the F1 score F 1 by the u-th execution of step S151 is greater than the F1 score nF 1 _u determined to be greater than the F1 score F 1 by the (u- 1 )-th execution of step S151. Therefore, by executing steps S147 to S156 for all of U pieces of provisional sample data D_sample_tentative_1 to D_sample_tentative_U each including U subsets d 1 to d U , the largest F1 score nF 1 _highest among the U F1 scores nF 1 _1 to nF 1 _U is obtained.

そして、推定手段16は、U個のF1スコアnF_1~nF_Uのうちで最も大きいF1スコアnF_highestが得られるときのサブセットdu_highestを含む仮のサンプルデータD_sample_highestをトレーニングデータに設定し(ステップS153参照)、その設定したトレーニングデータによってモデル変数(推定アルゴリズムALGの変数)を置き換える(ステップS154参照)。 Then, the estimation means 16 sets the provisional sample data D_sample_highest including the subset d u _highest when the highest F1 score nF 1 _highest is obtained among the U F1 scores nF 1 _1 to nF 1 _U as the training data (see step S153), and replaces the model variables (variables of the estimation algorithm ALG) with the set training data (see step S154).

その結果、F1スコアnF_highestは、ネットワークスキャンの結果を推定するときの正確性が最も高いことを示し、推定アルゴリズムALGの変数は、F1スコアnF_highestが得られるときのサブセットdu_highestを含む仮のサンプルデータD_sample_highestで置き換えられるので、最終的に仮のサンプルデータD_sample_highestで置き換えられた変数を有する推定アルゴリズムALGを用いてネットワークスキャンの結果を推定することによってネットワークスキャンの結果を推定するときの正確性を最も高くできる。 As a result, the F1 score nF 1 _highest indicates the highest accuracy in estimating the results of the network scan, and the variables of the estimation algorithm ALG are replaced with the hypothetical sample data D_sample_highest which includes the subset d u _highest when the F1 score nF 1 _highest is obtained, so that the accuracy in estimating the results of the network scan can be maximized by estimating the results of the network scan using the estimation algorithm ALG having variables replaced with the hypothetical sample data D_sample_highest.

なお、標準サンプルデータD_standard_z(z=1~Z)は、スキャン応答遅延{RTTm’_known}_z(m’=1’~M’,z=1~Z)と通信特性{CMbestm’_known}_z(m’=1’~M’,z=1~Z)とからなるので、抽出手段14が、サンプルデータxi_unknownの確率密度関数に最も類似する確率密度関数を有する標準サンプルデータD_similarity(=最も高い類似性PS_highestが算出されるときの標準サンプルデータD_standard_z)をZ個の標準サンプルデータD_standard_1~標準サンプルデータD_standard_Zから検出する処理は、「検出処理」を構成する。また、標準サンプルデータD_similarityに含まれるスキャン応答遅延{RTTm’_known}_similarity(m’=1’~M’)は、「類似スキャン応答遅延」を構成する。更に、検出処理を実行する抽出手段14は、「検出手段」を構成する。更に、M’,Zの各々は、2以上の整数であるので、標準サンプルデータD_standard_z(z=1~Z)に含まれる{RTTm’_known}_z(m’=1’~M’,z=1~Z)は、「複数組のM’個の第2のスキャン応答遅延」を構成する。 In addition, since the standard sample data D_standard_z (z = 1 to Z) consists of a scan response delay {RTT m' _known}_z (m' = 1' to M', z = 1 to Z) and a communication characteristic {CMbest m' _known}_z (m' = 1' to M', z = 1 to Z), the process in which the extraction means 14 detects the standard sample data D_similarity (= the standard sample data D_standard_z when the highest similarity P S_highest is calculated) having a probability density function most similar to the probability density function of the sample data x i _unknown from the Z pieces of standard sample data D_standard_1 to standard sample data D_standard_Z constitutes a "detection process". Furthermore, the scan response delay {RTT m' _known}_similarity (m' = 1' to M') included in the standard sample data D_similarity constitutes a "similar scan response delay." Furthermore, the extraction means 14 that executes the detection process constitutes a "detection means." Furthermore, since each of M' and Z is an integer equal to or greater than 2, {RTT m' _known}_z (m' = 1' to M', z = 1 to Z) included in the standard sample data D_standard_z (z = 1 to Z) constitutes "multiple sets of M' second scan response delays."

また、サンプルデータxi_unknownは、スキャン応答遅延RTT_unknown(m=1~M)と通信特性CMbest_unknown(m=1~M)とからなるので、「第1のサンプルデータ」を構成する。そして、図34および図35に示すフローチャートに従って通信特性CMbestを検出し、対応表TBL1(または対応表TBL2)から通信特性CMbestに結合されるスキャン応答遅延RTTを検出することによってサンプルデータxi_unknownを検出する抽出手段14は、「生成手段」を構成する。 Moreover, since the sample data x i _unknown is composed of a scan response delay RTT m _unknown (m = 1 to M) and a communication characteristic CMbest m _unknown (m = 1 to M), it constitutes “first sample data". Then, the extraction means 14 that detects the communication characteristic CMbest m according to the flowcharts shown in Figures 34 and 35 and detects the scan response delay RTT m combined with the communication characteristic CMbest m from the correspondence table TBL1 (or correspondence table TBL2) to detect the sample data x i _unknown constitutes “generation means".

更に、標準サンプルデータD_similarityは、スキャン応答遅延{RTT’_known}_similarity(m’=1’~M’)と通信特性{CMbestm’_known}_similarity(m’=1’~M’)とからなるので、「類似標準サンプルデータ」を構成する。そして、標準サンプルデータD_similarityを検出する抽出手段14は、「生成手段」を構成する。 Furthermore, the standard sample data D_similarity is made up of scan response delay {RTT m '_known}_similarity (m'=1' to M') and communication characteristic {CMbest m'_known }_similarity (m'=1' to M'), and therefore constitutes "similar standard sample data". The extraction means 14 that detects the standard sample data D_similarity constitutes the "generation means".

更に、F1スコアF,nF(=nF_1~nF_U),tFまたはマシューズ相関係数MCC,nMCC(=nMCC_1~nMCC_U),tMCCは、「評価指数」を構成し、F1スコアFまたはマシューズ相関係数MCCは、「第1の評価指数」を構成し、F1スコアnF(=nF_1~nF_U)またはマシューズ相関係数nMCC(=nMCC_1~nMCC_U)は、「第2の評価指数」を構成し、F1スコアtFまたはマシューズ相関係数tMCCは、「第3の評価指数」を構成する。 Furthermore, the F1 scores F 1 , nF 1 (=nF 1 _1 to nF 1 _U), tF 1 or the Matthews correlation coefficients MCC, nMCC (=nMCC_1 to nMCC_U), and tMCC constitute an "evaluation index", the F1 score F 1 or the Matthews correlation coefficient MCC constitutes a "first evaluation index", the F1 scores nF 1 (=nF 1 _1 to nF 1 _U) or the Matthews correlation coefficient nMCC (=nMCC_1 to nMCC_U) constitute a "second evaluation index", and the F1 score tF 1 or the Matthews correlation coefficient tMCC constitutes a "third evaluation index".

更に、トレーニングデータ(=サブセットdu_highestを含む仮のサンプルデータD_sample_tentative)で推定アルゴリズムALGの変数を置き換える推定手段16は、推定アルゴリズムALGを第1のサンプルデータによって更新する「更新手段」を構成する。 Furthermore, the estimation means 16 that replaces the variables of the estimation algorithm ALG with the training data (=the tentative sample data D_sample_tentative including the subset d u_highest ) constitutes an "update means" that updates the estimation algorithm ALG with the first sample data.

更に、ステップS132~S136を全てのz(=1~Z)について実行し、ステップS139において最も高い類似性PS_highestが得られるときの標準サンプルデータD_similarityを検出することは、標準サンプルデータD_standard_z(z=1~Z)のスキャン応答遅延{RTTm’_known}_z(m’=1’~M’,z=1~Z)のZ個のスキャン応答遅延{RTTm’_unknown}_1~{RTTm’_unknown}_Zの分布と、サンプルデータxi_unknownのスキャン応答遅延RTT_unknown(m=1~M)の分布とに基づいて、M個のスキャン応答遅延RTT_unknownの分布に最も類似する分布を有するM’個のスキャン応答遅延{RTT1’_known}_z~{RTTM’_known}_zを複数組(=Z組)のM’個のスキャン応答遅延{RTT1’_known}_z~{RTTM’_known}_zから類似スキャン応答遅延として検出することに相当する。 Furthermore, steps S132 to S136 are performed for all z (=1 to Z), and the standard sample data D_similarity when the highest similarity P S_highest is obtained in step S139 is detected by detecting M' scan response delays {RTT m' _unknown}_1 to {RTT m' _unknown}_Z having a distribution most similar to the distribution of M scan response delays RTT m _unknown based on the distribution of Z scan response delays {RTT m' _known}_z (m'=1' to M', z=1 to Z) of the standard sample data D_standard_z ( z =1 to Z) and the distribution of the scan response delay RTT m _unknown (m=1 to M) of the sample data x i _unknown. This corresponds to detecting {RTT 1 ' _known}_z through {RTT M ' _known}_z as similar scan response delays from a plurality of sets (=Z sets) of M' scan response delays {RTT 1 ' _known}_z through {RTT M ' _known}_z.

更に、ステップS130において、平均絶対偏差Wunknownを算出することは、「第1の算出処理」を構成する。 Furthermore, calculating the mean absolute deviation W unknown in step S130 constitutes a "first calculation process."

更に、ステップS132~ステップS136によって類似性PSzを算出することは、「第2の算出処理」を構成する。 Furthermore, calculating the similarity P Sz in steps S132 to S136 constitutes a "second calculation process."

更に、ステップS148を実行することは、「第1の訓練」を実行することを構成し、ステップS143を実行することは、「第2の訓練」を実行することを構成する。そして、ステップS143,S148を実行する推定手段16は、「訓練手段」を構成する。 Furthermore, executing step S148 constitutes executing a "first training", and executing step S143 constitutes executing a "second training". And the estimation means 16 that executes steps S143 and S148 constitutes a "training means".

図39は、図36のステップS130の詳細な動作を説明するためのフローチャートである。 Figure 39 is a flowchart explaining the detailed operation of step S130 in Figure 36.

図39を参照して、図36のステップS129の後、算出手段15は、サンプルデータxi_unknownの確率密度関数に基づいて式(9)によってサンプルデータxi_unknownのモードm(Mo)_unknownを算出する(ステップS1301)。 39, after step S129 in FIG. 36, the calculation means 15 calculates the mode m(Mo)_unknown of the sample data x i_unknown by equation (9) based on the probability density function of the sample data x i_unknown (step S1301).

その後、算出手段15は、サンプルデータxi_unknownとモードm(Mo)_unknownとに基づいて、式(10B)によって相対サンプルデータC(xi_unknown)_unknownを算出し(ステップS1302)、その算出した相対サンプルデータC(xi_unknown)_unknownを式(10A)に代入して平均絶対偏差Wunknownを算出する(ステップS1303)。即ち、算出手段15は、サンプルデータxi_unknownとモードm(Mo)_unknownとに基づいて、式(10)によって平均絶対偏差Wunknownを算出する。そして、ステップS1303の後、一連の動作は、図36のステップS131へ移行する。 Thereafter, the calculation means 15 calculates the relative sample data C( xi_unknown )_unknown by the formula (10B) based on the sample data xi_unknown and the mode m(Mo)_unknown (step S1302), and substitutes the calculated relative sample data C( xi_unknown )_unknown into the formula (10A) to calculate the mean absolute deviation Wunknown (step S1303). That is, the calculation means 15 calculates the mean absolute deviation Wunknown by the formula (10) based on the sample data xi_unknown and the mode m(Mo)_unknown. Then, after step S1303, the series of operations proceeds to step S131 in FIG. 36.

図40から図42は、それぞれ、図37のステップS143の詳細な動作を説明するための第1から第3のフローチャートである。 Figures 40 to 42 are first to third flowcharts, respectively, for explaining the detailed operation of step S143 in Figure 37.

図40を参照して、図37のステップS142の後、推定手段16は、抽出手段14から受けた標準サンプルデータD_similarityに含まれるスキャン応答遅延{RTTm’_known}_similarityおよび通信特性{CMbestm’_known}_similarityを検出する。 40, after step S142 in FIG. 37, the estimation means 16 detects the scan response delay {RTT m' _known}_similarity and the communication characteristic {CMbest m' _known}_similarity included in the standard sample data D_similarity received from the extraction means 14.

そして、推定手段16は、b=1を設定し(ステップS1431)、LDAアルゴリズムを用いて判別関数δ(x)を生成する(ステップS1432)。引き続いて、推定手段16は、ネットワークスキャンの結果を推定するモデルModelをModel=1に設定し(ステップS1433)、m=1を設定し(ステップS1434)、DS_count=0を設定する(ステップS1435)。ここで、mは、1つの基地局bに属する端末装置を表す。 Then, the estimation means 16 sets b=1 (step S1431) and generates a discriminant function δ g (x) using the LDA algorithm (step S1432). Subsequently, the estimation means 16 sets a model Model for estimating the result of the network scan to Model=1 (step S1433), sets m b =1 (step S1434), and sets DS_count=0 (step S1435). Here, m b represents a terminal device belonging to one base station b.

そして、推定手段16は、判別関数δ(x)を用いて通信特性{CMbestm’_known}_similarityを有する端末装置のDスコアを算出する(ステップS1436)。 Then, the estimation means 16 calculates the D-score of the terminal device having the communication characteristic {CMbest m' _known}_similarity by using the discriminant function δ g (x) (step S1436).

その後、推定手段16は、Dスコアが零(0)よりも小さいか否かを判定する(ステップS1437)。 Then, the estimation means 16 determines whether the D score is less than zero (0) (step S1437).

ステップS1437において、Dスコアが零(0)よりも小さいと判定されたとき、推定手段16は、DS_count=DS_count+1を設定する(ステップS1438)。即ち、推定手段16は、カウント値DS_countを“1”だけインクリメントする。 When it is determined in step S1437 that the D score is less than zero (0), the estimation means 16 sets DS_count = DS_count + 1 (step S1438). That is, the estimation means 16 increments the count value DS_count by "1".

そして、ステップS1437において、Dスコアが零(0)よりも小さくないと判定されたとき、またはステップS1438の後、推定手段16は、m=Nterminalであるか否かを判定する(ステップS1439)。 Then, when it is determined in step S1437 that the D score is not smaller than zero (0), or after step S1438, the estimation means 16 determines whether or not m b =N terminal (step S1439).

ステップS1439において、m=Nterminalでないと判定されたとき、推定手段16は、m=m+1を設定する(ステップS1440)。その後、一連の動作は、ステップS1436へ移行し、ステップS1439において、m=Nterminalであると判定されるまで、ステップS1436~ステップS1440が繰り返し実行される。 When it is determined in step S1439 that m b is not equal to N terminal , the estimation means 16 sets m b =m b +1 (step S1440). After that, the series of operations proceeds to step S1436, and steps S1436 to S1440 are repeatedly executed until it is determined in step S1439 that m b =N terminal .

そして、ステップS1439において、m=Nterminalであると判定されると、推定手段16は、Model=1であるか否かを判定する(ステップS1441)。 Then, when it is determined in step S1439 that m b =N terminal , the estimation means 16 determines whether or not Model = 1 (step S1441).

ステップS1441において、Model=1であると判定されたとき、推定手段16は、DS_count=0であるか否か、またはDS_count>(Nterminal×D_thres)であるか否かを判定する(ステップS1442)。 When it is determined in step S1441 that Model=1, the estimation means 16 determines whether or not DS_count=0, or whether or not DS_count>(N terminal ×D_thres) (step S1442).

ステップS1442において、DS_count=0でなく、かつ、DS_count>(Nterminal×D_thres)でないと判定されたとき、推定手段16は、Model=3を設定する(ステップS1443)。 When it is determined in step S1442 that DS_count is not 0 and DS_count is not greater than (N terminal ×D_thres), the estimation means 16 sets Model=3 (step S1443).

一方、ステップS1442において、DS_count=0である、またはDS_count>(Nterminal×D_thres)であると判定されたとき、推定手段16は、Model=2を設定する(ステップS1444)。 On the other hand, when it is determined in step S1442 that DS_count=0 or DS_count>(N terminal ×D_thres), the estimation means 16 sets Model=2 (step S1444).

そして、ステップS1443またはステップS1444の後、一連の動作は、ステップS1434へ移行する。 Then, after step S1443 or step S1444, the series of operations proceeds to step S1434.

一方、ステップS1441において、Model=1でないと判定されたとき、一連の動作は、図41のステップS1445へ移行する。 On the other hand, if it is determined in step S1441 that Model is not 1, the process proceeds to step S1445 in FIG. 41.

図41を参照して、ステップS1441において、Model=1でないと判定されたとき、推定手段16は、DS_count=0であるか否かを判定する(ステップS1445)。 Referring to FIG. 41, when it is determined in step S1441 that Model is not 1, the estimation means 16 determines whether DS_count is 0 or not (step S1445).

ステップS1445において、DS_count=0であると判定されたとき、推定手段16は、“正常”なスキャンデータを端末装置について決定する(ステップS1446)。 When it is determined in step S1445 that DS_count = 0, the estimation means 16 determines that the scan data for the terminal device is "normal" (step S1446).

一方、ステップS1445において、DS_count=0でないと判定されたとき、推定手段16は、DS_count<(Nterminal×D_thres)であるか否かを判定する(ステップS1447)。 On the other hand, when it is determined in step S1445 that DS_count is not 0, the estimation means 16 determines whether or not DS_count<(N terminal ×D_thres) (step S1447).

ステップS1447において、DS_count<(Nterminal×D_thres)でないと判定されたとき、推定手段16は、基地局bに属する全ての端末装置について、ネットワークスキャンが失敗した原因を“ネットワーク輻輳”であると推定する(ステップS1448)。 When it is determined in step S1447 that DS_count<(N terminal ×D_thres) is not satisfied, the estimation means 16 estimates that the cause of the failure of the network scan for all terminal devices belonging to base station b is "network congestion" (step S1448).

一方、ステップS1447において、DS_count<(Nterminal×D_thres)であると判定されたとき、推定手段16は、“0”よりも小さいDスコアを有する端末装置について、ネットワークスキャンが失敗した原因を“SNR不十分(通信品質不十分)”であると推定する(ステップS1449)。 On the other hand, when it is determined in step S1447 that DS_count < (N terminal × D_thres), the estimation means 16 estimates that the cause of the failure of the network scan for a terminal device having a D score smaller than "0" is "insufficient SNR (insufficient communication quality)" (step S1449).

そして、ステップS1446、ステップS1448およびステップS1449のいずれかの後、一連の動作は、図42のステップS1450へ移行する。 Then, after any of steps S1446, S1448, and S1449, the series of operations proceeds to step S1450 in FIG. 42.

図42を参照して、図41のステップS1446、ステップS1448およびステップS1449のいずれかの後、推定手段16は、m=1を設定する(ステップS1450)。 Referring to FIG. 42, after any of step S1446, step S1448, and step S1449 in FIG. 41, the estimation means 16 sets m b =1 (step S1450).

そして、推定手段16は、端末装置mについて、ネットワークスキャンの結果が推定済であるか否かを判定する(ステップS1451)。 Then, the estimation unit 16 judges whether or not the result of the network scan for the terminal device m- b has been estimated (step S1451).

ステップS1451において、端末装置mについて、ネットワークスキャンの結果が推定済でないと判定されたとき、推定手段16は、端末装置mの全てのポートでスキャン応答が無いか否かを判定する(ステップS1452)。 When it is determined in step S1451 that the result of the network scan for the terminal device mb has not been estimated, the estimation means 16 determines whether or not there is no scan response for all ports of the terminal device mb (step S1452).

ステップS1452において、端末装置mの一部のポートでスキャン応答が有ると判定されたとき、推定手段16は、端末装置mの全てのポートでスキャン応答が有るか否かを判定する(ステップS1453)。 When it is determined in step S1452 that there is a scan response from some of the ports of the terminal device mb , the estimation means 16 determines whether or not there is a scan response from all of the ports of the terminal device mb (step S1453).

ステップS1453において、端末装置mの全てのポートでスキャン応答が有ると判定されたとき、推定手段16は、端末装置mについて、ネットワークスキャンが“正常”であると推定する(ステップS1454)。 When it is determined in step S1453 that there is a scan response from all ports of the terminal device mb , the estimation means 16 estimates that the network scan for the terminal device mb is "normal" (step S1454).

一方、ステップS1453において、端末装置mの一部のポートでスキャン応答が無いと判定されたとき、推定手段16は、端末装置mについて、ネットワークスキャンが失敗した原因を“ポート閉”であると推定する(ステップS1455)。そして、推定手段16は、得られた待ち時間をホスト情報データベース13に保存する(ステップS1456)。 On the other hand, when it is determined in step S1453 that there is no scan response from some ports of the terminal device mb , the estimation means 16 estimates that the cause of the failure of the network scan for the terminal device mb is "port closed" (step S1455).The estimation means 16 then stores the obtained waiting time in the host information database 13 (step S1456).

一方、ステップS1452において、端末装置mの全てのポートでスキャン応答が無いと判定されとき、推定手段16は、端末装置mについて、ネットワークスキャンが失敗した原因を“ネットワーク接続無し”であると推定する(ステップS1457)。 On the other hand, when it is determined in step S1452 that there is no scan response from all ports of the terminal device mb , the estimation means 16 estimates that the cause of the failure of the network scan for the terminal device mb is "no network connection" (step S1457).

そして、ステップS1451において、端末装置mについての結果が推定済であると判定されたとき、またはステップS1454、ステップS1456およびステップS1457のいずれかの後、推定手段16は、m=Nterminalであるか否かを判定する(ステップS1458)。 Then, when it is determined in step S1451 that the result for the terminal device m b has been estimated, or after any of steps S1454, S1456 and S1457, the estimation means 16 determines whether or not m b =N terminal (step S1458).

ステップS1458において、m=Nterminalでないと判定されたとき、推定手段16は、m=m+1を設定する(ステップS1459)。その後、一連の動作は、ステップS1451へ移行し、ステップS1458において、m=Nterminalであると判定されるまで、ステップS1451~ステップS1459が繰り返し実行される。 When it is determined in step S1458 that m b is not equal to N terminal , the estimation means 16 sets m b =m b +1 (step S1459). After that, the series of operations proceeds to step S1451, and steps S1451 to S1459 are repeatedly executed until it is determined in step S1458 that m b =N terminal .

そして、ステップS1458において、m=Nterminalであると判定されると、推定手段16は、b=Bであるか否かを判定する(ステップS1460)。 Then, when it is determined in step S1458 that m b =N terminal , the estimation means 16 determines whether or not b =B (step S1460).

ステップS1460において、b=Bでないと判定されたとき、推定手段16は、b=b+1を設定する(ステップS1461)。その後、一連の動作は、図40のステップS1432へ移行し、ステップS1460において、b=Bであると判定されるまで、ステップS1432~ステップS1461が繰り返し実行される。 When it is determined in step S1460 that b is not equal to B, the estimation means 16 sets b to b+1 (step S1461). After that, the series of operations proceeds to step S1432 in FIG. 40, and steps S1432 to S1461 are repeatedly executed until it is determined in step S1460 that b is equal to B.

そして、ステップS1460において、b=Bであると判定されると、一連の動作は、図37のステップS144へ移行する。 If it is determined in step S1460 that b=B, the process proceeds to step S144 in FIG. 37.

なお、図37のステップS144および図38のステップS148,S149,S157,S161の詳細な動作も、図40から図42に示すフローチャートに従って実行される。 The detailed operations of step S144 in FIG. 37 and steps S148, S149, S157, and S161 in FIG. 38 are also performed according to the flowcharts shown in FIG. 40 to FIG. 42.

図40から図42に示すフローチャートが図37のステップS144の詳細な動作として実行される場合、推定手段16は、ステップS1460においてb=Bであると判定すると、混同行列CFMを生成し、その生成した混同行列CFMを算出手段15へ出力する。 When the flowcharts shown in Figures 40 to 42 are executed as detailed operations of step S144 in Figure 37, if the estimation means 16 determines in step S1460 that b = B, it generates a confusion matrix CFM and outputs the generated confusion matrix CFM to the calculation means 15.

また、図40から図42に示すフローチャートが図38のステップS149の詳細な動作として実行される場合、推定手段16は、ステップS1460においてb=Bであると判定すると、混同行列nCFM_uを生成し、その生成した混同行列nCFM_uを算出手段15へ出力する。 When the flowcharts shown in Figures 40 to 42 are executed as detailed operations of step S149 in Figure 38, if the estimation means 16 determines in step S1460 that b = B, it generates a confusion matrix nCFM_u and outputs the generated confusion matrix nCFM_u to the calculation means 15.

更に、図40から図42に示すフローチャートが図38のステップS157の詳細な動作として実行される場合、推定手段16は、ステップS1460においてb=Bであると判定すると、混同行列tCFMを生成し、その生成した混同行列tCFMを算出手段15へ出力する。 Furthermore, when the flowcharts shown in Figures 40 to 42 are executed as detailed operations of step S157 in Figure 38, if the estimation means 16 determines in step S1460 that b = B, it generates a confusion matrix tCFM and outputs the generated confusion matrix tCFM to the calculation means 15.

図42のステップS1450~ステップS1459は、1つの基地局に属する全ての端末装置の各々について、ネットワークスキャンの結果(“正常”、“ポート閉”および“ネットワーク接続無し”のいずれか)を推定するステップである。 Steps S1450 to S1459 in FIG. 42 are steps for estimating the results of a network scan (either "normal," "port closed," or "no network connection") for each of all terminal devices belonging to one base station.

図43は、図40のステップS1432の詳細な動作を説明するためのフローチャートである。なお、図43においては、ネットワークスキャンが“正常”であるときのスキャンデータ(“ネットワークが混雑”であるときの通信特性CMbest)を用いて学習した学習済のLDAアルゴリズムによって判別関数δ(x)を生成することを説明する。 Fig. 43 is a flowchart for explaining the detailed operation of step S1432 in Fig. 40. Note that Fig. 43 explains that the discriminant function δ g (x) is generated by a trained LDA algorithm trained using scan data when the network scan is "normal" (communication characteristics CMbest when the "network is congested").

図43を参照して、図40のステップS1431または図42のステップS1461の後、推定手段16は、LDAアルゴリズムを用いて、通信特性CMbestを有する端末装置をG(G=3)個のグループCLS~CLSに分類する(ステップS1432-1)。 43, after step S1431 in FIG. 40 or step S1461 in FIG. 42, the estimation means 16 classifies terminal devices having communication characteristics CMbest into G (G=3) groups CLS 1 to CLS 3 using the LDA algorithm (step S1432-1).

そして、推定手段16は、式(20C)(または式(20D))を用いて、各グループの平均μ,μ,μを算出する(ステップS1432-2)。 Then, the estimation means 16 calculates the averages μ 1 , μ 2 , and μ 3 of each group using the formula (20C) (or the formula (20D)) (step S1432-2).

その後、推定手段16は、式(20E)(または式(20F))を用いて、各グループの事前平均Π,Π,Πを算出する(ステップS1432-3)。 Thereafter, the estimation means 16 calculates the prior averages Π 1 , Π 2 , Π 3 of each group using equation (20E) (or equation (20F)) (step S1432-3).

引き続いて、推定手段16は、式(20B)を用いて、各グループの共分散行列Cを算出する(ステップS1432-4)。 The estimation means 16 then calculates the covariance matrix C of each group using equation (20B) (step S1432-4).

そうすると、推定手段16は、式(21)によって、Model1の合併共分散行列C12を算出する(ステップS1432-5)。また、推定手段16は、式(22)によって、Model2の合併共分散行列C13を算出する(ステップS1432-6)。更に、推定手段16は、式(23)によって、Model3の合併共分散行列C23を算出する(ステップS1432-7)。 Then, the estimation means 16 calculates the joint covariance matrix C12 of Model1 by equation (21) (step S1432-5). The estimation means 16 also calculates the joint covariance matrix C13 of Model2 by equation (22) (step S1432-6). Furthermore, the estimation means 16 calculates the joint covariance matrix C23 of Model3 by equation (23) (step S1432-7).

そして、推定手段16は、式(20A)によって、判別関数δpq(x)を生成する(ステップS1432-8)。式(20A)における“C”には、それぞれ、ステップS1432-5~ステップS1432-7において算出された合併共分散行列C12,C13,C23が代入される。 The estimation means 16 then generates a discriminant function δ pq (x) using equation (20A) (step S1432-8). The joint covariance matrices C 12 , C 13 , and C 23 calculated in steps S1432-5 to S1432-7 are substituted for “C” in equation (20A).

図43に示すフローチャートにおいては、推定手段16は、ステップS1432-1において、例えば、通信特性CMbestを有する端末装置を3個のグループCLS~CLSに分類する。 In the flow chart shown in FIG. 43, the estimation means 16 classifies, for example, terminal devices having communication characteristics CMbest into three groups CLS 1 to CLS 3 in step S1432-1.

そして、上述したように、グループCLSは、“正常”のグループであり、グループCLSは、“通信品質不十分”のグループであり、グループCLSは、“ネットワークが混雑”のグループである。また、Model1は、グループCLSとグループCLSとを扱い、Model2は、グループCLSとグループCLSとを扱い、Model3は、グループCLSとグループCLSとを扱う。 As described above, group CLS 1 is a "normal" group, group CLS 2 is a "poor communication quality" group, and group CLS 3 is a "network congestion" group. Model 1 handles groups CLS 1 and CLS 2 , Model 2 handles groups CLS 1 and CLS 3 , and Model 3 handles groups CLS 2 and CLS 3 .

従って、Model1が使用されるとき、ステップS1432-5において算出された合併共分散行列C12が、ステップS1432-8において、“C”に代入される。また、Model2が使用されるとき、ステップS1432-6において算出された合併共分散行列C13が、ステップS1432-8において、“C”に代入される。更に、Model3が使用されるとき、ステップS1432-7において算出された合併共分散行列C23が、ステップS1432-8において、“C”に代入される。 Therefore, when Model1 is used, the joint covariance matrix C12 calculated in step S1432-5 is substituted for "C" in step S1432-8. When Model2 is used, the joint covariance matrix C13 calculated in step S1432-6 is substituted for "C" in step S1432-8. Furthermore, when Model3 is used, the joint covariance matrix C23 calculated in step S1432-7 is substituted for "C" in step S1432-8.

また、“通信品質不十分”および“ネットワークが混雑”の失敗原因は、上述したように、端末装置との通信チャネルに起因した失敗原因であるので、ステップS1432-1において、通信特性CMbestを有する端末装置を3個のグループCLS~CLSに分類することは、「ネットワークスキャンが正常であることを表す第1のグループと、ネットワークスキャンが端末装置との通信チャネルに起因した原因によって失敗したことを表す第2および第3のグループとに分類する」ことに相当する。この場合、グループCLSは、第2のグループを構成し、グループCLSは、第3のグループを構成する。 Furthermore, since the failure causes of "inadequate communication quality" and "network congestion" are failure causes caused by the communication channel with the terminal device, as described above, classifying the terminal devices having the communication characteristic CMbest into three groups CLS 1 to CLS 3 in step S1432-1 corresponds to "classifying into a first group indicating that the network scan is normal, and into second and third groups indicating that the network scan has failed due to a cause caused by the communication channel with the terminal device." In this case, group CLS 2 constitutes the second group, and group CLS 3 constitutes the third group.

図44は、図40のステップS1436の詳細な動作を説明するためのフローチャートである。 Figure 44 is a flowchart explaining the detailed operation of step S1436 in Figure 40.

図44を参照して、図40のステップS1435またはステップS1440の後、推定手段16は、Model=1であるか否かを判定する(ステップS1436-1)。 Referring to FIG. 44, after step S1435 or step S1440 in FIG. 40, the estimation means 16 determines whether Model=1 (step S1436-1).

ステップS1436-1において、Model=1であると判定されたとき、推定手段16は、図43のステップS1432-5において算出した合併共分散行列C12を式(24A)のC12に代入して、判別関数fを算出する(ステップS1436-2)。この判別関数fは、グループCLS(=g)の共分散行列とグループCLS(=g)の共分散行列とを合併した合併共分散行列C12と、グループCLS(=g)の平均μと、グループCLS(=g)の事前平均Πとを用いて表される判別関数である。 When it is determined in step S1436-1 that Model=1, the estimation means 16 substitutes the joint covariance matrix C12 calculated in step S1432-5 of Fig. 43 for C12 in formula (24A) to calculate a discriminant function f1 (step S1436-2). This discriminant function f1 is a discriminant function expressed using the joint covariance matrix C12 obtained by combining the covariance matrix of group CLS1 (= g1 ) and the covariance matrix of group CLS2 (= g2 ), the mean μ1 of group CLS1 (= g1 ), and the prior mean Π1 of group CLS1 (= g1 ).

その後、推定手段16は、図43のステップS1432-5において算出した合併共分散行列C12を式(24B)のC12に代入して、判別関数fを算出する(ステップS1436-3)。この判別関数fは、グループCLS(=g)の共分散行列とグループCLS(=g)の共分散行列とを合併した合併共分散行列C12と、グループCLS(=g)の平均μと、グループCLS(=g)の事前平均Πとを用いて表される判別関数である。 Thereafter, the estimation means 16 substitutes the joint covariance matrix C12 calculated in step S1432-5 of Fig. 43 for C12 in formula (24B) to calculate a discriminant function f2 (step S1436-3). This discriminant function f2 is a discriminant function expressed using the joint covariance matrix C12 obtained by combining the covariance matrix of the group CLS1 (= g1 ) and the covariance matrix of the group CLS2 (= g2 ), the mean μ2 of the group CLS2 (= g2 ), and the prior mean Π2 of the group CLS2 (= g2 ).

一方、ステップS1436-1において、Model=1でないと判定されると、推定手段16は、Model=2であるか否かを判定する(ステップS1436-4)。 On the other hand, if it is determined in step S1436-1 that Model is not 1, the estimation means 16 determines whether Model is 2 (step S1436-4).

ステップS1436-4において、Model=2であると判定されたとき、推定手段16は、図43のステップS1432-6において算出した合併共分散行列C13を式(25A)のC13に代入して、判別関数fを算出する(ステップS1436-5)。この判別関数fは、グループCLS(=g)の共分散行列とグループCLS(=g)の共分散行列とを合併した合併共分散行列C13と、グループCLS(=g)の平均μと、グループCLS(=g)の事前平均Πとを用いて表される判別関数である。 When it is determined in step S1436-4 that Model=2, the estimation means 16 substitutes the joint covariance matrix C13 calculated in step S1432-6 of Fig. 43 for C13 in formula (25A) to calculate a discriminant function f1 (step S1436-5). This discriminant function f1 is a discriminant function expressed using the joint covariance matrix C13 obtained by combining the covariance matrix of group CLS1 (= g1 ) and the covariance matrix of group CLS3 (= g3 ), the mean μ1 of group CLS1 (= g1 ), and the prior mean Π1 of group CLS1 (= g1 ).

その後、推定手段16は、図43のステップS1432-6において算出した合併共分散行列C13を式(25B)のC13に代入して、判別関数fを算出する(ステップS1436-6)。この判別関数fは、グループCLS(=g)の共分散行列とグループCLS(=g)の共分散行列とを合併した合併共分散行列C13と、グループCLS(=g)の平均μと、グループCLS(=g)の事前平均Πとを用いて表される判別関数である。 Thereafter, the estimation means 16 substitutes the joint covariance matrix C13 calculated in step S1432-6 of Fig. 43 for C13 in formula (25B) to calculate a discriminant function f2 (step S1436-6). This discriminant function f2 is a discriminant function expressed using the joint covariance matrix C13 obtained by combining the covariance matrix of the group CLS1 (= g1 ) and the covariance matrix of the group CLS3 (= g3 ), the mean μ3 of the group CLS3 (= g3 ), and the prior mean Π3 of the group CLS3 (= g3 ).

一方、ステップS1436-4において、Model=2でないと判定されたとき、推定段15は、図43のステップS1432-7において算出した合併共分散行列C23を式(26A)のC23に代入して、判別関数fを算出する(ステップS1436-7)。この判別関数fは、グループCLS(=g)の共分散行列とグループCLS(=g)の共分散行列とを合併した合併共分散行列C23と、グループCLS(=g)の平均μと、グループCLS(=g)の事前平均Πとを用いて表される判別関数である。 On the other hand, when it is determined in step S1436-4 that Model=2 is not satisfied, the estimation stage 15 substitutes the joint covariance matrix C23 calculated in step S1432-7 of Fig. 43 for C23 in equation (26A) to calculate a discriminant function f1 (step S1436-7). This discriminant function f1 is a discriminant function expressed using the joint covariance matrix C23 obtained by combining the covariance matrix of group CLS2 (= g2 ) and the covariance matrix of group CLS3 (= g3 ), the mean μ2 of group CLS2 (= g2 ), and the prior mean Π2 of group CLS2 (=g2).

その後、推定手段16は、図43のステップS1432-7において算出した合併共分散行列C23を式(26B)のC23に代入して、判別関数fを算出する(ステップS1436-8)。この判別関数fは、グループCLS(=g)の共分散行列とグループCLS(=g)の共分散行列とを合併した合併共分散行列C23と、グループCLS(=g)の平均μと、グループCLS(=g)の事前平均Πとを用いて表される判別関数である。 Thereafter, the estimation means 16 substitutes the joint covariance matrix C23 calculated in step S1432-7 of Fig. 43 for C23 in formula (26B) to calculate a discriminant function f2 (step S1436-8). This discriminant function f2 is a discriminant function expressed using the joint covariance matrix C23 obtained by combining the covariance matrix of group CLS2 (= g2 ) and the covariance matrix of group CLS3 (= g3 ) , the mean μ3 of group CLS3 (= g3 ), and the prior mean Π3 of group CLS3 (= g3 ).

そして、ステップS1436-3、ステップS1436-6およびステップS1436-8のいずれかの後、推定手段16は、Dスコア=f-fを算出する(ステップS1436-9)。その後、一連の動作は、図40のステップS1437へ移行する。 Then, after any of step S1436-3, step S1436-6, and step S1436-8, the estimation means 16 calculates D score=f 1 −f 2 (step S1436-9). After that, the series of operations proceeds to step S1437 in FIG.

図44に示すフローチャートにおいては、図40のステップS1433において、Model=1が設定されているので、図40のステップS1436が最初に実行される場合、図44のステップS1436-1において、Model=1であると判定され、ステップS1436-2およびステップS1436-3が順次実行された後、ステップS1436-9において、Model1を用いてDスコアが算出される。 In the flowchart shown in FIG. 44, Model=1 is set in step S1433 in FIG. 40, so when step S1436 in FIG. 40 is executed first, it is determined in step S1436-1 in FIG. 44 that Model=1, and after steps S1436-2 and S1436-3 are executed in sequence, the D score is calculated in step S1436-9 using Model1.

そして、ステップS1436-9の後、図40のステップS1439において、m=Nterminalであると判定されるまで、図40のステップS1436~ステップS1440が繰り返し実行された後、ステップS1441において、Model=1であると判定され、ステップS1442およびステップS1443が順次実行され、またはステップS1442およびステップS1444が順次実行される。 Then, after step S1436-9, steps S1436 to S1440 in FIG. 40 are repeatedly executed until it is determined in step S1439 in FIG. 40 that m b =N terminal , and then in step S1441 it is determined that Model = 1, and steps S1442 and S1443 are executed in sequence, or steps S1442 and S1444 are executed in sequence.

ステップS1442およびステップS1443が順次実行された場合、Model=3が設定されるので(ステップS1443参照)、ステップS1443からステップS1434へ移行した後に、ステップS1436が実行されるとき、図44のステップS1436-1において、Model=1でないと判定され、更に、ステップS1436-4において、Model=2でないと判定され、ステップS1436-7およびステップS1436-8が順次実行された後、ステップS1436-9において、Model3を用いてDスコアが算出される。 When steps S1442 and S1443 are executed in sequence, Model = 3 is set (see step S1443), so when step S1436 is executed after moving from step S1443 to step S1434, it is determined in step S1436-1 of FIG. 44 that Model = 1 is not true, and further, in step S1436-4, it is determined that Model = 2 is not true, and after steps S1436-7 and S1436-8 are executed in sequence, in step S1436-9, the D score is calculated using Model 3.

一方、図40のステップS1442およびステップS1444が順次実行された場合、Model=2が設定されるので(ステップS1444参照)、ステップS1444からステップS1434へ移行した後に、ステップS1436が実行されるとき、図44のステップS1436-1において、Model=1でないと判定され、更に、ステップS1436-4において、Model=2であると判定され、ステップS1436-5およびステップS1436-6が順次実行された後、ステップS1436-9において、Model2を用いてDスコアが算出される。 On the other hand, if steps S1442 and S1444 in FIG. 40 are executed in sequence, Model=2 is set (see step S1444), and when step S1436 is executed after moving from step S1444 to step S1434, it is determined in step S1436-1 in FIG. 44 that Model=1 is not true, and further, in step S1436-4, it is determined that Model=2 is true, and after steps S1436-5 and S1436-6 are executed in sequence, in step S1436-9, the D score is calculated using Model2.

従って、図44に示すフローチャートは、設定されるModel(Model1、Model2およびModel3のいずれか)に応じてDスコアを算出するフローチャートである。 Therefore, the flowchart shown in Figure 44 is a flowchart for calculating the D score according to the set Model (either Model 1, Model 2, or Model 3).

また、ネットワークスキャンの結果を推定する図40から図42に示すフローチャートにおいては、ステップS1433においてModel=1を設定した後に、ステップS1436においてDスコアを算出するのは、Model1を用いれば、まず、ネットワークスキャンが“正常”であるか“失敗(=通信品質不十分が原因で失敗)”であるかを推定でき、ネットワークスキャンが“失敗(=通信品質不十分が原因で失敗)”であると推定したときに、ネットワークスキャンが失敗した原因を更に推定すればよいからである。 In addition, in the flowcharts shown in Figures 40 to 42 for estimating the results of a network scan, after setting Model = 1 in step S1433, the D score is calculated in step S1436 because, by using Model 1, it is first possible to estimate whether the network scan is "normal" or "failed (= failed due to insufficient communication quality)", and when it is estimated that the network scan is "failed (= failed due to insufficient communication quality)", the cause of the network scan failure can be further estimated.

また、ステップS1433において、Model=1が設定された後に、1つの基地局bに属する全ての端末装置についてModel1を用いてDスコアが算出されるとともに、“0”よりも小さいDスコアの個数がカウント値DS_countとしてカウントされる(ステップS1436~ステップS1440参照)。 In addition, in step S1433, after Model=1 is set, D scores are calculated for all terminal devices belonging to one base station b using Model1, and the number of D scores smaller than "0" is counted as the count value DS_count (see steps S1436 to S1440).

その後、ステップS1441を1回目に実行するとき、Model=1が設定されているので、ステップS1441において、Model=1であると判定され、ステップS1442~ステップS1444において、Model=2またはModel=3が設定される。 Then, when step S1441 is executed for the first time, Model=1 is set, so in step S1441 it is determined that Model=1, and in steps S1442 to S1444, Model=2 or Model=3 is set.

従って、Model2またはModel3は、Model1を用いて算出されたDスコアの個数(=DS_count)に応じて設定される。つまり、Model2またはModel3は、Model1に基づいて設定される。 Therefore, Model2 or Model3 is set according to the number of D scores (=DS_count) calculated using Model1. In other words, Model2 or Model3 is set based on Model1.

そして、ステップS1442~ステップS1444において、Model=2またはModel=3が設定された後、Model2またはModel3を用いてDスコアが算出されるとともに、“0”よりも小さいDスコアの個数がカウント値DS_countとしてカウントされる(ステップS1436~ステップS1440参照)。より詳細には、Model=2が設定されたとき、グループCLSに分類された通信特性CMbestと、グループCLSに分類された通信特性CMbestと、式(22)に示す合併共分散行列C13とを用いてDスコアが算出され、Model=3が設定されたとき、グループCLSに分類された通信特性CMbestと、グループCLSに分類された通信特性CMbestと、式(23)に示す合併共分散行列C23とを用いてDスコアが算出される。そして、算出されたDスコアに基づいて、“0”よりも小さいDスコアの個数がカウント値DS_countとしてカウントされる。 Then, in steps S1442 to S1444, after Model=2 or Model=3 is set, the D-score is calculated using Model2 or Model3, and the number of D-scores smaller than "0" is counted as a count value DS_count (see steps S1436 to S1440). More specifically, when Model=2 is set, the D-score is calculated using the communication characteristics CMbest classified into group CLS1 , the communication characteristics CMbest classified into group CLS3 , and the joint covariance matrix C13 shown in formula (22), and when Model=3 is set, the D-score is calculated using the communication characteristics CMbest classified into group CLS2 , the communication characteristics CMbest classified into group CLS3 , and the joint covariance matrix C23 shown in formula ( 23 ). Then, based on the calculated D scores, the number of D scores less than "0" is counted as a count value DS_count.

その後、ステップS1441において、Model=1でないと判定され、図41および図42に示すステップS1445~ステップS1457において、Model2またはModel3を用いて、ネットワークスキャンの結果(“正常”、“通信品質不十分”、“ネットワーク混雑”、“ポート閉”、“ネットワーク接続無し”のいずれか)が推定される。 Then, in step S1441, it is determined that Model=1 is not satisfied, and in steps S1445 to S1457 shown in Figures 41 and 42, Model 2 or Model 3 is used to estimate the result of the network scan (either "normal," "poor communication quality," "network congestion," "port closed," or "no network connection").

そして、Model2が設定されてネットワークスキャンの結果が推定される場合、Model2を用いて算出されたDスコアのうち、“0”よりも小さいDスコアの個数(=カウント値DS_count)が用いられる。 When Model2 is set and the results of a network scan are estimated, the number of D scores calculated using Model2 that are smaller than "0" (= count value DS_count) is used.

また、Model3が設定されてネットワークスキャンの結果が推定される場合、Model3を用いて算出されたDスコアのうち、“0”よりも小さいDスコアの個数(=カウント値DS_count)が用いられる。 In addition, when Model 3 is set and the results of a network scan are estimated, the number of D scores calculated using Model 3 that are smaller than "0" (= count value DS_count) is used.

この発明の実施の形態においては、推定アルゴリズムALGは、図40から図42に示すステップS1431~ステップS1461(図43および図44に示すフローチャートを含む)によって構成される。 In this embodiment of the invention, the estimation algorithm ALG is composed of steps S1431 to S1461 shown in Figures 40 to 42 (including the flowcharts shown in Figures 43 and 44).

図45は、図37のステップS145の詳細な動作を説明するためのフローチャートである。 Figure 45 is a flowchart explaining the detailed operation of step S145 in Figure 37.

図45を参照して、図37のステップS144の後、算出手段15は、OE、ECEおよびOIEを推定手段16から受け、その受けたOE、ECEおよびOIEの個数を検出する(ステップS145-1)。 Referring to FIG. 45, after step S144 in FIG. 37, the calculation means 15 receives OE, ECE, and OIE from the estimation means 16, and detects the number of OE, ECE, and OIE received (step S145-1).

そして、算出手段15は、OEの個数およびECEの個数に基づいて式(14A)によってTPを算出する(ステップS145-2)。 Then, the calculation means 15 calculates TP using formula (14A) based on the number of OEs and the number of ECEs (step S145-2).

その後、算出手段15は、OIEの個数およびECEの個数に基づいて式(14B)によってFNを算出する(ステップS145-3)。 Then, the calculation means 15 calculates the FN using formula (14B) based on the number of OIEs and the number of ECEs (step S145-3).

引き続いて、算出手段15は、TPを用いて式(15A)によってFPを算出する(ステップS145-4)。 The calculation means 15 then calculates FP using TP according to equation (15A) (step S145-4).

そして、算出手段15は、TPに分類された割合およびFPに分類された割合に基づいて、式(16)によってPrecisionを算出する(ステップS145-5)。また、算出手段15は、TPに分類された割合およびFNに分類された割合に基づいて、式(17)によってRecallを算出する(ステップS145-6)。 Then, the calculation means 15 calculates Precision using formula (16) based on the proportion classified as TP and the proportion classified as FP (step S145-5). The calculation means 15 also calculates Recall using formula (17) based on the proportion classified as TP and the proportion classified as FN (step S145-6).

その後、算出手段15は、PrecisionおよびRecallを式(18)に代入してF1スコアFを算出する(ステップS145-7)。そして、一連の動作は、図37のステップS146へ移行する。 Thereafter, the calculation means 15 calculates the F1 score F1 by substituting Precision and Recall into the formula (18) (step S145-7). Then, the series of operations proceeds to step S146 in FIG.

なお、図38のステップS150,S158の詳細な動作も、図45に示すフローチャートに従って実行される。ステップS150の詳細な動作が実行される場合、算出手段15は、OE、ECEおよびOIEを推定手段16から受け、その受けたOE、ECEおよびOIEを推定手段16から受け、その受けたOE、ECEおよびOIEを推定手段16から受け、その受けたOE、ECEおよびOIEに基づいてステップS145-1~ステップS145-7を順次実行してF1スコアnF_uを算出する。また、ステップS158の詳細な動作が実行される場合、算出手段15は、OE、ECEおよびOIEを推定手段16から受け、その受けたOE、ECEおよびOIEを推定手段16から受け、その受けたOE、ECEおよびOIEを推定手段16から受け、その受けたOE、ECEおよびOIEに基づいてステップS145-1~ステップS145-7を順次実行してF1スコアtFを算出する。 Note that the detailed operations of steps S150 and S158 in Fig. 38 are also executed according to the flowchart shown in Fig. 45. When the detailed operation of step S150 is executed, calculation means 15 receives OE, ECE and OIE from estimation means 16, receives the received OE, ECE and OIE from estimation means 16, receives the received OE, ECE and OIE from estimation means 16, and sequentially executes steps S145-1 to S145-7 based on the received OE, ECE and OIE to calculate F1 score nF 1 _u. Furthermore, when the detailed operation of step S158 is executed, the calculation means 15 receives the OE, ECE, and OIE from the estimation means 16, receives the received OE, ECE, and OIE from the estimation means 16, receives the received OE, ECE, and OIE from the estimation means 16, and sequentially executes steps S145-1 to S145-7 based on the received OE, ECE, and OIE to calculate the F1 score tF1 .

また、ステップS145-1~ステップS145-7に従ってF1スコアF,nF_u,tFを算出することは、「第3の算出処理」を構成する。 Moreover, calculating the F1 scores F 1 , nF 1 _u, tF 1 in accordance with steps S145-1 to S145-7 constitutes a "third calculation process."

図46は、図37のステップS145においてマシューズ相関係数MCCが算出されるときのステップS145の詳細な動作を説明するためのフローチャートである。 Figure 46 is a flowchart for explaining the detailed operation of step S145 when the Matthews correlation coefficient MCC is calculated in step S145 of Figure 37.

図46に示すフローチャートは、図45に示すフローチャートのステップS144-4~ステップS145-7をステップS145-4A,S145-5Aに変えたものであり、その他は、図45に示すフローチャートと同じである。 The flowchart shown in FIG. 46 is the same as the flowchart shown in FIG. 45, except that steps S144-4 to S145-7 in the flowchart shown in FIG. 45 have been replaced with steps S145-4A and S145-5A.

図46を参照して、図37のステップS145の詳細な動作が開始されると、算出手段15は、上述したステップS145-1~ステップS145-3を順次実行する。そして、ステップS145-3の後、算出手段15は、TPを用いて式(15A)によってFPを算出し、FNを用いて式(15B)によってTNを算出する(ステップS145-4A)。 Referring to FIG. 46, when the detailed operation of step S145 in FIG. 37 is started, the calculation means 15 sequentially executes steps S145-1 to S145-3 described above. Then, after step S145-3, the calculation means 15 calculates FP using TP according to equation (15A), and calculates TN using FN according to equation (15B) (step S145-4A).

そうすると、算出手段15は、TP、TN、FPおよびFNを式(19)に代入してマシューズ相関係数MCCを算出する(ステップS145-5A)。その後、一連の動作は、図37のステップS146へ移行する。 Then, the calculation means 15 substitutes TP, TN, FP, and FN into equation (19) to calculate the Matthews correlation coefficient MCC (step S145-5A). After that, the series of operations proceeds to step S146 in FIG. 37.

なお、図38のステップS150,S158において、マシューズ相関係数MCCが算出される場合、ステップS150,S158の詳細な動作も、図46に示すフローチャートによって実行される。ステップS150の詳細な動作が実行される場合、算出手段15は、ステップS145-1~ステップS145-3,S145-4A,S145-5Aを順次実行してマシューズ相関係数nMCC_uを算出する。また、ステップS158の詳細な動作が実行される場合、算出手段15は、ステップS145-1~ステップS145-3,S145-4A,S145-5Aを順次実行してマシューズ相関係数tMCCを算出する。 When the Matthews correlation coefficient MCC is calculated in steps S150 and S158 of FIG. 38, the detailed operations of steps S150 and S158 are also executed according to the flowchart shown in FIG. 46. When the detailed operation of step S150 is executed, the calculation means 15 sequentially executes steps S145-1 to S145-3, S145-4A, and S145-5A to calculate the Matthews correlation coefficient nMCC_u. When the detailed operation of step S158 is executed, the calculation means 15 sequentially executes steps S145-1 to S145-3, S145-4A, and S145-5A to calculate the Matthews correlation coefficient tMCC.

図47は、混同行列の例を示す図である。図47の(a)は、検証セット(=サブセットV1’~V8’の全てからなる。)を用いて推定アルゴリズムALGによってネットワークスキャンの結果を推定したときの混同行列を示し、図47の(b)は、テストデータ(=サブセットTD~TDの全てからなる。)を用いて推定アルゴリズムALGによってネットワークスキャンの結果を推定したときの混同行列を示す。 Fig. 47 shows examples of confusion matrices, where (a) in Fig. 47 shows the confusion matrix when the results of a network scan are estimated by the estimation algorithm ALG using a validation set (=consisting of all of the subsets V 1 ' -V 8 ' ), and (b) in Fig. 47 shows the confusion matrix when the results of a network scan are estimated by the estimation algorithm ALG using test data (=consisting of all of the subsets TD 1 -TD 4 ).

図47の(a)を参照して、ネットワークスキャンの結果が“正常”(既知の推定結果)である場合、検証セット(=サブセットV1’~V8’の全てからなる。)を用いて推定アルゴリズムALGによってネットワークスキャンの結果を推定したとき、例えば、TP=64、FN=0、TN=0およびFP=0からなる混同行列が得られた。 Referring to (a) of FIG. 47, when the result of the network scan is “normal” (known estimated result), when the result of the network scan is estimated by the estimation algorithm ALG using the validation set (=consisting of all of subsets V1 to V8 ), a confusion matrix consisting of, for example, TP=64, FN=0, TN=0 and FP=0 is obtained.

図47の(b)を参照して、ネットワークスキャンの結果が“正常”(既知の推定結果)である場合、テストデータ(=サブセットTD~TDの全てからなる。)を用いて推定アルゴリズムALGによってネットワークスキャンの結果を推定したとき、例えば、TP=32、FN=0、TN=0およびFP=0からなる混同行列が得られた。 Referring to FIG. 47(b), when the result of the network scan is “normal” (known estimation result), when the result of the network scan is estimated by the estimation algorithm ALG using the test data (=consisting of all of the subsets TD 1 to TD 4 ), a confusion matrix consisting of, for example, TP=32, FN=0, TN=0, and FP=0 is obtained.

従って、図37のステップS145および図38のステップS150において、図47の(a)に示す混同行列(検証セット(=サブセットV1’~V8’の全てからなる。)を用いて推定アルゴリズムALGによってネットワークスキャンの結果を推定したときの混同行列)が生成され、図38のステップS158において、図47の(b)に示す混同行列(テストデータ(=サブセットTD~TDの全てからなる。)を用いて推定アルゴリズムALGによってネットワークスキャンの結果を推定したときの混同行列)が生成される。 Therefore, in step S145 of FIG. 37 and step S150 of FIG. 38, the confusion matrix shown in FIG. 47(a) (the confusion matrix when the result of the network scan is estimated by the estimation algorithm ALG using the validation set (=consisting of all of the subsets V1 ' to V8 ' )) is generated, and in step S158 of FIG. 38, the confusion matrix shown in FIG. 47(b) (the confusion matrix when the result of the network scan is estimated by the estimation algorithm ALG using the test data (=consisting of all of the subsets TD1 to TD4 )) is generated.

図48は、Dスコアのシミュレーション結果を示す図である。図48を参照して、Dスコアのシミュレーションを行った結果、ネットワークスキャンが“正常”であるとき、端末装置の半数よりも多い端末装置において、Dスコアが“0”よりも大きいことが分かった(図48の(a)参照)。 Figure 48 shows the results of a simulation of the D score. As a result of performing a simulation of the D score with reference to Figure 48, it was found that when the network scan was "normal", the D score was greater than "0" for more than half of the terminal devices (see (a) of Figure 48).

また、ネットワークスキャンが失敗した原因が、“通信品質不十分”であるとき、端末装置の半数よりも少ない端末装置において、Dスコアが“0”よりも小さいことが分かった(図48の(b)参照)。 In addition, when the cause of a network scan failure was "insufficient communication quality," it was found that the D score was less than "0" in less than half of the terminal devices (see (b) in Figure 48).

更に、ネットワークスキャンが失敗した原因が、“ネットワーク混雑”であるとき、端末装置の半数よりも多い端末装置において、Dスコアが“0”よりも小さいことが分かった(図48の(c)参照)。 Furthermore, when the cause of the network scan failure was "network congestion," it was found that the D score was less than "0" in more than half of the terminal devices (see (c) in Figure 48).

従って、“0”よりも小さいDスコアの個数(=カウント値DS_count)を用いれば、ネットワークスキャンの結果が“正常”、“通信品質不十分”および“ネットワーク混雑”のいずれであるかを推定することができる。 Therefore, by using the number of D scores less than "0" (= count value DS_count), it is possible to estimate whether the results of the network scan are "normal," "inadequate communication quality," or "network congestion."

Model2は、ネットワークスキャンが“正常”であるグループCLSと、ネットワークスキャンが“ネットワーク混雑”の原因によって失敗したグループCLSとを扱い、グループCLSとグループCLSとを判別するDスコアD_2を算出し、その算出したDスコアD_2のうち、“0”よりも小さいDスコアD_2の個数(=カウント値DS_count)が“0”であれば、ネットワークスキャンが“正常”であると推定でき、“0”よりも小さいDスコアD_2の個数(=カウント値DS_count)が端末装置の半数よりも大きければ、ネットワークスキャンが“ネットワーク混雑”の原因によって失敗したと推定できる。 Model 2 handles group CLS 1 where the network scan is “normal” and group CLS 3 where the network scan failed due to “network congestion”, and calculates a D-score D_2 to distinguish between group CLS 1 and group CLS 3. If the number of D-scores D_2 that are smaller than “0” (=count value DS_count) among the calculated D-scores D_2 is “0”, it can be presumed that the network scan is “normal”, and if the number of D-scores D_2 that are smaller than “0” (=count value DS_count) is greater than half of the terminal devices, it can be presumed that the network scan failed due to “network congestion”.

また、Model3は、ネットワークスキャンが“通信品質不十分”の原因によって失敗したグループCLSと、ネットワークスキャンが“ネットワーク混雑”の原因によって失敗したグループCLSとを扱い、グループCLSとグループCLSとを判別するDスコアD_3を算出し、その算出したDスコアD_3のうち、“0”よりも小さいDスコアD_3の個数(=カウント値DS_count)が端末装置の半数よりも少なければ、ネットワークスキャンが“通信品質不十分”の原因で失敗したと推定でき、“0”よりも小さいDスコアD_3の個数(=カウント値DS_count)が端末装置の半数よりも大きければ、ネットワークスキャンが“ネットワーク混雑”の原因によって失敗したと推定できる。 Model 3 handles group CLS 2 in which the network scan has failed due to “inadequate communication quality” and group CLS 3 in which the network scan has failed due to “network congestion”, and calculates a D-score D_3 to distinguish between group CLS 2 and group CLS 3. If the number of D-scores D_3 less than “0” (=count value DS_count) among the calculated D-scores D_3 is less than half of the terminal devices, it can be assumed that the network scan has failed due to “inadequate communication quality”, and if the number of D-scores D_3 less than “0” (=count value DS_count) is greater than half of the terminal devices, it can be assumed that the network scan has failed due to “network congestion”.

そこで、まず、図41のステップS1445において、DS_count=0であるか否かを判定し、DS_count=0でないと判定されたとき、DS_count<(Nterminal×D_thres)であるか否かを更に判定し、DS_count<(Nterminal×D_thres)であるとき、“0”よりも小さいDスコアを有する端末装置について、ネットワークスキャンが“通信品質不十分”の原因で失敗したと推定し、DS_count<(Nterminal×D_thres)でないとき(即ち、DS_countが(Nterminal×D_thres)以上であるとき)、基地局に属する全ての端末装置について、ネットワークスキャンが“ネットワーク混雑”の原因で失敗したと推定することにした(ステップS1445,S1447~S1449参照)。 Therefore, first, in step S1445 of FIG. 41, it is determined whether DS_count=0 or not. If it is determined that DS_count=0 is not true, it is further determined whether DS_count<(N terminal ×D_thres) or not. If DS_count<(N terminal ×D_thres), it is presumed that the network scan failed for terminal devices having a D score smaller than "0" due to "insufficient communication quality". If DS_count<(N terminal ×D_thres) is not true (i.e., when DS_count is equal to or greater than (N terminal ×D_thres)), it is presumed that the network scan failed for all terminal devices belonging to the base station due to "network congestion" (see steps S1445, S1447 to S1449).

Model2が設定されたとき、ステップS1445,S1447~S1449において、ネットワークスキャンが“正常”であるグループCLSと、ネットワークスキャンが“ネットワーク混雑”の原因によって失敗したグループCLSとを判別するDスコアD_2が用いられるので、“0”よりも小さいDスコアD_2の個数(=カウント値DS_count)に応じて、DS_count=0(即ち、ネットワークスキャンが“正常”)とDS_count≠0(即ち、ネットワークスキャンが“通信品質不十分”または“ネットワーク混雑”の原因によって失敗)とを正確に推定できる。そして、DS_count=0でない(即ち、DS_count≠0)とき、“0”よりも小さいDスコアD_2の個数であるカウント値DS_countが(Nterminal×D_thres)よりも小さいか否かによって、ネットワークスキャンが失敗した原因が“通信品質不十分”または“ネットワーク混雑”であると正確に推定できる。 When Model 2 is set, in steps S1445 and S1447 to S1449, the D-score D_2 is used to distinguish between group CLS 1 in which the network scan is “normal” and group CLS 3 in which the network scan has failed due to “network congestion”, so that, depending on the number of D-scores D_2 that are smaller than “0” (=count value DS_count), it is possible to accurately estimate whether DS_count=0 (i.e., the network scan is “normal”) or DS_count≠0 (i.e., the network scan has failed due to “inadequate communication quality” or “network congestion”). Then, when DS_count is not 0 (i.e., DS_count ≠ 0), depending on whether the count value DS_count, which is the number of D scores D_2 smaller than "0", is smaller than (N terminal × D_thres), it can be accurately estimated that the cause of the failure of the network scan is "insufficient communication quality" or "network congestion".

一方、Model3が設定されたとき、ステップS1445,S1447~S1449において、ネットワークスキャンが“通信品質不十分”の原因によって失敗したグループCLSと、ネットワークスキャンが“ネットワーク混雑”の原因によって失敗したグループCLSとを判別するDスコアD_3が用いられるので、DS_count=0でない(即ち、DS_count≠0)とき、“0”よりも小さいDスコアD_3の個数であるカウント値DS_countが(Nterminal×D_thres)よりも小さいか否かによって、ネットワークスキャンが失敗した原因が“通信品質不十分”または“ネットワーク混雑”であると正確に推定できる。また、DS_count=0であるか否かの判定は、明確であるので、DS_count=0(即ち、ネットワークスキャンが“正常”)とDS_count≠0(即ち、ネットワークスキャンが“通信品質不十分”または“ネットワーク混雑”の原因によって失敗)とを正確に推定できる。 On the other hand, when Model 3 is set, in steps S1445, S1447 to S1449, a D-score D_3 is used to distinguish between group CLS 2 in which the network scan has failed due to "inadequate communication quality" and group CLS 3 in which the network scan has failed due to "network congestion". Therefore, when DS_count is not 0 (i.e., DS_count ≠ 0), it is possible to accurately estimate that the cause of the network scan failure is "inadequate communication quality" or "network congestion" depending on whether the count value DS_count, which is the number of D-scores D_3 smaller than "0", is smaller than (N terminal ×D_thres). In addition, since the determination of whether DS_count=0 or not is clear, it is possible to accurately estimate whether DS_count=0 (i.e., the network scan is “normal”) or whether DS_count≠0 (i.e., the network scan has failed due to “inadequate communication quality” or “network congestion”).

従って、Model2またはModel3のいずれを用いても、ネットワークスキャンが“正常”であるか“失敗”であるかを正確に推定でき、ネットワークスキャンが“失敗”であると推定したとき、更に、ネットワークスキャンが失敗した原因が“通信品質不十分”または“ネットワーク混雑”であると正確に推定できる。 Therefore, whether Model 2 or Model 3 is used, it is possible to accurately estimate whether a network scan is "normal" or "failed." When it is estimated that a network scan is "failed," it is also possible to accurately estimate that the cause of the network scan failure is "insufficient communication quality" or "network congestion."

更に、ステップS1445において、DS_count=0であると判定されたとき、直ちに、ネットワークスキャンが“正常”であると推定せずに、各端末装置のポートについて、スキャン応答があったポートの数に応じて、ネットワークスキャンが“正常”、“ポート閉”の原因による失敗および“ネットワーク接続無し”の原因による失敗のいずれかであると推定する(ステップS1452~S1455,S1457参照)。従って、各ポートでスキャン応答の有無を検知することによって、ネットワークスキャンが“正常”、“ポート閉”の原因による失敗および“ネットワーク接続無し”の原因による失敗のいずれであるかを正確に推定できる。 Furthermore, when it is determined in step S1445 that DS_count = 0, the network scan is not immediately assumed to be "normal", but is instead assumed to be either "normal", a failure due to a "closed port", or a failure due to "no network connection" for each terminal device port, depending on the number of ports for which a scan response was received (see steps S1452 to S1455 and S1457). Therefore, by detecting the presence or absence of a scan response at each port, it is possible to accurately estimate whether the network scan was "normal", a failure due to a "closed port", or a failure due to "no network connection".

更に、ステップS1447の“YES”からステップS1449へ至った場合、ステップS1449において、“0”よりも小さくないDスコア(即ち、“0”以上、かつ、(Nterminal×D_thres)よりも小さいDスコア)を有する端末装置についてネットワークスキャンの結果が推定されていないが、ステップS1449の後、ネットワークスキャンの結果が推定済でない各端末装置mについて、図42のステップS1452~ステップS1457が実行されるので、“0”よりも小さくないDスコア(即ち、“0”以上、かつ、(Nterminal×D_thres)よりも小さいDスコア)を有する端末装置についてのネットワークスキャンの結果は、“正常”、ネットワークスキャンを失敗した原因が“ポート閉”、およびネットワークスキャンを失敗した原因が“ネットワーク接続無し”のいずれかに推定される(ステップS1454,S1455,S1457参照)。 Furthermore, when the process proceeds from "YES" in step S1447 to step S1449, the results of the network scan have not been estimated for terminal devices having D scores not smaller than "0" (i.e., D scores greater than or equal to "0" and smaller than (N terminal ×D_thres)) in step S1449. However, after step S1449, steps S1452 to S1457 in FIG. 42 are executed for each terminal device m- b for which the results of the network scan have not been estimated. Therefore, the results of the network scan for terminal devices having D scores not smaller than "0" (i.e., D scores greater than or equal to "0" and smaller than (N terminal ×D_thres)) are estimated to be "normal", the cause of the network scan failure is "port closed", or the cause of the network scan failure is "no network connection" (see steps S1454, S1455, S1457).

なお、ステップS1445の“YES”→S1451の“NO”→S1452の“NO”→S1453の“YES”→S1454からなるステップ、およびステップS1445の“NO”→S1447~S1449からなるステップは、DスコアD_2またはDスコアD_3に基づいて、ネットワークスキャンが正常または失敗であると推定するとともに、ネットワークスキャンが失敗であると推定したとき、ネットワークスキャンが端末装置との通信チャネルに起因した原因によって失敗したと推定することに相当する。 The steps consisting of "YES" in step S1445 → "NO" in S1451 → "NO" in S1452 → "YES" in S1453 → S1454, and "NO" in step S1445 → S1447 to S1449 correspond to estimating that the network scan is successful or unsuccessful based on the D score D_2 or the D score D_3, and when it is estimated that the network scan has failed, estimating that the network scan has failed due to a cause arising from the communication channel with the terminal device.

この発明の実施の形態においては、ネットワークスキャンの結果を推定する動作は、ソフトウェアによって実現されてもよい。この場合、ネットワークスキャン装置1は、CPU(Central Processing Unit)、ROM(Read Only Memory)およびRAM(Random Access Memory)を備える。そして、ROMは、図33に示すフローチャート(図34から図44に示すフローチャートと、図45に示すフローチャートまたは図46に示すフローチャートとを含む)の各ステップからなるプログラムProg_Aを記憶する。 In an embodiment of the present invention, the operation of estimating the results of a network scan may be realized by software. In this case, the network scanning device 1 includes a CPU (Central Processing Unit), a ROM (Read Only Memory), and a RAM (Random Access Memory). The ROM stores a program Prog_A consisting of the steps of the flowchart shown in FIG. 33 (including the flowcharts shown in FIG. 34 to FIG. 44 and the flowchart shown in FIG. 45 or the flowchart shown in FIG. 46).

CPUは、ROMからプログラムProg_Aを読み出し、その読み出したプログラムProg_Aを実行して、ネットワークスキャンの結果を推定する動作を実行する。RAMは、上述した各種の算出結果を一時的に記憶する。 The CPU reads the program Prog_A from the ROM and executes the read program Prog_A to perform an operation to estimate the results of the network scan. The RAM temporarily stores the various calculation results described above.

また、プログラムProg_Aは、CD,DVD等の記録媒体に記録されて流通してもよい。プログラムProg_Aを記録した記録媒体がコンピュータに装着されると、コンピュータは、記録媒体からプログラムProg_Aを読み出して実行し、ネットワークスキャンの結果を推定する動作を実行する。 The program Prog_A may also be distributed in a form recorded on a recording medium such as a CD or DVD. When the recording medium on which the program Prog_A is recorded is inserted into a computer, the computer reads and executes the program Prog_A from the recording medium, and performs an operation to estimate the results of a network scan.

従って、プログラムProg_Aを記録した記録媒体は、コンピュータ読み取り可能な記録媒体である。 Therefore, the recording medium on which the program Prog_A is recorded is a computer-readable recording medium.

なお、上記においては、推定手段16は、通信特性CMbestを有する端末装置をグループCLS~CLSに分類するとき、ネットワークスキャンが“ネットワークが混雑”であるときのスキャンデータ(“ネットワークが混雑”であるときの通信特性CMbest)を用いてLDAアルゴリズムを学習し、その学習した学習済のLDAアルゴリズムを用いて、通信特性CMbestを有する端末装置を3個のグループCLS~CLSに分類すると説明したが、この発明の実施の形態においては、これに限らず、推定手段16は、ネットワークスキャンの結果(=“正常”、“ネットワークが混雑”、“通信品質不十分”のいずれか)のうち、最も精度良く推定したい結果が得られるときのスキャンデータ(最も精度良く推定したい結果が得られるときの通信特性CMbest)を用いてLDAアルゴリズムを学習し、その学習した学習済のLDAアルゴリズムを用いて、通信特性CMbestを有する端末装置を3個のグループCLS~CLSに分類してもよい。 In the above, it has been described that when classifying terminal devices having communication characteristics CMbest into groups CLS 1 to CLS 3 , the estimation means 16 learns an LDA algorithm using scan data when the network scan is “network congested” (communication characteristics CMbest when “network is congested”), and classifies terminal devices having communication characteristics CMbest into three groups CLS 1 to CLS 3 using the learned LDA algorithm. However, in the embodiment of the present invention, it is not limited to this, and the estimation means 16 may learn an LDA algorithm using scan data when the most accurately estimated result is obtained from the results of the network scan (= either “normal”, “network congested”, or “inadequate communication quality”), and classify terminal devices having communication characteristics CMbest into three groups CLS 1 to CLS 3 using the learned LDA algorithm.

より具体的には、推定手段16は、“正常”が最も精度良く推定したい結果であるとき、ネットワークスキャンが“正常”であるときのスキャンデータ(“正常”であるときの通信特性CMbest)を用いてLDAアルゴリズムを学習し、その学習した学習済のLDAアルゴリズムを用いて、通信特性CMbestを有する端末装置を3個のグループCLS~CLSに分類する。 More specifically, when "normal" is the result to be most accurately estimated, the estimation means 16 learns an LDA algorithm using scan data when the network scan is "normal" (communication characteristics CMbest when "normal"), and classifies terminal devices having communication characteristics CMbest into three groups CLS1 to CLS3 using the learned LDA algorithm.

また、推定手段16は、“ネットワークが混雑”が最も精度良く推定したい結果であるとき、ネットワークスキャンが“ネットワークが混雑”であるときのスキャンデータ(“ネットワークが混雑”であるときの通信特性CMbest)を用いてLDAアルゴリズムを学習し、その学習した学習済のLDAアルゴリズムを用いて、通信特性CMbestを有する端末装置を3個のグループCLS~CLSに分類する。 Furthermore, when "network congested" is the result to be most accurately estimated, the estimation means 16 learns an LDA algorithm using scan data when the network scan results in "network congested" (communication characteristics CMbest when "network congested"), and classifies terminal devices having communication characteristics CMbest into three groups CLS1 to CLS3 using the learned LDA algorithm.

更に、推定手段16は、“通信品質不十分”が最も精度良く推定したい結果であるとき、ネットワークスキャンが“通信品質不十分”であるときのスキャンデータ(“通信品質不十分”であるときの通信特性CMbest)を用いてLDAアルゴリズムを学習し、その学習した学習済のLDAアルゴリズムを用いて、通信特性CMbestを有する端末装置を3個のグループCLS~CLSに分類する。 Furthermore, when "inadequate communication quality" is the result to be most accurately estimated, the estimation means 16 learns an LDA algorithm using scan data when the network scan results in "inadequate communication quality" (communication characteristics CMbest when the communication quality is "inadequate"), and classifies terminal devices having communication characteristics CMbest into three groups CLS1 to CLS3 using the learned LDA algorithm.

このように、推定手段16は、最も精度良く推定したい結果に応じて、教師データであるスキャンデータを決定するとともに、その決定したスキャンデータを用いてLDAアルゴリズムを学習し、その学習した学習済のLDAアルゴリズムを用いて、通信特性CMbestを有する端末装置を3個のグループCLS~CLSに分類してもよい。 In this way, the estimation means 16 may determine the scan data that is the teacher data according to the result that is desired to be estimated most accurately, and may learn an LDA algorithm using the determined scan data, and may classify terminal devices having communication characteristics CMbest into three groups CLS1 to CLS3 using the learned LDA algorithm.

また、上記においては、ネットワークスキャンは、スキャンタイミングt(またはスキャンタイミングt’)毎に行われると説明したが、この発明の実施の形態においては、これに限らず、ネットワークスキャンは、スキャン期間T_total単位で行われてもよく、スキャン期間T_total内の複数のスキャンタイミングに亘って行われてもよい。従って、この発明の実施の形態においては、ネットワークスキャンを複数のスキャンタイミングに亘って実行して取得した通信特性を用いて、上述した方法によって、ネットワークスキャンが“正常”または“失敗”であるかを推定し、ネットワークスキャンが“ “失敗”であると推定したとき、ネットワークスキャンが“失敗”した原因を更に推定するものであればよい。 Also, in the above description, it has been explained that the network scan is performed at each scan timing t S (or scan timing t' S ), but this is not limited to the embodiment of the present invention, and the network scan may be performed in units of a scan period T S _total, or may be performed over a plurality of scan timings within the scan period T S _total. Therefore, in the embodiment of the present invention, it is sufficient that the communication characteristics acquired by executing the network scan over a plurality of scan timings are used to estimate whether the network scan is "normal" or "failed" by the above-mentioned method, and when it is estimated that the network scan is "failed", the cause of the "failure" of the network scan is further estimated.

図49は、スキャン応答遅延RTTの確率密度関数を示す図である。図49において、縦軸は、スキャン応答遅延RTTの確率密度関数を表し、横軸は、スキャン応答遅延RTTを表す。また、図49において、(a)は、ネットワークスキャンの結果が“正常”である通信環境において取得されたスキャン応答遅延RTTの確率密度関数を示し、(b)は、ネットワークスキャンの結果が“通信品質不十分”である通信環境において取得されたスキャン応答遅延RTTの確率密度関数を示し、(c)は、ネットワークスキャンの結果が“ネットワーク混雑”である通信環境において取得されたスキャン応答遅延RTTの確率密度関数を示し、(d)は、ネットワークスキャンの結果が“不明”である通信環境において取得されたスキャン応答遅延RTTの確率密度関数を示す。 Fig. 49 is a diagram showing the probability density function of scan response delay RTT m . In Fig. 49, the vertical axis represents the probability density function of scan response delay RTT m , and the horizontal axis represents scan response delay RTT m . In Fig. 49, (a) represents the probability density function of scan response delay RTT m acquired in a communication environment where the result of a network scan is "normal", (b) represents the probability density function of scan response delay RTT m acquired in a communication environment where the result of a network scan is "inadequate communication quality", (c) represents the probability density function of scan response delay RTT m acquired in a communication environment where the result of a network scan is "network congestion", and (d) represents the probability density function of scan response delay RTT m acquired in a communication environment where the result of a network scan is "unknown".

図49を参照して、ネットワークスキャンの結果が“正常”である通信環境において取得されたスキャン応答遅延RTTの確率密度関数((a))、ネットワークスキャンの結果が“通信品質不十分”である通信環境において取得されたスキャン応答遅延RTTの確率密度関数((b))およびネットワークスキャンの結果が“ネットワーク混雑”である通信環境において取得されたスキャン応答遅延RTTの確率密度関数((c))は、相互に異なる。 Referring to FIG. 49 , the probability density function ((a)) of the scan response delay RTT m obtained in a communication environment where the result of the network scan is “normal”, the probability density function ((b)) of the scan response delay RTT m obtained in a communication environment where the result of the network scan is “inadequate communication quality”, and the probability density function ((c)) of the scan response delay RTT m obtained in a communication environment where the result of the network scan is “network congestion” are all different from each other.

スキャン応答遅延RTTの確率密度関数が図49の(a)に示す確率密度関数である場合にネットワークスキャンの結果(=“正常”)を推定するために用いられたサンプルデータが標準サンプルデータD_standard_1であり、スキャン応答遅延RTTの確率密度関数が図49の(b)に示す確率密度関数である場合にネットワークスキャンの結果(=“通信品質不十分”)を推定するために用いられたサンプルデータが標準サンプルデータD_standard_2であり、スキャン応答遅延RTTの確率密度関数が図49の(c)に示す確率密度関数である場合にネットワークスキャンの結果(=“ネットワーク混雑”)を推定するために用いられたサンプルデータが標準サンプルデータD_standard_3である。 When the probability density function of the scan response delay RTT m is the probability density function shown in FIG. 49(a), the sample data used to estimate the result of the network scan (="normal") is standard sample data D_standard_1. When the probability density function of the scan response delay RTT m is the probability density function shown in FIG. 49(b), the sample data used to estimate the result of the network scan (="poor communication quality") is standard sample data D_standard_2. When the probability density function of the scan response delay RTT m is the probability density function shown in FIG. 49(c), the sample data used to estimate the result of the network scan (="network congestion") is standard sample data D_standard_3.

そして、図49の(d)に示すスキャン応答遅延RTTの確率密度関数は、図49の(a)に示すスキャン応答遅延RTTの確率密度関数に最も類似する。 And the probability density function of the scan response delay RTT m shown in FIG. 49(d) is most similar to the probability density function of the scan response delay RTT m shown in FIG. 49(a).

従って、図36および図37に示すステップS129~ステップS139に従って、図49の(d)に示すスキャン応答遅延RTTの確率密度関数に最も類似するスキャン応答遅延RTTの確率密度関数を図49の(a)~(c)に示す3個のスキャン応答遅延RTTの確率密度関数から検出することによって、図49の(d)に示すスキャン応答遅延RTTの確率密度関数に最も類似するスキャン応答遅延RTTの確率密度関数を正確に検出できることが分かった。 Therefore, it has been found that by detecting the probability density function of scan response delay RTT m most similar to the probability density function of scan response delay RTT m shown in FIG. 49(d) from the three probability density functions of scan response delay RTT m shown in FIG. 49(a) to (c) in accordance with steps S129 to S139 shown in FIGS . 36 and 37, it is possible to accurately detect the probability density function of scan response delay RTT m most similar to the probability density function of scan response delay RTT m shown in FIG. 49(d).

また、図49の(d)に示すスキャン応答遅延RTTの確率密度関数に最も類似するスキャン応答遅延RTTの確率密度関数(=図49の(a)に示すスキャン応答遅延RTTの確率密度関数)を検出すれば、ネットワークスキャンの結果を“正常”であると推定してもよいのであるが、推定アルゴリズムALGによってネットワークスキャンの結果を推定する場合、スキャン応答遅延RTTに加え、通信特性CMbestを用いてネットワークスキャンの結果を推定するので、ネットワークスキャンの推定結果が、必ず、“正常”になると断定することもできない。 Furthermore, if the probability density function of scan response delay RTT m that is most similar to the probability density function of scan response delay RTT m shown in FIG. 49(d) (= the probability density function of scan response delay RTT m shown in FIG. 49(a)) is detected, the network scan result may be estimated to be “normal”. However, when the network scan result is estimated by the estimation algorithm ALG, the network scan result is estimated using communication characteristic CMbest m in addition to the scan response delay RTT m , so it cannot be concluded that the estimated network scan result will always be “normal”.

そこで、ネットワークスキャンの結果を“正常”であると推定したときに用いた標準サンプルデータD_standard_1、ネットワークスキャンの結果を“通信品質不十分”であると推定したときに用いた標準サンプルデータD_standard_2およびネットワークスキャンの結果を“ネットワーク混雑”であると推定したときに用いた標準サンプルデータD_standard_3を結合して生成した初期のサンプルデータD_sample_initialと、初期のサンプルデータD_sample_initialに基づいて生成された仮のサンプルデータD_sample_tentative_1~D_sample_tentative_Uとを用いて推定アルゴリズムALGを訓練するとともに、検証セット(=サブセットV1’~VU’の全てからなる。)およびテストデータ(=サブセットTD~TDの全てからなる。)を用いて推定アルゴリズムALG(訓練後の推定アルゴリズムALG)によってネットワークスキャンの結果を推定し、ネットワークスキャンの推定結果を評価指数EVD,nEVD,tEVDによって評価することによって最適アルゴリズムに近づくように推定アルゴリズムALGを更新する構成を採用することにした(図36から図38に示すフローチャート参照)。 Therefore, the estimation algorithm ALG is trained using initial sample data D_sample_initial generated by combining standard sample data D_standard_1 used when the network scan result is estimated to be "normal", standard sample data D_standard_2 used when the network scan result is estimated to be "inadequate communication quality", and standard sample data D_standard_3 used when the network scan result is estimated to be "network congestion", and tentative sample data D_sample_tentative_1 to D_sample_tentative_U generated based on the initial sample data D_sample_initial, and the estimation algorithm ALG is trained using a validation set (=consisting of all of the subsets V 1' to V U' ) and test data (=subsets TD 1 to TD 4. ) is used to estimate the results of a network scan using an estimation algorithm ALG (trained estimation algorithm ALG), and the estimation results of the network scan are evaluated using evaluation indexes EVD, nEVD, and tEVD, thereby updating the estimation algorithm ALG so as to approach the optimal algorithm (see the flowcharts shown in FIGS. 36 to 38).

従って、最適アルゴリズムに近づいた推定アルゴリズムALGによってネットワークスキャンの結果を推定することによって、最も高い正確性でネットワークスキャンの結果を推定できる。 Therefore, by estimating the results of a network scan using the estimation algorithm ALG, which is close to the optimal algorithm, the results of a network scan can be estimated with the highest accuracy.

また、図36から図38に示すフローチャートの実行を完了した時点では、図40から図42に示すフローチャートの実行が図38のステップS161において完了しているのであるから、ネットワークスキャンの結果が“正常”、“通信品質不十分”、“ネットワーク混雑”、“ポート閉”および“接続無し”のいずれかに推定されている。そして、ネットワークスキャンの推定結果が「通信品質不十分」または「ネットワーク混雑」である場合、図33のステップS12において再スキャンリストが作成され、その後、ステップS4において、再スキャンリストに基づいてネットワークスキャンが実行される。その結果、ネットワークスキャンの推定結果が「通信品質不十分」または「ネットワーク混雑」であっても、再スキャンによってネットワークスキャンの推定結果が“正常”になる可能性があり、ネットワークスキャンの結果を正確に推定できる。 At the time when the execution of the flowcharts shown in Figures 36 to 38 is completed, the execution of the flowcharts shown in Figures 40 to 42 is completed in step S161 of Figure 38, so the result of the network scan is estimated to be either "normal", "inadequate communication quality", "network congestion", "port closed" or "no connection". If the estimated result of the network scan is "inadequate communication quality" or "network congestion", a rescan list is created in step S12 of Figure 33, and then a network scan is performed based on the rescan list in step S4. As a result, even if the estimated result of the network scan is "inadequate communication quality" or "network congestion", the estimated result of the network scan may become "normal" by rescanning, and the result of the network scan can be accurately estimated.

この発明の実施の形態においては、“正常”からなるネットワークスキャンの推定結果は、「第1の推定結果」を構成し、“通信品質不十分”からなるネットワークスキャンの推定結果は、「第2の推定結果」を構成し、“ネットワーク混雑”からなるネットワークスキャンの推定結果は、「第3の推定結果」を構成する。そして、第1の推定結果、第2の推定結果および第3の推定結果は、「複数の既知の推定結果」を構成する。 In an embodiment of the present invention, the estimated result of a network scan consisting of "normal" constitutes the "first estimated result", the estimated result of a network scan consisting of "inadequate communication quality" constitutes the "second estimated result", and the estimated result of a network scan consisting of "network congestion" constitutes the "third estimated result". The first estimated result, the second estimated result, and the third estimated result constitute the "multiple known estimated results".

また、この発明の実施の形態においては、標準サンプルデータD_standard_1は、「第1の標準サンプルデータ」を構成し、標準サンプルデータD_standard_2は、「第2の標準サンプルデータ」を構成し、標準サンプルデータD_standard_3は、「第3の標準サンプルデータ」を構成する。 In addition, in this embodiment of the present invention, the standard sample data D_standard_1 constitutes the "first standard sample data", the standard sample data D_standard_2 constitutes the "second standard sample data", and the standard sample data D_standard_3 constitutes the "third standard sample data".

更に、この発明の実施の形態においては、第1の推定結果は、標準サンプルデータD_standard_1を用いて推定アルゴリズムALGによって推定された結果であってもよく、第2の推定結果は、標準サンプルデータD_standard_2を用いて推定アルゴリズムALGによって推定された結果であってもよく、第3の推定結果は、標準サンプルデータD_standard_3を用いて推定アルゴリズムALGによって推定された結果であってもよい。また、第1の推定結果、第2の推定結果および第3の推定結果の各々は、推定アルゴリズムALG以外のアルゴリズムによって推定された結果であってもよい。 Furthermore, in an embodiment of the present invention, the first estimation result may be a result estimated by the estimation algorithm ALG using standard sample data D_standard_1, the second estimation result may be a result estimated by the estimation algorithm ALG using standard sample data D_standard_2, and the third estimation result may be a result estimated by the estimation algorithm ALG using standard sample data D_standard_3. Also, each of the first estimation result, the second estimation result, and the third estimation result may be a result estimated by an algorithm other than the estimation algorithm ALG.

この発明の実施の形態においては、しきい値Corrは、「第1のしきい値」を構成し、しきい値Sは、「第2のしきい値」を構成し、しきい値(Nterminal×D_thres)は、「第3のしきい値」を構成する。 In the embodiment of the present invention, the threshold value Corr_r constitutes a "first threshold value", the threshold value S_r constitutes a "second threshold value", and the threshold value (N terminal ×D_thres) constitutes a "third threshold value".

また、この発明の実施の形態においては、通信特性CMbestは、「第1の通信特性」を構成し、相関係数rijがしきい値Corrよりも大きい通信特性は、「D(Dは、正の整数)個の第2の通信特性」を構成し、スコアQの大きい順に抽出された通信特性は、「K(Kは、正の整数)個の第2の通信特性」を構成する。 In addition, in this embodiment of the present invention, the communication characteristic CMbest constitutes a "first communication characteristic", the communication characteristics having a correlation coefficient r ij greater than the threshold value Corr r constitute "D (D is a positive integer) second communication characteristics", and the communication characteristics extracted in descending order of the score Q constitute "K (K is a positive integer) second communication characteristics".

更に、この発明の実施の形態においては、Dスコアまたはカウント値DS_countは、「判別スコア」を構成する。 Furthermore, in an embodiment of the present invention, the D score or count value DS_count constitutes a "discrimination score."

更に、この発明の実施の形態においては、DスコアD_2は、「第1の判別スコア」を構成し、DスコアD_3は、「第2の判別スコア」を構成し、DスコアD_1は、「第3の判別スコア」を構成する。 Furthermore, in this embodiment of the invention, the D score D_2 constitutes the "first discrimination score", the D score D_3 constitutes the "second discrimination score", and the D score D_1 constitutes the "third discrimination score".

更に、この発明の実施の形態においては、図13に示すパケットロス率PLR、ジッタJT、スキャン最大遅延DLmaxおよびスキャン最小遅延DLminは、相関係数rijがしきい値Corrよりも大きい「D(Dは、正の整数)個の第2の通信特性」を構成する。 Furthermore, in this embodiment of the present invention, the packet loss rate PLR m , jitter JT m , scanning maximum delay DLmax m , and scanning minimum delay DLmin m shown in FIG. 13 constitute "D (D is a positive integer) second communication characteristics" whose correlation coefficient r ij is greater than a threshold value Corr r .

更に、この発明の実施の形態においては、上述したK個の通信特性は、「K個の第2の通信特性」を構成する。 Furthermore, in an embodiment of the present invention, the K communication characteristics described above constitute "K second communication characteristics."

更に、この発明の実施の形態においては、グループCLSは、ネットワークスキャンが正常である「第1のグループ」を構成し、グループCLS,CLSは、それぞれ、ネットワークスキャンが端末装置との通信チャネルに起因した原因によって失敗した「第2のグループ」および「第3のグループ」を構成する。 Furthermore, in this embodiment of the present invention, group CLS 1 constitutes a "first group" in which the network scan is normal, and groups CLS 2 and CLS 3 constitute a "second group" and a "third group" respectively in which the network scan has failed due to a cause attributable to the communication channel with the terminal device.

更に、この発明の実施の形態においては、Model2は、「第1のモデル」を構成し、Model3は、「第2のモデル」を構成する。 Furthermore, in this embodiment of the invention, Model 2 constitutes the "first model" and Model 3 constitutes the "second model."

今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は、上記した実施の形態の説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。 The embodiments disclosed herein should be considered to be illustrative and not restrictive in all respects. The scope of the present invention is indicated by the claims, not by the description of the embodiments above, and is intended to include all modifications within the meaning and scope of the claims.

この発明は、ネットワークスキャン装置、コンピュータに実行させるためのプログラムおよびプログラムを記録したコンピュータ読み取り可能な記録媒体に適用される。 This invention applies to a network scanning device, a program for causing a computer to execute the program, and a computer-readable recording medium on which the program is recorded.

1 ネットワークスキャン装置、10 通信システム、11 ネットワークスキャナ、12 スキャン解析マネージャ、13 ホスト情報データベース、14 抽出手段、15 算出手段、16 推定手段、17 スキャンスケジューラ、20 スキャン対象ネットワーク、30 ユーザ。 1 Network scanning device, 10 Communication system, 11 Network scanner, 12 Scan analysis manager, 13 Host information database, 14 Extraction means, 15 Calculation means, 16 Estimation means, 17 Scan scheduler, 20 Scan target network, 30 User.

Claims (19)

M(Mは、2以上の整数)個の端末装置に対してネットワークスキャンの結果が不明である第1の通信環境においてネットワークスキャンを実行し、前記ネットワークスキャンの第1のスキャン応答遅延を前記M個の端末装置の全てについて取得するスキャン手段と、
ネットワークスキャンの結果が既知である第2の通信環境において実行されたネットワークスキャンの結果がそれぞれ複数の既知の推定結果であるときに得られる複数組のM’(M’は、2以上の整数)個の第2のスキャン応答遅延のうちで前記M個の第1のスキャン応答遅延に最も類似した前記M’個の第2のスキャン応答遅延を類似スキャン応答遅延として検出する検出処理を実行する検出手段と、
前記類似スキャン応答遅延を構成する前記M’個の第2のスキャン応答遅延の1つと共に取得された複数の通信特性のうちで前記既知の推定結果の推定に最も適した通信特性である最適通信特性を前記M’個の第2のスキャン応答遅延の全てについて取得し、その取得したM’個の最適通信特性と前記M’個の第2のスキャン応答遅延とからなる類似標準サンプルデータを生成する生成手段と、
前記類似標準サンプルデータに基づいて、前記第1の通信環境において実行されたネットワークスキャンの結果を推定する推定アルゴリズムを訓練するとともに評価指数を用いて最適アルゴリズムに近づくように前記推定アルゴリズムを更新する更新手段と、
前記更新手段によって更新された推定アルゴリズムを用いて、前記第1の通信環境において実行されたネットワークスキャンの結果を推定する推定手段とを備え、
前記最適アルゴリズムは、ネットワークスキャンの結果を推定したときの推定結果が前記既知の推定結果に一致するようにネットワークスキャンの結果を推定するアルゴリズムからなり、
前記評価指数は、前記訓練後のアルゴリズムによってネットワークスキャンの結果を推定したときの推定結果の正確性を評価する指数である、ネットワークスキャン装置。
a scanning means for executing a network scan in a first communication environment in which the results of a network scan are unknown for M (M is an integer equal to or greater than 2) terminal devices, and acquiring a first scan response delay of the network scan for each of the M terminal devices;
a detection means for executing a detection process for detecting, as a similar scan response delay, M' second scan response delays that are most similar to the M first scan response delays among a plurality of sets of M'(M' is an integer equal to or greater than 2) second scan response delays obtained when the results of a network scan executed in a second communication environment in which the results of the network scan are known are a plurality of known estimated results;
a generating means for acquiring, for each of the M' second scan response delays, an optimal communication characteristic that is the communication characteristic most suitable for estimating the known estimation result among a plurality of communication characteristics acquired together with one of the M' second scan response delays constituting the similar scan response delay, and generating similar standard sample data consisting of the acquired M' optimal communication characteristics and the M' second scan response delays;
an update means for training an estimation algorithm for estimating the result of the network scan executed in the first communication environment based on the similar standard sample data, and updating the estimation algorithm using an evaluation index so as to approach an optimal algorithm;
an estimation means for estimating a result of a network scan executed in the first communication environment by using the estimation algorithm updated by the update means,
the optimization algorithm comprises an algorithm for estimating a result of a network scan such that the estimated result of the network scan matches the known estimated result;
A network scanning device, wherein the evaluation index is an index for evaluating the accuracy of an estimation result when the result of a network scan is estimated using the trained algorithm.
前記生成手段は、更に、前記類似標準サンプルデータからトレーニングデータとテストデータとを生成するとともに前記トレーニングデータからトレーニングセットと検証セットとを生成し、前記複数の既知の推定結果に対応付けられ、かつ、各々が前記M’個の第2のスキャン応答遅延と前記M’個の最適通信特性とからなる複数の標準サンプルデータのそれぞれ一部を結合した初期のサンプルデータを生成し、前記初期のサンプルデータのうち前記トレーニングセットと同じ種類の標準サンプルデータからなる一部のサンプルデータを前記トレーニングセットの一部によって置き換えた仮のサンプルデータを生成し、
前記更新手段は、前記初期のサンプルデータを用いて前記推定アルゴリズムを訓練するとともに前記検証セットを用いて訓練後の推定アルゴリズムによってネットワークスキャンの結果を推定したときの推定結果を評価する第1の評価指数が、前記仮のサンプルデータを用いて前記推定アルゴリズムを訓練するとともに前記検証セットを用いて訓練後の推定アルゴリズムによってネットワークスキャンの結果を推定したときの推定結果を評価する第2の評価指数以下であるとき、前記仮のサンプルデータで前記推定アルゴリズムを更新する、請求項1に記載のネットワークスキャン装置。
The generating means further generates training data and test data from the similar standard sample data, and generates a training set and a validation set from the training data, generates initial sample data by combining a portion of each of a plurality of standard sample data corresponding to the plurality of known estimation results and each of which is composed of the M′ second scan response delays and the M′ optimal communication characteristics, and generates provisional sample data by replacing a portion of the initial sample data composed of standard sample data of the same type as the training set with a portion of the training set;
2. The network scanning device according to claim 1, wherein the update means updates the estimation algorithm with the provisional sample data when a first evaluation index for evaluating an estimation result when the estimation algorithm is trained using the initial sample data and the network scan result is estimated by the trained estimation algorithm using the validation set is equal to or less than a second evaluation index for evaluating an estimation result when the estimation algorithm is trained using the provisional sample data and the network scan result is estimated by the trained estimation algorithm using the validation set.
前記複数の既知の推定結果は、前記ネットワークスキャンの結果が正常であることを示す第1の推定結果と、通信品質が不十分であることによって前記ネットワークスキャンが失敗したことを示す第2の推定結果と、ネットワークが混雑していることによって前記ネットワークスキャンが失敗したことを示す第3の推定結果とを含み、
前記複数の標準サンプルデータは、
ネットワークが正常である通信環境において取得された前記M’個の前記第2のスキャン応答遅延と前記M’個の最適通信特性とからなり、前記ネットワークスキャンの結果が前記第1の推定結果であると推定するための標準サンプルデータである第1の標準サンプルデータと、
ネットワークの通信品質が不十分である通信環境において取得された前記M’個の前記第2のスキャン応答遅延と前記M’個の最適通信特性とからなり、前記ネットワークスキャンの結果が前記第2の推定結果であると推定するための標準サンプルデータである第2の標準サンプルデータと、
ネットワークが混雑している通信環境において取得された前記M’個の前記第2のスキャン応答遅延と前記M’個の最適通信特性とからなり、前記ネットワークスキャンの結果が前記第3の推定結果であると推定するための標準サンプルデータである第3の標準サンプルデータとを含み、
前記第1の推定結果は、前記第1の標準サンプルデータを用いて前記推定アルゴリズムによって推定された結果であり、
前記第2の推定結果は、前記第2の標準サンプルデータを用いて前記推定アルゴリズムによって推定された結果であり、
前記第3の推定結果は、前記第3の標準サンプルデータを用いて前記推定アルゴリズムによって推定された結果である、請求項2に記載のネットワークスキャン装置。
the plurality of known inference results include a first inference result indicating that the result of the network scan is normal, a second inference result indicating that the network scan has failed due to insufficient communication quality, and a third inference result indicating that the network scan has failed due to network congestion;
The plurality of standard sample data are
first standard sample data, which is standard sample data for estimating that the result of the network scan is the first estimation result, and which is composed of the M' second scan response delays and the M' optimal communication characteristics acquired in a communication environment in which a network is normal;
second standard sample data, which is standard sample data for estimating that the result of the network scan is the second estimation result, and which is composed of the M' second scan response delays and the M' optimal communication characteristics acquired in a communication environment in which network communication quality is insufficient;
and third standard sample data, which is standard sample data for estimating that the result of the network scan is the third estimation result, the third standard sample data being composed of the M' second scan response delays and the M' optimal communication characteristics acquired in a communication environment in which a network is congested,
the first estimation result is a result estimated by the estimation algorithm using the first standard sample data;
the second estimation result is a result estimated by the estimation algorithm using the second standard sample data;
3. The network scanning device according to claim 2, wherein the third estimation result is a result estimated by the estimation algorithm using the third standard sample data.
前記生成手段は、前記初期のサンプルデータのうち前記トレーニングセットと同じ種類の標準サンプルデータからなる一部のサンプルデータを前記トレーニングセットの複数のサブセットデータのうちの1つのサブセットデータによって置き換えることを前記複数のサブセットデータの全てについて実行して前記仮のサンプルデータを構成する複数の仮のサンプルデータを生成し、
前記更新手段は、前記初期のサンプルデータを用いて前記推定アルゴリズムを訓練するとともに、前記検証セットを用いて訓練後の推定アルゴリズムによってネットワークスキャンの結果を推定したときの推定結果に基づいて第1の混同行列を生成する第1の処理と、前記仮のサンプルデータを構成する複数の仮のサンプルデータのうちの1つの仮のサンプルデータを用いて前記推定アルゴリズムを訓練するとともに、前記検証セットを用いて訓練後の推定アルゴリズムによってネットワークスキャンの結果を推定したときの推定結果に基づいて第2の混同行列を生成する処理を前記複数の仮のサンプルデータの全てについて実行する第2の処理と、前記第1の混同行列に基づいて算出された第1の評価指数と前記複数の第2の混同行列に基づいて算出された複数の第2の評価指数とに基づいて、前記第1の評価指数よりも大きく、かつ、前記複数の第2の評価指数のうちの最大の評価指数が得られるときの前記複数の仮のサンプルデータのうちの1つの仮のサンプルデータからなる最適サンプルデータで前記推定アルゴリズムを更新する第3の処理と、前記第3の処理の後、前記テストデータを用いて前記更新後の推定アルゴリズムによってネットワークスキャンの結果を推定したときの推定結果に基づいて第3の混同行列を生成する第4の処理と、前記第3の混同行列に基づいて算出された第3の評価指数が前記最大の評価指数以上であるとき、前記更新後の推定アルゴリズムおよび前記最適サンプルデータを承認する第5の処理とを実行する、請求項2または請求項3に記載のネットワークスキャン装置。
the generating means replaces a part of the sample data, which is made of standard sample data of the same type as the training set, among the initial sample data with one of a plurality of subset data of the training set, for all of the plurality of subset data, to generate a plurality of provisional sample data constituting the provisional sample data;
The update means includes a first process for training the estimation algorithm using the initial sample data, and generating a first confusion matrix based on an estimation result obtained when a result of a network scan is estimated by the trained estimation algorithm using the validation set; a second process for training the estimation algorithm using one of a plurality of provisional sample data constituting the provisional sample data, and generating a second confusion matrix based on an estimation result obtained when a result of a network scan is estimated by the trained estimation algorithm using the validation set, for all of the plurality of provisional sample data; and a first evaluation index calculated based on the first confusion matrix and a second confusion matrix calculated based on the plurality of second confusion matrices. 4. The network scanning device according to claim 2, further comprising: a third process for updating the estimation algorithm with optimal sample data consisting of one provisional sample data among the plurality of provisional sample data when a maximum evaluation index of the plurality of second evaluation indexes is obtained, the optimal sample data being greater than the first evaluation index and being based on a plurality of second evaluation indexes obtained by the estimation; a fourth process for generating a third confusion matrix based on an estimation result obtained when a result of a network scan is estimated by the updated estimation algorithm using the test data after the third process; and a fifth process for approving the updated estimation algorithm and the optimal sample data when a third evaluation index calculated based on the third confusion matrix is equal to or greater than the maximum evaluation index.
前記更新手段は、前記第3の評価指数が前記最大の評価指数よりも小さいとき、前記最適サンプルデータで更新された推定アルゴリズムを用いて、前記第1の処理から前記第5の処理を前記第3の評価指数が前記最大の評価指数以上になるまで繰り返し実行する、請求項4に記載のネットワークスキャン装置。 The network scanning device according to claim 4, wherein the update means, when the third evaluation index is smaller than the maximum evaluation index, repeatedly executes the first process to the fifth process using the estimation algorithm updated with the optimal sample data until the third evaluation index becomes equal to or greater than the maximum evaluation index. 前記評価指数を算出する算出手段を更に備え、
前記第1から第3の混同行列の各々は、想定した事象が発生した場合に、前記想定した事象の発生を正しく推定した割合を示す第1の要素と、想定した事象が実際には発生しなかった場合に、前記想定した事象が発生しなかったことを正しく推定した割合を示す第2の要素と、想定した事象が発生した場合に、前記想定した事象の発生を別の事象に誤って推定した割合を示す第3の要素と、想定した事象が実際には発生しなかった場合に、誤って想定した事象が発生したと推定した割合を示す第4の要素とからなり、
前記算出手段は、前記第1の要素または前記第4の要素に分類された割合のうちで実際に前記第1の要素に分類された割合の比であるPrecisionと、前記第1の要素または前記第3の要素に分類された割合のうちで実際に前記第1の要素に分類された割合の比であるRecallとを算出し、前記Precisionおよび前記Recallに基づいて2×Precision/(Precision+Recall)を算出する第3の算出処理を前記第1の混同行列に基づいて実行して前記第1の評価指数を算出し、前記第3の算出処理を前記複数の第2の混同行列に基づいて実行して前記複数の第2の評価指数を算出し、前記第3の算出処理を前記第3の混同行列に基づいて実行して前記第3の評価指数を算出する、請求項4または請求項5に記載のネットワークスキャン装置。
Further comprising a calculation means for calculating the evaluation index,
Each of the first to third confusion matrices includes a first element indicating a rate at which an assumed event is correctly estimated when the assumed event occurs, a second element indicating a rate at which an assumed event is correctly estimated not to have occurred when the assumed event does not actually occur, a third element indicating a rate at which an assumed event is erroneously estimated to have occurred as another event when the assumed event occurs, and a fourth element indicating a rate at which an assumed event is erroneously estimated to have occurred when the assumed event does not actually occur;
6. The network scanning device according to claim 4, wherein the calculation means calculates Precision, which is a ratio of a ratio actually classified into the first element among a ratio classified into the first element or the fourth element, and Recall, which is a ratio of a ratio actually classified into the first element among a ratio classified into the first element or the third element, and calculates 2×Precision/(Precision+Recall) based on the Precision and the Recall, based on the first confusion matrix to calculate the first evaluation index, executes the third calculation process based on the plurality of second confusion matrices to calculate the plurality of second evaluation indexes, and executes the third calculation process based on the third confusion matrix to calculate the third evaluation index.
前記評価指数を算出する算出手段を更に備え、
前記第1から第3の混同行列の各々は、想定した事象が発生した場合に、前記想定した事象の発生を正しく推定した割合を示す第1の要素と、想定した事象が実際には発生しなかった場合に、前記想定した事象が発生しなかったことを正しく推定した割合を示す第2の要素と、想定した事象が発生した場合に、前記想定した事象の発生を別の事象に誤って推定した割合を示す第3の要素と、想定した事象が実際には発生しなかった場合に、誤って想定した事象が発生したと推定した割合を示す第4の要素とからなり、
前記算出手段は、前記第1の混同行列の前記第1の要素、前記第2の要素、前記第3の要素および前記第4の要素を用いてマシューズ相関係数からなる前記第1の評価指数を算出し、前記複数の第2の混同行列の前記第1の要素、前記第2の要素、前記第3の要素および前記第4の要素を用いてマシューズ相関係数からなる前記複数の第2の評価指数を算出し、前記第3の混同行列の前記第1の要素、前記第2の要素、前記第3の要素および前記第4の要素を用いてマシューズ相関係数からなる前記第3の評価指数を算出する、請求項4または請求項5に記載のネットワークスキャン装置。
Further comprising a calculation means for calculating the evaluation index,
Each of the first to third confusion matrices includes a first element indicating a rate at which an assumed event is correctly estimated when the assumed event occurs, a second element indicating a rate at which an assumed event is correctly estimated not to have occurred when the assumed event does not actually occur, a third element indicating a rate at which an assumed event is erroneously estimated to have occurred as another event when the assumed event occurs, and a fourth element indicating a rate at which an assumed event is erroneously estimated to have occurred when the assumed event does not actually occur;
6. The network scanning device according to claim 4, wherein the calculation means calculates the first evaluation index consisting of a Matthews correlation coefficient using the first element, the second element, the third element, and the fourth element of the first confusion matrix, calculates the plurality of second evaluation indexes consisting of a Matthews correlation coefficient using the first element, the second element, the third element, and the fourth element of the plurality of second confusion matrices, and calculates the third evaluation index consisting of a Matthews correlation coefficient using the first element, the second element, the third element, and the fourth element of the third confusion matrix.
前記検出手段は、前記検出処理において、前記複数組のM’個の第2のスキャン応答遅延の複数の分布と前記M個の第1のスキャン応答遅延の分布とに基づいて、前記M個の第1のスキャン応答遅延の分布に最も類似する分布を有する前記M’個の第2のスキャン応答遅延を前記複数組のM’個の第2のスキャン応答遅延から前記類似スキャン応答遅延として検出する、請求項1から請求項7のいずれか1項に記載のネットワークスキャン装置。 The network scanning device according to any one of claims 1 to 7, wherein the detection means detects, in the detection process, the M' second scan response delays having a distribution most similar to the distribution of the M first scan response delays from the multiple sets of M' second scan response delays as the similar scan response delay based on the multiple distributions of the multiple sets of M' second scan response delays and the distribution of the M first scan response delays. 前記検出手段は、前記検出処理において、前記M個の第1のスキャン応答遅延に基づいて最も生じやすい前記第1のスキャン応答遅延の値を示す第1のモードを算出し、前記M個の第1のスキャン応答遅延と前記第1のモードとの差の絶対値の平均値である第1の平均絶対偏差を算出する第1の算出処理と、前記第1の算出処理の後、前記M’個の第2のスキャン応答遅延に基づいて最も生じやすい前記第2のスキャン応答遅延の値を示す第2のモードを算出し、前記M’個の第2のスキャン応答遅延と前記第2のモードとの差の絶対値の平均値である第2の平均絶対偏差を算出し、前記第1の平均絶対偏差と前記第2の平均絶対偏差との差の絶対値からなる平均絶対偏差の差を算出し、1から前記平均絶対偏差の差を減算して類似性を算出する第2の算出処理を前記複数の既知の推定結果の全てについて実行して複数の類似性を取得し、その取得した複数の類似性のうち、最も高い類似性を算出する元になった前記M’個の第2のスキャン応答遅延を前記類似スキャン応答遅延として検出する、請求項8に記載のネットワークスキャン装置。 The network scanning device according to claim 8, wherein the detection means performs a first calculation process to calculate a first mode indicating the most likely value of the first scan response delay based on the M first scan response delays, and calculate a first mean absolute deviation that is the average value of the absolute value of the difference between the M first scan response delays and the first mode, and after the first calculation process, calculate a second mode indicating the most likely value of the second scan response delay based on the M' second scan response delays, calculate a second mean absolute deviation that is the average value of the absolute value of the difference between the M' second scan response delays and the second mode, calculate a difference in mean absolute deviation consisting of the absolute value of the difference between the first mean absolute deviation and the second mean absolute deviation, and subtract the difference in mean absolute deviation from 1 to calculate a similarity, for all of the multiple known estimation results to obtain multiple similarities, and detects the M' second scan response delays that were the basis for calculating the highest similarity among the multiple obtained similarities as the similar scan response delay. スキャン手段が、M(Mは、2以上の整数)個の端末装置に対してネットワークスキャンの結果が不明である第1の通信環境においてネットワークスキャンを実行し、前記ネットワークスキャンの第1のスキャン応答遅延を前記M個の端末装置の全てについて取得する第1のステップと、
検出手段が、ネットワークスキャンの結果が既知である第2の通信環境において実行されたネットワークスキャンの結果がそれぞれ複数の既知の推定結果であるときに得られる複数組のM’(M’は、2以上の整数)個の第2のスキャン応答遅延のうちで前記M個の第1のスキャン応答遅延に最も類似した前記M’個の第2のスキャン応答遅延を類似スキャン応答遅延として検出する検出処理を実行する第2のステップと、
生成手段が、前記類似スキャン応答遅延を構成する前記M’個の第2のスキャン応答遅延の1つと共に取得された複数の通信特性のうちで前記既知の推定結果の推定に最も適した通信特性である最適通信特性を前記M’個の第2のスキャン応答遅延の全てについて取得し、その取得したM’個の最適通信特性と前記M’個の第2のスキャン応答遅延とからなる類似標準サンプルデータを生成する第3のステップと、
更新手段が、前記類似標準サンプルデータに基づいて、前記第1の通信環境において実行されたネットワークスキャンの結果を推定する推定アルゴリズムを訓練するとともに評価指数を用いて最適アルゴリズムに近づくように前記推定アルゴリズムを更新する第4のステップと、
推定手段が、前記第4のステップにおいて更新された推定アルゴリズムを用いて、前記第1の通信環境において実行されたネットワークスキャンの結果を推定する第5のステップとをコンピュータに実行させ、
前記最適アルゴリズムは、ネットワークスキャンの結果を推定したときの推定結果が前記既知の推定結果に一致するようにネットワークスキャンの結果を推定するアルゴリズムからなり、
前記評価指数は、前記訓練後のアルゴリズムによってネットワークスキャンの結果を推定したときの推定結果の正確性を評価する指数である、コンピュータに実行させるためのプログラム。
A first step in which a scanning means executes a network scan in a first communication environment in which the results of a network scan are unknown for M (M is an integer equal to or greater than 2) terminal devices, and acquires a first scan response delay of the network scan for each of the M terminal devices;
a second step of executing a detection process in which the detection means detects, as similar scan response delays, M' second scan response delays that are most similar to the M first scan response delays among a plurality of sets of M'(M' is an integer equal to or greater than 2) second scan response delays obtained when the results of a network scan executed in a second communication environment in which the results of the network scan are known are a plurality of known estimated results;
a third step in which a generating means acquires, for each of the M' second scan response delays, an optimal communication characteristic that is the communication characteristic most suitable for estimating the known estimation result among a plurality of communication characteristics acquired together with one of the M' second scan response delays constituting the similar scan response delay, and generates similar standard sample data consisting of the acquired M' optimal communication characteristics and the M' second scan response delays;
a fourth step in which an update means trains an estimation algorithm for estimating a result of a network scan executed in the first communication environment based on the similar standard sample data, and updates the estimation algorithm using an evaluation index so as to approach an optimal algorithm;
a fifth step in which an estimation means estimates a result of a network scan performed in the first communication environment using the estimation algorithm updated in the fourth step;
the optimization algorithm comprises an algorithm for estimating a result of a network scan such that the estimated result of the network scan matches the known estimated result;
The evaluation index is an index for evaluating the accuracy of an estimation result when the result of a network scan is estimated by the trained algorithm.
前記生成手段は、前記第3のステップにおいて、更に、前記類似標準サンプルデータからトレーニングデータとテストデータとを生成するとともに前記トレーニングデータからトレーニングセットと検証セットとを生成し、前記複数の既知の推定結果に対応付けられ、かつ、各々が前記M’個の第2のスキャン応答遅延と前記M’個の最適通信特性とからなる複数の標準サンプルデータのそれぞれ一部を結合した初期のサンプルデータを生成し、前記初期のサンプルデータのうち前記トレーニングセットと同じ種類の標準サンプルデータからなる一部のサンプルデータを前記トレーニングセットの一部によって置き換えた仮のサンプルデータを生成し、
前記更新手段は、前記第4のステップにおいて、前記初期のサンプルデータを用いて前記推定アルゴリズムを訓練するとともに前記検証セットを用いて訓練後の推定アルゴリズムによってネットワークスキャンの結果を推定したときの推定結果を評価する第1の評価指数が、前記仮のサンプルデータを用いて前記推定アルゴリズムを訓練するとともに前記検証セットを用いて訓練後の推定アルゴリズムによってネットワークスキャンの結果を推定したときの推定結果を評価する第2の評価指数以下であるとき、前記仮のサンプルデータで前記推定アルゴリズムを更新する、請求項10に記載のコンピュータに実行させるためのプログラム。
In the third step, the generating means further generates training data and test data from the similar standard sample data, and generates a training set and a validation set from the training data, generates initial sample data by combining a portion of a plurality of standard sample data that correspond to the plurality of known estimation results and each of which is composed of the M′ second scan response delays and the M′ optimal communication characteristics, and generates temporary sample data by replacing a portion of the initial sample data composed of standard sample data of the same type as the training set with a portion of the training set,
11. The program for causing a computer to execute the program according to claim 10, wherein in the fourth step, when a first evaluation index for evaluating an estimation result obtained when the estimation algorithm is trained using the initial sample data and the network scan result is estimated by the trained estimation algorithm using the validation set is equal to or lower than a second evaluation index for evaluating an estimation result obtained when the estimation algorithm is trained using the provisional sample data and the network scan result is estimated by the trained estimation algorithm using the validation set, the update means updates the estimation algorithm with the provisional sample data.
前記複数の既知の推定結果は、前記ネットワークスキャンの結果が正常であることを示す第1の推定結果と、通信品質が不十分であることによって前記ネットワークスキャンが失敗したことを示す第2の推定結果と、ネットワークが混雑していることによって前記ネットワークスキャンが失敗したことを示す第3の推定結果とを含み、
前記複数の標準サンプルデータは、
ネットワークが正常である通信環境において取得された前記M’個の前記第2のスキャン応答遅延と前記M’個の最適通信特性とからなり、前記ネットワークスキャンの結果が前記第1の推定結果であると推定するための標準サンプルデータである第1の標準サンプルデータと、
ネットワークの通信品質が不十分である通信環境において取得された前記M’個の前記第2のスキャン応答遅延と前記M’個の最適通信特性とからなり、前記ネットワークスキャンの結果が前記第2の推定結果であると推定するための標準サンプルデータである第2の標準サンプルデータと、
ネットワークが混雑している通信環境において取得された前記M’個の前記第2のスキャン応答遅延と前記M’個の最適通信特性とからなり、前記ネットワークスキャンの結果が前記第3の推定結果であると推定するための標準サンプルデータである第3の標準サンプルデータとを含み、
前記第1の推定結果は、前記第1の標準サンプルデータを用いて前記推定アルゴリズムによって推定された結果であり、
前記第2の推定結果は、前記第2の標準サンプルデータを用いて前記推定アルゴリズムによって推定された結果であり、
前記第3の推定結果は、前記第3の標準サンプルデータを用いて前記推定アルゴリズムによって推定された結果である、請求項11に記載のコンピュータに実行させるためのプログラム。
the plurality of known inference results include a first inference result indicating that the result of the network scan is normal, a second inference result indicating that the network scan has failed due to insufficient communication quality, and a third inference result indicating that the network scan has failed due to network congestion;
The plurality of standard sample data are
first standard sample data, which is standard sample data for estimating that the result of the network scan is the first estimation result, and which is composed of the M' second scan response delays and the M' optimal communication characteristics acquired in a communication environment in which a network is normal;
second standard sample data, which is standard sample data for estimating that the result of the network scan is the second estimation result, and which is composed of the M' second scan response delays and the M' optimal communication characteristics acquired in a communication environment in which network communication quality is insufficient;
and third standard sample data, which is standard sample data for estimating that the result of the network scan is the third estimation result, the third standard sample data being composed of the M' second scan response delays and the M' optimal communication characteristics acquired in a communication environment in which a network is congested,
the first estimation result is a result estimated by the estimation algorithm using the first standard sample data;
the second estimation result is a result estimated by the estimation algorithm using the second standard sample data,
The program for causing a computer to execute the program according to claim 11 , wherein the third estimation result is a result estimated by the estimation algorithm using the third standard sample data.
前記生成手段は、前記第3のステップにおいて、前記初期のサンプルデータのうち前記トレーニングセットと同じ種類の標準サンプルデータからなる一部のサンプルデータを前記トレーニングセットの複数のサブセットデータのうちの1つのサブセットデータによって置き換えることを前記複数のサブセットデータの全てについて実行して前記仮のサンプルデータを構成する複数の仮のサンプルデータを生成し、
前記第4のステップは、
前記更新手段が、前記初期のサンプルデータを用いて前記推定アルゴリズムを訓練するとともに、前記検証セットを用いて訓練後の推定アルゴリズムによってネットワークスキャンの結果を推定したときの推定結果に基づいて第1の混同行列を生成する第1のサブステップと、
前記更新手段が、前記仮のサンプルデータを構成する複数の仮のサンプルデータのうちの第1の仮のサンプルデータを用いて前記推定アルゴリズムを訓練するとともに、前記検証セットを用いて訓練後の推定アルゴリズムによってネットワークスキャンの結果を推定したときの推定結果に基づいて第2の混同行列を生成する第2のサブステップと、
前記更新手段が、前記第2の混同行列に基づいて算出された第2の評価指数が前記第1の混同行列に基づいて算出された第1の評価指数よりも大きいとき、前記第2の評価指数を前記第1の評価指数に設定するとともに前記第1の仮のサンプルデータで前記推定アルゴリズムを更新する第3のサブステップと、
前記更新手段が、前記第2の評価指数が前記第1の評価指数よりも大きくないとき前記第2の評価指数を前記第1の評価指数に設定せずに前記第1の仮のサンプルデータと異なる第2の仮のサンプルデータを複数の仮のサンプルデータから選択する第4のサブステップと、
前記更新手段が、前記第2のサブステップから前記第4のサブステップを前記複数の仮のサンプルデータの全てについて繰り返し実行する第5のサブステップと、
前記更新手段が、前記テストデータを用いて、前記第5のサブステップにおいて最終的に更新された前記推定アルゴリズムによってネットワークスキャンの結果を推定したときの推定結果に基づいて第3の混同行列を生成する第6のサブステップと、
前記更新手段が、前記第3の混同行列に基づいて算出された第3の評価指数が前記第5のサブステップにおいて最終的に得られた前記第1の評価指数以上であるとき前記最終的に更新された前記推定アルゴリズムと、前記最終的に得られた前記第1の評価指数を構成する前記第2の評価指数が得られるときの前記第1の仮のサンプルデータとを承認する第7のサブステップとを含む、請求項11または請求項12に記載のコンピュータに実行させるためのプログラム。
In the third step, the generating means replaces a part of the sample data of the initial sample data, which is made of standard sample data of the same type as the training set, with one of a plurality of subset data of the training set, for all of the plurality of subset data, to generate a plurality of provisional sample data constituting the provisional sample data;
The fourth step includes:
a first sub-step in which the update means trains the estimation algorithm using the initial sample data, and generates a first confusion matrix based on an estimation result when the trained estimation algorithm estimates a result of a network scan using the validation set;
a second sub-step in which the update means trains the estimation algorithm using a first set of provisional sample data among a plurality of provisional sample data constituting the provisional sample data, and generates a second confusion matrix based on an estimation result obtained when a result of a network scan is estimated by the trained estimation algorithm using the validation set;
a third sub-step of the update means setting the second evaluation index to the first evaluation index when the second evaluation index calculated based on the second confusion matrix is greater than the first evaluation index calculated based on the first confusion matrix, and updating the estimation algorithm with the first provisional sample data;
a fourth sub-step in which the update means does not set the second evaluation index to the first evaluation index when the second evaluation index is not greater than the first evaluation index, and selects second provisional sample data different from the first provisional sample data from a plurality of provisional sample data;
a fifth substep in which the updating means repeatedly executes the second substep to the fourth substep for all of the plurality of virtual sample data;
a sixth sub-step of generating a third confusion matrix based on an estimation result when the update means estimates a result of a network scan by the estimation algorithm finally updated in the fifth sub-step using the test data;
13. The program for causing a computer to execute the program according to claim 11 or 12, further comprising a seventh substep in which the updating means approves the finally updated estimation algorithm when a third evaluation index calculated based on the third confusion matrix is equal to or greater than the first evaluation index finally obtained in the fifth substep, and the first provisional sample data when the second evaluation index constituting the finally obtained first evaluation index is obtained.
前記第4のステップは、
前記更新手段が、前記第3の評価指数が前記第5のサブステップにおいて最終的に得られた前記第1の評価指数よりも小さいとき、前記最終的に更新された前記推定アルゴリズムを用いて、前記第3の評価指数が前記第5のサブステップにおいて最終的に得られた前記第1の評価指数以上になるまで前記第2のサブステップから前記第7のサブステップを繰り返し実行する第8のサブステップを更に含む、請求項13に記載のコンピュータに実行させるためのプログラム。
The fourth step includes:
14. The program for causing a computer to execute the program according to claim 13, further comprising an eighth substep in which, when the third evaluation index is smaller than the first evaluation index finally obtained in the fifth substep, the updating means repeatedly executes the second substep to the seventh substep using the finally updated estimation algorithm until the third evaluation index becomes equal to or larger than the first evaluation index finally obtained in the fifth substep.
算出手段が、前記評価指数を算出する第6のステップを更にコンピュータに実行させ、
前記第1から第3の混同行列の各々は、想定した事象が発生した場合に、前記想定した事象の発生を正しく推定した割合を示す第1の要素と、想定した事象が実際には発生しなかった場合に、前記想定した事象が発生しなかったことを正しく推定した割合を示す第2の要素と、想定した事象が発生した場合に、前記想定した事象の発生を別の事象に誤って推定した割合を示す第3の要素と、想定した事象が実際には発生しなかった場合に、誤って想定した事象が発生したと推定した割合を示す第4の要素とからなり、
前記算出手段は、前記第6のステップにおいて、前記第1の要素または前記第4の要素に分類された割合のうちで実際に前記第1の要素に分類された割合の比であるPrecisionと、前記第1の要素または前記第3の要素に分類された割合のうちで実際に前記第1の要素に分類された割合の比であるRecallとを算出し、前記Precisionおよび前記Recallに基づいて2×Precision/(Precision+Recall)を算出する算出処理を前記第1の混同行列に基づいて実行して前記第1の評価指数を算出し、前記算出処理を前記複数の第2の混同行列に基づいて実行して前記複数の第2の評価指数を算出し、前記算出処理を前記第3の混同行列に基づいて実行して前記第3の評価指数を算出する、請求項13または請求項14に記載のコンピュータに実行させるためのプログラム。
The calculation means further causes the computer to execute a sixth step of calculating the evaluation index;
Each of the first to third confusion matrices includes a first element indicating a rate at which an assumed event is correctly estimated when the assumed event occurs, a second element indicating a rate at which an assumed event is correctly estimated not to have occurred when the assumed event does not actually occur, a third element indicating a rate at which an assumed event is erroneously estimated to have occurred as another event when the assumed event occurs, and a fourth element indicating a rate at which an assumed event is erroneously estimated to have occurred when the assumed event does not actually occur;
The calculation means, in the sixth step, calculates Precision, which is a ratio of the ratio of the ratio classified into the first element or the fourth element to the ratio actually classified into the first element, and Recall, which is a ratio of the ratio of the ratio classified into the first element or the third element to the ratio actually classified into the first element, and calculates 2×Precision/(Precision+Recall) based on the Precision and the Recall based on the first confusion matrix to calculate the first evaluation index, and calculates the multiple second confusion matrices to calculate the multiple second evaluation indexes, and calculates the third evaluation index based on the third confusion matrix. The program for causing a computer to execute the program according to claim 13 or 14.
算出手段が、前記評価指数を算出する第6のステップを更にコンピュータに実行させ、
前記第1から第3の混同行列の各々は、想定した事象が発生した場合に、前記想定した事象の発生を正しく推定した割合を示す第1の要素と、想定した事象が実際には発生しなかった場合に、前記想定した事象が発生しなかったことを正しく推定した割合を示す第2の要素と、想定した事象が発生した場合に、前記想定した事象の発生を別の事象に誤って推定した割合を示す第3の要素と、想定した事象が実際には発生しなかった場合に、誤って想定した事象が発生したと推定した割合を示す第4の要素とからなり、
前記算出手段は、前記第6のステップにおいて、前記第1の混同行列の前記第1の要素、前記第2の要素、前記第3の要素および前記第4の要素を用いてマシューズ相関係数からなる前記第1の評価指数を算出し、前記複数の第2の混同行列の前記第1の要素、前記第2の要素、前記第3の要素および前記第4の要素を用いてマシューズ相関係数からなる前記複数の第2の評価指数を算出し、前記第3の混同行列の前記第1の要素、前記第2の要素、前記第3の要素および前記第4の要素を用いてマシューズ相関係数からなる前記第3の評価指数を算出する、請求項13または請求項14に記載のコンピュータに実行させるためのプログラム。
The calculation means further causes the computer to execute a sixth step of calculating the evaluation index;
Each of the first to third confusion matrices includes a first element indicating a rate at which an assumed event is correctly estimated when the assumed event occurs, a second element indicating a rate at which an assumed event is correctly estimated not to have occurred when the assumed event does not actually occur, a third element indicating a rate at which an assumed event is erroneously estimated to have occurred as another event when the assumed event occurs, and a fourth element indicating a rate at which an assumed event is erroneously estimated to have occurred when the assumed event does not actually occur;
15. The program for causing a computer to execute the program according to claim 13 or 14, wherein, in the sixth step, the calculation means calculates the first evaluation index consisting of a Matthews correlation coefficient using the first element, the second element, the third element, and the fourth element of the first confusion matrix, calculates the plurality of second evaluation indexes consisting of a Matthews correlation coefficient using the first element, the second element, the third element, and the fourth element of the plurality of second confusion matrices, and calculates the third evaluation index consisting of a Matthews correlation coefficient using the first element, the second element, the third element, and the fourth element of the third confusion matrix.
前記検出手段は、前記第2のステップの前記検出処理において、前記複数組のM’個の第2のスキャン応答遅延の複数の分布と前記M個の第1のスキャン応答遅延の分布とに基づいて、前記M個の第1のスキャン応答遅延の分布に最も類似する分布を有する前記M’個の第2のスキャン応答遅延を前記複数組のM’個の第2のスキャン応答遅延から前記類似スキャン応答遅延として検出する、請求項10から請求項16のいずれか1項に記載のコンピュータに実行させるためのプログラム。 The program for causing a computer to execute the program according to any one of claims 10 to 16, wherein the detection means detects, in the detection process of the second step, the M' second scan response delays having a distribution most similar to the distribution of the M first scan response delays from the multiple sets of M' second scan response delays based on the multiple distributions of the multiple sets of M' second scan response delays and the distribution of the M first scan response delays, as the similar scan response delay. 前記検出手段は、前記第2のステップの前記検出処理において、前記M個の第1のスキャン応答遅延に基づいて最も生じやすい前記第1のスキャン応答遅延の値を示す第1のモードを算出し、前記M個の第1のスキャン応答遅延と前記第1のモードとの差の絶対値の平均値である第1の平均絶対偏差を算出する第1の算出処理と、前記第1の算出処理の後、前記M’個の第2のスキャン応答遅延に基づいて最も生じやすい前記第2のスキャン応答遅延の値を示す第2のモードを算出し、前記M’個の第2のスキャン応答遅延と前記第2のモードとの差の絶対値の平均値である第2の平均絶対偏差を算出し、前記第1の平均絶対偏差と前記第2の平均絶対偏差との差の絶対値からなる平均絶対偏差の差を算出し、1から前記平均絶対偏差の差を減算して類似性を算出する第2の算出処理を前記複数の既知の推定結果の全てについて実行して複数の類似性を取得し、その取得した複数の類似性のうち、最も高い類似性を算出する元になった前記M’個の第2のスキャン応答遅延を前記類似スキャン応答遅延として検出する、請求項17に記載のコンピュータに実行させるためのプログラム。 In the detection process of the second step, the detection means calculates a first mode indicating the value of the first scan response delay most likely to occur based on the M first scan response delays, and calculates a first mean absolute deviation, which is the average value of the absolute values of the differences between the M first scan response delays and the first mode; and after the first calculation process, calculates a second mode indicating the value of the second scan response delay most likely to occur based on the M' second scan response delays, and calculates a first mean absolute deviation, which is the average value of the absolute values of the differences between the M' second scan response delays and the second mode. 18. The program for causing a computer to execute the program according to claim 17, which calculates a second mean absolute deviation, which is the average value of the absolute values of the differences between the first mean absolute deviation and the second mean absolute deviation, calculates a difference in mean absolute deviation consisting of the absolute values of the differences between the first mean absolute deviation and the second mean absolute deviation, and subtracts the difference in mean absolute deviation from 1 to calculate the similarity, and executes a second calculation process for all of the multiple known estimation results to obtain multiple similarities, and detects the M' second scan response delays, which were used to calculate the highest similarity among the multiple similarities obtained, as the similar scan response delay. 請求項10から請求項18のいずれか1項に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。 A computer-readable recording medium having recorded thereon the program according to any one of claims 10 to 18.
JP2021052478A 2020-08-20 2021-03-25 Network scanning device, a program for causing a computer to execute the program, and a computer-readable recording medium having the program recorded thereon Active JP7634259B2 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2020139052 2020-08-20
JP2020139052 2020-08-20

Publications (2)

Publication Number Publication Date
JP2022035964A JP2022035964A (en) 2022-03-04
JP7634259B2 true JP7634259B2 (en) 2025-02-21

Family

ID=80443823

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021052478A Active JP7634259B2 (en) 2020-08-20 2021-03-25 Network scanning device, a program for causing a computer to execute the program, and a computer-readable recording medium having the program recorded thereon

Country Status (1)

Country Link
JP (1) JP7634259B2 (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019046249A1 (en) 2017-08-30 2019-03-07 Citrix Systems, Inc. Advanced network analytics

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019046249A1 (en) 2017-08-30 2019-03-07 Citrix Systems, Inc. Advanced network analytics

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
栗原 拓哉 外3名,「整数計画法によるネットワークスキャンのスケジューリング方式」,電子情報通信学会技術研究報告,一般社団法人電子情報通信学会,2019年07月03日,第119巻, 第106号,pp.183-188
矢野 一人 外4名,「IoTワイヤレス機器に対する広域ネットワークスキャン技術の研究開発」,電子情報通信学会技術研究報告,一般社団法人電子情報通信学会,2019年07月03日,第119巻, 第106号,pp.177-182

Also Published As

Publication number Publication date
JP2022035964A (en) 2022-03-04

Similar Documents

Publication Publication Date Title
CN104519031B (en) A kind of method and apparatus for hostile network behavioral value
US9923912B2 (en) Learning detector of malicious network traffic from weak labels
Coates et al. Maximum likelihood network topology identification from edge-based unicast measurements
CN104067567B (en) System and method for carrying out spam detection using character histogram
WO2018160136A1 (en) Method and apparatus for determining an identity of an unknown internet-of-things (iot) device in a communication network
US20140317736A1 (en) Method and system for detecting fake accounts in online social networks
CN113206824A (en) Dynamic network abnormal attack detection method and device, electronic equipment and storage medium
Letteri et al. Feature selection strategies for http botnet traffic detection
Gafni et al. Anomaly search over discrete composite hypotheses in hierarchical statistical models
Zhang et al. A fast and accurate guessing entropy estimation algorithm for full-key recovery
Mostardinha et al. A negative selection approach to intrusion detection
Wang et al. Towards fast detecting intrusions: using key attributes of network traffic
Richardson et al. The limits of automatic OS fingerprint generation
JP7634259B2 (en) Network scanning device, a program for causing a computer to execute the program, and a computer-readable recording medium having the program recorded thereon
Mansour et al. Biologically-inspired SDN-based intrusion detection and prevention mechanism for heterogeneous IoT networks
JP7634258B2 (en) Network scanning device, program for causing a computer to execute the program, computer-readable recording medium having the program recorded thereon, and data production method
JP7557855B2 (en) Network scanning device, a program for causing a computer to execute the program, and a computer-readable recording medium having the program recorded thereon
Kumar et al. Elevating IDS capabilities: the convergence of SVM, Deep learning, and RFECV in network security
CN114650260A (en) Network packet loss type identification method and device and electronic equipment
CN117113221B (en) 5G network abnormal flow detection method based on deep learning
Sahu et al. NITIDS: a robust network intrusion dataset
Alyahya et al. ScaNeF-IoT: Scalable network fingerprinting for IoT device
CN116723003B (en) Methods, systems, media, and equipment for anomaly detection of compressed network traffic based on dynamic evolution of immune detectors.
CN119211130A (en) Traffic identification and association method, anti-correlation analysis method and device based on multi-classification neural network model
JP7557857B2 (en) Network scanning device, a program for causing a computer to execute the program, and a computer-readable recording medium having the program recorded thereon

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240202

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20241115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20241122

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20250124

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20250203

R150 Certificate of patent or registration of utility model

Ref document number: 7634259

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150