Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP7701700B2 - NETWORK FAILURE LOCALIZATION DEVICE, NETWORK FAILURE LOCALIZATION METHOD, AND PROGRAM - Google Patents
[go: Go Back, main page]

JP7701700B2 - NETWORK FAILURE LOCALIZATION DEVICE, NETWORK FAILURE LOCALIZATION METHOD, AND PROGRAM - Google Patents

NETWORK FAILURE LOCALIZATION DEVICE, NETWORK FAILURE LOCALIZATION METHOD, AND PROGRAM Download PDF

Info

Publication number
JP7701700B2
JP7701700B2 JP2021196292A JP2021196292A JP7701700B2 JP 7701700 B2 JP7701700 B2 JP 7701700B2 JP 2021196292 A JP2021196292 A JP 2021196292A JP 2021196292 A JP2021196292 A JP 2021196292A JP 7701700 B2 JP7701700 B2 JP 7701700B2
Authority
JP
Japan
Prior art keywords
test
target network
fault location
result
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021196292A
Other languages
Japanese (ja)
Other versions
JP2023082481A (en
Inventor
光希 池内
康太郎 松田
洋 斎藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Tokyo NUC
NTT Inc
NTT Inc USA
Original Assignee
Nippon Telegraph and Telephone Corp
University of Tokyo NUC
NTT Inc USA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp, University of Tokyo NUC, NTT Inc USA filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2021196292A priority Critical patent/JP7701700B2/en
Publication of JP2023082481A publication Critical patent/JP2023082481A/en
Application granted granted Critical
Publication of JP7701700B2 publication Critical patent/JP7701700B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Description

本発明は、ネットワークにおける障害箇所を特定する技術に関連するものである。 The present invention relates to technology for identifying fault locations in a network.

近年、ネットワークの複雑化が進み、ネットワーク機器が出力するログやメトリクスなどのデータだけに依存した従来の方法だけでは検知できないような障害が発生するようになった。 In recent years, networks have become more complex, resulting in the occurrence of failures that cannot be detected using traditional methods that rely solely on data such as logs and metrics output by network devices.

このような障害を検知する手段として「ネットワークトモグラフィー」と呼ばれる手段が注目されている。ネットワークトモグラフィーは、複数の離れたノード間のend-to-endの通信状況を測定(これをパス測定と呼ぶ)し、その疎通性に関する記録を統合することで、障害箇所(障害ノードや障害リンク)を特定する手段である。 As a means of detecting such failures, a method called "network tomography" has attracted attention. Network tomography measures the end-to-end communication status between multiple distant nodes (this is called path measurement) and integrates records of this connectivity to pinpoint the location of the failure (failed node or failed link).

特に、各ネットワークコンポーネント(ノード、リンク)のバイナリ状態(障害がある/ない)を推定するものは、バイナリネットワークトモグラフィーとも呼ばれ、盛んに研究されている[非特許文献1]。 In particular, methods that estimate the binary state (fault/no fault) of each network component (node, link) are also called binary network tomography and are being actively researched [Non-Patent Document 1].

バイナリネットワークトモグラフィーの既存技術の多くは、ルーティングが確定的であることを仮定している。しかし、現実には負荷分散メカニズムや、ウェイトが等しいパスに分散してトラヒックを送るECMPなどのプロトコルが存在し、ルーティングが確率的に振る舞う状況が生ずる。確率ルーティング下におけるネットワークトモグラフィーについても、少数ではあるが既存手法[非特許文献2,3]が存在する。 Most existing techniques for binary network tomography assume that routing is deterministic. However, in reality, there are load balancing mechanisms and protocols such as ECMP that distribute traffic among paths with equal weights, which can lead to situations in which routing behaves probabilistically. There are also a small number of existing methods for network tomography under probabilistic routing [Non-Patent Documents 2, 3].

N. Duffield, "Simple network performance tomography," in Proceedings of the 3rd ACM SIGCOMM conference on Internet measurement. ACM, 2003, pp. 210-215.N. Duffield, "Simple network performance tomography," in Proceedings of the 3rd ACM SIGCOMM conference on Internet measurement. ACM, 2003, pp. 210-215. H. Herodotou, B. Ding, S. Balakrishnan, G. Outhred, and P. Fitter, "Scalable near real-time failure localization of data center networks," in Proceedings of the 20th ACM SIGKDD international conference on Knowledge discovery and data mining. ACM, 2014, pp. 1689-1698.H. Herodotou, B. Ding, S. Balakrishnan, G. Outhred, and P. Fitter, "Scalable near real-time failure localization of data center networks," in Proceedings of the 20th ACM SIGKDD international conference on Knowledge discovery and data mining. ACM, 2014, pp. 1689-1698. R. Tagyo, D. Ikegami, and R. Kawahara, "Network tomography using routing probability for undeterministic routing," IEICE Transactions on Communications, vol. E104.B, no. 7, pp. 837-848, 2021.R. Tagyo, D. Ikegami, and R. Kawahara, "Network tomography using routing probability for undeterministic routing," IEICE Transactions on Communications, vol. E104.B, no. 7, pp. 837-848, 2021. T. Soma and Y. Yoshida, "Maximizing monotone submodular functions over the integer lattice," Mathematical Programming, vol. 172, no. 1, pp. 539-563, 2018.T. Soma and Y. Yoshida, "Maximizing monotone submodular functions over the integer lattice," Mathematical Programming, vol. 172, no. 1, pp. 539-563, 2018. T. Soma, N. Kakimura, K. Inaba, and K.-i. Kawarabayashi, "Optimal budget allocation: Theoretical guarantee and efficient algorithm," in Proceedings of International Conference on Machine Learning (ICML). PMLR, 2014, pp. 351-359.T. Soma, N. Kakimura, K. Inaba, and K.-i. Kawarabayashi, "Optimal budget allocation: Theoretical guarantee and efficient algorithm," in Proceedings of International Conference on Machine Learning (ICML). PMLR, 2014, pp. 351-359. S. Knight, H. X. Nguyen, N. Falkner, R. Bowden, and M. Roughan, "The internet topology zoo," IEEE Journal on Selected Areas in Communications, vol. 29, no. 9, pp. 1765-1775, 2011.S. Knight, H.

確率ルーティングでは、ノードペアが決まっても、それを結ぶパスが一意に定まらないため、正しく障害箇所を特定するには大量のパス測定が必要となる。一般に大量のパス測定は、障害箇所特定までが長期化したり、ネットワークに大きな負荷がかかったりするため、できる限り避けるべきである。 In probabilistic routing, even if node pairs are determined, the path connecting them is not uniquely determined, so a large number of path measurements are required to correctly identify the location of a fault. In general, large-scale path measurements should be avoided as much as possible, as they can take a long time to identify the location of a fault and place a heavy load on the network.

しかしながら、確率ルーティング下における既存のネットワークトモグラフィー手法[非特許文献2、3]では、既に大量のパス測定データが得られていることを仮定しており、不必要に多くのパス測定が実施されてしまう可能性がある。 However, existing network tomography methods under probabilistic routing [Non-Patent Documents 2, 3] assume that a large amount of path measurement data has already been obtained, and there is a possibility that an unnecessarily large number of path measurements will be performed.

本発明は上記の点に鑑みてなされたものであり、確率ルーティング下において限られた回数のパス測定でできるだけ正確に障害箇所を特定するための障害箇所特定技術を提供することを目的とする。 The present invention has been made in consideration of the above points, and aims to provide a fault location identification technology that identifies the fault location as accurately as possible with a limited number of path measurements under probabilistic routing.

開示の技術によれば、対象ネットワークの障害箇所を特定するためのネットワーク障害箇所特定装置であって、
前記対象ネットワークに対して実行すべきパス測定のテストを算出するテスト最適化部と、
前記テスト最適化部により算出された前記テストを前記対象ネットワークに対して実行するテスト実行部と、
前記テスト実行部による前記テストの結果に応じて前記対象ネットワークの状態を絞り込むテスト結果分析部と、を備え、
前記テスト最適化部が、前記テスト結果分析部により得られた分析結果を用いて更にテストを算出し、前記テスト実行部が前記更に算出されたテストを実行し、前記テスト結果分析部が、前記更に算出されたテストの結果に応じて前記対象ネットワークの前記状態を絞り込む処理を、1回以上繰り返すネットワーク障害箇所特定装置であり、
前記テスト最適化部は、前記テストの実行結果を表す確率変数と前記対象ネットワークの前記状態を表す確率変数の間の相互情報量の最大化問題の最適解あるいは近似最適解である更なるテストを算出する
ネットワーク障害箇所特定装置が提供される。

According to the disclosed technology, there is provided a network fault location identification device for identifying a fault location in a target network, comprising:
a test optimization unit for calculating path measurement tests to be performed on the target network;
a test execution unit that executes the test calculated by the test optimization unit on the target network;
a test result analysis unit that narrows down the state of the target network according to the result of the test by the test execution unit,
a network fault location identification device, the network fault location identification device repeating, one or more times, a process in which the test optimization unit calculates a further test using an analysis result obtained by the test result analysis unit, the test execution unit executes the further calculated test, and the test result analysis unit narrows down the state of the target network according to the result of the further calculated test;
A network fault location identification device is provided, in which the test optimization unit calculates a further test which is an optimal or near-optimal solution to a problem of maximizing mutual information between a random variable representing the result of executing the test and a random variable representing the state of the target network.

開示の技術によれば、確率ルーティング下において限られた回数のパス測定でできるだけ正確に障害箇所を特定することが可能となる。 The disclosed technology makes it possible to pinpoint the location of a fault as accurately as possible using a limited number of path measurements under probabilistic routing.

本発明の実施の形態におけるシステム構成図である。1 is a system configuration diagram according to an embodiment of the present invention. Algorithm1を示す図である。FIG. 1 is a diagram showing Algorithm 1. Procedure2を示す図である。FIG. 2 is a diagram showing Procedure 2. Procedure3を示す図である。FIG. 3 is a diagram showing Procedure 3. ネットワーク障害箇所特定装置100の構成例を示す図である。FIG. 1 illustrates an example of the configuration of a network failure point identification device 100. ネットワーク障害箇所特定装置100の処理手順を示すフローチャートである。4 is a flowchart showing a processing procedure of the network failure point locating device 100. 評価に用いたトポロジーを示す図である。FIG. 1 is a diagram showing the topology used in the evaluation. Missouriの評価結果を示す図である。FIG. 1 is a diagram showing evaluation results of Missouri. IONの評価結果を示す図である。FIG. 1 shows the evaluation results of ION. Ntelosの評価結果を示す図である。FIG. 13 is a diagram showing the evaluation results of Ntelos. 装置のハードウェア構成例を示す図である。FIG. 2 illustrates an example of a hardware configuration of the apparatus.

以下、図面を参照して本発明の実施の形態(本実施の形態)を説明する。以下で説明する実施の形態は一例に過ぎず、本発明が適用される実施の形態は、以下の実施の形態に限られるわけではない。 The following describes an embodiment of the present invention (the present embodiment) with reference to the drawings. The embodiment described below is merely an example, and the embodiment to which the present invention is applicable is not limited to the following embodiment.

(システム全体構成、動作概要)
図1に、本実施の形態におけるシステムの全体構成例を示す。図1に示すように、本システムは、ネットワーク障害箇所特定装置100が、ネットワーク障害箇所を特定する対象となるネットワークである対象ネットワーク200に接続された構成を備える。ネットワーク障害箇所特定装置100は、対象ネットワーク200のルーティングのトポロジー情報や動的に変化しうるルーティング情報や、パス測定装置の制約情報などに基づいて、上記パス測定装置がパス測定に関するテストを実施しその結果を得る工程を1回以上繰り返すことで障害箇所を特定する。
(Overall system configuration and operation overview)
An example of the overall configuration of a system according to this embodiment is shown in Fig. 1. As shown in Fig. 1, this system has a configuration in which a network fault location identification device 100 is connected to a target network 200, which is a network for which a network fault location is to be identified. The network fault location identification device 100 identifies the fault location by repeating one or more times a process in which the path measurement device performs a test related to path measurement and obtains the results, based on routing topology information of the target network 200, routing information that may change dynamically, and constraint information of the path measurement device.

対象ネットワーク200は、複数のノードと複数のリンクを有し、確率ルーティングによりデータ送受信がなされている。なお、リンクを枝あるいはエッジと呼んでもよい。 The target network 200 has multiple nodes and multiple links, and data is sent and received using probabilistic routing. The links may also be called branches or edges.

本実施の形態では、ネットワーク障害箇所特定装置100が、確率ルーティング下において限られた回数のパス測定でできるだけ正確に障害箇所を特定する。そのためのネットワーク障害箇所特定装置100の動作概要は下記のとおりである。 In this embodiment, the network fault location identification device 100 identifies the fault location as accurately as possible with a limited number of path measurements under probabilistic routing. The outline of the operation of the network fault location identification device 100 for this purpose is as follows.

本実施の形態では、ネットワーク障害箇所特定装置100が、障害箇所を絞り込むにあたってパス測定の有効性を「相互情報量」を用いて表現する。相互情報量は確率ルーティングであっても自然に定義できる。相互情報量が大きい、すなわち障害箇所が最も絞り込めると見込めるパス測定を優先的に実施し、測定データを得る。 In this embodiment, the network fault location identification device 100 expresses the effectiveness of path measurements in narrowing down the fault location using "mutual information." Mutual information can be naturally defined even in probabilistic routing. Path measurements with large mutual information, i.e., path measurements that are expected to most effectively narrow down the fault location, are performed preferentially to obtain measurement data.

ネットワーク障害箇所特定装置100は、この測定データに従い、障害箇所の可能性を表した確率分布をベイズ推定の枠組みで更新する。これらの手順を繰り返すことにより、段階的に障害箇所を絞り込んでいく。 The network fault location identification device 100 updates the probability distribution representing the possible fault locations in the Bayesian estimation framework according to this measurement data. By repeating these steps, the fault locations are gradually narrowed down.

本実施の形態では、ネットワーク障害箇所特定装置100は、有効性の高いパス測定を利用すること、ベイズ推定に従い実施すべき測定を逐次的に決定することで、少数の測定で効率的に障害箇所を絞り込み、上記の課題を解決している。 In this embodiment, the network fault location identification device 100 uses highly effective path measurements and sequentially determines the measurements to be performed according to Bayesian estimation, thereby efficiently narrowing down the fault location with a small number of measurements and resolving the above-mentioned problem.

以下、ネットワーク障害箇所特定装置100が実行する処理内容を詳細に説明する。 The processing performed by the network fault location identification device 100 is explained in detail below.

(問題設定)
まず、本実施の形態における問題の定式化について説明する。ただし、本実施の形態に係る技術は厳格に以下の定義に従わない状況でも適用可能なものである。例えば、以下ではリンク故障の特定に関する定式化を行っているが、ノード故障の特定に関しても同様に本実施の形態に係る技術を適用できる。
(Problem setting)
First, the formulation of the problem in this embodiment will be described. However, the technology according to this embodiment can be applied even in situations that do not strictly follow the following definition. For example, although the following formulation is performed regarding the identification of a link failure, the technology according to this embodiment can be similarly applied to the identification of a node failure.

対象とするネットワークを無向グラフG(V,E)とする。V={vは頂点集合、E={eは枝集合である。「ネットワーク状態」あるいは単に「状態」をバイナリベクトルs=(s,・・・,s|E|)∈S⊂{0,1}|E|で表す。ここでs=1(s=0)は枝eが異常(正常)であることを表し、Sはあり得る全状態の集合を表す。 The target network is an undirected graph G(V,E). V={v i } where i is a set of vertices, and E={e j } where j is a set of edges. A "network state" or simply a "state" is represented by a binary vector s=(s 1 ,...,s |E| )∈S⊂{0,1} |E| , where s j =1 (s j =0) indicates that edge e j is abnormal (normal), and S represents the set of all possible states.

監視パス集合A={a1,・・・,a|A|}は、バイナリベクトルa=(aj1,・・・,aj|E|)∈{0,1}|E|で表される「監視パス」の集合である。ajl=1であれば、監視パスaが枝eを含むことを表す。監視パスは単に枝の集合と見なせるため、ループありのパスも許容する。 The monitoring path set A = {a1, ..., a|A|} is a set of "monitoring paths" represented by a binary vector aj = ( aj1 , ..., aj|E| ) ∈ {0, 1} |E| . If ajl = 1, it means that the monitoring path aj includes an edge e1 . Since the monitoring path can be regarded as simply a set of edges, paths with loops are also allowed.

監視パスaのテストが実行されたとき、a内の枝が一本でも異常であれば結果1を、全ての枝が正常であれば結果0を得る。すなわち結果1とはその監視パスが不通であったことを表し、結果0とはその監視パスが疎通できたことを表す。本実施の形態では、確率ルーティングを想定しているため、aを直接指定することはできず、ソース頂点(Sノード)とデスティネーション頂点(Dノード)を同じくする複数の監視パスの「グループ」を指定できるだけである。 When a test of a monitoring path aj is executed, if even one edge in aj is abnormal, a result of 1 is obtained, and if all edges are normal, a result of 0 is obtained. In other words, a result of 1 indicates that the monitoring path is not connected, and a result of 0 indicates that the monitoring path is connected. In this embodiment, since probabilistic routing is assumed, aj cannot be specified directly, and only a "group" of multiple monitoring paths that have the same source vertex (S node) and destination vertex (D node) can be specified.

グループc∈Cが指定されると、監視パスaのテストが独立に確率pij(i=1,・・・,|C|,j=1,・・・,|A|)で実行されるとする。ここで For a group c i ∈ C, it is assumed that the tests of the monitoring path a j are independently executed with probability p ij (i=1, ..., |C|, j=1, ..., |A|).

Figure 0007701700000001
が成り立つ。事前にルーティングの統計を解析しておくことにより、(piji,jは既知と見なせる。状態sの下でcが実行されると、確率
Figure 0007701700000001
holds. By analyzing the routing statistics in advance, (p ij ) i,j can be considered as known. When c i is executed under state s, the probability

Figure 0007701700000002
で結果1を得る。ここで
Figure 0007701700000002
to get result 1. Here,

Figure 0007701700000003
は引数が真であれば1を、偽であれば0を返す指示関数である。u(s)を行列表示したものをU=(u(s))i,sと表す。実際のネットワーク運用では、パス測定装置が同時に複数の方向にプローブパケットを送信したり、統計値を得るために同じ方向に対して複数パケットを一度に送ったりできるように、監視システムが設計されていることもある。
Figure 0007701700000003
is an indicator function that returns 1 if the argument is true and 0 if it is false. The matrix representation of u i (s) is expressed as U = (u i (s)) i,s . In actual network operation, a monitoring system may be designed so that a path measurement device can simultaneously send probe packets in multiple directions, or send multiple packets in the same direction at once to obtain statistics.

このような状況を考慮して、「プローブテスト」あるいは単に「テスト」ξ∈X={ξ,・・・,ξ|X|}を定める。本実施の形態において、 Taking such a situation into consideration, a "probe test" or simply a "test" ξ i ∈X={ξ 1 , ..., ξ |X| } is defined.

Figure 0007701700000004
を実行すると、cがξij回実行される(j=1,・・・,|C|)。ここでZは非負整数全体の集合を表す。すなわち、ξは異なるノードペア間の同時測定や、複数回測定を一つのテストとしてパッケージ化したものである。一度のテストに同数の測定が含まれるように、|ξ|=Σξijをiによらない定数とするのが自然である。
Figure 0007701700000004
When C is executed, c j is executed ξ ij times (j = 1, ..., |C|). Here, Z + represents the set of all non-negative integers. That is, ξ i is a package of simultaneous measurements between different node pairs or multiple measurements as one test. It is natural to set |ξ i | = Σ j ξ ij as a constant independent of i so that one test contains the same number of measurements.

本実施の形態における問題は以下の通りである。 The problems with this embodiment are as follows:

今、状態s∈Sが未知とする。またsの事前分布と実施可能なテストξの回数Nが与えられたとする。このとき、N回のテストの実施でできるだけ高確度で真の状態を特定するためには、どのような戦略でテストを実施する(各テストをどのタイミングでどのくらいの回数実施する)のが効率的だろうか。またテストの実施結果に応じて、どのように真の状態を推定すればよいだろうか。なお、以下の説明では状態sは動的に変化しないとしているが、途中で変化する場合であっても本実施の形態に係る技術は適用可能である。 Now, assume that the state s∈S is unknown. Also assume that the prior distribution of s and the number N of tests ξ that can be performed are given. In this case, what is the most efficient strategy for performing the tests (when and how many times each test should be performed) in order to identify the true state as accurately as possible by performing N tests? Also, how should the true state be estimated based on the results of the tests? Note that in the following explanation, it is assumed that the state s does not change dynamically, but the technology related to this embodiment can be applied even if it changes during the process.

(ネットワーク障害箇所特定装置100による処理内容の詳細)
本実施の形態では「アダプティブ測定」のアプローチをとる。これは、ネットワーク障害箇所特定装置100が、現状で得られているテストの結果に応じて次に実施するテストを逐次的に決定していくものである。アダプティブ測定は、一度にN回分のテストを全て決めてしまう非アダプティブなアプローチに比べて、実装が複雑になるが、最適なテストの決定に際して使える情報が段階的に増えていくため、結果として少数のテスト回数で高精度な状態特定が可能となることが見込める。
(Details of Processing by Network Fault Location Identification Device 100)
In this embodiment, an "adaptive measurement" approach is adopted. In this approach, the network fault location identification device 100 sequentially determines the next test to be performed depending on the currently obtained test results. Adaptive measurement is more complicated to implement than a non-adaptive approach in which all N tests are determined at once, but since the information available for determining the optimal test increases step by step, it is expected that a small number of tests will result in highly accurate state identification.

具体的には以下のようなバッチ処理として定式化する。 Specifically, this is formulated as a batch process as follows:

N回のテストをサイズNのB個のバッチに分ける。すなわちN×B=Nが成り立つ。b回目のバッチ((b∈[1,B]∩Z))では、テスト設計 Divide the N tests into B batches of size N B , i.e., N B ×B=N. In the bth batch ((b∈[1,B]∩Z + )), the test design

Figure 0007701700000005
を決定する。これはテストξ(i=1,・・・,|X|)を実施する回数を表したものであり、|M|=Nである。Mを決定した後、それを実行して、結果
Figure 0007701700000005
This represents the number of times to execute the test ξ i (i=1, . . . , |X|), where |M b |=N B. After determining M b , execute it and obtain the result

Figure 0007701700000006
を得る。ここで
Figure 0007701700000006
where

Figure 0007701700000007
は、グループc
Figure 0007701700000007
is the number of groups c i

Figure 0007701700000008
回の実行の中で、結果1を得た回数を表している。b<B(つまり最終バッチ以外)のときは、yM_bとそれ以前のバッチの結果に基づき、次のテスト設計Mb+1を決定していくこととなる。以上より、考えるべき問題は、各バッチにおいて状態を効率的に絞り込む上で、どのようにMを設計するかである。なおバッチサイズとバッチ回数(N,B)に関しては、運用の実態(一回のテスト実行に要する時間や許容されるネットワーク負荷など)に応じて決定されるハイパーパラメータである。
Figure 0007701700000008
It represents the number of times that a result 1 was obtained in the number of executions. When b<B (i.e., other than the final batch), the next test design M b+1 is determined based on y M_b and the results of the previous batch. From the above, the problem to be considered is how to design M b in order to efficiently narrow down the states in each batch. Note that the batch size and the number of batches (N, B N ) are hyperparameters that are determined according to the actual operation (the time required to execute one test, the allowable network load, etc.).

M(Mの添え字bは適宜省略する)を設計するにあたっては、Mの「よさ」を定量的に表さなければならない。真の状態を特定するのが目的であるから、状態の確率分布をできるだけ先鋭化する、すなわちエントロピーを下げるのが自然な戦略である。 When designing M (the subscript b in Mb will be omitted as appropriate), it is necessary to quantitatively express the "goodness" of M. Since the purpose is to identify the true state, a natural strategy is to sharpen the probability distribution of the state as much as possible, i.e., to reduce the entropy.

そこで本実施の形態では、Mの実行により得られるyがもたらす有効性の指標として、YとSの間の相互情報量I(S;Y)を用いることにする(yやsを確率変数と見なす際は、Y、Sのように大文字を用いる)。I(S;Y)は、状態分布のエントロピーがYを観測することで平均的にどのくらい減少するかを表す。これにより本実施の形態で考える問題を以下のように記述することができる。 Therefore, in this embodiment, the mutual information I(S; YM ) between YM and S is used as an index of the effectiveness of yM obtained by executing M (when yM or s is regarded as a random variable, capital letters are used, such as YM and S ). I(S; YM) represents the average reduction in the entropy of the state distribution by observing YM . This allows the problem considered in this embodiment to be written as follows:

[問題]:事前分布Pr(s)と(b-1)回目のバッチまでに得られる測定結果 [Problem]: Prior distribution Pr(s) and measurement results obtained up to the (b-1)th batch

Figure 0007701700000009
が与えられたとき、
Figure 0007701700000009
Given

Figure 0007701700000010
を求めよ。
Figure 0007701700000010
Seek.

ここでI(S;Y|Db-1)はDb-1が与えられたときのYとSの間の相互情報量であり、下記の数式1のように与えられる。 Here, I(S; Y M |D b-1 ) is the mutual information between Y M and S when D b-1 is given, and is given by the following Equation 1.

Figure 0007701700000011
また数式1右辺の各量は、下記の数式2、3で与えられる。
Figure 0007701700000011
The quantities on the right side of Equation 1 are given by Equations 2 and 3 below.

Figure 0007701700000012
Figure 0007701700000012

Figure 0007701700000013
上記の問題は、組合せ最適化問題であり、NP困難であることが示せる。従って、ネットワーク障害箇所特定装置100は、一例として以下に示す貪欲法に基づくアルゴリズムによって近似解を求める。
Figure 0007701700000013
The above problem is a combinatorial optimization problem, and can be shown to be NP-hard. Therefore, the network fault location identification device 100 obtains an approximate solution by, for example, an algorithm based on the greedy method shown below.

ただし、本実施の形態に係る技術は、貪欲法に閉じるものではなく、他の近似最適化手法や最適化手法を用いることも可能である。またここではルーティング確率が動的に変化しない場合を述べているが、それが変化する場合であってもその情報が取得できるのならば、本実施の形態に係る技術を適用可能である。 However, the technology according to this embodiment is not limited to the greedy method, and other approximate optimization methods or optimization methods can also be used. Also, although the case where the routing probability does not change dynamically is described here, the technology according to this embodiment can be applied even if it changes, as long as the information can be obtained.

ネットワーク障害箇所特定装置100により実行される処理の手順(アルゴリズム)を図2のAlgorithm1に示す。まず2行目であり得る状態を削減するStateSpaceReductionの処理があるが、これに関しては後述する。 The procedure (algorithm) of the process executed by the network fault location identification device 100 is shown in Algorithm 1 in Figure 2. First, in the second line, there is a StateSpaceReduction process that reduces the number of possible states, which will be described later.

5行目から始まるバッチ処理では、6~10行目でMを貪欲法に基づき作成する。whileループ内ではI(S;Y|Db-1)の増分が最も大きいようなξi_maxを逐次的に選択し、Mの第imax成分をインクリメントしている。Mを作成した後、それを実行して、yを取得し、11~13行目で事後分布Pr(s|D)の更新を行う。 In the batch processing starting from line 5, M is created based on the greedy algorithm in lines 6 to 10. In the while loop, ξ i_max that gives the largest increment in I(S; Y M |D b-1 ) is selected sequentially, and the i max component of M is incremented. After M is created, it is executed to obtain y M , and the posterior distribution Pr(s|D b ) is updated in lines 11 to 13.

続いて8行目の相互情報量の計算方法について説明する。相互情報量は図3に示したProcedure2に基づく。基本的には数式1のI(S;Y|Db-1)の数式に基づくが、数式3内のyに関する和は指数個の項の和となるため、厳密な実行が難しい。そこで以下のようにモンテカルロサンプリングを行う。 Next, the method of calculating the mutual information on line 8 will be described. The mutual information is based on Procedure 2 shown in Fig. 3. Basically, it is based on the formula I(S; Y M |D b-1 ) in Equation 1, but since the sum related to y M in Equation 3 is the sum of an exponential number of terms, it is difficult to execute strictly. Therefore, Monte Carlo sampling is performed as follows.

まず、yのN個のサンプリングを二項分布に従い4行目で取得する。各サンプルに対して、6~7行目で、後述の方法で事後分布を計算し、そのエントロピーを計算する。そして8行目でそれらの平均をとる。Procedure2では、すべての可能な状態sが列挙可能であることを仮定しているが、|S|が大きい場合には、sに関する和もサンプル平均に置き換えてもよい。 First, N y samples of y M are obtained according to the binomial distribution in line 4. For each sample, the posterior distribution is calculated using the method described below in lines 6 and 7, and its entropy is calculated. Then, the average is taken in line 8. In Procedure 2, it is assumed that all possible states s can be enumerated, but if |S| is large, the sum over s may also be replaced with the sample average.

次にAlgorithm1の13行目、Procedure2の2、6、8行目に現れる事後分布Pr(s|D)(Pr(s|Db-1)なども同様)に関する計算について説明する。Pr(s|D)は Next, we will explain the calculation of the posterior distribution Pr(s|D b ) (Pr(s|D b-1 ) and so on) that appears on line 13 of Algorithm 1 and lines 2, 6, and 8 of Procedure 2. Pr(s|D b ) is

Figure 0007701700000014
と記述することができる。ここでベイズの定理と、sが与えられた下でyM_bとDb-1が条件付き独立であることを用いた。Pr(s|Db-1)は既知であり、Pr(yM_b)|s)は下記の数式4により計算することができる。
Figure 0007701700000014
Here, we use Bayes' theorem and the fact that y M_b and D b-1 are conditionally independent under the condition s. Pr(s|D b-1 ) is known, and Pr(y M_b )|s) can be calculated by the following Equation 4.

Figure 0007701700000015
実装する際は、logu(s)、log(1-u(s))やコンビネーションのlogの値をメモ化して、
Figure 0007701700000015
When implementing, memoize the values of log u i (s), log(1-u i (s)), and the log of the combination,

Figure 0007701700000016
の代わりに
Figure 0007701700000016
instead of

Figure 0007701700000017
を計算するとよい。
Figure 0007701700000017
It is a good idea to calculate

さて、Algorithm1は貪欲法に基づく近似アルゴリズムであるが、以下のように相互情報量最大化の意味で定数の近似度を持っていることが示せる。すなわち、最悪ケースであっても、相互情報量が一定値以上であることが保証されている。 Now, Algorithm 1 is an approximation algorithm based on the greedy method, but it can be shown that it has a constant approximation in the sense of maximizing mutual information as follows. In other words, even in the worst case, it is guaranteed that the mutual information will be equal to or greater than a certain value.

[定理]:Nが十分大きいときAlgorithm1で得られるMとし、最適なM [Theorem]: When Ny is sufficiently large, let Mb obtained by Algorithm 1 be 〜 Mb , and let the optimal Mb be

Figure 0007701700000018
とする。このとき、
Figure 0007701700000018
In this case,

Figure 0007701700000019
が成り立つ。
Figure 0007701700000019
holds true.

(略証)
ルーティングの確率が互いに独立であることを用いると、相互情報量I(S;Y|Db-1)は
(abbreviated proof)
By using the fact that the routing probabilities are mutually independent, the mutual information I(S; Y M |D b-1 ) is

Figure 0007701700000020
の関数として単調DR劣モジュラ[非特許文献4]という性質を持つことが示せる。一般に単調DR劣モジュラ関数の最大化問題は貪欲法により(1-1/e)-近似を達成できることが知られている[非特許文献5]。(証終)
最後に、Algorithm1の2行目にあったStateSpaceReductionの処理について説明を行う。この処理は、あらかじめあり得ない状態をSから取り除いておくことで、Algorithm1の実行時間を短縮するためのものである。一般に行列Uには0や1を値に持つ成分が多く含まれている。
Figure 0007701700000020
It can be shown that it has the property of being monotone DR submodular as a function of [Non-Patent Document 4]. It is generally known that the maximization problem of a monotone DR submodular function can achieve (1-1/e)-approximation by a greedy method [Non-Patent Document 5]. (End of Proof)
Finally, we will explain the processing of StateSpaceReduction in the second line of Algorithm 1. This processing is intended to reduce the execution time of Algorithm 1 by removing impossible states from S in advance. In general, a matrix U contains many components with values of 0 and 1.

実際、一つのグループcは、ネットワーク全体のうちごく一部の枝しか含まないのが通常であるので0の成分が多く、また同一グループ内の監視パスは一部で共通の枝を経由していることも多いから1の成分が多くなる。加えて、次のような自明な命題も成り立つ:「u(s)=1(0)とする。このとき、もしグループcが実行されて結果が1(0)であったならば、真の状態はsではない」。以上を踏まえて、次の定義を導入する。 In fact, a group c usually contains only a small portion of the edges of the entire network, so there are many 0s, and monitoring paths within the same group often pass through some common edges, so there are many 1s. In addition, the following trivial proposition also holds: "Let u i (s) = 1 (0). In this case, if group c i is executed and the result is 1 (0), then the true state is not s." Based on the above, the following definition is introduced.

[定義](除去可能な状態):グループcを実行し結果1(0)が得られたとき、u(s)=0(1)を満たす状態sは除去可能である。 [Definition] (Removable state): When group c i is executed and the result 1 (0) is obtained, state s that satisfies u i (s)=0 (1) is removable.

明らかに除去可能な状態は状態空間Sから除外してよい。また次の補題が成り立つ。 A state that is clearly removable may be removed from the state space S. The following lemma also holds.

[補題]:テストξを実行したとき除去可能な状態の個数の期待値R(U,ξ)は下記の数式5で与えられる。 [Lemma]: The expected number of removable states when performing test ξ, R(U, ξ), is given by the following formula 5.

Figure 0007701700000021
ここでδ(x)=1(x=d)、δ(x)=0(その他)であり(d=0,1)、0=1である。特にξ=e(第l成分のみが1であるような単位ベクトル)のときは下記の数式6となる。
Figure 0007701700000021
Here, δ d (x) = 1 (x = d), δ d (x) = 0 (otherwise) (d = 0, 1), and 0 0 = 1. In particular, when ξ = e l (a unit vector in which only the l-th component is 1), the following Equation 6 is obtained.

Figure 0007701700000022
ここで、
Figure 0007701700000022
Where:

Figure 0007701700000023
である。
Figure 0007701700000023
It is.

(略証)
期待値の線形性より
(abbreviated proof)
From the linearity of expectation

Figure 0007701700000024
となる。各グループの実行がベルヌーイ試行であることを踏まえると、
Figure 0007701700000024
Considering that each group's execution is a Bernoulli trial,

Figure 0007701700000025
と記述できるので、これの余事象をとってiについて和を取ればよい。数式6はξ=eを代入して計算し、不等式は
Figure 0007701700000025
Since we can write it as follows, we can take the complementary event of this and sum it with respect to i. Equation 6 is calculated by substituting ξ=e l , and the inequality becomes

Figure 0007701700000026
から得られる。(証終)
上の補題を基に、StateSpaceReductionの処理をまとめたものが、図4のProcedure3である。各グループcに対して数式6を計算し、それを最大化するcl_maxを得る。次にcl_maxを含むようなテストξを任意に選んで実行する。実行結果に応じて除去可能な状態をSから除外し、行列Uも小さくする。以上の工程をNiter回繰り返す。
Figure 0007701700000026
It is obtained from (end of proof).
Based on the above lemma, the processing of StateSpaceReduction is summarized in Procedure 3 in Figure 4. Calculate Equation 6 for each group c l , and obtain c l _max that maximizes it. Next, arbitrarily select and execute a test ξ that includes c l _max . Depending on the execution result, remove removable states from S, and also reduce the matrix U. The above process is repeated N iter times.

なお、数式6の代わりに数式5を最大化するξを任意に選んで実行するようにしてもよい。数式5や数式6は相互情報量の計算よりも軽量なので、結果的にAlgorithm1の総計算時間が小さくなる。 In addition, instead of formula 6, ξ that maximizes formula 5 may be arbitrarily selected and executed. Formulas 5 and 6 are lighter than the calculation of mutual information, so the total calculation time of Algorithm 1 is reduced as a result.

(実施例)
上記の処理の実施例として、ネットワーク障害箇所特定装置100の構成例と、その構成を用いた処理手順例を説明する。
(Example)
As an embodiment of the above process, a configuration example of the network fault location identification device 100 and a processing procedure example using this configuration will be described.

図5に、ネットワーク障害箇所特定装置100の構成例を示す。図5に示すように、ネットワーク障害箇所特定装置100は、入力用UI110、状態数削減部120、テスト実行部130、相互情報量最大化部140、事後分布計算部150、出力用UI160を有する。状態数削減部120、テスト実行部130、事後分布計算部150は、図示のとおりに対象ネットワーク200と接続している。なお、「状態数削減部120+相互情報量最大化部140」をテスト最適化部と呼んでもよい。また、事後分布計算部150をテスト結果分析部と呼んでもよい。 Figure 5 shows an example of the configuration of the network fault location identification device 100. As shown in Figure 5, the network fault location identification device 100 has an input UI 110, a state number reduction unit 120, a test execution unit 130, a mutual information maximization unit 140, a posterior distribution calculation unit 150, and an output UI 160. The state number reduction unit 120, the test execution unit 130, and the posterior distribution calculation unit 150 are connected to the target network 200 as shown in the figure. Note that the "state number reduction unit 120 + mutual information maximization unit 140" may be called a test optimization unit. Also, the posterior distribution calculation unit 150 may be called a test result analysis unit.

上記の構成を備えるネットワーク障害箇所特定装置100の処理手順を図6のフローチャートを参照して説明する。 The processing procedure of the network fault location identification device 100 having the above configuration will be explained with reference to the flowchart in Figure 6.

S101において、まず入力用UI110にアルゴリズム実行に必要なデータやパラメータ(事前分布Pr(s)、U、N、Bなど)を入力する。S102において、これらを基に状態数削減部120がProcedure3に従いξを決定し、それをテスト実行部130に渡す。 In S101, data and parameters (prior distribution Pr(s), U, N B , B, etc.) required for executing the algorithm are first input to the input UI 110. In S102, the state number reduction unit 120 determines ξ based on this in accordance with Procedure 3 and passes it to the test execution unit 130.

S103において、テスト実行部130は、pingを始めとする疎通性確認プログラムなどを用いて、テストを対象ネットワーク200で実行する。再びS102において、状態数削減部120が、得られた結果を基に、Procedure3に従って、次のξを決定する。 In S103, the test execution unit 130 executes a test on the target network 200 using a connectivity check program such as ping. In S102 again, the state number reduction unit 120 determines the next ξ based on the obtained results in accordance with Procedure 3.

S102~S103を定められた回数実施したら、次に、S104において、相互情報量最大化部140が、Algorithm1の貪欲法に従ってMを作成する。これをテスト実行部130に渡して、S105において対象ネットワーク200でテストを実行する。 After steps S102 and S103 have been performed a set number of times, in step S104, the mutual information maximization unit 140 creates M according to the greedy method of Algorithm 1. This is passed to the test execution unit 130, which executes a test on the target network 200 in step S105.

その結果は事後分布計算部150に渡され、S106において、ベイズ推定の枠組みに従って事後分布を計算する。得られた事後分布は、相互情報量最大化部140に渡され、Algorithm1のループに従い、以上の工程(S104~S106)を繰り返す。決められた回数実施したら、最終的な事後分布から、最尤値として推定状態を出力用UI160に出力する。S107において、出力用UIが推定状態を出力する。 The result is passed to the posterior distribution calculation unit 150, and in S106, the posterior distribution is calculated according to the Bayesian estimation framework. The obtained posterior distribution is passed to the mutual information maximization unit 140, and the above steps (S104 to S106) are repeated according to the loop of Algorithm 1. After a predetermined number of executions, the estimated state is output to the output UI 160 as the maximum likelihood value from the final posterior distribution. In S107, the output UI outputs the estimated state.

(効果について)
以上説明した本実施の形態に係る技術により、確率ルーティング下において限られた回数のパス測定でできるだけ正確に障害箇所を特定することが可能となる。当該技術では、障害特定に有効なパス測定を優先的に行うため、障害特定までに要するパス測定が少数に抑えられ、障害特定の短期化、ネットワーク負荷の削減が期待できる。
(About the effects)
The technology according to the present embodiment described above makes it possible to pinpoint a fault location as accurately as possible with a limited number of path measurements under probabilistic routing. This technology prioritizes path measurements that are effective for fault identification, so the number of path measurements required to identify a fault is reduced, and it is expected to shorten the time required to identify a fault and reduce the network load.

図7の3つのネットワークデータ[非特許文献6]を用いて評価を行った。図7における#failuresは同時に故障する枝数を表し、|S|はあり得る状態の総数である。各ネットワークに対し以下のような設定を考える。 The evaluation was performed using the three network data [Non-Patent Document 6] in Fig. 7. In Fig. 7, #failures represents the number of simultaneously failed edges, and |S k | is the total number of possible states. The following settings are considered for each network.

グループ数は|C|=3|V|で、各ノードに対して、それをSノードとしたとき、ランダムに選んだ3つのノードをDノードとして、ノードペア(グループ)を決めた。各ノードペアに対して、最短パス、二番目に短いパス、三番目に短いパスを監視パスとみなした(|A|=9|V|)。各グループに対してi番目に短いパスは確率 The number of groups is |C| = 3|V|, and for each node, when it is the S node, three randomly selected nodes are the D nodes, and node pairs (groups) are determined. For each node pair, the shortest path, the second shortest path, and the third shortest path are considered as monitoring paths (|A| = 9|V|). The i-th shortest path for each group has the probability

Figure 0007701700000027
で選択されるようにした(lはパスの長さ)。Sノードを同じくする3つのグループを一度ずつ実行するものを一つのプローブテストξとみなし、全部で|X|=|V|パターンのテストを考えた。初期状態分布Pr(s)は一様とし、N=30とした。また、Procedure3による状態削減はNiter=10として実施した。
Figure 0007701700000027
(l i is the path length). Three groups with the same S node are executed once each, which is regarded as one probe test ξ, and a total of |X| = |V| patterns were considered for testing. The initial state distribution Pr(s) was uniform, and N y = 30. In addition, state reduction by Procedure 3 was performed with N iter = 10.

本実施の形態に係る技術(PMと記す)の他に、比較として、Random、LS[非特許文献2]、LASSO[非特許文献3]を実施した。Randomは本実施の形態の手法において、相互情報量を用いずに、ランダムにξを選択したものである。 In addition to the technique according to the present embodiment (denoted as PM), we also carried out Random, LS [Non-Patent Document 2], and LASSO [Non-Patent Document 3] for comparison. Random is the technique according to the present embodiment in which ξ is selected randomly without using mutual information.

LSとLASSOは確率ルーティングにおけるネットワークトモグラフィーとして提案された非アダプティブなアプローチによる既存手法である。LASSOに関してはハイパーパラメータλを0.0001、0.001、0.01と変えた場合に実施した。 LS and LASSO are existing methods that use non-adaptive approaches proposed as network tomography in probabilistic routing. For LASSO, we performed the experiment by changing the hyperparameter λ to 0.0001, 0.001, and 0.01.

評価指標としては正答率を用いた。故障枝が2本ある状態に対しては、2つとも特定して初めて正解とした。Missouriについては真の状態全パターンに対して、IONとNtelosについては、真の状態50パターン(ランダムに選択)に対して、実験を行い、正答率を算出した。 The accuracy rate was used as the evaluation index. For a state with two faulty branches, the answer was considered correct only when both were identified. For Missouri, experiments were performed for all true state patterns, and for ION and Ntelos, experiments were performed for 50 true state patterns (selected at random), and the accuracy rate was calculated.

実験の結果を図8~図10に示す。各図において横軸が総テスト数N、縦軸が正答率である。本実施の形態に係る方法PMが既存手法LS、LASSOよりも高い性能を示していることがわかる。例えば正答率0.96を超すのに、最善の既存手法では160(Missouri)、320(ION)、640(Ntelos)のテスト数を要しているのに対し、PMではそれぞれ22、34、34のテスト数で十分である。また、PMはRandomの結果も上回っており、相互情報量を用いることの有用性がわかる。 The experimental results are shown in Figures 8 to 10. In each figure, the horizontal axis is the total number of tests N, and the vertical axis is the accuracy rate. It can be seen that the method PM according to this embodiment shows higher performance than the existing methods LS and LASSO. For example, to exceed a accuracy rate of 0.96, the best existing methods require 160 (Missouri), 320 (ION), and 640 (Ntelos) tests, whereas PM requires only 22, 34, and 34 tests, respectively. PM also exceeds the results of Random, demonstrating the usefulness of using mutual information.

(ハードウェア構成例)
ネットワーク障害箇所特定装置100は、例えば、コンピュータにプログラムを実行させることにより実現できる。このコンピュータは、物理的なコンピュータであってもよいし、クラウド上の仮想マシンであってもよい。
(Hardware configuration example)
The network failure point identification device 100 can be realized, for example, by causing a computer to execute a program. This computer may be a physical computer or a virtual machine on the cloud.

すなわち、ネットワーク障害箇所特定装置100は、コンピュータに内蔵されるCPUやメモリ等のハードウェア資源を用いて、ネットワーク障害箇所特定装置100で実施される処理に対応するプログラムを実行することによって実現することが可能である。上記プログラムは、コンピュータが読み取り可能な記録媒体(可搬メモリ等)に記録して、保存したり、配布したりすることが可能である。また、上記プログラムをインターネットや電子メール等、ネットワークを通して提供することも可能である。 That is, the network fault location identification device 100 can be realized by executing a program corresponding to the processing performed by the network fault location identification device 100 using hardware resources such as a CPU and memory built into a computer. The above program can be recorded on a computer-readable recording medium (such as a portable memory) and stored or distributed. The above program can also be provided via a network such as the Internet or email.

図11は、上記コンピュータのハードウェア構成例を示す図である。図11のコンピュータは、それぞれバスBSで相互に接続されているドライブ装置1000、補助記憶装置1002、メモリ装置1003、CPU1004、インタフェース装置1005、表示装置1006、入力装置1007、出力装置1008等を有する。 Figure 11 is a diagram showing an example of the hardware configuration of the computer. The computer in Figure 11 has a drive device 1000, an auxiliary storage device 1002, a memory device 1003, a CPU 1004, an interface device 1005, a display device 1006, an input device 1007, an output device 1008, etc., all of which are interconnected by a bus BS.

当該コンピュータでの処理を実現するプログラムは、例えば、CD-ROM又はメモリカード等の記録媒体1001によって提供される。プログラムを記憶した記録媒体1001がドライブ装置1000にセットされると、プログラムが記録媒体1001からドライブ装置1000を介して補助記憶装置1002にインストールされる。但し、プログラムのインストールは必ずしも記録媒体1001より行う必要はなく、ネットワークを介して他のコンピュータよりダウンロードするようにしてもよい。補助記憶装置1002は、インストールされたプログラムを格納すると共に、必要なファイルやデータ等を格納する。 The program that realizes the processing on the computer is provided by a recording medium 1001, such as a CD-ROM or a memory card. When the recording medium 1001 storing the program is set in the drive device 1000, the program is installed from the recording medium 1001 via the drive device 1000 into the auxiliary storage device 1002. However, the program does not necessarily have to be installed from the recording medium 1001, but may be downloaded from another computer via a network. The auxiliary storage device 1002 stores the installed program as well as necessary files, data, etc.

メモリ装置1003は、プログラムの起動指示があった場合に、補助記憶装置1002からプログラムを読み出して格納する。CPU1004は、メモリ装置1003に格納されたプログラムに従って、ライトタッチ維持装置100に係る機能を実現する。インタフェース装置1005は、ネットワーク等に接続するためのインタフェースとして用いられる。表示装置1006はプログラムによるGUI(Graphical User Interface)等を表示する。入力装置1007はキーボード及びマウス、ボタン、又はタッチパネル等で構成され、様々な操作指示を入力させるために用いられる。出力装置1008は演算結果を出力する。 When an instruction to start a program is received, the memory device 1003 reads out and stores the program from the auxiliary storage device 1002. The CPU 1004 realizes functions related to the light touch maintenance device 100 in accordance with the program stored in the memory device 1003. The interface device 1005 is used as an interface for connecting to a network, etc. The display device 1006 displays a GUI (Graphical User Interface) or the like according to a program. The input device 1007 is composed of a keyboard and mouse, buttons, a touch panel, etc., and is used to input various operational instructions. The output device 1008 outputs the results of calculations.

(付記)
本明細書には、少なくとも下記各項のネットワーク障害箇所特定装置、ネットワーク障害箇所特定方法、及びプログラムが開示されている。
(第1項)
対象ネットワークの障害箇所を特定するためのネットワーク障害箇所特定装置であって、
前記対象ネットワークに対して実行すべき最適なパス測定のテストを算出するテスト最適化部と、
前記テスト最適化部により算出されたテストを前記対象ネットワークに対して実行するテスト実行部と、
前記テスト実行部によるテストの結果に応じてネットワークの状態を絞り込むテスト結果分析部と、を備え、
前記テスト最適化部が、前記テスト結果分析部により得られた分析結果を用いてテストを算出し、前記テスト実行部がテストを実行し、前記テスト結果分析部が、テストの結果に応じてネットワークの状態を絞り込む処理を、1回以上繰り返す
ネットワーク障害箇所特定装置。
(第2項)
前記対象ネットワークにおけるルーティング情報は、発着ノードに対してそれらを結ぶパスが一意に定まらず、確率的に決定され、テストにおいてどのパスが選択されたかは観測できず、その確率分布のみ利用可能である
第1項に記載のネットワーク障害箇所特定装置。
(第3項)
前記テスト最適化部は、テストの実行結果を表す確率変数と前記対象ネットワークの状態を表す確率変数の間の相互情報量の最大化問題の最適解あるいは近似最適解であるテストを選出する
第1項又は第2項に記載のネットワーク障害箇所特定装置。
(第4項)
前記テスト最適化部は、テストの実行結果に基づいて、候補として除外できるネットワーク状態の個数の期待値が大きくなるようなテストを選出する
第1項ないし第3項のうちいずれか1項に記載のネットワーク障害箇所特定装置。
(第5項)
前記テスト結果分析部は、ネットワーク状態を表す確率分布を、テストの実行結果に基づいて、ベイズ推定の枠組みに従って更新する
第1項ないし第3項のうちいずれか1項に記載のネットワーク障害箇所特定装置。
(第6項)
対象ネットワークの障害箇所を特定するためのネットワーク障害箇所特定装置が実行するネットワーク障害箇所特定方法であって、
前記対象ネットワークに対して実行すべき最適なパス測定のテストを算出するテスト最適化ステップと、
前記テスト最適化ステップにより算出されたテストを前記対象ネットワークに対して実行するテスト実行ステップと、
前記テスト実行ステップによるテストの結果に応じてネットワークの状態を絞り込むテスト結果分析ステップと、を備え、
前記テスト結果分析ステップにより得られた分析結果を用いて前記テスト最適化ステップによりテストを算出し、前記テスト実行ステップによりテストを実行し、前記テスト結果分析ステップによりテストの結果に応じてネットワークの状態を絞り込む処理を、1回以上繰り返す
ネットワーク障害箇所特定方法。
(第7項)
コンピュータを、第1項ないし第5項のうちいずれか1項に記載のネットワーク障害箇所特定装置における各部として機能させるためのプログラム。
(Additional Note)
This specification discloses at least the network fault location locating device, the network fault location locating method, and the program described in the following sections.
(Section 1)
A network fault location identification device for identifying a fault location in a target network, comprising:
a test optimizer for computing optimal path measurement tests to perform on the target network;
a test execution unit that executes the test calculated by the test optimization unit on the target network;
a test result analysis unit that narrows down the network state according to the result of the test performed by the test execution unit;
The test optimization unit calculates a test using the analysis result obtained by the test result analysis unit, the test execution unit executes the test, and the test result analysis unit repeats the process of narrowing down the network state according to the test result, one or more times.
(Section 2)
A network fault location identification device as described in claim 1, in which the routing information in the target network does not uniquely determine the path connecting the source and destination nodes, but is determined probabilistically, and it is not possible to observe which path was selected in the test, and only the probability distribution is available.
(Section 3)
The network fault location identification device described in claim 1 or 2, wherein the test optimization unit selects a test that is an optimal solution or a near-optimal solution to a problem of maximizing mutual information between a random variable representing a test execution result and a random variable representing a state of the target network.
(Section 4)
4. The network fault location identification device according to claim 1, wherein the test optimization unit selects a test that increases an expected value of a number of network states that can be excluded as candidates based on a result of the test execution.
(Section 5)
4. The network fault location identification device according to claim 1, wherein the test result analysis unit updates a probability distribution representing a network state based on a result of execution of the test in accordance with a framework of Bayesian estimation.
(Section 6)
A network fault location identification method executed by a network fault location identification device for identifying a fault location in a target network, comprising:
a test optimization step for computing optimal path measurement tests to be performed on the target network;
a test execution step of executing the test calculated by the test optimization step on the target network;
a test result analysis step of narrowing down the network state according to the result of the test performed by the test execution step;
A network fault location identification method, comprising: calculating a test in the test optimization step using the analysis results obtained in the test result analysis step; executing the test in the test execution step; and narrowing down the network state according to the test results in the test result analysis step, the above steps being repeated one or more times.
(Section 7)
A program for causing a computer to function as each unit in the network fault location locating device according to any one of claims 1 to 5.

以上、本実施の形態について説明したが、本発明はかかる特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。 Although the present embodiment has been described above, the present invention is not limited to this specific embodiment, and various modifications and variations are possible within the scope of the gist of the present invention described in the claims.

100 ネットワーク障害箇所特定装置
110 入力用UI
120 状態数削減部
130 テスト実行部
140 相互情報量最大化部
150 事後分布計算部
160 出力用UI
1000 ドライブ装置
1001 記録媒体
1002 補助記憶装置
1003 メモリ装置
1004 CPU
1005 インタフェース装置
1006 表示装置
1007 入力装置
1008 出力装置
100 Network fault location identification device 110 Input UI
120 State number reduction unit 130 Test execution unit 140 Mutual information maximization unit 150 Posterior distribution calculation unit 160 Output UI
1000 Drive device 1001 Recording medium 1002 Auxiliary storage device 1003 Memory device 1004 CPU
1005 Interface device 1006 Display device 1007 Input device 1008 Output device

Claims (7)

対象ネットワークの障害箇所を特定するためのネットワーク障害箇所特定装置であって、
前記対象ネットワークに対して実行すべきパス測定のテストを算出するテスト最適化部と、
前記テスト最適化部により算出された前記テストを前記対象ネットワークに対して実行するテスト実行部と、
前記テスト実行部による前記テストの結果に応じて前記対象ネットワークの状態を絞り込むテスト結果分析部と、を備え、
前記テスト最適化部が、前記テスト結果分析部により得られた分析結果を用いて更にテストを算出し、前記テスト実行部が前記更に算出されたテストを実行し、前記テスト結果分析部が、前記更に算出されたテストの結果に応じて前記対象ネットワークの前記状態を絞り込む処理を、1回以上繰り返すネットワーク障害箇所特定装置であり、
前記テスト最適化部は、前記テストの実行結果を表す確率変数と前記対象ネットワークの前記状態を表す確率変数の間の相互情報量の最大化問題の最適解あるいは近似最適解である更なるテストを算出する
ネットワーク障害箇所特定装置。
A network fault location identification device for identifying a fault location in a target network, comprising:
a test optimization unit for calculating path measurement tests to be performed on the target network;
a test execution unit that executes the test calculated by the test optimization unit on the target network;
a test result analysis unit that narrows down the state of the target network according to the result of the test by the test execution unit,
a network fault location identification device, the network fault location identification device repeating, one or more times, a process in which the test optimization unit calculates a further test using an analysis result obtained by the test result analysis unit, the test execution unit executes the further calculated test, and the test result analysis unit narrows down the state of the target network according to the result of the further calculated test;
The test optimization unit calculates a further test that is an optimal solution or a near-optimal solution of a problem of maximizing mutual information between a random variable representing the result of executing the test and a random variable representing the state of the target network.
対象ネットワークの障害箇所を特定するためのネットワーク障害箇所特定装置であって、
前記対象ネットワークに対して実行すべきパス測定のテストを算出するテスト最適化部と、
前記テスト最適化部により算出された前記テストを前記対象ネットワークに対して実行するテスト実行部と、
前記テスト実行部による前記テストの結果に応じて前記対象ネットワークの状態を絞り込むテスト結果分析部と、を備え、
前記テスト最適化部が、前記テスト結果分析部により得られた分析結果を用いて更にテストを算出し、前記テスト実行部が前記更に算出されたテストを実行し、前記テスト結果分析部が、前記更に算出されたテストの結果に応じて前記対象ネットワークの前記状態を絞り込む処理を、1回以上繰り返すネットワーク障害箇所特定装置であり、
前記テスト最適化部は、前記テストの実行結果に基づいて、候補として除外できる前記対象ネットワークの前記状態の個数の期待値が大きくなるような更なるテストを算出する
ネットワーク障害箇所特定装置。
A network fault location identification device for identifying a fault location in a target network, comprising:
a test optimization unit for calculating path measurement tests to be performed on the target network;
a test execution unit that executes the test calculated by the test optimization unit on the target network;
a test result analysis unit that narrows down the state of the target network according to the result of the test by the test execution unit,
a network fault location identification device, the network fault location identification device repeating, one or more times, a process in which the test optimization unit calculates a further test using an analysis result obtained by the test result analysis unit, the test execution unit executes the further calculated test, and the test result analysis unit narrows down the state of the target network according to the result of the further calculated test;
The test optimization unit calculates further tests that will increase an expected value of the number of states of the target network that can be excluded as candidates based on results of the tests.
対象ネットワークの障害箇所を特定するためのネットワーク障害箇所特定装置であって、
前記対象ネットワークに対して実行すべきパス測定のテストを算出するテスト最適化部と、
前記テスト最適化部により算出された前記テストを前記対象ネットワークに対して実行するテスト実行部と、
前記テスト実行部による前記テストの結果に応じて前記対象ネットワークの状態を絞り込むテスト結果分析部と、を備え、
前記テスト最適化部が、前記テスト結果分析部により得られた分析結果を用いて更にテストを算出し、前記テスト実行部が前記更に算出されたテストを実行し、前記テスト結果分析部が、前記更に算出されたテストの結果に応じて前記対象ネットワークの前記状態を絞り込む処理を、1回以上繰り返すネットワーク障害箇所特定装置であり、
前記テスト結果分析部は、前記対象ネットワークの前記状態を表す確率分布を、前記テストの実行結果に基づいて、ベイズ推定の枠組みに従って更新する
ネットワーク障害箇所特定装置。
A network fault location identification device for identifying a fault location in a target network, comprising:
a test optimization unit for calculating path measurement tests to be performed on the target network;
a test execution unit that executes the test calculated by the test optimization unit on the target network;
a test result analysis unit that narrows down the state of the target network according to the result of the test by the test execution unit,
a network fault location identification device, the network fault location identification device repeating, one or more times, a process in which the test optimization unit calculates a further test using an analysis result obtained by the test result analysis unit, the test execution unit executes the further calculated test, and the test result analysis unit narrows down the state of the target network according to the result of the further calculated test;
The test result analysis unit updates a probability distribution representing the state of the target network based on the execution results of the test in accordance with a Bayesian estimation framework.
対象ネットワークの障害箇所を特定するためのネットワーク障害箇所特定装置が実行するネットワーク障害箇所特定方法であって、
前記対象ネットワークに対して実行すべきパス測定のテストを算出するテスト最適化ステップと、
前記テスト最適化ステップにより算出された前記テストを前記対象ネットワークに対して実行するテスト実行ステップと、
前記テスト実行ステップによる前記テストの結果に応じて前記対象ネットワークの状態を絞り込むテスト結果分析ステップと、を備え、
前記テスト結果分析ステップにより得られた分析結果を用いて前記テスト最適化ステップにより更にテストを算出し、前記テスト実行ステップにより前記更に算出されたテストを実行し、前記テスト結果分析ステップにより前記更に算出されたテストの結果に応じて前記対象ネットワークの前記状態を絞り込む処理を、1回以上繰り返すネットワーク障害箇所特定方法であり、
前記テスト最適化ステップにおいて、前記テストの実行結果を表す確率変数と前記対象ネットワークの前記状態を表す確率変数の間の相互情報量の最大化問題の最適解あるいは近似最適解である更なるテストを算出する
ネットワーク障害箇所特定方法。
A network fault location identification method executed by a network fault location identification device for identifying a fault location in a target network, comprising:
a test optimization step for computing path measurement tests to be performed on the target network;
a test execution step of executing the test calculated by the test optimization step on the target network;
a test result analysis step of narrowing down the state of the target network according to the result of the test performed by the test execution step;
a test optimization step using an analysis result obtained by the test result analysis step, a test execution step executing the further calculated test, and a process of narrowing down the state of the target network according to the result of the further calculated test by the test result analysis step, the process being repeated one or more times;
A network fault location method, in which in the test optimization step, a further test is calculated which is an optimal solution or a near-optimal solution of a problem of maximizing mutual information between a random variable representing the result of executing the test and a random variable representing the state of the target network.
対象ネットワークの障害箇所を特定するためのネットワーク障害箇所特定装置が実行するネットワーク障害箇所特定方法であって、
前記対象ネットワークに対して実行すべきパス測定のテストを算出するテスト最適化ステップと、
前記テスト最適化ステップにより算出された前記テストを前記対象ネットワークに対して実行するテスト実行ステップと、
前記テスト実行ステップによる前記テストの結果に応じて前記対象ネットワークの状態を絞り込むテスト結果分析ステップと、を備え、
前記テスト結果分析ステップにより得られた分析結果を用いて前記テスト最適化ステップにより更にテストを算出し、前記テスト実行ステップにより前記更に算出されたテストを実行し、前記テスト結果分析ステップにより前記更に算出されたテストの結果に応じて前記対象ネットワークの前記状態を絞り込む処理を、1回以上繰り返すネットワーク障害箇所特定方法であり、
前記テスト最適化ステップにおいて、前記テストの実行結果に基づいて、候補として除外できる前記対象ネットワークの前記状態の個数の期待値が大きくなるような更なるテストを算出する
ネットワーク障害箇所特定方法。
A network fault location identification method executed by a network fault location identification device for identifying a fault location in a target network, comprising:
a test optimization step for computing path measurement tests to be performed on the target network;
a test execution step of executing the test calculated by the test optimization step on the target network;
a test result analysis step of narrowing down the state of the target network according to the result of the test performed by the test execution step;
a test optimization step using an analysis result obtained by the test result analysis step, a test execution step executing the further calculated test, and a process of narrowing down the state of the target network according to the result of the further calculated test by the test result analysis step, the process being repeated one or more times;
A network fault location method, comprising: calculating, in the test optimization step, a further test that increases an expected value of the number of states of the target network that can be excluded as candidates, based on a result of executing the test.
対象ネットワークの障害箇所を特定するためのネットワーク障害箇所特定装置が実行するネットワーク障害箇所特定方法であって、
前記対象ネットワークに対して実行すべきパス測定のテストを算出するテスト最適化ステップと、
前記テスト最適化ステップにより算出された前記テストを前記対象ネットワークに対して実行するテスト実行ステップと、
前記テスト実行ステップによる前記テストの結果に応じて前記対象ネットワークの状態を絞り込むテスト結果分析ステップと、を備え、
前記テスト結果分析ステップにより得られた分析結果を用いて前記テスト最適化ステップにより更にテストを算出し、前記テスト実行ステップにより前記更に算出されたテストを実行し、前記テスト結果分析ステップにより前記更に算出されたテストの結果に応じて前記対象ネットワークの前記状態を絞り込む処理を、1回以上繰り返すネットワーク障害箇所特定方法であり、
前記テスト結果分析ステップにおいて、前記対象ネットワークの前記状態を表す確率分布を、前記テストの実行結果に基づいて、ベイズ推定の枠組みに従って更新する
ネットワーク障害箇所特定方法。
A network fault location identification method executed by a network fault location identification device for identifying a fault location in a target network, comprising:
a test optimization step for computing path measurement tests to be performed on the target network;
a test execution step of executing the test calculated by the test optimization step on the target network;
a test result analysis step of narrowing down the state of the target network according to the result of the test performed by the test execution step;
a test optimization step using an analysis result obtained by the test result analysis step, a test execution step executing the further calculated test, and a process of narrowing down the state of the target network according to the result of the further calculated test by the test result analysis step, the process being repeated one or more times;
In the test result analysis step, a probability distribution representing the state of the target network is updated based on the execution results of the tests in accordance with a Bayesian estimation framework.
コンピュータを、請求項1ないし3のうちいずれか1項に記載のネットワーク障害箇所特定装置における各部として機能させるためのプログラム。 A program for causing a computer to function as each part of a network fault location identification device according to any one of claims 1 to 3.
JP2021196292A 2021-12-02 2021-12-02 NETWORK FAILURE LOCALIZATION DEVICE, NETWORK FAILURE LOCALIZATION METHOD, AND PROGRAM Active JP7701700B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021196292A JP7701700B2 (en) 2021-12-02 2021-12-02 NETWORK FAILURE LOCALIZATION DEVICE, NETWORK FAILURE LOCALIZATION METHOD, AND PROGRAM

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021196292A JP7701700B2 (en) 2021-12-02 2021-12-02 NETWORK FAILURE LOCALIZATION DEVICE, NETWORK FAILURE LOCALIZATION METHOD, AND PROGRAM

Publications (2)

Publication Number Publication Date
JP2023082481A JP2023082481A (en) 2023-06-14
JP7701700B2 true JP7701700B2 (en) 2025-07-02

Family

ID=86728395

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021196292A Active JP7701700B2 (en) 2021-12-02 2021-12-02 NETWORK FAILURE LOCALIZATION DEVICE, NETWORK FAILURE LOCALIZATION METHOD, AND PROGRAM

Country Status (1)

Country Link
JP (1) JP7701700B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7524492B1 (en) 2024-02-02 2024-07-29 株式会社インターネットイニシアティブ Communication management device and communication management method

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011124897A (en) 2009-12-14 2011-06-23 Fujitsu Ltd Network management device, and method of identifying abnormal part
JP2019071563A (en) 2017-10-10 2019-05-09 日本電信電話株式会社 Communication quality deterioration estimation device and communication quality deterioration estimation method

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011124897A (en) 2009-12-14 2011-06-23 Fujitsu Ltd Network management device, and method of identifying abnormal part
JP2019071563A (en) 2017-10-10 2019-05-09 日本電信電話株式会社 Communication quality deterioration estimation device and communication quality deterioration estimation method

Also Published As

Publication number Publication date
JP2023082481A (en) 2023-06-14

Similar Documents

Publication Publication Date Title
US11367010B2 (en) Quantum computer simulator characterization
Natole et al. Stochastic proximal algorithms for AUC maximization
Jauernig et al. DARWIN: Survival of the fittest fuzzing mutators
WO2008154657A2 (en) Distributed kernel density estimation
WO2009090939A1 (en) Apparatus and method for detecting network abnormality
JP7701700B2 (en) NETWORK FAILURE LOCALIZATION DEVICE, NETWORK FAILURE LOCALIZATION METHOD, AND PROGRAM
US9563719B2 (en) Self-monitoring object-oriented applications
Tu et al. Mining workflows for anomalous data transfers
Ikeuchi et al. Network tomography based on adaptive measurements in probabilistic routing
JP6835702B2 (en) Anomaly estimation device, anomaly estimation method and program
Zhu et al. Scalable quantum architecture search via landscape analysis
Arslan et al. Automatic performance analysis of cloud based load testing of web-application & its comparison with traditional load testing
Marappan et al. Solution to graph coloring problem using divide and conquer based genetic method
Assunção et al. Establishing integration test orders of classes with several coupling measures
JP2018124829A (en) State determination device, state determination method, and program
US11093229B2 (en) Deployment scheduling using failure rate prediction
Maurya et al. decoder-bench: Benchmarking Decoders for Quantum Error Correction
Chen et al. HiBGT: High-performance Bayesian group testing for COVID-19
Wei et al. A model-based test case prioritization approach based on fault urgency and severity
JP2024178731A (en) NETWORK FAILURE LOCALIZATION DEVICE, NETWORK FAILURE LOCALIZATION METHOD, AND PROGRAM
Liu et al. Automate: Automatic Anomaly Detection and Root Cause Analysis Framework for Hadoop
Dodd et al. A fast and frugal Gaussian Boson Sampling emulator
EP3982271A1 (en) Method for autotuning noisy hpc systems
JP7584092B2 (en) Observation point optimization device, observation point optimization method, and program
Ikram et al. Root cause analysis of failures from partial causal structures

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7426

Effective date: 20211203

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20211203

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240229

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20240701

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20240702

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20241122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20241126

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20250124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20250311

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20250512

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20250610

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20250612

R150 Certificate of patent or registration of utility model

Ref document number: 7701700

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350