JP7600679B2 - Machine learning device and failure analysis device - Google Patents
Machine learning device and failure analysis device Download PDFInfo
- Publication number
- JP7600679B2 JP7600679B2 JP2020215268A JP2020215268A JP7600679B2 JP 7600679 B2 JP7600679 B2 JP 7600679B2 JP 2020215268 A JP2020215268 A JP 2020215268A JP 2020215268 A JP2020215268 A JP 2020215268A JP 7600679 B2 JP7600679 B2 JP 7600679B2
- Authority
- JP
- Japan
- Prior art keywords
- fault
- alarm
- unit
- learning model
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims description 52
- 238000010801 machine learning Methods 0.000 title claims description 37
- 238000004891 communication Methods 0.000 claims description 38
- 238000012806 monitoring device Methods 0.000 claims description 20
- 238000010276 construction Methods 0.000 claims description 17
- 238000012790 confirmation Methods 0.000 description 21
- 238000011084 recovery Methods 0.000 description 20
- 230000004044 response Effects 0.000 description 8
- 238000000034 method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000005856 abnormality Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000012706 support-vector machine Methods 0.000 description 3
- 101100001471 Schizosaccharomyces pombe (strain 972 / ATCC 24843) alm1 gene Proteins 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Landscapes
- Testing And Monitoring For Control Systems (AREA)
- Debugging And Monitoring (AREA)
Description
本発明は、機械学習装置及び障害解析装置に関する。 The present invention relates to a machine learning device and a fault analysis device.
発電所のネットワークで用いる通信設備や回線設備に障害が発生した場合に、NMS(Network Management System)におけるアラーム表示、回線管理システムと関係事業所へのアラーム出力、及び疎通確認に基づいて故障箇所の特定を行っている。 If a fault occurs in the communication equipment or line equipment used in the power plant's network, the location of the fault is identified based on an alarm displayed in the NMS (Network Management System), an alarm output to the line management system and related business offices, and a communication check.
例えば、特許文献1は、セキュリティ・ユーティリティ・サーバ(SUS)により、ネットワーク管理要素が、閾値および/または他の基準を設定し、閾値や基準を超えた場合、NMSに通知を送信するなどの、特定の動作をもたらす警告を出力すると共に、ネットワーク内のノードが異常検出機構で異常を検出する技術を開示している。 For example, Patent Document 1 discloses a technology in which a security utility server (SUS) allows a network management element to set thresholds and/or other criteria, and when the thresholds or criteria are exceeded, outputs an alert that results in a specific action, such as sending a notification to an NMS, while nodes in the network detect anomalies using an anomaly detection mechanism.
しかし、発電所のネットワークに含まれるNMSにおけるアラーム表示に基づいて故障箇所を特定する場合、担当者の通信設備や回線設備に関する知識によって障害の特定に要する時間にばらつきが発生する。また、NMSにおけるアラームは、通信設備や回線設備に障害が発生した場合に出力されるのみならず、例えば停電作業や通信作業に伴って、通信設備や回線設備を停止する際にも出力される。このため、アラームが多く出力される作業中に、通信設備や回線設備における障害が発生すると、停電作業や通信作業などの作業に伴うアラーム表示に、障害の発生に伴うアラーム表示が紛れ込み、担当者は、運用箇所からの疎通障害連絡があるまで、障害の発生に伴うアラーム表示に気づかないことがある。 However, when identifying the location of a fault based on an alarm display in the NMS included in the power plant network, the time required to identify the fault varies depending on the knowledge of the person in charge about the communication equipment and line equipment. Furthermore, alarms in the NMS are not only output when a fault occurs in the communication equipment or line equipment, but are also output when communication equipment or line equipment is shut down, for example, in connection with power outage or communication work. For this reason, if a fault occurs in the communication equipment or line equipment during work that generates many alarms, the alarm display associated with the fault may be mixed in with the alarm displays associated with the power outage or communication work, and the person in charge may not notice the alarm display associated with the fault until they receive a communication fault report from the operation site.
本発明は、通信設備や回線設備に関する知識量を問わず、アラーム表示に基づいて自動的に障害を特定することが可能となる、機械学習装置及び障害解析装置を提供することを目的とする。 The present invention aims to provide a machine learning device and a fault analysis device that can automatically identify faults based on alarm displays, regardless of the amount of knowledge about communication equipment and line equipment.
前記目的を達成するため、本発明は、次に記載する構成を備えている。 To achieve the above objective, the present invention has the following configuration.
(1) ネットワークを通じて取得される設備情報から通信設備又は回線設備の障害を識別するための学習モデルを構築する機械学習装置であって、前記ネットワークの監視装置で発生している前記設備情報としてのアラームに係る情報を第1入力データとして取得する第1入力データ取得手段と、前記アラームに対応する障害の判定結果を第1ラベルとして取得する第1ラベル取得手段と、前記第1入力データと前記第1ラベルとの組を教師データとして教師あり学習を行うことにより、前記監視装置で発生しているアラームに対応する前記判定結果を生成するための第1学習モデルを構築する第1学習モデル構築手段と、を備える機械学習装置。 (1) A machine learning device that constructs a learning model for identifying faults in communication facilities or line facilities from facility information acquired through a network, the machine learning device comprising: a first input data acquisition means that acquires information related to an alarm occurring in a monitoring device of the network as the facility information as first input data; a first label acquisition means that acquires a fault determination result corresponding to the alarm as a first label; and a first learning model construction means that performs supervised learning using a pair of the first input data and the first label as teacher data to construct a first learning model for generating the determination result corresponding to the alarm occurring in the monitoring device.
(1)によれば、通信設備や回線設備に関する知識量を問わず、アラーム表示に基づいて自動的に障害を特定する機械学習装置を提供することが可能となる。 According to (1), it is possible to provide a machine learning device that can automatically identify faults based on alarm displays, regardless of the amount of knowledge about communication equipment and line equipment.
(2) (1)に記載の機械学習装置において、前記通信設備としてのマイクロ波無線機からの出力波形に係る情報を第2入力データとして取得する第2入力データ取得手段と、前記出力波形に対応する障害の判定結果を第2ラベルとして取得する第2ラベル取得手段と、前記第2入力データと前記第2ラベルとの組を教師データとして教師あり学習を行うことにより、前記出力波形に対応する前記判定結果を生成するための第2学習モデルを構築する第2学習モデル構築手段と、を更に備えることが好ましい。 (2) In the machine learning device described in (1), it is preferable that the device further comprises a second input data acquisition means for acquiring information related to an output waveform from a microwave radio as the communication equipment as second input data, a second label acquisition means for acquiring a fault judgment result corresponding to the output waveform as a second label, and a second learning model construction means for constructing a second learning model for generating the judgment result corresponding to the output waveform by performing supervised learning using a pair of the second input data and the second label as teacher data.
(2)によれば、通信設備や回線設備に関する知識量を問わず、マイクロ波無線機からの出力波形に基づいて自動的に障害を特定する機械学習装置を提供することが可能となる。 (2) It is possible to provide a machine learning device that can automatically identify faults based on the output waveform from a microwave radio, regardless of the amount of knowledge about communication equipment and line equipment.
(3) (1)又は(2)に記載の機械学習装置で構築した前記第1学習モデルを用いた障害解析装置であって、新たな前記アラームを取得するアラーム取得手段と、前記アラーム取得手段によって取得されたアラームを、事前に登録されていたアラームと、事前に登録されていないアラームとに振り分けるアラーム振分手段と、前記事前に登録されていないアラームと前記第1学習モデルとを用いて、前記障害の発生を判定する第1障害判定手段と、を備える障害解析装置。 (3) A fault analysis device using the first learning model constructed by the machine learning device described in (1) or (2), comprising: an alarm acquisition means for acquiring a new alarm; an alarm sorting means for sorting the alarms acquired by the alarm acquisition means into alarms that have been registered in advance and alarms that have not been registered in advance; and a first fault determination means for determining the occurrence of the fault using the alarms that have not been registered in advance and the first learning model.
(3)によれば、通信設備や回線設備に関する知識量を問わず、アラーム表示に基づいて自動的に障害を特定する障害解析装置を提供することが可能となる。 (3) makes it possible to provide a fault analysis device that automatically identifies faults based on alarm displays, regardless of the level of knowledge about communication equipment and line equipment.
(4) (3)に記載の障害解析装置において、前記第1障害判定手段は、前記障害に加えて、前記障害の発生確度を判定し、前記障害の発生確度が100%ではない場合に、前記障害の発生確度を高めるための確認事項を出力する確認事項出力手段を更に備えることが好ましい。 (4) In the fault analysis device described in (3), it is preferable that the first fault determination means further includes a confirmation item output means for determining, in addition to the fault, the probability of the fault occurring, and outputting a confirmation item for increasing the probability of the fault occurring if the probability of the fault occurring is not 100%.
(4)によれば、第1学習モデルによる判定結果としての障害の発生確度を高めることが可能となる。 (4) makes it possible to increase the probability of occurrence of a fault as a result of the determination made by the first learning model.
(5) (3)又は(4)に記載の障害解析装置において、(2)に記載の機械学習装置で構築した前記第2学習モデルを用いた障害解析装置であって、前記事前に登録されていないアラームのログが、前記マイクロ波無線機からの出力が閾値を超えたことを示す場合に、前記出力波形と前記第2学習モデルとを用いて、前記障害の発生を判定する第2障害判定手段と、を備え、前記第1障害判定手段は、前記事前に登録されていないアラームのログが、前記出力が閾値を超えたことを示さない場合に、前記事前に登録されていないアラームと前記第1学習モデルとを用いて、前記障害の発生を判定することが好ましい。 (5) In the fault analysis device described in (3) or (4), the fault analysis device uses the second learning model constructed by the machine learning device described in (2), and includes a second fault determination means that determines the occurrence of the fault using the output waveform and the second learning model when the log of the non-preregistered alarm indicates that the output from the microwave radio exceeds a threshold value, and it is preferable that the first fault determination means determines the occurrence of the fault using the non-preregistered alarm and the first learning model when the log of the non-preregistered alarm does not indicate that the output exceeds a threshold value.
(5)によれば、通信設備や回線設備に関する知識量を問わず、マイクロ波無線機からの出力波形に基づいて自動的に障害を特定する障害解析装置を提供することが可能となる。 (5) makes it possible to provide a fault analysis device that can automatically identify faults based on the output waveform from a microwave radio, regardless of the level of knowledge about communication equipment and line equipment.
本発明によれば、通信設備や回線設備に関する知識量を問わず、アラーム表示に基づいて障害を特定することが可能となる。 According to the present invention, it is possible to identify faults based on alarm displays, regardless of the level of knowledge about communication equipment and line equipment.
以下、本発明の実施形態について、図1~図6を参照することにより説明する。 The following describes an embodiment of the present invention with reference to Figures 1 to 6.
〔1 実施形態の構成〕
〔1.1 全体構成〕
まず、本実施形態に係る障害解析システム100の構成について説明する。図1は障害解析システム100の全体構成を示す図である。障害解析システム100は、図1に示すように、機械学習装置10、障害解析装置20、監視装置30、端末装置40、及びネットワーク50を備えている。なお、機械学習装置10、障害解析装置20、監視装置30、端末装置40は、1台でも複数台でもよい。
[Configuration of 1 embodiment]
1.1 Overall Configuration
First, the configuration of a
また、機械学習装置10と、障害解析装置20と、監視装置30と、端末装置40とは、それぞれネットワーク50に接続されており、ネットワーク50を介して相互に通信を行うことが可能である。ネットワーク50は、例えば、LAN(Local Area Network)や、インターネット、公衆電話網、あるいは、これらの組み合わせである。ネットワーク50における具体的な通信方式や、有線接続及び無線接続のいずれであるか等については、特に限定されない。なお、機械学習装置10と障害解析装置20とは、ネットワーク50を用いた通信ではなく、接続部を介して直接接続してもよく、障害解析装置20と監視装置30とは、接続部を介して直接接続してもよい。
The
機械学習装置10は、教師あり学習により、障害解析装置20で用いる学習モデルを構築する装置である。そのため、機械学習装置10は、図1に示すように、第1学習部11と第2学習部12を備える。
The
障害解析装置20は、後述の監視装置30で検知されるアラームを、機械学習装置10で構築された学習モデルに適用することにより、NMSで発生している障害を解析する装置である。
The
監視装置30は、例えばNMSに備わる通信設備や回線設備等に発生している障害を、当該通信設備や回線設備等から取得したアラームに基づいて検知することで、NMSの状況を監視する装置である。
The
端末装置40は、障害解析装置20から出力される障害解析結果や、監視装置30から出力される監視結果を取得して表示すると共に、端末装置40のユーザからの入力を、障害解析装置20や監視装置30に出力する装置である。端末装置40は、例えばスマートフォンなどの携帯電話や、タブレットなどの携帯端末によって実現されることが好適であるが、これには限定されない。また、図1において、端末装置40は、端末装置40a~40qの複数台が示されているがこれには限定されず、例えば1台のみ存在してもよい。
The terminal device 40 is a device that acquires and displays the fault analysis results output from the
〔1.2 機械学習装置の構成〕
上記のように、機械学習装置10は、第1学習部11と第2学習部12とを備える。第1学習部11は、NMSの監視装置30で発生しているアラームに係る情報から、NMSで発生している障害を判定するための第1学習モデルを構築する。第2学習部は、NMSに備わるマイクロ波無線機からの出力波形に係る情報から、NMSで発生している障害を判定するための第2学習モデルを構築する。
[1.2 Configuration of machine learning device]
As described above, the
図2は、第1学習部11の機能ブロック図である。第1学習部11は、図2に示すように、第1入力データ取得部111、第1ラベル取得部112、第1学習モデル構築部113、第1学習モデル記憶部114を備える。
Figure 2 is a functional block diagram of the
第1入力データ取得部111は、NMSの監視装置で発生しているアラームに係る情報を第1入力データとして取得する。なお、このアラームに係る情報としては、例えば、特定の発電所における「N150MOPT 高速セクション REC」というアラーム、「MJ」というアラーム、「4WVA1 低速IF部 EQP1」というアラーム、「故障一括」というアラーム、「装置異常」というアラームが挙げられる。
The first input
なお、ここで、「N150MOPT」とは、通常回線の150M(150メガ)光送信部のことである。とりわけ「N」は「通常」の回線であることを意味し、通常回線が停止した際には、「E」(Emergency)で示される予備系の回線に切り替わる。「OPT」とは、発光・送信を示す。
また、「高速セクション」の「高速」とは、国際標準ISOで規定され、伝送速度STM-1(155.52Mbps)、STM-16(2488.32Mbps)等、多くの種類が存在する、多重化速度が高速である高速回線を意味し、「セクション」とは、光多重化装置における高速回線が通っている領域・区間のことである。
また、「REC」とは、光入力断又はフレーム同期はずれ時に発生するアラーム出力表示である。
また、「4WVA1」とは、光多重化装置における4W回線(主に音声信号、電話回線等)を収容する基板名である。
また、「低速IF部」とは、低速回線に使用されるインタフェースのことである。
また、「EQP1」とは、「Equipment(装置)1」の略号である。
また、「故障一括」とは、装置内でアラームが発生した際、該当装置を特定しやすくするために発報するアラームのことであり、アラームで確認した装置において、詳細なアラーム検証・確認が必要となる。
また、「装置異常」とは、装置全体ではなく、装置を構成するユニットの警報を通知するアラームのことであり、装置停止・回線停止は伴わないが、信頼性が低下している(例えば、冗長化されたシステムの場合、片方の系統が停止している等)状態を示す。
Here, "N150MOPT" refers to the 150M (150 Mega) optical transmission section of the normal line. In particular, "N" means that it is a "normal" line, and when the normal line stops, it switches to the backup line indicated by "E" (Emergency). "OPT" indicates light emission/transmission.
In addition, the "high speed" in "high speed section" refers to a high speed line with a high multiplexing speed, which is defined by the international standard ISO and comes in many types, such as transmission speeds of STM-1 (155.52 Mbps) and STM-16 (2488.32 Mbps), and a "section" refers to the area or section in an optical multiplexing device through which a high speed line passes.
"REC" is an alarm output indication that occurs when optical input is cut off or frame synchronization is lost.
Also, "4WVA1" is the name of a board that accommodates 4W lines (mainly voice signals, telephone lines, etc.) in an optical multiplexing device.
Moreover, the "low-speed IF unit" refers to an interface used for a low-speed line.
Additionally, "EQP1" is an abbreviation for "Equipment 1."
In addition, a "lump fault" is an alarm that is issued when an alarm occurs within a device in order to make it easier to identify the device in question, and detailed alarm verification and confirmation are required for the device identified by the alarm.
In addition, "equipment abnormality" refers to an alarm that notifies of a warning of a unit that makes up the equipment, rather than of the entire equipment, and does not involve equipment or line shutdown, but indicates a state in which reliability is reduced (for example, in the case of a redundant system, one of the systems has stopped).
第1ラベル取得部112は、アラームに対応する障害の判定結果を第1ラベルとして取得する。なお、この判定結果は、例えば、「N150MOPT」基板内のIC不良、光心線不良、「4WVA1」の基板故障、装置電源部の異常が挙げられる。
The first
第1学習モデル構築部113は、第1入力データと第1ラベルとの組を教師データとして教師あり学習を行うことにより、NMSの監視装置30で発生しているアラームに係る情報から、NMSで発生している障害を判定するための第1学習モデルを構築し、構築した第1学習モデルを、障害解析装置20に送信する。
The first learning
第1学習モデル構築部113は、例として、サポート・ベクター・マシン(Support Vector Machine、以下SVMともいう)を用いて実現することが可能である。例えば、サポート・ベクター・マシンに加えて、ロジスティック回帰式や正解率表を用いることにより、本実施形態によって構築される第1学習モデルは、アラームに対応する障害を判定するのみならず、各障害が発生している確度を出力することが好適である(例えば、高橋和子「サポートベクターマシンにおけるアンサンブル学習の提案」,第23回人工知能学会全国大会)。
The first learning
この第1学習モデルは、例えば、複数のアラームの各々がONとなっているかOFFかの組み合わせに応じて、発生している障害と確度を判定するための学習モデルである。 This first learning model is a learning model for determining the occurrence and the likelihood of a fault, for example, based on a combination of whether each of a number of alarms is ON or OFF.
第1学習モデル記憶部114は、第1学習モデル構築部113が構築した学習モデルを記憶する。
The first learning
第2学習部12は、第2入力データ取得部121、第2ラベル取得部122、第2学習モデル構築部123、第2学習モデル記憶部124を備える。なお、第2学習部12の構成は、図2に示す第1学習部11の構成と同様であるからその図示を省略する。
The
第2入力データ取得部121は、NMSに備わる通信設備としてのマイクロ波無線機からの出力波形に係る情報を第2入力データとして取得する。 The second input data acquisition unit 121 acquires, as second input data, information related to the output waveform from a microwave radio serving as communication equipment provided in the NMS.
第2ラベル取得部122は、上記の出力波形に対応する障害の判定結果を第2ラベルとして取得する。なお、この判定結果は、例えば、降雨や倒木等の事象であって良い。 The second label acquisition unit 122 acquires the fault determination result corresponding to the output waveform as the second label. Note that this determination result may be, for example, an event such as rainfall or a fallen tree.
第2学習モデル構築部123は、第2入力データと第2ラベルとの組を教師データとして教師あり学習を行うことにより、NMSに備わるマイクロ波無線機からの出力波形に係る情報から、NMSで発生している障害を判定するための第2学習モデルを構築し、構築した第2学習モデルを、障害解析装置20に送信する。この第2学習モデルは、例えば、降雨や倒木により、マイクロ波無線機からの出力波形が乱れた場合に、その乱れ具合に応じて、発生している障害が、例えば降雨であったり、あるいは倒木であったりすることを判定するための学習モデルである。
The second learning model construction unit 123 constructs a second learning model for determining a fault occurring in the NMS from information related to the output waveform from the microwave radio provided in the NMS by performing supervised learning using a pair of the second input data and the second label as teaching data, and transmits the constructed second learning model to the
〔1.3 障害解析装置の構成〕
図3は、障害解析装置20の機能ブロック図である。障害解析装置20は、記憶部21と、制御部22と、通信部23と、表示部24とを備える。
[1.3 Configuration of the fault analysis device]
3 is a functional block diagram of the
記憶部21は、機械学習装置10から取得した第1学習モデル及び第2学習モデルを記憶する。
The
更に記憶部21は、事前登録データベース211、アラーム障害対応データベース212、障害特性データベース213を格納する。
The
事前登録データベース211は、停電作業や通信作業に伴って、通信設備や回線設備を停止することに伴って発生する作業アラームを事前に登録するデータベースである。例えば、障害解析装置20のユーザは、端末装置40から、作業アラームに係る情報を入力することにより、事前登録データベース211に、将来発生する作業アラームが登録される。
The
アラーム障害対応データベース212は、アラームと、当該アラームに対応する障害との対応関係を定義するデータベースである。アラーム障害対応データベース212は、例えば、複数のアラームの各々がONかOFFかによる組み合わせと、発生している障害との対応関係を定義する。後述のように、実際に出力されている複数のアラームの組み合わせを、第1学習モデルに適用することにより、発生しているであろう障害とその確度が判定されるが、この際、アラーム障害対応データベース212を参照することにより、仮に当該障害が実際に発生しているのであれば、本来のアラームのON-OFFの組み合わせが分かる。これを実際に出力されている複数のアラームのON-OFFと比較することにより、本来であればONとなっているはずのアラームが実際にはOFFとなっていたり、あるいは、本来OFFとなっているはずのアラームが実際にはONとなっていたりすることが判別される。
The alarm
障害特性データベース213は、発生している障害と、当該障害の発生箇所、当該障害への対応の優先度、当該障害から復旧するために用いる障害復旧品・予備品の有無と保管場所、当該障害の発生場所までの所要移動時間、及び、当該障害からの復旧の見込時間との対応関係を定義するデータベースである。
The
制御部22は、障害解析装置20の全体を制御する部分であり、各種プログラムを、ROM、RAM、フラッシュメモリ又はハードディスク(HDD)等の記憶領域から適宜読み出して実行することにより、本実施形態における各種機能を実現している。制御部22は、CPUであってよい。制御部22は、アラーム取得部221、アラーム振分部222、第1障害判定部223、第2障害判定部224、障害候補出力部225、確認事項出力部226、障害特定部227、優先度出力部228、障害復旧品出力部229、所用移動時間出力部230、復旧見込時間出力部231とを備える。
The
アラーム取得部221は、後述の通信部23を介して、監視装置30から、第1学習モデルや第2学習モデルの構築時に取得したアラームとは別個に、新たなアラームを取得する。
The
アラーム振分部222は、事前登録データベース211を参照することにより、アラーム取得部221によって取得されたアラームが、事前に登録された作業アラームか、あるいは、事前に登録されておらず、実際に障害が発生していることに伴って出力されている障害アラームかを振り分ける。
The
第1障害判定部223は、事前に登録されていない障害アラームを、記憶部21に記憶されている第1学習モデルに適用することにより、発生しているであろう障害とその発生の確度を類推し、判定する。
The first
第2障害判定部224は、事前に登録されていない障害アラームのログが、マイクロ波無線機からの出力が閾値を超えていることを示す場合に、当該マイクロ波無線機からの出力波形を、記憶部21に記憶されている第2学習モデルに適用することにより、発生しているであろう障害を類推し、判定する。更に、第2障害判定部224は、当該発生しているであろう障害を、通信部23を介して端末装置40に出力する。あるいは、第2障害判定部224は、当該発生しているであろう障害を、後述の表示部24に出力してもよい。
When a log of a fault alarm not registered in advance indicates that the output from the microwave radio exceeds a threshold, the second
障害候補出力部225は、第1障害判定部223によって判定された障害の候補を、当該候補が複数ある場合には確度の高い順にソートした上で、当該確度と共に通信部23を介して端末装置40に出力する。あるいは、障害候補出力部225は、障害の候補を、当該確度と共に後述の表示部24に出力してもよい。
The fault
確認事項出力部226は、アラーム障害対応データベース212を参照することにより、障害解析装置20のユーザに対する確認事項を出力する。具体的には、障害候補出力部225によって出力された障害候補に対応する、アラーム振分部222によって振り分けられた事前に登録されていない複数のアラームの組み合わせが、アラーム障害対応データベース212に記載のアラームの組み合わせと一部異なる場合、当該異なるアラームに対応する事象を、ユーザに対する確認事項として、通信部23を介して端末装置40に出力する。あるいは、確認事項出力部226は、ユーザに対する確認事項を、後述の表示部24に出力してもよい。
The confirmation
例えば、アラーム振分部222によって振り分けられた、事前に登録されていない複数の障害アラームの組み合わせが、(ALM1,ALM2,ALM3,ALM4)=(ON,OFF,ON,OFF)であり、これを第1学習モデルに適用した結果、障害Dが90%の確度で発生していると判定されたとする。この際、アラーム障害対応データベース212において、障害Dに対応する本来の障害アラームの組み合わせが、(ALM1,ALM2,ALM3,ALM4)=(ON,OFF,OFF,OFF)であった場合、確認事項出力部226は、本来であればOFFになっているはずのALM3がONになっていることに基づいて、ALM3に対応する確認事項を出力する。
For example, suppose that the combination of multiple failure alarms not registered in advance that are distributed by the
障害特定部227は、実際に発生している障害を特定する。例えば、障害特定部227は、障害候補出力部225によって出力された複数の障害候補から、ユーザによって端末装置40を介して選択された選択結果に基づいて、実際に発生している障害を特定してもよい。あるいは、第2障害判定部224によって出力された障害に対する、ユーザの確認動作に基づいて、実際に発生している障害を特定してもよい。
The
優先度出力部228は、障害特性データベース213を参照することにより、障害特定部227によって特定された障害への対応の優先度を、通信部23を介して端末装置40に出力する。あるいは、優先度出力部228は、障害への対応の優先度を、後述の表示部24に出力してもよい。
The
障害復旧品出力部229は、障害特性データベース213を参照することにより、障害特定部227によって特定された障害から復旧するために用いる障害復旧品・予備品の有無と保管場所を、通信部23を介して端末装置40に出力する。あるいは、障害復旧品出力部229は、障害から復旧するために用いる障害復旧品・予備品の有無と保管場所を、後述の表示部24に出力してもよい。
The failure recovery
所要移動時間出力部230は、障害特性データベース213を参照することにより、障害特定部227によって特定された障害の発生場所までの所要移動時間を、通信部23を介して端末装置40に出力する。あるいは、所要移動時間出力部230は、所要移動時間を、後述の表示部24に出力してもよい。この際、例えば所要移動時間を算出するために、端末装置40に備わる、GPS情報取得部(不図示)によって取得されるGPS情報を用いてもよい。
The required travel
復旧見込時間出力部231は、障害特性データベース213を参照することにより、障害特定部227によって特定された障害からの復旧の見込時間を、通信部23を介して端末装置40に出力する。あるいは、復旧見込時間出力部231は、復旧見込時間を、後述の表示部24に出力してもよい。
The expected recovery
通信部23は、障害解析装置20が、機械学習装置10、監視装置30、及び端末装置40と通信するために用いる通信インタフェースである。
The
表示部24は、例えば、障害候補出力部225によって出力される障害候補、確認事項出力部226によって出力される確認事項、優先度出力部228によって出力される優先度、障害復旧品出力部229によって出力される障害復旧品・予備品の有無と保管場所、所要移動時間出力部230によって出力される所要移動時間、復旧見込時間出力部231によって出力される復旧見込時間を表示するモニタである。
The
〔2 実施形態の動作〕
次に、本実施形態に係る障害解析システム100の動作について説明する。まず、図4及び図5を参照し、機械学習装置10の動作について説明する。
2. Operation of the embodiment
Next, the operation of the
〔2.1 機械学習装置10の動作〕
図4は、第1学習部11の動作を示すフローチャートである。
ステップS11において、第1入力データ取得部111が、NMSの監視装置30で発生しているアラームに係る情報を第1入力データとして取得する。
2.1 Operation of the
FIG. 4 is a flowchart showing the operation of the
In step S11, the first input
ステップS12において、第1ラベル取得部112が、アラームに対応する障害の判定結果を第1ラベルとして取得する。
In step S12, the first
ステップS13において、第1学習モデル構築部113は、第1入力データと第1ラベルとの組を教師データとする。
In step S13, the first learning
ステップS14において、第1学習モデル構築部113は、ステップS13の教師データを用いて教師あり学習を行う。
In step S14, the first learning
ステップS15において、機械学習が終了した場合(S15:YES)には、処理はステップS16に移行する。機械学習がまだ終了していない場合(S15:NO)には、処理はステップS11に移行する。 If machine learning has ended in step S15 (S15: YES), the process proceeds to step S16. If machine learning has not yet ended (S15: NO), the process proceeds to step S11.
ステップS16において、第1学習モデル構築部113は、構築した第1学習モデルを障害解析装置20に送信する。その後、全ての処理を終了する。
In step S16, the first learning
図5は、第2学習部12の動作を示すフローチャートである。
ステップS21において、第2入力データ取得部121が、NMSに備わるマイクロ波無線機からの出力波形に係る情報を第2入力データとして取得する。
FIG. 5 is a flowchart showing the operation of the
In step S21, the second input data acquisition unit 121 acquires, as second input data, information related to an output waveform from a microwave radio provided in the NMS.
ステップS22において、第2ラベル取得部122が、出力波形に対応する障害の判定結果を第2ラベルとして取得する。 In step S22, the second label acquisition unit 122 acquires the fault determination result corresponding to the output waveform as a second label.
ステップS23において、第2学習モデル構築部123は、第2入力データと第2ラベルとの組を教師データとする。 In step S23, the second learning model construction unit 123 sets the pair of the second input data and the second label as teacher data.
ステップS24において、第2学習モデル構築部123は、ステップS23の教師データを用いて教師あり学習を行う。 In step S24, the second learning model construction unit 123 performs supervised learning using the teacher data from step S23.
ステップS25において、機械学習が終了した場合(S25:YES)には、処理はステップS26に移行する。機械学習がまだ終了していない場合(S25:NO)には、処理はステップS21に移行する。 If machine learning has ended in step S25 (S25: YES), the process proceeds to step S26. If machine learning has not yet ended (S25: NO), the process proceeds to step S21.
ステップS26において、第2学習モデル構築部123は、構築した第2学習モデルを障害解析装置20に送信する。その後、全ての処理を終了する。
In step S26, the second learning model construction unit 123 transmits the constructed second learning model to the
〔2.2 障害解析装置20の動作〕
次に、図6を参照し、障害解析装置20の動作について説明する。
2.2 Operation of the
Next, the operation of the
ステップS31において、アラーム取得部221は、後述の通信部23を介して、監視装置30から、第1学習モデルや第2学習モデルの構築時に取得したアラームとは別個に、新たなアラームを取得する。
In step S31, the
ステップS32において、アラーム振分部222は、事前登録データベース211を参照することにより、アラーム取得部221によって取得されたアラームが、事前に登録された作業アラームか、あるいは、事前に登録されておらず、実際に障害が発生していることに伴って出力されている障害アラームかを振り分ける。
In step S32, the
ステップS33において、障害アラームのログに、マイクロ波無線機からの出力が閾値を超えたことを示すデータが含まれない場合(S33:NO)には、処理はステップS34に進む。障害アラームのログに、マイクロ波無線機からの出力が閾値を超えたことを示すデータが含まれる場合(S33:YES)には、処理はステップS35に進む。 In step S33, if the fault alarm log does not contain data indicating that the output from the microwave radio has exceeded the threshold (S33: NO), processing proceeds to step S34. If the fault alarm log contains data indicating that the output from the microwave radio has exceeded the threshold (S33: YES), processing proceeds to step S35.
ステップS34において、第1障害判定部223は、事前に登録されていない障害アラームを、記憶部21に記憶されている第1学習モデルに適用することにより、発生しているであろう障害とその発生の確度を類推し、判定する。
In step S34, the first
ステップS35において、第2障害判定部224は、マイクロ波無線機からの出力波形を、記憶部21に記憶されている第2学習モデルに適用することにより、発生しているであろう障害を類推し、判定する。更に、第2障害判定部224は、当該発生しているであろう障害を出力する。
In step S35, the second
ステップS36において、障害候補出力部225は、第1障害判定部223によって判定された障害の候補を、当該候補が複数ある場合には確度の高い順にソートした上で、当該確度と共に出力する。
In step S36, the fault
ステップS37において、障害候補出力部225によって出力された障害候補の確度が100%の場合(S37:YES)には、処理はステップS39に進行する。それ以外の場合(S37:NO)には、処理はステップS38に進行する。
In step S37, if the accuracy of the fault candidate output by the fault
ステップS38において、確認事項出力部226は、アラーム障害対応データベース212を参照することにより、障害解析装置20のユーザに対する確認事項を出力する。
In step S38, the confirmation
ステップS39において、障害特定部227は、実際に発生している障害を特定する。
In step S39, the
ステップS40において、優先度出力部228は、障害特性データベース213を参照することにより、障害特定部227によって特定された障害への対応の優先度を出力する。
In step S40, the
ステップS41において、障害復旧品出力部229は、障害特性データベース213を参照することにより、障害特定部227によって特定された障害から復旧するために用いる障害復旧品・予備品の有無と保管場所を出力する。
In step S41, the failure recovery
ステップS42において、所要移動時間出力部230は、障害特性データベース213を参照することにより、障害特定部227によって特定された障害の発生場所までの所要移動時間を出力する。
In step S42, the required travel
ステップS43において、復旧見込時間出力部231は、障害特性データベース213を参照することにより、障害特定部227によって特定された障害からの復旧の見込時間を出力する。その後、全ての処理を終了する。
In step S43, the expected recovery
〔3 変形例〕
以上、本発明の実施形態について説明したが、本発明は前述した実施形態に限るものではない。また、本実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本実施形態に記載されたものに限定されるものではない。
[3 Modifications]
Although the embodiment of the present invention has been described above, the present invention is not limited to the above-described embodiment. Furthermore, the effects described in the present embodiment are merely a list of the most preferable effects resulting from the present invention, and the effects of the present invention are not limited to those described in the present embodiment.
〔3.1 変形例1〕
上記の実施形態において、機械学習装置10と障害解析装置20とを別体として示したがが、これには限定されない。例えば、機械学習装置10が障害解析装置20の筐体に組み込まれることにより、一体化されて実現される態様としてもよい。
3.1 Modification 1
In the above embodiment, the
〔3.2 変形例2〕
上記の実施形態において、第1障害判定部223が、発生しているであろう障害とその発生の確度を類推し、判定するとしたがこれには限定されない。例えば、第1障害判定部223に加えて、第2障害判定部224も、発生しているであろう障害に加えて、その確度を類推し、判定してもよい。更に、第2障害判定部224は、複数の障害の候補を、当該確度でソートした上で出力してもよい。
3.2 Modification 2
In the above embodiment, the first
〔3.3 変形例3〕
上記の実施形態において、確認事項出力部226は、ユーザに対する確認事項を出力するとしたが、これには限定されない。例えば、単に確認事項を出力するのみならず、ユーザからの確認結果を、障害解析装置20に入力する構成とし、当該入力結果に基づいて、障害候補に対応する確度を再計算してもよい。
3.3 Modification 3
In the above embodiment, the confirmation
障害解析システム100による障害解析方法は、ソフトウェアにより実現される。ソフトウェアによって実現される場合には、このソフトウェアを構成するプログラムが、コンピュータにインストールされる。また、これらのプログラムは、リムーバブルメディアに記録されてユーザに配布されてもよいし、ネットワークを介してユーザのコンピュータにダウンロードされることにより配布されてもよい。
The fault analysis method by the
10 機械学習装置
11 第1学習部
12 第2学習部
20 障害解析装置
21 記憶部
22 制御部
23 通信部
24 表示部
30 監視装置
40 端末装置
50 ネットワーク
100 障害解析システム
111 第1入力データ取得部
112 第1ラベル取得部
113 第1学習モデル構築部
114 第1学習モデル記憶部
121 第2入力データ取得部
122 第2ラベル取得部
123 第2学習モデル構築部
124 第2学習モデル記憶部
211 事前登録データベース
212 アラーム障害対応データベース
213 障害特性データベース
221 アラーム取得部
222 アラーム振分部
223 第1障害判定部
224 第2障害判定部
225 障害候補出力部
226 確認事項出力部
227 障害特定部
228 優先度出力部
229 障害復旧品出力部
230 所要移動時間出力部
LIST OF
Claims (4)
前記ネットワークの監視装置で発生している前記設備情報としてのアラームに係る情報を第1入力データとして取得する第1入力データ取得手段と、
前記アラームに対応する障害の判定結果を第1ラベルとして取得する第1ラベル取得手段と、
前記第1入力データと前記第1ラベルとの組を教師データとして教師あり学習を行うことにより、前記監視装置で発生しているアラームに対応する前記判定結果を生成するための第1学習モデルを構築する第1学習モデル構築手段と、
を備え、
前記通信設備としてのマイクロ波無線機からの出力波形に係る情報を第2入力データとして取得する第2入力データ取得手段と、
前記出力波形に対応する障害の判定結果を第2ラベルとして取得する第2ラベル取得手段と、
前記第2入力データと前記第2ラベルとの組を教師データとして教師あり学習を行うことにより、前記出力波形に対応する前記判定結果を生成するための第2学習モデルを構築する第2学習モデル構築手段と、
を更に備える機械学習装置。 A machine learning device that constructs a learning model for identifying faults in communication facilities or line facilities from facility information acquired through a network,
a first input data acquisition means for acquiring information related to an alarm occurring in a monitoring device of the network as the facility information as first input data;
a first label acquisition means for acquiring a result of a fault determination corresponding to the alarm as a first label;
a first learning model construction means for constructing a first learning model for generating the determination result corresponding to an alarm occurring in the monitoring device by performing supervised learning using a pair of the first input data and the first label as teacher data;
Equipped with
second input data acquiring means for acquiring information related to an output waveform from a microwave radio device serving as the communication equipment as second input data;
a second label acquiring means for acquiring a fault determination result corresponding to the output waveform as a second label;
a second learning model constructing means for constructing a second learning model for generating the determination result corresponding to the output waveform by performing supervised learning using a pair of the second input data and the second label as teacher data;
The machine learning device further comprises :
新たな前記アラームを取得するアラーム取得手段と、
前記アラーム取得手段によって取得されたアラームを、事前に登録されていたアラームと、事前に登録されていないアラームとに振り分けるアラーム振分手段と、
前記事前に登録されていないアラームと前記第1学習モデルとを用いて、前記障害の発生を判定する第1障害判定手段と、
を備える障害解析装置。 A fault analysis device using the first learning model constructed by the machine learning device according to claim 1 ,
an alarm acquisition means for acquiring the new alarm;
an alarm sorting means for sorting the alarms acquired by the alarm acquisition means into alarms that have been registered in advance and alarms that have not been registered in advance;
a first fault determination means for determining the occurrence of the fault by using the alarm not registered in advance and the first learning model;
A failure analysis device comprising:
前記障害の発生確度が100%ではない場合に、前記障害の発生確度を高めるための確認事項を出力する確認事項出力手段を更に備える、請求項2に記載の障害解析装置。 The first fault determination means determines the probability of occurrence of the fault in addition to the fault,
3. The fault analysis device according to claim 2 , further comprising a check item output unit that outputs a check item for increasing the probability of the fault occurring when the probability of the fault occurring is not 100%.
前記事前に登録されていないアラームのログが、前記マイクロ波無線機からの出力が閾値を超えたことを示す場合に、前記出力波形と前記第2学習モデルとを用いて、前記障害の発生を判定する第2障害判定手段と、
を備え、
前記第1障害判定手段は、前記事前に登録されていないアラームのログが、前記出力が閾値を超えたことを示さない場合に、前記事前に登録されていないアラームと前記第1学習モデルとを用いて、前記障害の発生を判定する、請求項2又は請求項3に記載の障害解析装置。 A fault analysis device using the second learning model constructed by the machine learning device according to claim 1 ,
a second fault determination means for determining the occurrence of a fault using the output waveform and the second learning model when the log of the alarm not registered in advance indicates that the output from the microwave radio device exceeds a threshold value;
Equipped with
The fault analysis device according to claim 2 or claim 3, wherein the first fault determination means determines the occurrence of the fault using the alarm that is not pre-registered and the first learning model when the log of the alarm that is not pre-registered does not indicate that the output exceeds a threshold value.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020215268A JP7600679B2 (en) | 2020-12-24 | 2020-12-24 | Machine learning device and failure analysis device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020215268A JP7600679B2 (en) | 2020-12-24 | 2020-12-24 | Machine learning device and failure analysis device |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2022100961A JP2022100961A (en) | 2022-07-06 |
| JP7600679B2 true JP7600679B2 (en) | 2024-12-17 |
Family
ID=82271358
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2020215268A Active JP7600679B2 (en) | 2020-12-24 | 2020-12-24 | Machine learning device and failure analysis device |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7600679B2 (en) |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2014164628A (en) | 2013-02-26 | 2014-09-08 | Nec Corp | Information processing device, information processing method, information processing program, integrated monitoring server and monitoring system |
| JP2016219962A (en) | 2015-05-18 | 2016-12-22 | Kddi株式会社 | Device for evaluating fault prediction result taking operation loss into account, system, program and method |
-
2020
- 2020-12-24 JP JP2020215268A patent/JP7600679B2/en active Active
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2014164628A (en) | 2013-02-26 | 2014-09-08 | Nec Corp | Information processing device, information processing method, information processing program, integrated monitoring server and monitoring system |
| JP2016219962A (en) | 2015-05-18 | 2016-12-22 | Kddi株式会社 | Device for evaluating fault prediction result taking operation loss into account, system, program and method |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2022100961A (en) | 2022-07-06 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR102648377B1 (en) | Intelligent integrated wiring board with network cable quality monitoring | |
| CN110321268B (en) | Alarm information processing method and device | |
| US9049105B1 (en) | Systems and methods for tracking and managing event records associated with network incidents | |
| CN105659528A (en) | Method and apparatus for realizing fault location | |
| CN113808725A (en) | Equipment early warning system and method | |
| US10990090B2 (en) | Apparatus and method for automatic detection and classification of industrial alarms | |
| CN111754123B (en) | Data monitoring method, device, computer equipment and storage medium | |
| CN103281461A (en) | Call center monitoring method, device and system | |
| CN108696396A (en) | A kind of monitoring alarm devices and methods therefor of distributed memory system | |
| CN104065526A (en) | Server fault alarming method and device thereof | |
| US11120037B2 (en) | Test data integration system and method thereof | |
| CN116300564A (en) | An automated monitoring operation and maintenance platform that supports cross-region and cross-cluster hybrid infrastructure | |
| CN115292123A (en) | System exception handling method and device, storage medium and electronic equipment | |
| CN110750427A (en) | Data center equipment inspection method and system | |
| JP7600679B2 (en) | Machine learning device and failure analysis device | |
| JP2010147804A (en) | Transmitting apparatus, and unit mounted on the same | |
| CN119690732B (en) | Positioning and troubleshooting system based on distributed architecture | |
| US20100214075A1 (en) | Apparatus and method for failure management of rfid middleware management system | |
| CN119723823A (en) | Device data monitoring method, device, electronic device and storage medium | |
| JP7525054B2 (en) | Estimation device, estimation method, and estimation program | |
| CN117909111A (en) | Method, device, equipment and storage medium for processing monitoring data | |
| US12047260B2 (en) | Systems and methods for network incident management | |
| CN115102838B (en) | Emergency processing method and device for server downtime risk and electronic equipment | |
| CN117376096A (en) | A fault warning method and device | |
| CN109815080A (en) | The 3 D monitoring method and device thereof of computer equipment |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20231207 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240807 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240924 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20241021 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20241105 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20241118 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7600679 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |