Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP3663196B2 - Supervisory control device - Google Patents
[go: Go Back, main page]

JP3663196B2 - Supervisory control device - Google Patents

Supervisory control device Download PDF

Info

Publication number
JP3663196B2
JP3663196B2 JP2002337666A JP2002337666A JP3663196B2 JP 3663196 B2 JP3663196 B2 JP 3663196B2 JP 2002337666 A JP2002337666 A JP 2002337666A JP 2002337666 A JP2002337666 A JP 2002337666A JP 3663196 B2 JP3663196 B2 JP 3663196B2
Authority
JP
Japan
Prior art keywords
communication
unit
package
standby
communication unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002337666A
Other languages
Japanese (ja)
Other versions
JP2003162455A (en
Inventor
徹治 山崎
光政 吉川
学 田辺
正光 古味
健 八手
英樹 山下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2002337666A priority Critical patent/JP3663196B2/en
Publication of JP2003162455A publication Critical patent/JP2003162455A/en
Application granted granted Critical
Publication of JP3663196B2 publication Critical patent/JP3663196B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、冗長構成通信経路を持つ装置の通信経路等の異常の監視を行う監視制御装置に関する。
【0002】
近年、通信サービスが多様化する中で、通信装置も大容量化・複雑化している。これに伴い、通信装置の信頼性の向上が求められている。このため、CPUと通信機能を持つLSIを搭載したCPUパッケージが、冗長構成をもつ通信用パッケージを介して配下パッケージと通信する装置においては、冗長構成をもつ通信用パッケージを監視制御することが必要とされる。
【0003】
図1はかかる装置構成を示す図である。図示のように、本装置では、CPUパッケージ4が現用系(運用系)/予備系(非運用系)の冗長構成を持つ通信用パッケージ51、52と通信線を介して接続され、各通信用パッケージ51、52は配下パッケージ61、62、63・・・とそれぞれ通信線を介して接続される。
【0004】
CPUパッケージ4はCPU(中央処理装置)41と通信機能を持つ通信LSI42とを搭載し、現用系/予備系の通信用パッケージ51、52を選択するセレクタ43を持つ。通信用パッケージ51、52それぞれは、CPUパッケージ4からのコマンドを各配下パッケージ61、62、63・・・に宛てて送信し、各配下パッケージ61、62、63・・・からの応答結果をCPUパッケージ4に送信する。配下パッケージ61、62、63・・・は、通信用パッケージ51または52からのコマンドに対して応答を返す機能を持ち、通信用パッケージを選択するセレクタ611、621、631・・・を持つ。CPUパッケージ4と配下パッケージ61、62、63・・・は冗長構成を持つ通信用パッケージ51、52の一方をセレクタにて選択し、選択している系を現用系(運用系とも称する)、選択していない系を予備系(非運用系とも称する)とする。
【0005】
この通信用パッケージ51、52の冗長切替は、現用系・予備系の通信用パッケージ51、52の故障の有無を見て、現用系が故障かつ予備系が正常な場合にCPUパッケージ4のセレクタ43と配下パッケージ61、62、63・・・のセレクタ611、621、631・・・によって切替を行う。例えば0系の通信用パッケージ51が現用系の場合、図2の通信ルートをとり、冗長切替が発生すると、図3の通信ルートをとる。
【0006】
ただし、例えば図2に示すように、0系の通信用パッケージ51が現用系の場合、CPUパッケージ4のセレクタ43は現用系通信用パッケージ51を向いているため、CPUパッケージ4からはCPUパッケージ4・通信用パッケージ52間の通信パスを通して直接に予備系通信用パッケージ52の故障状態を検知することができず、CPUパッケージ4は現用系の通信用パッケージ51を介して通信した予備系通信用パッケージ52への通信結果から予備系通信用パッケージ52の故障状態を判断する。
【0007】
この従来の通信用パッケージの冗長切替では、例えば通信用パッケージ51が現用系の場合、CPUパッケージ4・予備系通信用パッケージ52間の通信パスの故障があっても、CPUパッケージ4から現用系通信用パッケージ51を介しての予備系通信用パッケージ52への通信には何の異常もないため、予備系通信用パッケージ52の故障(CPUパッケージ4・通信用パッケージ52間の通信パス故障)はCPUパッケージ4には見えない。
【0008】
この結果、現用系通信用パッケージ51に何らかの故障があった場合、予備系は正常と判断しているので、通信用パッケージの切替が発生する。すると、初めてCPUパッケージ4・通信用パッケージ52間の故障が分かる。しかし、この時点では、既に両系の通信用パッケージ51、52に故障があることになり、切替動作自体が無駄であり、またその配下パッケージ61、62、63・・・の通信の正常性は全く期待できない。また、予備系の通信用パッケージ52と各配下パッケージ61、62、63・・・間の通信パスに異常があった場合にも、予備系への切替が行われた後でなければそれを発見することができない。
【0009】
また、通信用パッケージの冗長切替によって故障状態が見えなくなる通信パスが生ずることもある。例えば0系の通信用パッケージ51が現用系の場合、図2の通信ルートをとる。この時、0系通信用パッケージ51・配下パッケージ61間の通信パスに異常があったとすると、通信用パッケージの冗長切替が発生するが、切替後は0系通信用パッケージ51・配下パッケージ61間の通信パスは使用されないので、故障状態を監視することができない。
【0010】
したがって本発明は、予めCPUパッケージ・予備通信用パッケージ間の通信パスの正常性を確認できるようにして監視制御性能を向上させることを目的とする。
【0011】
【問題点を解決するための手段】
前述の問題点を解決するために、本発明においては、一つの形態として、CPUを搭載した主ユニットと冗長構成を持つ通信用ユニットと該通信用ユニット配下の配下ユニットを備え、主ユニットは現用系通信用ユニットに障害がある時に予備系通信用ユニットに冗長切替を行う装置の監視制御装置であって、該主ユニットは、現用系通信用ユニットから予備系通信用ユニットに通信経路を切り替えてコマンドを送出し、該予備系通信用ユニットからの応答を検査することで主ユニット・予備系通信用ユニット間の通信経路の異常の有無を検査し、その後に元の現用系通信ユニットに通信経路を戻すリバース処理を周期的に行い、予備系通信用ユニットが実装された直後の動作が不安定な状態の場合に行うリバース処理の頻度よりも、それ以外の安定した状態の場合に行うリバース処理の頻度を低くするように構成した監視制御装置が提供される。
このようにリバース処理を行うことにより、予め主ユニット・予備系通信用ユニット間の通信経路の正常性を確認することができるので、監視制御性能の向上が図られる。また、上記リバース処理の頻度を、予備系通信用ユニットが実装された直後の動作が不安定な状態の場合よりも、それ以外の安定した状態の場合に低くするようにしたので、監視制御性能を維持しつつ無駄な切替を防止することができる。
【0012】
上記の監視制御装置では、上記主ユニットは上記リバース処理を行うにあたり、他の割込みをマスクしてリバース処理の優先度を最も高くするように構成できる。このようにすることで、リバース処理よりも優先度の高い処理が割り込んでくることがある装置構成の場合、リバース処理中に他のコマンドが飛ばないように、処理の優先度を最も高くすることで、通信の異常動作を防止できる。
【0013】
また上記の監視制御装置では、現用系通信用ユニットの故障により予備系通信ユニットに冗長切替を行う前に上記リバース処理を行って主ユニット・予備系通信用ユニット間の現在の通信経路の異常の有無を確認するように構成できる。このようにすることで、リバース処理の頻度を低くして監視制御動作性能を維持しつつ、無駄な切替を防止することができる。
【0015】
また上記の監視制御装置では、予備系通信用ユニットに既に何らかの故障がある場合は、リバース処理を行わないように構成できる。このようにすることで、リバース処理の頻度を低くして監視制御動作性能を維持することができる。
【0016】
また上記の監視制御装置では、冗長切替前に現用系であった通信用ユニット・配下ユニット間の通信パス異常の情報は、配下ユニットが未実装になるまで通信パス異常テーブルに保持するように構成できる。このようにすることで、切替前に現用系であった通信用ユニット・配下ユニット間の通信パス異常は、切替が発生すると使用しない通信パスとなるため、故障状態の監視を行っても配下ユニットとの通信は正常になるので、故障状態を配下ユニットが未実装になるまで保持することによって、通信用ユニットの切替の有無に関わらず、故障として扱えるようになる。
【0017】
また上記の監視制御装置では、配下ユニットの故障の有無を判断する際には、通信用ユニットへのコマンドに対する応答が正常かつ配下ユニットへのコマンドに対する応答が異常な場合のみ配下ユニットの故障とし、通信用ユニットへのコマンドに対する応答が異常な場合は、上記通信パス異常テーブルに上記通信パス異常の情報が保持されているとき以外は故障としないことで、故障箇所を限定するよう構成できる。このようにすることで、故障箇所を限定することができる。
【0018】
【発明の実施の形態】
以下、本発明の実施例を説明する。
実施例装置の装置構成は図1に示したものとする。いま0系の通信用パッケージ51を現用系として装置が運用されているものとする。CPUパッケージ4は現用系・予備系の通信用パッケージ51、52の故障の有無を監視する際に、CPUパッケージ4が現用系通信パッケージ51と非通信中にCPUパッケージ4のセレクタ43を予備系通信用パッケージ52の方へ一時的に切り替え、予備系通信用パッケージ52へコマンドを送信する。このコマンドに対して予備系通信用パッケージ52から応答が返って来ると、この応答を解析することで、CPUパッケージ4・予備系通信用パッケージ52間の通信パスの異常の有無を判別する。この処理の後、再びCPUパッケージ4のセレクタ43を現用系通信用パッケージ51の方へ戻す。以降、この処理をリバース処理と呼ぶ。
【0019】
図4はリバース処理の処理手順を示すフローチャート、図6はCPUパッケージ4が周期的に実行する装置監視制御処理手順のフローチャートである。このリバース処理は装置監視制御処理手順のなかで実行される。以下、0系の通信用パッケージ51を現用系とした場合を例にして各処理を説明する。
【0020】
図4のリバース処理は、予備系通信用パッケージが正常な場合のみ行う。よって、予備系通信パッケージ52が正常かを判定する(ステップS1)。正常ならば他の優先度の高い処理の割込みをマスクする割込みマスクを行い(ステップS2)、CPUパッケージ4のセレクタ43を予備系側に切り替え(ステップS3)、予備系通信用パッケージ52にコマンドを送信し(ステップS4)、応答があればその応答を解析する(ステップS5)。解析の結果、応答が正常か異常かを判定し(ステップS6)、異常であればリバース故障フラグに“1”を立てる(ステップS7)。その後、セレクタ43を元の現用系側に切り替え(ステップS8)、割込みマスクを解除して(ステップS9)、リバース処理を終える。
【0021】
このようにリバース処理では、処理の最初と最後に他の優先度の高い処理の割込みをマスクする処理と、マスクを解除する処理を行う。このようにマスク処理を行うのは以下の理由による。すなわち、セレクタ43が予備系通信用パッケージ52を選択している間に、他の処理が割り込んで入ってくることがあり得るような処理構成の場合は、割り込んで来た処理に応答して直ちに配下パッケージ61、62、63・・・にコマンドを送信すると、通常の運用時におけるCPUパッケージ4・現用系通信用パッケージ51・配下パッケージ61、62、63・・・という正規の通信ルートとは異なる通信ルート(すなわち予備系通信用パッケージ52を通る通信ルート)を通って配下パッケージに通信してしまい、問題を生じる場合がある。また、セレクタ43を動作している時に割り込み処理が入ると、その際の通信の正常性は保証できない。これを避けるために、マスク処理を行うことによって、セレクタ43の反転動作を行う処理を最も優先度の高い処理としている。
【0022】
次に図6の装置監視制御処理フローについて説明する。CPUパッケージ4はCPUパッケージ4・現用系通信用パッケージ51を介して通信用パッケージ51、52の故障情報を収集しており(ステップS11)、この故障情報とリバース処理で求めた予備系通信用パッケージ52の通信パス異常の有無との論理和をとって現用系と予備系の故障状態とする(ステップS12)。すなわち現用系は現用系側から収集された故障情報に基づいて異常が検知され、予備系はリバース処理の結果と現用系を介しての故障情報収集の結果のいずれか一方が異常の場合には異常とされる。
【0023】
ついで、現用系/予備系の切り替えが必要かを判定するために、現用系に故障があるかを調べるとともに予備系に故障がないかを調べる。そして現用系が故障かつ予備系が正常なら図4のリバース処理を行う(ステップS13)。ここで行うリバース処理は通信パッケージの運用を現在の現用系通信用パッケージ51から予備系通信用パッケージ52に切り替える前に、切替先の予備系が正常であるかを再度確認し信頼性を上げるためである。リバース処理の結果、通信パスに異常がなければ(ステップS15)、通信用パッケージの切替処理を行う(ステップS16)。予備系通信用パッケージ52に既に何らかの故障がある場合は、リバース処理を行っても無意味であるからリバース処理を行わない(ステップS13)。
【0024】
ついで、現用系の通信パッケージ51(現用系/予備系の切替が行われた場合には切替後に現用系となった通信用パッケージ52、以下同じ)を介して配下パッケージ61、62、63・・・の監視制御処理を行う(ステップS17)。まず現用系通信パッケージ51に通信パス異常があるかを調べ(ステップS18)、異常がなければ次いで配下パッケージ61、62、63・・・の通信パスに異常があるかを調べる。そして現用系通信用パッケージ51の通信パス異常なしかつ配下パッケージに通信パス異常ありの場合にのみ、図5に示した通信パス異常テーブルに異常ありを設定する(ステップS20)。一方、現用系通信用パッケージ51に通信パス異常がある場合にはそれに基づいて配下パッケージも異常となるので、通信パス異常テーブルの設定は行わない。
【0025】
この通信パス異常テーブルは配下パッケージ61、62、63・・・にそれぞれ対応した記憶領域を持ち、その記憶領域に各配下パッケージ61、62、63・・・の通信パスの異常/正常のデータを記入したものである。この通信パス異常テーブルに異常ありとなっているものは配下パッケージの故障として扱う。
【0026】
この通信パス異常テーブルは、一旦異常ありに設定されると、その異常ありのパッケージが修理等のために抜き取られて未実装になるまでクリアしない。すなわち、配下パッケージ61、62、63・・・が実装から未実装になったものがないかを調べ(ステップS21)、未実装になったものがあれば、通信パス異常テーブルのその配下パッケージに該当する領域のデータをクリアする(ステップS22)。
【0027】
このように取り扱うのは以下の理由による。すなわち現用系通信用パッケージ51・配下パッケージ61、62、63・・・間の通信パス異常は配下パッケージ61、62、63・・・への通信で見えるが、予備系通信用パッケージ52・配下パッケージ61、62、63・・・間の通信パス異常は見えないので、現用系通信用パッケージ51配下の故障は、通信用パッケージの冗長切替が発生しても故障状態を保持し、配下パッケージが未実装になるまで故障状態を保持する。
【0028】
また、配下パッケージの故障の有無を判断する際(図6のステップS17以降)には、通信用パッケージへのコマンドに対する応答が正常(ステップS18で「NO」)かつ配下パッケージへのコマンドに対する応答が異常な場合(ステップS19で「YES」)のみ配下パッケージの故障とし、通信用パッケージへのコマンドに対する応答が異常な場合(ステップS18で「YES」)は、この通信用パッケージが異常になる前に配下パッケージの通信パスに異常があった(すなわち、通信パス異常テーブルに配下パッケージの通信パス異常が記入されている)場合にのみ配下パッケージの故障として扱い、それ以外の場合は配下パッケージの故障としないことで、故障箇所を限定する。
【0029】
次に、フローチャート中に3)で示す部分では、予備系が交換等により未実装から実装になった直後は装置監視制御処理フローと同一周期で5回リバース処理を行い、その後は装置監視制御処理の10周期に1回だけの割合でリバース処理を行う。
【0030】
このように扱う理由は以下の通りである。すなわち、リバース処理は、現用系・予備系の通信用パッケージが正常な場合は、本来無駄な処理であるため、処理の頻度が少ない方が全体の監視制御能力が高くなる。そこで、予備系の通信用パッケージが実装された直後の、パッケージの状態が不安定な場合は、リバース処理の頻度を高くし、安定な状態の場合は処理の頻度を低くする。この結果、安定な状態に入った後は予備系通信用パッケージの故障検出率が低下するので、前述したように予備系の通信用パッケージを現用系に切り替えようとする前には必ずリバース処理を行うようにする(ステップS14)。
【0031】
この3)部分について詳細に説明する。予備系通信用パッケージ52が修理等で抜き取られて未実装となった後に新たな予備系通信用パッケージ52が実装された場合、その実装されたことが判定されると(ステップS23)、リバースカウンタA=4、リバースカウンタB=9、リバース故障フラグ=0にそれぞれ初期設定する(ステップS24)。ここでリバースカウンタAは予備系通信用パッケージ実装直後に行うリバース処理の頻度を管理するカウンタであり、リバースカウンタBは実装後安定な状態に入ってからのリバース処理の頻度を管理するカウンタである。
【0032】
まず、リバースカウンタAが、A≧0かを判定し(ステップS25)、肯定である場合にはリバース処理を行って(ステップS26)、リバースカウンタAの内容を一つデクリメントする(ステップS27)。従って、予備系通信用パッケージ52を実装後に装置監視制御処理フローが5回繰り返されると、リバースカウンタAは、A<0となるので、その後はリバース処理は行われない。
【0033】
ついでリバースカウンタB=0かを判定し(ステップS28)、否定の時にはリバースカウンタBの内容を一つデクリメントする(ステップS31)。B=0の時にはリバース処理を行って(ステップS29)、リバースカウンタBにB=9を再設定する(ステップS30)。よって、予備系通信用パッケージ52を実装後は装置監視制御処理フローが10回繰り返される毎に1回、リバース処理が実行される。
【0034】
以上の処理で故障があるパッケージが発見されたら、その故障があるパッケージに対しては外部に見えるランプを点灯することで保守者に故障があることを知らせる(ステップS32)。
【0035】
このように本実施例装置では、本来なら切り替えてみなければ分からない、CPUパッケージ・予備系通信用パッケージ間の通信パス異常の有無を予め知ることができる。リバース処理は、何の異常も無ければ無駄な処理であるため、監視制御処理の毎周期リバース処理を行うのに比べて、効果が薄れないようにリバース処理の頻度を低くすることができる。通信パス異常があるパッケージの故障状態を該当パッケージが未実装になるまで保持することにより、切り替えによって故障が回復したように見えることを防止することができる。配下パッケージの通信パス異常の条件を限定することによって、故障箇所を限定することができる。
【0036】
【発明の効果】
以上説明したように、本発明によれば、リバース処理を行うことにより、予め主ユニット・予備系通信用ユニット間の通信パスの正常性を知ることができ、予備系通信用ユニットを交換する等の対策をとることが可能なため、保守上の効果が大きい。また、リバース処理による監視制御性能の低下を極力防ぐことができる。また、故障状態の保持、故障箇所を限定することにより、的確な保守動作を促すことができる。
【図面の簡単な説明】
【図1】本発明における監視制御装置の実施例構成を示す図である。
【図2】本発明の実施例装置における0系を現用系とした場合の通信パスを説明する図である。
【図3】本発明の実施例装置における1系を現用系とした場合の通信パスを説明する図である。
【図4】本発明の実施例装置におけるリバース処理の手順を示すフローチャートである。
【図5】本発明の実施例装置における通信パス異常テーブルの構成例を示す図である。
【図6】本発明における装置監視制御処理の手順を示すフローチャートである。
【符号の説明】
4 CPUパッケージ
41 CPU
42 通信LSI
43 セレクタ
51、52 通信用パッケージ
61、62、63・・・ 配下パッケージ
611、621、631 セレクタ
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a monitoring control apparatus that monitors an abnormality of a communication path or the like of a device having a redundant configuration communication path.
[0002]
In recent years, as communication services have been diversified, communication devices have become larger in capacity and complicated. In connection with this, the improvement of the reliability of a communication apparatus is calculated | required. Therefore, it is necessary to monitor and control a communication package having a redundant configuration in a device in which a CPU package having an LSI having a communication function with the CPU communicates with a subordinate package via a communication package having a redundant configuration. It is said.
[0003]
FIG. 1 is a diagram showing such a device configuration. As shown in the figure, in this apparatus, the CPU package 4 is connected via communication lines to communication packages 51 and 52 having a redundant configuration of the active system (active system) / standby system (non-operating system). The packages 51 and 52 are connected to the subordinate packages 61, 62, 63,.
[0004]
The CPU package 4 includes a CPU (central processing unit) 41 and a communication LSI 42 having a communication function, and has a selector 43 for selecting the active / standby communication packages 51 and 52. Each of the communication packages 51 and 52 transmits a command from the CPU package 4 to each subordinate package 61, 62, 63..., And the response result from each subordinate package 61, 62, 63. Send to package 4. The subordinate packages 61, 62, 63,... Have a function of returning a response to the command from the communication package 51 or 52, and have selectors 611, 621, 631,. The CPU package 4 and the subordinate packages 61, 62, 63... Select one of the communication packages 51, 52 having a redundant configuration with a selector, and select the selected system as an active system (also referred to as an operational system). A system that is not used is a standby system (also referred to as a non-operational system).
[0005]
The redundancy switching of the communication packages 51 and 52 is performed by checking the presence / absence of a failure in the active / standby communication packages 51 and 52, and selecting the selector 43 of the CPU package 4 when the active system is faulty and the standby system is normal. Are switched by selectors 611, 621, 631... Of subordinate packages 61, 62, 63. For example, when the 0-system communication package 51 is the active system, the communication route of FIG. 2 is taken, and when the redundancy switching occurs, the communication route of FIG. 3 is taken.
[0006]
However, for example, as shown in FIG. 2, when the 0-system communication package 51 is the active system, the selector 43 of the CPU package 4 faces the active communication package 51. The failure state of the standby communication package 52 cannot be detected directly through the communication path between the communication packages 52, and the CPU package 4 communicates with the standby communication package 51 via the active communication package 51. The failure state of the standby communication package 52 is determined from the communication result to 52.
[0007]
In the conventional redundant switching of the communication package, for example, when the communication package 51 is the active system, even if there is a failure in the communication path between the CPU package 4 and the standby system communication package 52, the active communication is performed from the CPU package 4. Since there is no abnormality in the communication to the standby communication package 52 via the communication package 51, the failure of the standby communication package 52 (the communication path failure between the CPU package 4 and the communication package 52) is the CPU. Invisible on package 4.
[0008]
As a result, when there is some failure in the active communication package 51, the standby system is determined to be normal, and the communication package is switched. Then, the failure between the CPU package 4 and the communication package 52 is known for the first time. However, at this point, the communication packages 51 and 52 of both systems have already failed, the switching operation itself is useless, and the normality of the communication of the subordinate packages 61, 62, 63. I can't expect anything. In addition, even if there is an abnormality in the communication path between the standby communication package 52 and each of the subordinate packages 61, 62, 63... Can not do it.
[0009]
In addition, there may be a communication path in which a failure state is not visible due to redundant switching of communication packages. For example, when the 0-system communication package 51 is the active system, the communication route of FIG. 2 is taken. At this time, if there is an abnormality in the communication path between the 0-system communication package 51 and the subordinate package 61, redundant switching of the communication package occurs. After the switching, the communication between the 0-system communication package 51 and the subordinate package 61 occurs. Since the communication path is not used, the failure state cannot be monitored.
[0010]
Therefore, an object of the present invention is to improve the monitoring control performance by allowing the normality of the communication path between the CPU package and the standby communication package to be confirmed in advance.
[0011]
[Means for solving problems]
In order to solve the above-mentioned problems, in the present invention, as one form, a main unit equipped with a CPU, a communication unit having a redundant configuration, and a subordinate unit under the communication unit are provided. A supervisory control device for switching redundantly to a standby communication unit when there is a failure in the standby communication unit, the main unit switching the communication path from the active communication unit to the standby communication unit A command is sent and the response from the standby communication unit is inspected to check whether there is an abnormality in the communication path between the main unit and the standby communication unit, and then the communication path to the original working communication unit There periodically row reverse process of returning the, than the frequency of the reverse processing operation immediately after the standby system communication unit is mounted is performed when the unstable state, it than Configuration the monitoring control device is provided performed when the stable state so as to reduce the frequency of the reverse process.
By performing the reverse processing in this way, the normality of the communication path between the main unit and the standby communication unit can be confirmed in advance, so that the monitoring control performance can be improved. In addition, since the frequency of the reverse processing is set to be lower in the other stable state than in the case where the operation immediately after the standby communication unit is mounted is unstable, the monitoring control performance It is possible to prevent unnecessary switching while maintaining the above.
[0012]
In the above monitoring and control apparatus, the main unit can be configured to mask the other interrupts and perform the highest priority in the reverse process when performing the reverse process. In this way, in the case of a device configuration in which processing with higher priority than reverse processing may interrupt, the highest processing priority is set so that other commands do not skip during reverse processing. Thus, abnormal communication operation can be prevented.
[0013]
The above supervisory control device, current communication path between the reverse-process the primarily engaged unit replacement system communication unit before performing the redundant switch in the standby system communication unit due to a failure of the current for system communication unit It can be configured to check whether there is any abnormality. By doing so, it is possible to prevent unnecessary switching while reducing the frequency of reverse processing and maintaining the monitoring control operation performance.
[0015]
Further, the above monitoring control apparatus can be configured not to perform the reverse process when the standby communication unit already has some failure. By doing in this way, the frequency of reverse processing can be lowered and the monitoring control operation performance can be maintained.
[0016]
In addition, the above monitoring and control device is configured so that information on the communication path error between the communication unit and subordinate unit that was the active system before redundancy switching is held in the communication path error table until the subordinate unit is not installed. it can. By doing this, a communication path error between the communication unit and subordinate unit that was the active system before switching becomes a communication path that is not used when switching occurs, so the subordinate unit can be monitored even if the failure status is monitored Therefore, by maintaining the failure state until the subordinate unit is not mounted, it can be handled as a failure regardless of whether or not the communication unit is switched.
[0017]
In the above monitoring and control apparatus, when determining whether or not the subordinate unit has a failure , the subordinate unit has a failure only when the response to the command to the communication unit is normal and the response to the command to the subordinate unit is abnormal. When the response to the command to the communication unit is abnormal, the failure location can be limited by not making a failure except when the communication path abnormality information is held in the communication path abnormality table . By doing in this way, a failure location can be limited.
[0018]
DETAILED DESCRIPTION OF THE INVENTION
Examples of the present invention will be described below.
The apparatus configuration of the embodiment apparatus is as shown in FIG. It is assumed that the apparatus is now operated with the 0-system communication package 51 as the active system. When the CPU package 4 monitors the presence / absence of a failure in the active / standby communication packages 51, 52, the selector 43 of the CPU package 4 is in standby communication while the CPU package 4 is not communicating with the active communication package 51. The temporary package 52 is temporarily switched, and a command is transmitted to the standby communication package 52. When a response is returned from the standby communication package 52 to this command, the response is analyzed to determine whether there is an abnormality in the communication path between the CPU package 4 and the standby communication package 52. After this processing, the selector 43 of the CPU package 4 is returned to the active communication package 51 again. Hereinafter, this processing is referred to as reverse processing.
[0019]
FIG. 4 is a flowchart showing a processing procedure of reverse processing, and FIG. 6 is a flowchart of a device monitoring control processing procedure periodically executed by the CPU package 4. This reverse processing is executed in the apparatus monitoring control processing procedure. Each process will be described below by taking as an example the case where the 0-system communication package 51 is the active system.
[0020]
The reverse processing of FIG. 4 is performed only when the standby communication package is normal. Therefore, it is determined whether the standby communication package 52 is normal (step S1). If normal, an interrupt mask for masking interrupts of other high-priority processes is performed (step S2), the selector 43 of the CPU package 4 is switched to the standby side (step S3), and a command is sent to the standby communication package 52. It transmits (step S4), and if there is a response, the response is analyzed (step S5). As a result of the analysis, it is determined whether the response is normal or abnormal (step S6). If the response is abnormal, the reverse failure flag is set to “1” (step S7). Thereafter, the selector 43 is switched to the original working side (step S8), the interrupt mask is released (step S9), and the reverse process is finished.
[0021]
As described above, in the reverse process, a process for masking interrupts of other high priority processes and a process for canceling the mask are performed at the beginning and end of the process. The mask process is performed in this way for the following reason. That is, in the case of a processing configuration in which another process may interrupt and enter while the selector 43 selects the standby communication package 52, immediately in response to the interrupting process. When a command is transmitted to the subordinate packages 61, 62, 63..., It differs from the normal communication route of the CPU package 4, the active communication package 51, the subordinate packages 61, 62, 63. There is a case where a problem is caused by communicating with the subordinate package through a communication route (that is, a communication route passing through the standby communication package 52). Also, if interrupt processing is entered when the selector 43 is operating, the normality of communication at that time cannot be guaranteed. In order to avoid this, the process of performing the inversion operation of the selector 43 is made the process with the highest priority by performing the mask process.
[0022]
Next, the apparatus monitoring control process flow of FIG. 6 will be described. The CPU package 4 collects failure information of the communication packages 51 and 52 via the CPU package 4 and the active communication package 51 (step S11). The failure communication information and the standby communication package obtained by the reverse processing are collected. A logical sum of the presence / absence of communication path abnormality 52 is taken to make a failure state between the active system and the standby system (step S12). In other words, if the abnormality is detected in the active system based on the failure information collected from the active system side, the backup system has an error when either the result of reverse processing or the result of failure information collection through the active system is abnormal. It is considered abnormal.
[0023]
Next, in order to determine whether it is necessary to switch between the active system and the standby system, it is checked whether there is a failure in the active system and whether there is a failure in the standby system. If the active system is faulty and the standby system is normal, the reverse process of FIG. 4 is performed (step S13). In the reverse processing performed here, before switching the operation of the communication package from the current active communication package 51 to the standby communication package 52, the switching destination standby system is confirmed again to increase the reliability. It is. If there is no abnormality in the communication path as a result of the reverse process (step S15), the communication package switching process is performed (step S16). If there is any failure in the standby communication package 52, the reverse process is not performed because the reverse process is meaningless (step S13).
[0024]
Then, the subordinate packages 61, 62, 63,... Are connected via the active communication package 51 (if the active / standby system is switched, the communication package 52 becomes the active system after switching, the same applies hereinafter). The monitoring control process is performed (step S17). First, it is checked whether or not there is a communication path abnormality in the active communication package 51 (step S18). If there is no abnormality, then it is checked whether there is an abnormality in the communication paths of the subordinate packages 61, 62, 63. Only when there is no communication path abnormality in the active communication package 51 and there is a communication path abnormality in the subordinate package, an abnormality is set in the communication path abnormality table shown in FIG. 5 (step S20). On the other hand, if there is a communication path abnormality in the active communication package 51, the subordinate package also becomes abnormal based on the communication path abnormality, so the communication path abnormality table is not set.
[0025]
This communication path abnormality table has storage areas respectively corresponding to the subordinate packages 61, 62, 63..., And the communication path abnormality / normal data of each subordinate package 61, 62, 63. It is what you entered. An abnormality in the communication path abnormality table is treated as a subordinate package failure.
[0026]
Once the communication path abnormality table is set as having an abnormality, the communication path abnormality table is not cleared until the abnormal package is removed for repair or the like and is not mounted. That is, the subordinate packages 61, 62, 63... Are checked for any unmounted packages (step S21). If any of the subordinate packages 61, 62, 63. The data in the corresponding area is cleared (step S22).
[0027]
This is handled for the following reason. That is, an abnormal communication path between the active communication package 51 and the subordinate packages 61, 62, 63... Can be seen in communication with the subordinate packages 61, 62, 63. 61, 62, 63... Is not visible, so a failure under the active communication package 51 maintains the failure state even when a redundant switching of the communication package occurs. The fault state is maintained until mounting.
[0028]
When determining whether there is a failure in the subordinate package (after step S17 in FIG. 6), the response to the command to the communication package is normal (“NO” in step S18), and the response to the command to the subordinate package is received. If it is abnormal (“YES” in step S19), it is determined that the subordinate package has failed. If the response to the command to the communication package is abnormal (“YES” in step S18) , before this communication package becomes abnormal It is treated as a subordinate package failure only if there is an error in the subordinate package communication path (that is, the subordinate package communication path error is entered in the communication path error table). By not doing so, the failure location is limited.
[0029]
Next, in the part indicated by 3) in the flowchart, immediately after the standby system is replaced from unmounted by replacement, etc., reverse processing is performed five times at the same cycle as the device monitoring control processing flow, and thereafter the device monitoring control processing is performed. Reverse processing is performed at a rate of once every 10 cycles.
[0030]
The reason for handling in this way is as follows. In other words, the reverse processing is essentially useless processing when the active and standby communication packages are normal, and therefore, the overall monitoring control capability is higher when the processing frequency is low. Therefore, the frequency of reverse processing is increased when the state of the package is unstable immediately after the standby communication package is mounted, and the frequency of processing is decreased when the package is stable. As a result, the failure detection rate of the standby communication package decreases after entering the stable state, so as described above, the reverse process must be performed before attempting to switch the standby communication package to the active system. This is performed (step S14).
[0031]
The part 3) will be described in detail. If the standby system communication package 52 is mounted a new standby system communications package 52 after a withdrawn by not implemented in the repair or the like, when it is its implementation is determined (step S 23), Reverse Counter A = 4, reverse counter B = 9, and reverse failure flag = 0 are respectively initialized (step S24). Here, the reverse counter A is a counter that manages the frequency of reverse processing performed immediately after mounting of the standby communication package, and the reverse counter B is a counter that manages the frequency of reverse processing after entering a stable state after mounting. .
[0032]
First, it is determined whether the reverse counter A is A ≧ 0 (step S25) . If the result is affirmative, a reverse process is performed (step S26), and the content of the reverse counter A is decremented by one (step S27) . Accordingly, when the apparatus monitoring control process flow is repeated five times after the standby communication package 52 is mounted, the reverse counter A becomes A <0, and thereafter no reverse process is performed.
[0033]
Next, it is determined whether or not the reverse counter B = 0 (step S28). If the determination is negative, the content of the reverse counter B is decremented by one (step S31). When B = 0, reverse processing is performed (step S29), and B = 9 is reset in the reverse counter B (step S30). Therefore, after the standby communication package 52 is mounted, the reverse process is executed once every time the apparatus monitoring control process flow is repeated 10 times.
[0034]
When a package having a failure is found by the above processing, the maintenance person is informed of the failure by turning on a lamp that is visible to the outside of the package having the failure (step S32).
[0035]
As described above, in the apparatus according to the present embodiment, it is possible to know in advance whether there is an abnormality in the communication path between the CPU package and the standby communication package, which cannot be known unless switching is performed. Since the reverse process is a useless process if there is no abnormality, the frequency of the reverse process can be reduced so that the effect is not reduced compared to the case where the reverse process is performed every cycle of the monitoring control process. By holding the failure state of a package having a communication path abnormality until the corresponding package is not mounted, it is possible to prevent the failure from appearing to be recovered by switching. By limiting the conditions of the communication path abnormality of the subordinate package, the failure location can be limited.
[0036]
【The invention's effect】
As described above, according to the present invention, by performing the reverse process, the normality of the communication path between the main unit and the standby communication unit can be known in advance, and the standby communication unit is replaced. Because it is possible to take this measure, the effect on maintenance is great. Further, it is possible to prevent the deterioration of the monitoring control performance due to the reverse process as much as possible. Moreover, by maintaining the failure state and limiting the failure location, it is possible to promote an accurate maintenance operation.
[Brief description of the drawings]
FIG. 1 is a diagram showing a configuration of an embodiment of a monitoring control apparatus according to the present invention.
FIG. 2 is a diagram for explaining a communication path when the 0 system in the embodiment apparatus of the present invention is the active system.
FIG. 3 is a diagram illustrating a communication path when one system in the apparatus according to the embodiment of the present invention is an active system.
FIG. 4 is a flowchart showing a procedure of reverse processing in the embodiment apparatus of the present invention.
FIG. 5 is a diagram showing a configuration example of a communication path abnormality table in the embodiment apparatus of the present invention.
FIG. 6 is a flowchart showing a procedure of apparatus monitoring control processing in the present invention.
[Explanation of symbols]
4 CPU package 41 CPU
42 Communication LSI
43 Selector 51, 52 Communication package 61, 62, 63 ... Subordinate package 611, 621, 631 Selector

Claims (6)

主ユニットと冗長構成を持つ通信用ユニットと該通信用ユニット配下の配下ユニットを備え、主ユニットは現用系通信用ユニットに障害がある時に予備系通信用ユニットに冗長切替を行う装置の監視制御装置であって、
該主ユニットは、現用系通信用ユニットから予備系通信用ユニットに通信経路を切り替えてコマンドを送出し、該予備系通信用ユニットからの応答を検査することで主ユニット・予備系通信用ユニット間の通信経路の異常の有無を監視し、その後に元の現用系通信ユニットに通信経路を戻すリバース処理を周期的に行い、
予備系通信用ユニットが実装された直後の動作が不安定な状態の場合に行うリバース処理の頻度よりも、それ以外の安定した状態の場合に行うリバース処理の頻度を低くするように構成した監視制御装置。
A monitoring control device for a device comprising a communication unit having a redundant configuration with a main unit and a subordinate unit under the communication unit, wherein the main unit performs redundant switching to the standby communication unit when there is a failure in the active communication unit Because
The main unit switches the communication path from the active communication unit to the standby communication unit, sends a command, and checks the response from the standby communication unit to check the response between the main unit and the standby communication unit. the presence or absence of an abnormality monitoring communication path, then have periodically row reverse process of returning a communication path based on the working communication unit,
Monitoring configured so that the frequency of reverse processing performed in other stable states is lower than the frequency of reverse processing performed when the operation immediately after the standby communication unit is mounted is unstable. Control device.
上記主ユニットは上記リバース処理を行うにあたり、他の割込みをマスクしてリバース処理の優先度を最も高くするように構成した請求項1記載の監視制御装置。  2. The monitoring control apparatus according to claim 1, wherein the main unit is configured to mask the other interrupts and to make the priority of the reverse processing highest when performing the reverse processing. 用系通信用ユニットの故障により予備系通信ユニットに冗長切替を行う前に上記リバース処理を行って主ユニット・予備系通信用ユニット間の現在の通信経路の異常の有無を確認するように構成した請求項1または2記載の監視制御装置。To confirm the presence or absence of abnormality of the current communication path between the reverse-process the primarily engaged unit replacement system communication unit before performing the redundant switch in the standby system communication unit due to a failure of the current use system communication unit The monitoring and control device according to claim 1 or 2 configured as described above. 予備系通信用ユニットに既に何らかの故障がある場合は、リバース処理を行わないように構成した請求項1〜3のいずれかに記載の監視制御装置。The monitoring control device according to any one of claims 1 to 3 , wherein reverse processing is not performed when the standby communication unit already has some failure. 冗長切替前に現用系であった通信用ユニット・配下ユニット間の通信パス異常の情報は、配下ユニットが未実装になるまで通信パス異常テーブルに保持するように構成した請求項1〜4の何れかに記載の監視制御装置。Communication path abnormality of information between the working system and a communication for unit subordinate unit redundancy switching before any of claims 1 to 4, wherein the subordinate unit is configured to hold the communication path abnormality table until unmounted The monitoring control device according to any one of the above. 配下ユニットの故障の有無を判断する際には、通信用ユニットへのコマンドに対する応答が正常かつ配下ユニットへのコマンドに対する応答が異常な場合のみ配下ユニットの故障とし、通信用ユニットへのコマンドに対する応答が異常な場合は、上記通信パス異常テーブルに上記通信パス異常の情報が保持されているとき以外は故障としないことで、故障箇所を限定するよう構成した請求項に記載の監視制御装置。 When determining whether there is a failure in the subordinate unit, the subordinate unit will fail only when the response to the command to the communication unit is normal and the response to the command to the subordinate unit is abnormal, and the response to the command to the communication unit The monitoring control device according to claim 5 , wherein when there is an abnormality , the failure location is limited by not causing a failure except when the communication path abnormality information is held in the communication path abnormality table .
JP2002337666A 2002-11-21 2002-11-21 Supervisory control device Expired - Fee Related JP3663196B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002337666A JP3663196B2 (en) 2002-11-21 2002-11-21 Supervisory control device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002337666A JP3663196B2 (en) 2002-11-21 2002-11-21 Supervisory control device

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP23654395A Division JP3385138B2 (en) 1995-09-14 1995-09-14 Transmission device redundant configuration switching device

Publications (2)

Publication Number Publication Date
JP2003162455A JP2003162455A (en) 2003-06-06
JP3663196B2 true JP3663196B2 (en) 2005-06-22

Family

ID=19197769

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002337666A Expired - Fee Related JP3663196B2 (en) 2002-11-21 2002-11-21 Supervisory control device

Country Status (1)

Country Link
JP (1) JP3663196B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7526568B1 (en) * 2004-02-20 2009-04-28 Broadcast Pix, Inc. Integrated live video production system

Also Published As

Publication number Publication date
JP2003162455A (en) 2003-06-06

Similar Documents

Publication Publication Date Title
US8018842B2 (en) Counter multi-failure system and common link terminal device used therein
US8775869B2 (en) Device and method for coordinating automatic protection switching operation and recovery operation
US12289196B2 (en) Smart online link repair and job scheduling in machine learning supercomputers
JP3663196B2 (en) Supervisory control device
JPS5914777B2 (en) System configuration method
JP5548160B2 (en) Fault monitoring node device and fault detection and recovery method
US8111625B2 (en) Method for detecting a message interface fault in a communication device
KR100328758B1 (en) Method for protection switching of SDH optical transmission equipment by using FSM
JP2003173265A (en) System having redundant function card and failure countermeasure method
JP5270590B2 (en) Transmission apparatus having link down protection function and link down detection method
JPH10303966A (en) Fault detection method for redundant system of internetwork equipment
CN121418381B (en) Ultrafast private ring network protocol and method for switch
KR960010879B1 (en) Bus duplexing control of multiple processor
JPH10262098A (en) Line protection system
JP2001325157A (en) Plant monitoring and control system
JP2005311463A (en) Network line management method and information communication apparatus
KR970001623B1 (en) Abnormal condition processing method in the digital mobile packet router
JPH0983496A (en) Redundant configuration switching device for transmission device and supervisory control device
JP2713134B2 (en) Automatic system selection method and communication system therefor
JP3623404B2 (en) Transmission path switching control device and transmission path switching control method
JP3450151B2 (en) Failure notification device and failure notification method
JP2008083896A (en) Anomaly source identification method, system operation method, base station control system operation method, and processing system
JPH0832676A (en) Exchange system capable of collecting fault information
JPH10320237A (en) Failure analysis device
JP2001016296A (en) Fault standardizing method

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040805

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040810

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041012

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050322

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050325

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees