Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP6476718B2 - INFORMATION PROCESSING SYSTEM, PROGRAM, AND INFORMATION PROCESSING METHOD - Google Patents
[go: Go Back, main page]

JP6476718B2 - INFORMATION PROCESSING SYSTEM, PROGRAM, AND INFORMATION PROCESSING METHOD - Google Patents

INFORMATION PROCESSING SYSTEM, PROGRAM, AND INFORMATION PROCESSING METHOD Download PDF

Info

Publication number
JP6476718B2
JP6476718B2 JP2014208274A JP2014208274A JP6476718B2 JP 6476718 B2 JP6476718 B2 JP 6476718B2 JP 2014208274 A JP2014208274 A JP 2014208274A JP 2014208274 A JP2014208274 A JP 2014208274A JP 6476718 B2 JP6476718 B2 JP 6476718B2
Authority
JP
Japan
Prior art keywords
management device
management
data
communication path
slave
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2014208274A
Other languages
Japanese (ja)
Other versions
JP2016082250A (en
Inventor
浩史 辻村
浩史 辻村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2014208274A priority Critical patent/JP6476718B2/en
Publication of JP2016082250A publication Critical patent/JP2016082250A/en
Application granted granted Critical
Publication of JP6476718B2 publication Critical patent/JP6476718B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Small-Scale Networks (AREA)
  • Hardware Redundancy (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Description

本発明は、情報処理システムに関する。   The present invention relates to an information processing system.

複数の情報処理装置を接続することで、大規模なシステムを実現するビルディング・ブロックシステム(以下、BBシステムと呼ぶことがある。)が知られている。BBシステムの各情報処理装置は、プロセッサ(処理装置)、メモリを含み、それぞれ情報を処理することができる。情報処理装置は、プロセッサとメモリを1つの筐体に収めた1台のコンピュータであってもよく、又、プロセッサとメモリを搭載した1枚のシステムボードであってもよい。また、各情報処理装置は、通信機能を有し、他の情報処理装置と連携して情報を処理できる。   A building block system (hereinafter sometimes referred to as a BB system) that realizes a large scale system by connecting a plurality of information processing apparatuses is known. Each information processing device of the BB system includes a processor (processing device) and a memory, and can process information. The information processing apparatus may be a single computer in which a processor and a memory are housed in a single housing, or may be a single system board on which a processor and a memory are mounted. Each information processing apparatus has a communication function, and can process information in cooperation with other information processing apparatuses.

ある種のBBシステム内の各情報処理装置は、自情報処理装置内のプロセッサ(処理装置)やメモリなどのハードウェア装置を管理するサービスプロセッサ(SP:Service Processor)を備える。SPは、例えば、MPU(Micro−Processing Unit)、フラッシュメモリなどの不揮発性メモリ、及び揮発性メモリを備える。各SPは、自情報処理装置内のプロセッサ(処理装置)やメモリなどのハードウェア装置を管理し、該ハードウェア装置の装置情報を「SPデータ」として記憶する。   Each information processing apparatus in a certain BB system includes a service processor (SP) that manages hardware devices such as a processor (processing apparatus) and a memory in the own information processing apparatus. The SP includes, for example, a MPU (Micro-Processing Unit), a non-volatile memory such as a flash memory, and a volatile memory. Each SP manages hardware devices such as a processor (processing device) and a memory in its own information processing device, and stores device information of the hardware device as “SP data”.

以上のようなBBシステムは、複数の処理装置と、それら複数の処理装置を管理する複数の管理装置とを含む情報処理システムの例である。すなわち、BBシステム内の各SPは、管理装置の具体例であり、1台以上の処理装置を管理する。   The BB system as described above is an example of an information processing system including a plurality of processing devices and a plurality of management devices that manage the plurality of processing devices. That is, each SP in the BB system is a specific example of a management device, and manages one or more processing devices.

ある種のBBシステムにおいて、SPは、マスタSPと、マスタSPのバックアップであるスタンバイSPと、スレイブSPと、に分類される。複数の情報処理装置中の何れか1つの情報処理装置内のSPが、マスタSPとして動作する。マスタSPは、スタンバイSP及びスレイブSPを統括するSPであり、スタンバイSP及びスレイブSPが管理する各種ハードウェア装置についてのSPデータを、スタンバイSP及びスレイブSPから収集する。マスタSPは、スタンバイSP及びスレイブSPを統括するSPであるため、スタンバイSPとスレイブSPが管理しているハードウェア装置を、スタンバイSPとスレイブSPを介して、管理することができる。   In some BB systems, SPs are classified into a master SP, a standby SP that is a backup of the master SP, and a slave SP. An SP in any one information processing apparatus among a plurality of information processing apparatuses operates as a master SP. The master SP is an SP that supervises the standby SP and the slave SP, and collects SP data on various hardware devices managed by the standby SP and slave SP from the standby SP and slave SP. Since the master SP is an SP that supervises the standby SP and the slave SP, hardware devices managed by the standby SP and slave SP can be managed via the standby SP and slave SP.

また、マスタSPは、自情報処理装置内のプロセッサ(処理装置)やメモリなどのハードウェア装置を管理する。スタンバイSPは、マスタSPが収集したSPデータのうち、少なくともスレイブSPが管理するハードウェア装置のSPデータをマスタSPから受信し、マスタSPで障害が発生した際に、マスタSPの代替として、スレイブSPを統括するSPである。スタンバイSPは、自情報処理装置内のプロセッサ(処理装置)やメモリなどのハードウェア装置を管理する。スレイブSPは、自情報処理装置内のプロセッサ(処理装置)やメモリなどのハードウェア装置を管理する。   The master SP also manages hardware devices such as a processor (processing device) and a memory in the information processing apparatus. Among the SP data collected by the master SP, the standby SP receives at least SP data of hardware devices managed by the slave SP from the master SP, and when a failure occurs in the master SP, the slave SP substitutes for the slave SP. It is an SP that controls the SP. The standby SP manages hardware devices such as a processor (processing device) and a memory in the own information processing device. The slave SP manages hardware devices such as a processor (processing device) and a memory in its own information processing device.

サービスプロセッサ間で時刻を同期させる時刻同期処理部と、プロセッサ間通信を監視するプロセッサ間監視処理部と、同期した時刻をトリガにして動作する診断処理部を備える多重化サービスプロセッサも提案されている(例えば、特許文献1を参照)。診断処理部は、ユニット内の共有格納領域への診断データの書き込み処理、共有格納領域からの読み出し処理、およびプロセッサ間通信の監視処理の一連の自己診断処理を自律的に順次実行する。また診断処理部は、待機系のサービスプロセッサへの切替処理を行う。   A multiplexed service processor has also been proposed that includes a time synchronization processing unit that synchronizes time between service processors, an interprocessor monitoring processing unit that monitors interprocessor communication, and a diagnosis processing unit that operates with the synchronized time as a trigger. (See, for example, Patent Document 1). The diagnosis processing unit autonomously sequentially executes a series of self-diagnosis processing of writing processing of diagnosis data to the shared storage area in the unit, reading processing from the shared storage area, and monitoring processing of interprocessor communication. The diagnostic processing unit also performs switching processing to a standby service processor.

特開2011−65521号公報JP, 2011-65521, A

複数の管理装置を有する情報処理システムにおいて、第1の管理装置から第2の管理装置にデータを送信するのに使われる通信路で障害が発生した場合に、該データの送信ができなくなる。   In the information processing system having a plurality of management devices, when a failure occurs in the communication path used to transmit data from the first management device to the second management device, the data can not be transmitted.

1つの側面において、本発明は、管理装置間の通信路で障害が発生しても、管理装置間でデータの送受信を継続できるようにすることを目的とする。   In one aspect, the present invention is directed to enabling transmission and reception of data between management devices to be continued even when a failure occurs in a communication path between management devices.

一態様による情報処理システムは、複数の処理装置と、複数の処理装置を管理する複数の管理装置を含む。第1の管理装置は、データを記憶する。第2の管理装置は、データを第1の管理装置から通信路を介して受信し、受信したデータを記憶する。第1の管理装置は、該通信路に障害が発生すると、他の1台以上の管理装置の状態に基づいて、他の1台以上の管理装置の中から、第1の管理装置および第2の管理装置と接続されている第3の管理装置を選択する。そして、第1の管理装置は、第3の管理装置を介してデータを第2の管理装置に送信する。第2の管理装置は、第2の管理装置が記憶する第2のデータを、該通信路または別の通信路を介して第1の管理装置に送信する。第2の管理装置が第2のデータの送信に用いる該通信路または該別の通信路に障害が発生すると、第2の管理装置は、該他の1台以上の管理装置の状態に基づいて、該他の1台以上の管理装置の中から、第3の管理装置または第3の管理装置とは異なる第4の管理装置を選択し、選択した第3の管理装置または選択した第4の管理装置を介して、第2のデータを第1の管理装置に送信する。該他の1台以上の管理装置の各々の状態は、当該他の管理装置が管理する1台以上の処理装置の状態が当該他の管理装置を介したデータ送信に悪影響を与える程度に基づく指標値により表される。第1の管理装置は、該指標値に基づいて第3の管理装置を選択する。第2の管理装置は、該指標値に基づいて第3の管理装置または第4の管理装置を選択する。 An information processing system according to an aspect includes a plurality of processing devices and a plurality of management devices that manage the plurality of processing devices. The first management device stores data. The second management device receives data from the first management device via the communication path, and stores the received data. When a failure occurs in the communication path, the first management device selects a first management device and a second management device from among the one or more other management devices based on the state of the other one or more management devices. Select a third management device connected to the management device of Then, the first management device transmits data to the second management device via the third management device. The second management device transmits the second data stored by the second management device to the first management device via the communication path or another communication path. If a failure occurs in the communication path used by the second management device for transmission of the second data or the other communication path, the second management device is based on the status of the one or more other management devices. A fourth management apparatus different from the third management apparatus or the third management apparatus is selected from the one or more other management apparatuses, and the selected third management apparatus or the selected fourth management apparatus The second data is transmitted to the first management device via the management device. The state of each of the other one or more management devices is an indicator based on the degree to which the state of one or more processing devices managed by the other management device adversely affects data transmission via the other management device. Represented by a value. The first management device selects a third management device based on the index value. The second management device selects the third management device or the fourth management device based on the index value.

管理装置間の通信路で障害が発生しても、管理装置間でデータの送受信を継続できる。   Even if a failure occurs in the communication path between the management devices, data transmission and reception can be continued between the management devices.

本実施形態に係るBBシステムの例を説明する図である。It is a figure explaining the example of the BB system concerning this embodiment. 通信路で障害が発生した場合のBBシステムの処理の例(その1)を説明する図である。It is a figure explaining an example (the 1) of processing of BB system when fault occurs in a channel. 情報処理装置のハードウェア構成の例(その1)を説明する図である。It is a figure explaining the example (the 1) of the hardware constitutions of an information processor. 情報処理装置のハードウェア構成の例(その2)を説明する図である。It is a figure explaining the example (the 2) of the hardware constitutions of an information processor. 通信路で障害が発生した場合のBBシステムの処理の例(その2)を説明する図である。It is a figure explaining the example (the 2) of processing of BB system when a failure occurs in a communication way. 通信路で障害が発生した場合のBBシステムの処理の例(その3)を説明する図である。It is a figure explaining the example (the 3) of processing of BB system when a failure occurs in a communication way. 代替経路を形成する処理の例を説明する図である。It is a figure explaining an example of processing which forms an alternative course. 経由情報の例を説明する図である。It is a figure explaining the example of passage information. 係数情報の例を説明する図である。It is a figure explaining the example of coefficient information. マスタSPの代替経路形成処理の例を説明するフローチャートである。It is a flowchart explaining the example of the alternative path formation process of master SP. スタンバイSPの代替経路形成処理の例を説明するフローチャートである。It is a flowchart explaining the example of the alternative path formation process of standby SP. スレイブSPのリスク指標値の算出処理の例を説明するフローチャートである。It is a flowchart explaining the example of calculation processing of the risk index value of slave SP. スレイブSPのリスク指標値の算出処理の例を説明するフローチャートである。It is a flowchart explaining the example of calculation processing of the risk index value of slave SP. スレイブSPの選択処理の例を説明するフローチャートである。It is a flowchart explaining the example of selection processing of slave SP. スレイブSPの選択処理の例を説明するフローチャートである。It is a flowchart explaining the example of selection processing of slave SP. 代替経路の形成処理の例(その1)を説明するフローチャートである。It is a flowchart explaining the example (the 1) of formation processing of an alternative path. 代替経路の形成処理の例(その2)を説明するフローチャートである。It is a flowchart explaining the example (the 2) of formation processing of an alternative path. 代替経路の形成処理の例(その3)を説明するフローチャートである。It is a flowchart explaining the example (the 3) of formation processing of an alternative path. 通信路の障害が回復した後の処理の例を説明するフローチャートである。It is a flowchart explaining the example of the processing after the failure of the communication path is recovered. リスク指標値の再計算の処理の例を説明するフローチャートである。It is a flow chart explaining an example of processing of recalculation of a risk index value.

以下、図面を参照しながら、実施形態を詳細に説明する。
図1は、本実施形態に係るBBシステムの例を説明する図である。図1のBBシステム100は、マスタSP120を備える情報処理装置101と、スタンバイSP130を備える情報処理装置102と、スレイブSP140aを備える情報処理装置103aと、スレイブSP140bを備える情報処理装置103bを含む。各情報処理装置は、SP以外にさらに、プロセッサ(すなわち処理装置)とメモリを含み、それぞれ情報を処理することができる。情報処理装置は、プロセッサとメモリを1つの筐体に収めた1台のコンピュータであってもよく、又、プロセッサとメモリを搭載した1枚のシステムボードであってもよい。
Hereinafter, embodiments will be described in detail with reference to the drawings.
FIG. 1 is a diagram for explaining an example of a BB system according to the present embodiment. The BB system 100 of FIG. 1 includes an information processing apparatus 101 having a master SP 120, an information processing apparatus 102 having a standby SP 130, an information processing apparatus 103a having a slave SP 140a, and an information processing apparatus 103b having a slave SP 140b. Each information processing apparatus further includes a processor (that is, a processing device) and a memory in addition to the SP, and can process information. The information processing apparatus may be a single computer in which a processor and a memory are housed in a single housing, or may be a single system board on which a processor and a memory are mounted.

BBシステム100は、複数の処理装置と、それら複数の処理装置を管理する複数の管理装置を含む情報処理システムの例である。各管理装置が管理する処理装置の数は、1以上の任意の数であってよい。図1の各SPは、自情報処理装置内の(つまり、当該SP自体が搭載されている情報処理装置内の)プロセッサ(処理装置)やメモリなどのハードウェア装置を管理する管理装置の例である。各SPは、例えば、MPU、フラッシュメモリなどの不揮発性メモリ、及び揮発性メモリを備える。   The BB system 100 is an example of an information processing system including a plurality of processing devices and a plurality of management devices that manage the plurality of processing devices. The number of processing devices managed by each management device may be one or more arbitrary number. Each SP in FIG. 1 is an example of a management device that manages hardware devices such as a processor (processing device) and memory in the own information processing device (that is, in the information processing device in which the SP itself is installed). is there. Each SP includes, for example, an MPU, a non-volatile memory such as a flash memory, and a volatile memory.

情報処理装置103bは、入出力装置110(以下、「Input/Output(I/O)装置」と略す)と接続されている。I/O装置110は、例えば、キーボード、マウス、モニタなどの装置である。I/O装置110は、情報処理装置101、102、103aの何れにも接続可能であり、情報処理装置103b以外の情報処理装置に接続されていてもよい。I/O装置110が省略されていてもよい。   The information processing device 103 b is connected to an input / output device 110 (hereinafter, abbreviated as “input / output (I / O) device”). The I / O device 110 is, for example, a device such as a keyboard, a mouse, and a monitor. The I / O device 110 can be connected to any of the information processing devices 101, 102, and 103a, and may be connected to an information processing device other than the information processing device 103b. The I / O device 110 may be omitted.

以下では、情報処理装置103aと情報処理装置103bをまとめて「情報処理装置103」と称する。また、スレイブSP140aとスレイブSP140bをまとめて「スレイブSP140」と称する。   Hereinafter, the information processing apparatus 103a and the information processing apparatus 103b will be collectively referred to as "the information processing apparatus 103". Also, the slave SP 140 a and the slave SP 140 b are collectively referred to as “slave SP 140”.

マスタSP120、スタンバイSP130、スレイブSP140などの各SPは、自情報処理装置内のプロセッサ(処理装置)やメモリなどのハードウェア装置の制御や監視を行い、該ハードウェア装置の装置情報を、「SPデータ」として記憶する。各ハードウェア装置の装置情報は、少なくとも当該ハードウェア装置の状態を示す。各SPは、当該SPが搭載されている情報処理装置にI/O装置110が接続されている場合は、I/O装置110も監視する。SPがI/O装置110を監視する場合、I/O装置110の装置情報も、SPデータに含まれる。更に、各SPは、自情報処理装置と接続されている他情報処理装置を検出し、どの情報処理装置が自情報処理装置に接続されているのかを示す情報を、SPデータとして記憶する。   Each SP such as the master SP 120, the standby SP 130, and the slave SP 140 controls and monitors hardware devices such as a processor (processing device) and a memory in its own information processing device. Store as data. The device information of each hardware device indicates at least the state of the hardware device. Each SP also monitors the I / O device 110 when the I / O device 110 is connected to the information processing device in which the SP is installed. When the SP monitors the I / O device 110, device information of the I / O device 110 is also included in the SP data. Furthermore, each SP detects another information processing apparatus connected to the own information processing apparatus, and stores information indicating which information processing apparatus is connected to the own information processing apparatus as SP data.

マスタSP120は、スタンバイSP130及びスレイブSP140を統括するSPである。言い換えると、マスタSP120は、スタンバイSP130とスレイブSP140が管理している処理装置などのハードウェア装置を、スタンバイSP130とスレイブSP140を介して、管理することができる。その管理のために、マスタSP120は、スタンバイSP130とスレイブSP140が記憶するSPデータを収集する。   The master SP 120 is an SP that controls the standby SP 130 and the slave SP 140. In other words, the master SP 120 can manage hardware devices such as processing devices managed by the standby SP 130 and the slave SP 140 via the standby SP 130 and the slave SP 140. For the management, the master SP 120 collects SP data stored by the standby SP 130 and slave SP 140.

スタンバイSP130は、マスタSP120が故障した場合にマスタSP120のバックアップとして動作するSPである。そのため、スタンバイSP130は、マスタSP120が収集したSPデータ(少なくとも、そのうちスレイブSP130から収集されたSPデータ)及びマスタSP120のSPデータを、マスタSP120から受信する。スタンバイSP130は、マスタSP120が記憶しているSPデータと同じデータを記憶することで、マスタSP120で障害が発生した場合でもマスタSP120の代替としてスレイブSP140を統括するSPとなれる。   The standby SP 130 is an SP that operates as a backup of the master SP 120 when the master SP 120 fails. Therefore, the standby SP 130 receives, from the master SP 120, the SP data collected by the master SP 120 (at least the SP data collected from the slave SP 130 among them) and the SP data of the master SP 120. By storing the same data as the SP data stored in the master SP 120, the standby SP 130 can be an SP that supervises the slave SP 140 as a substitute for the master SP 120 even when a failure occurs in the master SP 120.

情報処理装置101は、情報処理装置102と2本の通信ケーブル(すなわち通信路151と通信路152)で接続されている。通信路152は、情報処理装置101のマスタSP120から情報処理装置102のスタンバイSP130にSPデータを送信するために用いられる。通信路151は、情報処理装置102のスタンバイSP130から情報処理装置101のマスタSP120にSPデータを送信するために用いられる。   The information processing apparatus 101 is connected to the information processing apparatus 102 via two communication cables (ie, the communication path 151 and the communication path 152). The communication path 152 is used to transmit SP data from the master SP 120 of the information processing apparatus 101 to the standby SP 130 of the information processing apparatus 102. The communication path 151 is used to transmit SP data from the standby SP 130 of the information processing apparatus 102 to the master SP 120 of the information processing apparatus 101.

情報処理装置101は、通信路153aで情報処理装置103aと、通信路153bで情報処理装置103bと、接続されている。また、情報処理装置102は、通通信路154aで情報処理装置103aと、通信路154bで情報処理装置103bと、接続されている。   The information processing apparatus 101 is connected to the information processing apparatus 103 a by the communication path 153 a and to the information processing apparatus 103 b by the communication path 153 b. Further, the information processing apparatus 102 is connected to the information processing apparatus 103 a by the communication path 154 a and to the information processing apparatus 103 b by the communication path 154 b.

なお、図1の例では、情報処理装置101と情報処理装置102が2本の通信ケーブルで接続されているものの、実施形態によっては、双方向に通信可能な通信ケーブル1本で情報処理装置101と情報処理装置102が接続されていてもよい。   Although the information processing apparatus 101 and the information processing apparatus 102 are connected by two communication cables in the example of FIG. 1, the information processing apparatus 101 may be connected by one communication cable capable of bidirectional communication depending on the embodiment. And the information processing apparatus 102 may be connected.

ここで、通信路152で障害が発生した場合、マスタSP120は、通信路152を用いたスタンバイSP130へのSPデータの送信ができなくなる。すると、マスタSP120が記憶するSPデータとスタンバイSP130が記憶するSPデータが異なる、という状況が生じ得る。マスタSP120とスタンバイSP130とが異なるSPデータを記憶している場合、スタンバイSP130は、マスタSP120で障害が発生すると、マスタSP120のバックアップとして動作できなくなる。   Here, when a failure occurs in the communication path 152, the master SP 120 can not transmit SP data to the standby SP 130 using the communication path 152. Then, a situation may occur in which the SP data stored by the master SP 120 and the SP data stored by the standby SP 130 are different. When the master SP 120 and the standby SP 130 store different SP data, the standby SP 130 can not operate as a backup of the master SP 120 when a failure occurs in the master SP 120.

本実施形態のマスタSP120は、通信路152で障害が発生した場合、情報処理装置103a又は情報処理装置103bを介した別の通信路を形成し、SPデータをスタンバイSP130に送信する。別の通信路を形成するために、マスタSP120は、スレイブSP140が管理する処理装置などのハードウェア装置の状態を示す情報を指標化した値を取得する。この値は、スレイブSP140により算出される。スレイブSP140は、スレイブSP140が管理する処理装置などのハードウェア装置の状態を示す情報を指標化する際に、図9とともに後述する係数情報を用いてもよい。図1のBBシステム100では、マスタSP120は、スレイブSP140a〜140bからそれぞれ取得した値に基づいて、スレイブSP140aを選択する。マスタSP120は、通信路153aと通信路154aを用い、スレイブSP140aを介してスタンバイSP130にSPデータを送信する。   When a failure occurs in the communication path 152, the master SP 120 according to this embodiment forms another communication path via the information processing device 103a or the information processing device 103b, and transmits SP data to the standby SP 130. In order to form another communication path, the master SP 120 acquires a value indexed to information indicating the state of a hardware device such as a processing device managed by the slave SP 140. This value is calculated by the slave SP 140. The slave SP 140 may use coefficient information described later with reference to FIG. 9 when indexing information indicating the state of a hardware device such as a processing device managed by the slave SP 140. In the BB system 100 of FIG. 1, the master SP 120 selects the slave SP 140a based on the values acquired from the slave SPs 140a to 140b. The master SP 120 transmits SP data to the standby SP 130 via the slave SP 140 a using the communication path 153 a and the communication path 154 a.

上記の実施形態のように、マスタSP120からスタンバイSP130にSPデータを送信するための通信路152で障害が発生しても、スレイブSP140を介して、マスタSP120はSPデータをスタンバイSP130に送信できる。つまり、マスタSP120とスタンバイSP130とが同じSPデータを記憶する状態を維持することができる。マスタSP120とスタンバイSP130とが同じSPデータを記憶することで、スタンバイSP130は、マスタSP120のバックアップとして動作可能である。   As in the above embodiment, even if a failure occurs in the communication path 152 for transmitting SP data from the master SP 120 to the standby SP 130, the master SP 120 can transmit SP data to the standby SP 130 via the slave SP 140. That is, the master SP 120 and the standby SP 130 can maintain the same SP data storage state. With the master SP 120 and the standby SP 130 storing the same SP data, the standby SP 130 can operate as a backup of the master SP 120.

以上のように、BBシステム100は、複数の処理装置を管理する複数の管理装置を含む情報処理システムの例である。マスタSP120は、複数の管理装置のうち、データ(例えば、マスタSP120のSPデータと、スレイブSP140から収集されたSPデータ)を記憶する第1の管理装置の例である。スタンバイSP130は、複数の管理装置のうち、上記データを第1の管理装置から通信路(例えば通信路152)を介して受信し、受信したデータを記憶する第2の管理装置の例である。   As described above, the BB system 100 is an example of an information processing system including a plurality of management devices that manage a plurality of processing devices. The master SP 120 is an example of a first management device that stores data (for example, SP data of the master SP 120 and SP data collected from the slave SP 140) among a plurality of management devices. The standby SP 130 is an example of a second management apparatus that receives the data from the first management apparatus via the communication path (for example, the communication path 152) among the plurality of management apparatuses, and stores the received data.

通信路に障害が発生すると、第1の管理装置は、他の1台以上の管理装置の中から、第1の管理装置および第2の管理装置と接続されている第3の管理装置を選択する。例えば、スレイブSP140aが第3の管理装置の例である。第3の管理装置の選択は、他の1台以上の管理装置の状態に基づいて行われる。具体的には、第3の管理装置の選択は、例えば、上記のとおりスレイブSP140a〜140bに搭載される処理装置などのハードウェア装置の状態を示す情報に基づいて行われてもよい。   When a failure occurs in the communication path, the first management device selects a third management device connected to the first management device and the second management device from among one or more other management devices. Do. For example, the slave SP 140a is an example of the third management device. The selection of the third management device is made based on the status of one or more other management devices. Specifically, the selection of the third management device may be performed based on information indicating the state of a hardware device such as a processing device mounted on the slave SPs 140a to 140b as described above.

第1の管理装置は、第3の管理装置を選択すると、第3の管理装置を介してデータを第2の管理装置に送信する。その結果、上記通信路に障害が発生しても、第1の管理装置から第2の管理装置へのデータ送信を継続することが可能となる。   When the first management device selects the third management device, the first management device transmits data to the second management device via the third management device. As a result, even if a failure occurs in the communication path, it becomes possible to continue data transmission from the first management device to the second management device.

上記のようにマスタSP120とスタンバイSP130の間のデータ同期のためにデータ送信が行われる場合、データ送信の継続によりデータ同期が維持される。データ同期が維持されていれば、マスタSP120で障害が発生した際に、マスタSP120からスタンバイSP130へのフェイルオーバが適切に行われる。   As described above, when data transmission is performed for data synchronization between the master SP 120 and the standby SP 130, data synchronization is maintained by continuation of data transmission. If data synchronization is maintained, when a failure occurs in the master SP 120, failover from the master SP 120 to the standby SP 130 is appropriately performed.

なお、上記の例とは逆に、スタンバイSP130が第1の管理装置に対応し、かつ、マスタSP120が第2の管理装置に対応するような実施形態も可能である。すなわち、スタンバイSP130が記憶するデータのマスタSP120への送信を継続するために、スタンバイSP130が、通信路の障害に応じて第3の管理装置を選択し、第3の管理装置を介してデータをマスタSP120に送信してもよい。   Note that, contrary to the above example, an embodiment is also possible in which the standby SP 130 corresponds to the first management device and the master SP 120 corresponds to the second management device. That is, in order to continue the transmission of data stored by the standby SP 130 to the master SP 120, the standby SP 130 selects the third management apparatus according to the failure of the communication path, and transmits the data via the third management apparatus. It may be transmitted to the master SP 120.

図2は、通信経路で障害が発生した場合のBBシステムの処理の例(その1)を説明する図である。図2のBBシステム100において、図1と同じ構成要素には、図1と同じ符号を付す。図2では、簡略化のために、I/O装置110を記載していない。I/O装置110は、情報処理装置101〜103の何れにも接続可能である。   FIG. 2 is a diagram for explaining an example (part 1) of processing of the BB system when a failure occurs in a communication path. In the BB system 100 of FIG. 2, the same components as in FIG. 1 are given the same reference numerals as in FIG. 1. In FIG. 2, I / O device 110 is not described for simplification. The I / O device 110 can be connected to any of the information processing devices 101 to 103.

図2のBBシステム100は、それぞれスレイブSP140a〜140nを備える情報処理装置103a〜103nを備える。図2におけるスレイブSP140a〜140nや情報処理装置103a〜103nの例示は、情報処理装置103及びスレイブSP140の数を制限する趣旨のものではない。以下では、情報処理装置103a〜103nをまとめて「情報処理装置103」と称することがある。また、以下では、スレイブSP140a〜140nをまとめて「スレイブSP140」と称することがある。   The BB system 100 of FIG. 2 includes information processing apparatuses 103a to 103n provided with slaves SP 140a to 140n, respectively. The illustration of the slave SPs 140a to 140n and the information processing apparatuses 103a to 103n in FIG. 2 is not intended to limit the number of information processing apparatuses 103 and slave SPs 140. Hereinafter, the information processing apparatuses 103a to 103n may be collectively referred to as the "information processing apparatus 103". Also, in the following, the slave SPs 140 a to 140 n may be collectively referred to as “slave SP 140”.

情報処理装置101は、情報処理装置103a〜103nと、それぞれの通信路153a〜通信路153nを介して接続されている。情報処理装置102は、情報処理装置103a〜103nと、それぞれ通信路154a〜通信路154nを介して接続されている。   The information processing apparatus 101 is connected to the information processing apparatuses 103a to 103n via the communication paths 153a to 153n. The information processing apparatus 102 is connected to the information processing apparatuses 103a to 103n via communication paths 154a to 154n, respectively.

マスタSP120は、記憶部121、同期部122、データ制御部123、検出部124を含む。スタンバイSP130は、記憶部131、同期部132、データ制御部133、検出部134を含む。スレイブSP140a〜140nは、それぞれ、記憶部141a〜141n、データ経由部142a〜142n、管理部143a〜143n、検出部144a〜144n、同期部145a〜145nを含む。以下では、記憶部141a〜141nをまとめて、「記憶部141」と称する。データ経由部142a〜142nをまとめて、「データ経由部142」と称する。管理部143a〜143nをまとめて、「管理部143」と称する。検出部144a〜144nをまとめて、「検出部144」と称する。同期部145a〜145nをまとめて、「同期部145」と称する。   The master SP 120 includes a storage unit 121, a synchronization unit 122, a data control unit 123, and a detection unit 124. The standby SP 130 includes a storage unit 131, a synchronization unit 132, a data control unit 133, and a detection unit 134. The slaves SP 140a to 140n respectively include storage units 141a to 141n, data relay units 142a to 142n, management units 143a to 143n, detection units 144a to 144n, and synchronization units 145a to 145n. Hereinafter, the storage units 141 a to 141 n will be collectively referred to as “storage unit 141”. The data passing parts 142a to 142n are collectively referred to as a "data passing part 142". The management units 143a to 143n are collectively referred to as a "management unit 143". The detection units 144a to 144n are collectively referred to as "detection unit 144". The synchronization units 145a to 145n are collectively referred to as "synchronization unit 145".

スレイブSP140の管理部143は、自情報処理装置内のプロセッサ(処理装置)やメモリなどのハードウェア装置を管理する。具体的には、管理部143は、自情報処理装置103に搭載されているハードウェア装置を認識し、ハードウェア装置の故障を監視する。管理部143は、認識したハードウェア装置の情報や、パーティション(詳しくは後述する)の起動、停止などを示す情報などを、スレイブSPデータ163として記憶部141に記憶する。係数情報164(詳しくは、図9とともに説明する)は、予め記憶部141に設定されている。図2には、スレイブSPデータ163と係数情報164の例として、スレイブSP140内の記憶部141aに記憶されるスレイブSPデータ163aと係数情報164aが図示されている。   The management unit 143 of the slave SP 140 manages hardware devices such as a processor (processing device) and a memory in the own information processing device. Specifically, the management unit 143 recognizes the hardware device installed in the self-information processing device 103, and monitors a failure of the hardware device. The management unit 143 stores information of the recognized hardware device, information indicating start and stop of the partition (which will be described in detail later), and the like in the storage unit 141 as slave SP data 163. The coefficient information 164 (to be described in detail with reference to FIG. 9) is set in the storage unit 141 in advance. In FIG. 2, as an example of slave SP data 163 and coefficient information 164, slave SP data 163a and coefficient information 164a stored in the storage unit 141a in the slave SP 140 are illustrated.

スレイブSP140の検出部144は、自情報処理装置103と接続された他情報処理装置101〜102やI/O装置110などの装置を検出し、検出した装置に関する情報も、スレイブSPデータ163として記憶部141に記憶する。検出部144は、更に、自情報処理装置103と情報処理装置101を接続する通信路153に障害が発生すると、障害を検出する。また、検出部144は、自情報処理装置103と情報処理装置102を接続する通信路154に障害が発生すると、障害を検出する。   The detection unit 144 of the slave SP 140 detects a device such as the other information processing devices 101 to 102 or the I / O device 110 connected to the self information processing device 103, and stores information on the detected device as slave SP data 163. It is stored in the unit 141. The detection unit 144 further detects a failure when a failure occurs in the communication path 153 connecting the self information processing apparatus 103 and the information processing apparatus 101. Further, when a failure occurs in the communication path 154 connecting the self information processing apparatus 103 and the information processing apparatus 102, the detection unit 144 detects the failure.

同期部145は、定期的に、又は、スレイブSP140のスレイブSPデータ163に更新があると、スレイブSPデータ163を、マスタSP120の同期部122に送信する。同期部122は、受信したスレイブSP140のスレイブSPデータ163を記憶部121に記憶する。データ経由部142については、後述する。   The synchronization unit 145 transmits the slave SP data 163 to the synchronization unit 122 of the master SP 120 periodically or when the slave SP data 163 of the slave SP 140 is updated. The synchronization unit 122 stores the received slave SP data 163 of the slave SP 140 in the storage unit 121. The data passing unit 142 will be described later.

スタンバイSP130の検出部134は、自情報処理装置102と接続された他情報処理装置101や103、I/O装置110などの装置を検出し、検出した装置に関する情報をスタンバイSPデータ162として記憶部131に記憶する。検出部134は、検出した情報処理装置103の情報を、経由情報166として記憶部131に記憶する。経由情報166は、通信路151に障害が発生し、スタンバイSP130が情報処理装置103a〜103nの何れかを介した別の通信路を形成する際の、選択候補となる情報処理装置の一覧情報を含む。   The detection unit 134 of the standby SP 130 detects devices such as the other information processing devices 101 and 103 and the I / O device 110 connected to the self information processing device 102, and stores information on the detected devices as the standby SP data 162. It memorizes in 131. The detection unit 134 stores the detected information of the information processing apparatus 103 in the storage unit 131 as route information 166. The via information 166 is a list of information processing apparatuses as candidates for selection when the standby SP 130 forms another communication path via any of the information processing apparatuses 103 a to 103 n when a failure occurs in the communication path 151. Including.

検出部134は、更に、通信路151、通信路152に障害が発生すると、障害を検出する。また、検出部134は、自情報処理装置102と情報処理装置103を接続する通信路154に障害が発生すると、障害を検出する。   The detection unit 134 further detects a failure when a failure occurs in the communication channel 151 and the communication channel 152. When a failure occurs in the communication path 154 connecting the self information processing apparatus 102 and the information processing apparatus 103, the detection unit 134 detects the failure.

同期部132は、定期的に、又は、スタンバイSPデータ162に更新があると、スタンバイSPデータ162をマスタSP120の同期部122に送信する。マスタSP120の同期部122は、受信したスタンバイSPデータ162を記憶部121に記憶する。データ制御部133については後述する。   The synchronization unit 132 transmits the standby SP data 162 to the synchronization unit 122 of the master SP 120 periodically or when the standby SP data 162 is updated. The synchronization unit 122 of the master SP 120 stores the received standby SP data 162 in the storage unit 121. The data control unit 133 will be described later.

マスタSP120の検出部124は、自情報処理装置101と接続された他情報処理装置102〜103、I/O装置110などの装置を検出し、検出した装置に関する情報をマスタSPデータ161として記憶部121に記憶する。検出部124は、検出した情報処理装置103の情報を、経由情報165として記憶部121に記憶する。経由情報165は、通信路152に障害が発生し、マスタSP120が情報処理装置103a〜103nの何れかを介した別の通信路を形成する際の、選択候補となる情報処理装置103の一覧情報を含む。   The detection unit 124 of the master SP 120 detects devices such as the other information processing devices 102 to 103 and the I / O device 110 connected to the self information processing device 101, and stores information on the detected devices as master SP data 161. It memorizes in 121. The detection unit 124 stores the detected information of the information processing apparatus 103 in the storage unit 121 as route information 165. The via information 165 is a list information of the information processing apparatus 103 which is a selection candidate when a failure occurs in the communication path 152 and the master SP 120 forms another communication path via any of the information processing apparatuses 103a to 103n. including.

検出部124は、更に、通信路151、通信路152に障害が発生すると、障害を検出する。また、検出部124は、自情報処理装置101と情報処理装置103を接続する通信路153に障害が発生すると、障害を検出する。   Furthermore, when a failure occurs in the communication path 151 and the communication path 152, the detection unit 124 detects the failure. Further, when a failure occurs in the communication path 153 connecting the self information processing apparatus 101 and the information processing apparatus 103, the detection unit 124 detects the failure.

同期部122は、定期的に、又は、マスタSPデータ161に更新があると、マスタSPデータ161をスタンバイSP130の同期部132に送信する。スタンバイSP130の同期部132は、受信したマスタSPデータ161を、記憶部131に記憶する。データ制御部123については後述する。   The synchronization unit 122 transmits the master SP data 161 to the synchronization unit 132 of the standby SP 130 periodically or when the master SP data 161 is updated. The synchronization unit 132 of the standby SP 130 stores the received master SP data 161 in the storage unit 131. The data control unit 123 will be described later.

同期部122は、マスタSP120が故障した場合に、スタンバイSP130がマスタSP120の代替として動作できるようにするために、スタンバイSP130に、マスタSP120の記憶部121と同じSPデータを記憶させる。具体的には、同期部122は、マスタSPデータ161と、スレイブSP140a〜140nから受信したスレイブSPデータ163a〜163nとを、スタンバイSP130の同期部132に送信する。スタンバイSP130の同期部132は、同期部122から受信したマスタSPデータ161と、スレイブSPデータ163a〜163nとを、記憶部131に記憶する。スタンバイSP130は、マスタSP120が使用する最新のスレイブSPデータ163a〜163nを記憶部131に記憶することで、マスタSP120が故障してもマスタSP120の代わりにスレイブSP140a〜140nを管理できるようになる。なお、マスタSP120が故障している間は、スレイブSP140の同期部145は、スタンバイSP130の同期部132に、スレイブSPデータ163を送信する。   The synchronization unit 122 causes the standby SP 130 to store the same SP data as the storage unit 121 of the master SP 120 so that the standby SP 130 can operate as a substitute for the master SP 120 when the master SP 120 fails. Specifically, synchronization unit 122 transmits master SP data 161 and slave SP data 163a to 163n received from slave SPs 140a to 140n to synchronization unit 132 of standby SP 130. The synchronization unit 132 of the standby SP 130 stores the master SP data 161 received from the synchronization unit 122 and slave SP data 163 a to 163 n in the storage unit 131. By storing the latest slave SP data 163a to 163n used by the master SP 120 in the storage unit 131, the standby SP 130 can manage the slave SPs 140a to 140n instead of the master SP 120 even if the master SP 120 fails. While the master SP 120 is broken, the synchronization unit 145 of the slave SP 140 transmits slave SP data 163 to the synchronization unit 132 of the standby SP 130.

ここで、マスタSP120の同期部122からスタンバイSP130の同期部132にSPデータを送信するための通信路152で障害が発生した場合、通信路152を用いたマスタSP120からスタンバイSP130へのSPデータの送信ができなくなる。すると、マスタSP120が記憶するSPデータとスタンバイSP130が記憶するSPデータが異なる、という状況が生じ得る。マスタSP120とスタンバイSP130とが異なるSPデータを記憶している場合、スタンバイSP130は、マスタSP120で障害が発生すると、マスタSP120のバックアップとして動作できなくなる。   Here, when a failure occurs in the communication path 152 for transmitting SP data from the synchronization unit 122 of the master SP 120 to the synchronization unit 132 of the standby SP 130, the SP data from the master SP 120 to the standby SP 130 using the communication path 152 You can not send. Then, a situation may occur in which the SP data stored by the master SP 120 and the SP data stored by the standby SP 130 are different. When the master SP 120 and the standby SP 130 store different SP data, the standby SP 130 can not operate as a backup of the master SP 120 when a failure occurs in the master SP 120.

そのため、本実施形態のマスタSP120は、通信路152で障害が発生した場合、情報処理装置103a〜103nの何れかを介した(より具体的には、スレイブ140a〜140nの何れかを介した)別の通信路を形成する。この別の通信路を、以下において、代替経路と称する。代替経路を形成する処理では、まず、マスタSP120の検出部124が、マスタSP120からスタンバイSP130にSPデータを送信するための通信路152で障害を検出すると、障害を検出したことを、データ制御部123に通知する。データ制御部123は、記憶部121に記憶されている経由情報165に含まれるマスタSP120と通信可能なスレイブSP140のデータ経由部142に計算命令を送信する。計算命令は、スレイブSP140が管理する処理装置などのハードウェア装置の状態を示す情報であるスレイブSPデータ163を、係数情報164を用いて指標化するように求める命令である。計算命令を受信したデータ経由部142は、スレイブSPデータ163と、記憶部141の係数情報164に含まれる情報とから、データ転送に悪影響を与える要因を指標化したリスク指標値を計算する。データ転送に悪影響を与える要因の例は、データ経由部142の搭載された情報処理装置103内の各ハードウェア装置の故障や、情報処理装置103内の各処理装置の負荷などである。データ経由部142は、計算したリスク指標値を、マスタSP120のデータ制御部123に送信する。   Therefore, when a failure occurs in the communication path 152, the master SP 120 according to the present embodiment passes through any of the information processing apparatuses 103a to 103n (more specifically, through any of the slaves 140a to 140n). Form another communication path. This other communication path is hereinafter referred to as an alternative path. In the process of forming an alternative path, first, when the detecting unit 124 of the master SP 120 detects a failure in the communication path 152 for transmitting SP data from the master SP 120 to the standby SP 130, the data control unit Notify 123 The data control unit 123 transmits the calculation instruction to the data transit unit 142 of the slave SP 140 that can communicate with the master SP 120 included in the transit information 165 stored in the storage unit 121. The calculation instruction is an instruction for obtaining the slave SP data 163, which is information indicating the state of a hardware device such as a processing device managed by the slave SP 140, using the coefficient information 164. The data passing unit 142 that has received the calculation instruction calculates a risk index value that indexes a factor that adversely affects data transfer from the slave SP data 163 and the information included in the coefficient information 164 of the storage unit 141. Examples of factors that adversely affect data transfer are a failure of each hardware device in the information processing apparatus 103 in which the data passing unit 142 is installed, a load of each processing apparatus in the information processing apparatus 103, and the like. The data relay unit 142 transmits the calculated risk index value to the data control unit 123 of the master SP 120.

マスタSP120のデータ制御部123は、計算命令を送信した全スレイブSP140から、リスク指標値を受け取ると、該リスク指標値に基づいて記憶部121の経由情報165を更新する。マスタSP120のデータ制御部123は、リスク指標値に基づいて(詳しくは、図9とともに後述する)、1つのスレイブSP140を選択する。マスタSP120のデータ制御部123は、選択したスレイブSP140を介した代替経路を形成する。   When the data control unit 123 of the master SP 120 receives the risk index value from all slaves SP 140 that have transmitted the calculation instruction, the data control unit 123 updates the via information 165 of the storage unit 121 based on the risk index value. The data control unit 123 of the master SP 120 selects one slave SP 140 based on the risk index value (to be described later in detail with reference to FIG. 9). The data control unit 123 of the master SP 120 forms an alternative path via the selected slave SP 140.

リスク指標値は、スレイブSP140が管理する1台以上の処理装置などのハードウェア装置の状態が当該スレイブSP140を介したデータ送信に悪影響を与える程度に基づく指標値の例である。本実施形態では、リスク指標値によりスレイブSP140の状態が表される。リスク指標値により表される状態とは、換言すれば、代替経路が経由する中継点としてスレイブ140がどの程度適しているか、という度合いである。本実施形態では、リスク指標値により表される状態に基づいて、1つのスレイブSP140が選択される。   The risk index value is an example of an index value based on the degree to which the state of hardware devices such as one or more processing devices managed by the slave SP 140 adversely affects data transmission via the slave SP 140. In the present embodiment, the state of the slave SP 140 is represented by the risk index value. The state represented by the risk index value is, in other words, the degree to which the slave 140 is suitable as a relay point through which the alternative route passes. In the present embodiment, one slave SP 140 is selected based on the condition represented by the risk index value.

代替経路が形成されると、マスタSP120の同期部122は、スタンバイSP130に送信するSPデータ(マスタSPデータ161とスレイブSPデータ163)を、データ制御部123に出力する。データ制御部123は、同期部122から受け取ったSPデータを、選択したスレイブSP140のデータ経由部142に送信する。データ経由部142は、受信したSPデータを、スタンバイSP130のデータ制御部133に送信する。データ制御部133は、受信したSPデータを同期部132に出力する。同期部132は、データ制御部133から受け取ったSPデータを、記憶部131に記憶する。   When the alternative path is formed, the synchronization unit 122 of the master SP 120 outputs the SP data (master SP data 161 and slave SP data 163) to be transmitted to the standby SP 130 to the data control unit 123. The data control unit 123 transmits the SP data received from the synchronization unit 122 to the data passing unit 142 of the selected slave SP 140. The data passing unit 142 transmits the received SP data to the data control unit 133 of the standby SP 130. The data control unit 133 outputs the received SP data to the synchronization unit 132. The synchronization unit 132 stores the SP data received from the data control unit 133 in the storage unit 131.

このように、マスタSP120が代替経路を形成することで、マスタSP120からスタンバイSP130にSPデータを送信するための通信路152で障害が発生しても、マスタSP120は、SPデータをスタンバイSP130に送信し続けることができる。マスタSP120とスタンバイSP130とが同じSPデータを記憶することで、スタンバイSP130は、マスタSP120のバックアップとして動作可能な状態を維持することができる。   Thus, even if a failure occurs in the communication path 152 for transmitting SP data from the master SP 120 to the standby SP 130 by the master SP 120 forming an alternative path, the master SP 120 transmits SP data to the standby SP 130. You can keep doing. By the master SP 120 and the standby SP 130 storing the same SP data, the standby SP 130 can maintain an operable state as a backup of the master SP 120.

図3は、情報処理装置のハードウェア構成の例(その1)を説明する図である。図1〜図2に示す情報処理装置101〜103は、同じハードウェア構成である。そのため、情報処理装置101〜103を纏めて「情報処理装置200」と称す。情報処理装置200は、CPU Memory Unit(CMU)210と、サービスプロセッサ(SP)220を備える。CPUは、Central Processing Unitの略である。   FIG. 3 is a diagram for explaining an example (part 1) of the hardware configuration of the information processing apparatus. The information processing apparatuses 101 to 103 illustrated in FIGS. 1 and 2 have the same hardware configuration. Therefore, the information processing apparatuses 101 to 103 are collectively referred to as an “information processing apparatus 200”. The information processing apparatus 200 includes a CPU Memory Unit (CMU) 210 and a service processor (SP) 220. CPU is an abbreviation of Central Processing Unit.

CMU210は、プロセッサ211とメモリ212を備える。プロセッサ211は、SP220により管理される処理装置の例である。プロセッサ211は、任意の処理回路であってよく、例えばCentral Processing Unit(CPU)であってもよい。メモリ212は、プロセッサ211の動作により得られたデータや、プロセッサ211の処理に用いられるデータを、適宜記憶する。   The CMU 210 includes a processor 211 and a memory 212. The processor 211 is an example of a processing device managed by the SP 220. The processor 211 may be any processing circuit, and may be, for example, a central processing unit (CPU). The memory 212 appropriately stores data obtained by the operation of the processor 211 and data used for the processing of the processor 211.

なお、図3には情報処理装置200が1つのCMU210を有する例が示されているが、情報処理装置200が2つ以上のCMU210を有していてもよい。また、1つのCMU210が2つ以上のプロセッサ211を有していてもよい。   Although FIG. 3 shows an example in which the information processing apparatus 200 includes one CMU 210, the information processing apparatus 200 may include two or more CMUs 210. Also, one CMU 210 may have two or more processors 211.

SP220は、プロセッサ221とメモリ222を備える。プロセッサ221は、任意の処理回路であってよく、例えばCentral Processing Unit(CPU)であってもよい。マスタSP120において、プロセッサ221は、プログラムを実行することにより、検出部124、同期部122、データ制御部123として動作する。スタンバイSP130において、プロセッサ221は、プログラムを実行することにより、検出部134、同期部132、データ制御部133として動作する。スレイブSP140において、プロセッサ221は、プログラムを実行することにより、同期部145、検出部144、データ経由部142、管理部143として動作する。   The SP 220 includes a processor 221 and a memory 222. The processor 221 may be any processing circuit, and may be, for example, a central processing unit (CPU). In the master SP 120, the processor 221 operates as a detection unit 124, a synchronization unit 122, and a data control unit 123 by executing a program. In the standby SP 130, the processor 221 operates as a detection unit 134, a synchronization unit 132, and a data control unit 133 by executing a program. In the slave SP 140, the processor 221 operates as a synchronization unit 145, a detection unit 144, a data relay unit 142, and a management unit 143 by executing a program.

マスタSP120において、メモリ222は、記憶部121として使われ、スタンバイSP130のSPデータのコピー、スレイブSP140のSPデータのコピー、マスタSP120のSPデータ及び経由情報165を保持する。スタンバイSP130において、メモリ222は、記憶部131として使われ、スタンバイSP130のSPデータ、スレイブSP140のSPデータのコピー、マスタSP120のSPデータのコピー及び経由情報165を保持する。スレイブSP140において、メモリ222は、記憶部141として使われ、スレイブSP140のSPデータと係数情報164を保持する。さらに、メモリ222は、プロセッサ221の動作により得られたデータや、プロセッサ221の処理に用いられるデータも、適宜、記憶する。   In the master SP 120, the memory 222 is used as the storage unit 121, and holds a copy of SP data of the standby SP 130, a copy of SP data of the slave SP 140, and SP data of the master SP 120 and passing information 165. In the standby SP 130, the memory 222 is used as the storage unit 131, and holds the SP data of the standby SP 130, the copy of the SP data of the slave SP 140, the copy of the SP data of the master SP 120, and the routing information 165. In the slave SP 140, the memory 222 is used as the storage unit 141, and holds the SP data of the slave SP 140 and the coefficient information 164. Furthermore, the memory 222 appropriately stores data obtained by the operation of the processor 221 and data used for the processing of the processor 221.

図4は、情報処理装置のハードウェア構成の例(その2)を説明する図である。情報処理装置200は、プロセッサ11、メモリ12、バス15、外部記憶装置16、ネットワーク接続装置19、SP20を備える。さらにオプションとして、情報処理装置200は、入力装置13、出力装置14、媒体駆動装置17を備えてもよい。あるいは、入力装置13、出力装置14、媒体駆動装置17のうち少なくとも1つが情報処理装置200の外部にあって情報処理装置200に接続されていてもよい。情報処理装置200は、例えば、コンピュータなどで実現されることがある。   FIG. 4 is a diagram for explaining an example (part 2) of the hardware configuration of the information processing apparatus. The information processing apparatus 200 includes a processor 11, a memory 12, a bus 15, an external storage device 16, a network connection device 19, and an SP 20. Further, as an option, the information processing device 200 may include an input device 13, an output device 14, and a medium drive device 17. Alternatively, at least one of the input device 13, the output device 14, and the medium drive device 17 may be external to the information processing device 200 and connected to the information processing device 200. The information processing device 200 may be realized by, for example, a computer.

プロセッサ11は、図3のCMU210のプロセッサ211である。メモリ12は、CMU210のメモリ212である。プロセッサ11は、例えば、外部記憶装置16に記憶されたプログラムをメモリ12にロードして実行することができる。ネットワーク接続装置19は、他の装置との通信に使用される。ネットワーク接続装置19は、例えば、ネットワークアダプタなどの通信回路である。SP20は、図3のSP220である。   The processor 11 is the processor 211 of the CMU 210 of FIG. The memory 12 is a memory 212 of the CMU 210. The processor 11 can load a program stored in the external storage device 16 into the memory 12 and execute the program, for example. The network connection device 19 is used to communicate with other devices. The network connection device 19 is, for example, a communication circuit such as a network adapter. SP20 is SP220 of FIG.

入力装置13は、例えば、ボタン、キーボード、マウス等であってもよく、出力装置14は、ディスプレイなどであってもよい。バス15は、プロセッサ11、メモリ12、入力装置13、出力装置14、外部記憶装置16、媒体駆動装置17、ネットワーク接続装置19、SP20の間を相互にデータの受け渡しが行えるように接続する。SP20は、ネットワーク接続装置19(およびケーブル等の物理的通信路)を介して、他の情報処理装置200に搭載された他のSP20と通信することが可能である。外部記憶装置16には、プログラムやデータなどが格納される。外部記憶装置16は、例えば、Hard Disk Drive(HDD)でもよく、Solid-State Drive(SSD)でもよい。外部記憶装置16に格納されている情報は、適宜、プロセッサ11などに提供される。媒体駆動装置17は、メモリ12や外部記憶装置16に記憶されているデータを可搬型記録媒体18に送信することができ、また、可搬型記録媒体18からプログラムやデータ等を読み出すことができる。ここで、可搬型記録媒体18は、フロッピイディスク、Magneto-Optical(MO)ディスク、Compact Disc Recordable(CD−R)やDigital Versatile Disk Recordable(DVD−R)などの、持ち運びが可能な任意の記録媒体とすることができる。可搬型記録媒体18はフラッシュメモリなどの半導体メモリカードであってもよく、媒体駆動装置17はメモリカード用のリーダ及びライタであってもよい。   The input device 13 may be, for example, a button, a keyboard, a mouse or the like, and the output device 14 may be a display or the like. The bus 15 connects the processor 11, the memory 12, the input device 13, the output device 14, the external storage device 16, the medium drive device 17, the network connection device 19, and the SP 20 so as to mutually exchange data. The SP 20 can communicate with another SP 20 mounted on another information processing apparatus 200 via the network connection device 19 (and a physical communication path such as a cable). The external storage device 16 stores programs and data. The external storage device 16 may be, for example, a Hard Disk Drive (HDD) or a Solid-State Drive (SSD). The information stored in the external storage device 16 is appropriately provided to the processor 11 or the like. The medium drive device 17 can transmit data stored in the memory 12 or the external storage device 16 to the portable recording medium 18, and can read a program, data, etc. from the portable recording medium 18. Here, the portable recording medium 18 is any portable recording such as a floppy disk, a Magneto-Optical (MO) disk, a Compact Disc Recordable (CD-R), a Digital Versatile Disk Recordable (DVD-R), etc. It can be a medium. The portable recording medium 18 may be a semiconductor memory card such as a flash memory, and the medium driving device 17 may be a reader and a writer for the memory card.

図5は、通信路で障害が発生した場合のBBシステムの処理の例(その2)を説明する図である。図5のBBシステム100において、図2と同じ構成要素には、図2と同じ符号を付す。   FIG. 5 is a diagram for explaining an example (part 2) of the process of the BB system when a failure occurs in the communication path. In the BB system 100 of FIG. 5, the same components as in FIG. 2 are denoted by the same reference numerals as in FIG.

スタンバイSP130の同期部132からマスタSP120の同期部122にSPデータを送信するための通信路151で障害が発生した場合、通信路151を用いたスタンバイSP130からマスタSP120へのSPデータの送信ができなくなる。すると、マスタSP120が記憶するSPデータとスタンバイSP130が記憶するSPデータが異なる、という状況が生じ得る。マスタSP120とスタンバイSP130とが異なるSPデータを記憶している場合、スタンバイSP130は、マスタSP120で障害が発生すると、マスタSP120のバックアップとして動作できなくなる。   When a failure occurs in the communication path 151 for transmitting SP data from the synchronization unit 132 of the standby SP 130 to the synchronization unit 122 of the master SP 120, SP data can be transmitted from the standby SP 130 to the master SP 120 using the communication path 151. It disappears. Then, a situation may occur in which the SP data stored by the master SP 120 and the SP data stored by the standby SP 130 are different. When the master SP 120 and the standby SP 130 store different SP data, the standby SP 130 can not operate as a backup of the master SP 120 when a failure occurs in the master SP 120.

そのため、本実施形態のスタンバイSP130は、通信路151で障害が発生した場合、障害が発生した通信路151の代替経路を形成する処理を開始する。代替経路を形成する処理では、まず、スタンバイSP130の検出部134が、スタンバイSP130からマスタSP120にSPデータを送信するための通信路151で障害を検出すると、障害を検出したことを、データ制御部133に通知する。データ制御部133は、記憶部131に記憶されている経由情報166に基づいて、スタンバイSP130と通信可能なスレイブSP140を特定する。データ制御部133は、特定したスレイブSP140のデータ経由部142に、スレイブSPデータ163を、係数情報164を用いて指標化するように求める計算命令を送信する。計算命令を受信したデータ経由部142は、スレイブSPデータ163と、記憶部141の係数情報164とから、データ転送に悪影響を与える要因を指標化したリスク指標値を計算する。データ経由部142は、計算したリスク指標値を、スタンバイSP130のデータ制御部133に送信する。   Therefore, when a failure occurs in the communication path 151, the standby SP 130 according to the present embodiment starts processing for forming an alternative path of the communication path 151 in which the failure has occurred. In the process of forming an alternative path, first, when the detecting unit 134 of the standby SP 130 detects a failure in the communication path 151 for transmitting SP data from the standby SP 130 to the master SP 120, the data control unit Notify 133 The data control unit 133 identifies the slave SP 140 that can communicate with the standby SP 130 based on the route information 166 stored in the storage unit 131. The data control unit 133 transmits, to the data passing unit 142 of the identified slave SP 140, a calculation instruction for obtaining the index of the slave SP data 163 using the coefficient information 164. The data passing unit 142 that has received the calculation instruction calculates a risk index value that indexes a factor that adversely affects data transfer from the slave SP data 163 and the coefficient information 164 of the storage unit 141. The data relay unit 142 transmits the calculated risk index value to the data control unit 133 of the standby SP 130.

スタンバイSP130のデータ制御部133は、計算命令を送信した全スレイブSP140から、リスク指標値を受け取ると、該リスク指標値に基づいて記憶部131の経由情報166を更新する。スタンバイSP130のデータ制御部133は、リスク指標値に基づいて(詳しくは、図9とともに後述する)、1つのスレイブSP140を選択する。スタンバイSP130のデータ制御部133は、選択したスレイブSP140を介した代替経路を形成する。   When the data control unit 133 of the standby SP 130 receives the risk index value from all slaves SP 140 that has transmitted the calculation instruction, the data control unit 133 updates the via information 166 of the storage unit 131 based on the risk index value. The data control unit 133 of the standby SP 130 selects one slave SP 140 based on the risk index value (details will be described later with reference to FIG. 9). The data control unit 133 of the standby SP 130 forms an alternative path via the selected slave SP 140.

代替経路が形成されると、スタンバイSP130の同期部132は、マスタSP120に送信するSPデータ(スタンバイSPデータ162)を、スタンバイSP130のデータ制御部133に出力する。スタンバイSP130のデータ制御部133は、同期部132から受け取ったSPデータを、選択したスレイブSP140のデータ経由部142に送信する。データ経由部142は、受信したSPデータを、マスタSP120のデータ制御部123に送信する。マスタSP120のデータ制御部123は、受信したSPデータを同期部122に出力する。同期部122は、データ制御部123から受け取ったSPデータを、記憶部121に記憶する。   When the alternative path is formed, the synchronization unit 132 of the standby SP 130 outputs the SP data (standby SP data 162) to be transmitted to the master SP 120 to the data control unit 133 of the standby SP 130. The data control unit 133 of the standby SP 130 transmits the SP data received from the synchronization unit 132 to the data passing unit 142 of the selected slave SP 140. The data passing unit 142 transmits the received SP data to the data control unit 123 of the master SP 120. The data control unit 123 of the master SP 120 outputs the received SP data to the synchronization unit 122. The synchronization unit 122 stores the SP data received from the data control unit 123 in the storage unit 121.

このように、スタンバイSP130が代替経路を形成することで、スタンバイSP130からマスタSP120にSPデータを送信するための通信路151で障害が発生しても、スタンバイSP130は、SPデータをマスタSP120に送信し続けることができる。マスタSP120とスタンバイSP130とが同じSPデータを記憶することで、スタンバイSP130は、マスタSP120のバックアップとして動作可能な状態を維持することができる。   Thus, even if a failure occurs in the communication path 151 for transmitting SP data from the standby SP 130 to the master SP 120 by the standby SP 130 forming an alternative path, the standby SP 130 transmits SP data to the master SP 120. You can keep doing. By the master SP 120 and the standby SP 130 storing the same SP data, the standby SP 130 can maintain an operable state as a backup of the master SP 120.

なお、図2と図5のBBシステム100では、SPデータの送信元となるマスタSP120又はスタンバイSP130が、SPデータの送信に使用する通信路の障害を検出し、代替経路を形成する。送信元となるSPが代替経路を形成することで、マスタSP120とスタンバイSP130は、同じSPデータを記憶することができる。   In the BB system 100 of FIGS. 2 and 5, the master SP 120 or the standby SP 130, which is the SP data transmission source, detects a failure in the communication path used for SP data transmission, and forms an alternative path. The master SP 120 and the standby SP 130 can store the same SP data as the transmission source SP forms an alternative path.

図6は、通信路で障害が発生した場合のBBシステムの処理の例(その3)を説明する図である。図6のBBシステム100において、図2と同じ構成要素には、図2と同じ符号を付す。図6のBBシステム100は、マスタSP120からスタンバイSP130にSPデータを送信するための通信路152と、スタンバイSP130からマスタSP120にSPデータを送信するための通信路151の双方で障害が発生した場合の例である。   FIG. 6 is a diagram for explaining an example (part 3) of the process of the BB system when a failure occurs in the communication path. In the BB system 100 of FIG. 6, the same components as in FIG. 2 are denoted by the same reference numerals as in FIG. In the BB system 100 of FIG. 6, failures occur in both the communication path 152 for transmitting SP data from the master SP 120 to the standby SP 130 and the communication path 151 for transmitting SP data from the standby SP 130 to the master SP 120. An example of

マスタSP120の検出部124は、マスタSP120からスタンバイSP130にSPデータを送信するための通信路152で障害を検出すると、障害を検出したことを、データ制御部123に通知する。同様に、スタンバイSP130の検出部134は、スタンバイSP130からマスタSP120にSPデータを送信するための通信路151で障害を検出すると、障害を検出したことを、データ制御部133に通知する。   When detecting a failure on the communication path 152 for transmitting SP data from the master SP 120 to the standby SP 130, the detection unit 124 of the master SP 120 notifies the data control unit 123 that the failure is detected. Similarly, when detecting a failure on the communication path 151 for transmitting SP data from the standby SP 130 to the master SP 120, the detection unit 134 of the standby SP 130 notifies the data control unit 133 that the failure is detected.

データ制御部123は、記憶部121に記憶されている経由情報165に基づいて、マスタSP120と通信可能なスレイブSP140を特定する。データ制御部123は、特定したスレイブSP140のデータ経由部142に、スレイブSPデータ163を、係数情報164を用いて指標化するように求める計算命令を送信する。   The data control unit 123 specifies the slave SP 140 that can communicate with the master SP 120 based on the via information 165 stored in the storage unit 121. The data control unit 123 transmits, to the data passing unit 142 of the specified slave SP 140, a calculation instruction for obtaining the index of the slave SP data 163 using the coefficient information 164.

データ制御部133は、記憶部131に記憶されている経由情報166に基づいて、スタンバイSP130と通信可能なスレイブSP140を特定する。データ制御部133は、特定したスレイブSP140のデータ経由部142に、スレイブSPデータ163を、係数情報164を用いて指標化するように求める計算命令を送信する。なお、データ制御部123及びデータ制御部133の処理は、異なる情報処理装置内で実行されるため、実行タイミングは異なってよい。   The data control unit 133 identifies the slave SP 140 that can communicate with the standby SP 130 based on the route information 166 stored in the storage unit 131. The data control unit 133 transmits, to the data passing unit 142 of the identified slave SP 140, a calculation instruction for obtaining the index of the slave SP data 163 using the coefficient information 164. Note that the processing of the data control unit 123 and the data control unit 133 is performed in different information processing apparatuses, so the execution timing may be different.

データ経由部142は、マスタSP120のデータ制御部123からの計算命令を受けると、リスク指標値を計算し、計算したリスク指標値を、マスタSP120のデータ制御部123に送信する。また、データ経由部142は、スタンバイSP130のデータ制御部133からの計算命令を受けると、リスク指標値を計算し、計算したリスク指標値を、スタンバイSP130のデータ制御部133に送信する。   When receiving the calculation instruction from the data control unit 123 of the master SP 120, the data passing unit 142 calculates a risk index value, and transmits the calculated risk index value to the data control unit 123 of the master SP 120. Also, upon receiving a calculation instruction from the data control unit 133 of the standby SP 130, the data passing unit 142 calculates a risk index value, and transmits the calculated risk index value to the data control unit 133 of the standby SP 130.

なお、スレイブSP140のデータ経由部142は、リスク指標値を送信する際に、併せて、スレイブSP140自身が既に代替経路として選択済みであるかを示す予約情報を送信する。   When transmitting the risk index value, the data relay unit 142 of the slave SP 140 also transmits reservation information indicating whether the slave SP 140 has already been selected as an alternative path.

マスタSP120のデータ制御部123は、計算命令を送信した全スレイブSP140から、リスク指標値及び予約情報を受け取ると、記憶部121の経由情報165に、リスク指標値及び予約情報を追加する。マスタSP120のデータ制御部123は、リスク指標値に基づいて(詳しくは、図9とともに後述する)、1つのスレイブSP140bを選択する。なお、既に代替経路として選択されていることが予約情報により示されているスレイブSP140は、選択対象から外される。マスタSP120のデータ制御部123は、選択したスレイブSP140bを介した代替経路を形成する。選択されたスレイブSP140bは、代替経路を形成する処理の際に、スレイブSP140b自身が代替経路として選択されたことを示す情報を、係数情報164として記憶部141bに記憶する。マスタSP120のデータ制御部123は、代替経路の形成が完了すると、代替経路の形成が完了したことを示すように、記憶部121の経由情報165を更新する。   When the data control unit 123 of the master SP 120 receives the risk index value and the reservation information from all slaves SP 140 that have transmitted the calculation instruction, the data control unit 123 adds the risk index value and the reservation information to the via information 165 of the storage unit 121. The data control unit 123 of the master SP 120 selects one slave SP 140 b based on the risk index value (to be described later in detail with reference to FIG. 9). The slave SP 140, which is indicated by the reservation information that has already been selected as the alternative route, is excluded from the selection targets. The data control unit 123 of the master SP 120 forms an alternative path via the selected slave SP 140 b. The selected slave SP 140 b stores information indicating that the slave SP 140 b itself is selected as an alternative path in the storage unit 141 b as coefficient information 164 in the process of forming the alternative path. When the formation of the alternative path is completed, the data control unit 123 of the master SP 120 updates the passing information 165 of the storage unit 121 so as to indicate that the formation of the alternative path is completed.

スタンバイSP130のデータ制御部133は、計算命令を送信した全スレイブSP140から、リスク指標値及び予約情報を受け取ると、記憶部131の経由情報166に、リスク指標値の情報及び予約情報を追加する。スタンバイSP130のデータ制御部133は、リスク指標値に基づいて(詳しくは、図9とともに後述する)、1つのスレイブSP140aを選択する。なお、既に代替経路として選択されていることが予約情報により示されているスレイブSP140bは、選択対象から外される。スタンバイSP130のデータ制御部133は、選択したスレイブSP140aを介した代替経路を形成する。選択されたスレイブSP140aは、代替経路を形成する処理の際に、スレイブSP140a自身が代替経路として選択されたことを示す情報を、スレイブSPデータ163として記憶部141aに記憶する。スタンバイSP130のデータ制御部133は、代替経路の形成が完了すると、代替経路の形成が完了したことを示すように、記憶部131の経由情報165を更新する。   When the data control unit 133 of the standby SP 130 receives the risk index value and the reservation information from all slaves SP 140 that have transmitted the calculation instruction, the data control unit 133 adds the information of the risk index value and the reservation information to the via information 166 of the storage unit 131. The data control unit 133 of the standby SP 130 selects one slave SP 140a based on the risk index value (to be described later in detail with reference to FIG. 9). The slave SP 140b, which is indicated by the reservation information that has already been selected as the alternative route, is excluded from the selection targets. The data control unit 133 of the standby SP 130 forms an alternative path via the selected slave SP 140a. The selected slave SP 140 a stores information indicating that the slave SP 140 a is selected as an alternative path in the storage unit 141 a as slave SP data 163 in the process of forming the alternative path. When the formation of the alternative path is completed, the data control unit 133 of the standby SP 130 updates the passing information 165 of the storage unit 131 so as to indicate that the formation of the alternative path is completed.

なお、BBシステム100に、スレイブSP140が1つしかない場合は、マスタSP120とスレイブSP140は、予約情報によらず、その1つのスレイブSP140を代替経路として選択する。   If there is only one slave SP 140 in the BB system 100, the master SP 120 and slave SP 140 select that one slave SP 140 as an alternative path regardless of the reservation information.

代替経路が形成されると、マスタSP120の同期部122は、スタンバイSP130に送信するSPデータ(マスタSPデータ161とスレイブSPデータ163a〜163n)を、データ制御部123に出力する。データ制御部123は、同期部122から受け取ったSPデータを、選択したスレイブSP140bのデータ経由部142bに送信する。データ経由部142bは、受信したSPデータを、スタンバイSP130のデータ制御部133に送信する。データ制御部133は、受信したSPデータを同期部132に出力する。同期部132は、データ制御部133から受け取ったSPデータを、記憶部131に記憶する。   When the alternative path is formed, the synchronization unit 122 of the master SP 120 outputs the SP data (master SP data 161 and slave SP data 163a to 163n) to be transmitted to the standby SP 130 to the data control unit 123. The data control unit 123 transmits the SP data received from the synchronization unit 122 to the data passing unit 142 b of the selected slave SP 140 b. The data passing unit 142 b transmits the received SP data to the data control unit 133 of the standby SP 130. The data control unit 133 outputs the received SP data to the synchronization unit 132. The synchronization unit 132 stores the SP data received from the data control unit 133 in the storage unit 131.

同様に、スタンバイSP130の同期部132は、マスタSP120に送信するSPデータ(スタンバイSPデータ162)を、スタンバイSP130のデータ制御部133に出力する。スタンバイSP130のデータ制御部133は、同期部132から受け取ったSPデータを、選択したスレイブSP140aのデータ経由部142aに送信する。データ経由部142aは、受信したSPデータを、マスタSP120のデータ制御部123に送信する。マスタSP120のデータ制御部123は、受信したSPデータを同期部122に出力する。同期部122は、データ制御部123から受け取ったSPデータを、記憶部121に記憶する。   Similarly, the synchronization unit 132 of the standby SP 130 outputs the SP data (standby SP data 162) to be transmitted to the master SP 120 to the data control unit 133 of the standby SP 130. The data control unit 133 of the standby SP 130 transmits the SP data received from the synchronization unit 132 to the data passing unit 142 a of the selected slave SP 140 a. The data passing unit 142a transmits the received SP data to the data control unit 123 of the master SP 120. The data control unit 123 of the master SP 120 outputs the received SP data to the synchronization unit 122. The synchronization unit 122 stores the SP data received from the data control unit 123 in the storage unit 121.

このように、SPデータの送信元となるマスタSP120又はスタンバイSP130が、SPデータの送信に使用する通信路の障害を検出し、代替経路を形成する。送信元となるSPが代替経路を形成することで、マスタSP120とスタンバイSP130は、同じSPデータを記憶することができる。マスタSP120とスタンバイSP130とが同じSPデータを記憶することで、スタンバイSP130は、マスタSP120のバックアップとして動作可能な状態を維持することができる。また、既に代替経路として選択されていることが予約情報により示されているスレイブSP140が、選択対象から外されることで、同じスレイブSP140が代替経路として二重に選ばれることを防ぐことができる。1つのスレイブSP140が2つの代替経路の中継点として二重に選択されることを防ぐことにより、データ送信を中継するためにスレイブSP140にかかる負荷が過大になることを防ぐことができる。   As described above, the master SP 120 or the standby SP 130, which is the SP data transmission source, detects a failure in the communication path used to transmit the SP data, and forms an alternative path. The master SP 120 and the standby SP 130 can store the same SP data as the transmission source SP forms an alternative path. By the master SP 120 and the standby SP 130 storing the same SP data, the standby SP 130 can maintain an operable state as a backup of the master SP 120. In addition, the slave SP 140, which is indicated by the reservation information that has already been selected as the alternative path, can be prevented from being double selected as the alternative path by being excluded from selection targets. . By preventing one slave SP 140 from being selected twice as a relay point of two alternative paths, it is possible to prevent an excessive load on the slave SP 140 to relay data transmission.

図7は、代替経路を形成する処理の例を説明する図である。図7のBBシステム100において、図2と同じ構成要素には、図2と同じ符号を付す。   FIG. 7 is a diagram for explaining an example of processing for forming an alternative path. In the BB system 100 of FIG. 7, the same components as in FIG. 2 are assigned the same reference numerals as in FIG. 2.

図7のBBシステム100では、通信路151で障害が発生している。そのため、スタンバイSP130は、1つのスレイブSP140を選択し、選択したスレイブSP140を介した代替経路の形成を開始する。以下に、代替経路の形成処理を、順番に示す。   In the BB system 100 of FIG. 7, a failure occurs in the communication path 151. Therefore, the standby SP 130 selects one slave SP 140 and starts forming an alternative path via the selected slave SP 140. Below, the formation process of an alternative path is shown in order.

ステップS1で、スタンバイSP130のデータ制御部133は、自スタンバイSP130内の同期部132に、SPデータを送信する処理を停止するよう求める停止命令を出力する。停止命令により、スタンバイSP130の同期部132から、マスタSP120の同期部122へのデータ送信が停止される。   In step S1, the data control unit 133 of the standby SP 130 outputs, to the synchronization unit 132 in the own standby SP 130, a stop instruction for stopping the process of transmitting the SP data. By the stop instruction, data transmission from the synchronization unit 132 of the standby SP 130 to the synchronization unit 122 of the master SP 120 is stopped.

ステップS2で、スタンバイSP130のデータ制御部133は、同期部132に設定されている接続先情報を、バックアップ166として記憶部131に記憶する。同期部132に設定されている接続先情報は、通信路151に対応する情報処理装置101側のInternet Protocol address(IP)アドレスやPort番号などを含む。   In step S2, the data control unit 133 of the standby SP 130 stores the connection destination information set in the synchronization unit 132 in the storage unit 131 as the backup 166. The connection destination information set in the synchronization unit 132 includes an Internet Protocol address (IP) address or a port number of the information processing apparatus 101 corresponding to the communication path 151.

ステップS3で、スタンバイSP130のデータ制御部133は、同期部132の接続先情報に、データ制御部133に割り当てられているIPアドレスとPort番号を設定する。   In step S3, the data control unit 133 of the standby SP 130 sets the IP address and port number assigned to the data control unit 133 in the connection destination information of the synchronization unit 132.

ステップS4で、スタンバイSP130のデータ制御部133は、同期部132を再起動する。   In step S4, the data control unit 133 of the standby SP 130 restarts the synchronization unit 132.

再起動により、ステップS5で、スタンバイSP130の同期部132は、ステップS3で接続先情報として設定されたIPアドレスとPort番号を認識し、データ制御部133との間の通信路を形成する。同期部132とデータ制御部133との間の通信路は、具体的には、ソケットを利用したプロセス間通信のための論理的な通信路である。なお、同期部132の再起動に伴い、通信路152も一度切断されるが、リトライ処理などで自動的に通信路152は再形成される。つまり、通信路152上のコネクションは一度切断されるが、通信路152を実現するための物理的なケーブルには障害がないため、通信路152上のコネクションはリトライ処理などにより再確立される。通信路152上のコネクションは、具体的には、例えばTransmission Control Protocol(TCP)コネクションである。   By restarting, in step S5, the synchronization unit 132 of the standby SP 130 recognizes the IP address and port number set as connection destination information in step S3 and forms a communication path with the data control unit 133. The communication path between the synchronization unit 132 and the data control unit 133 is specifically a logical communication path for inter-process communication using a socket. Note that although the communication path 152 is disconnected once along with the restart of the synchronization unit 132, the communication path 152 is automatically rebuilt by a retry process or the like. That is, although the connection on the communication path 152 is disconnected once, since there is no failure in the physical cable for realizing the communication path 152, the connection on the communication path 152 is reestablished by a retry process or the like. The connection on the communication path 152 is specifically, for example, a Transmission Control Protocol (TCP) connection.

ステップS6で、スタンバイSP130のデータ制御部133は、記憶部131に記憶されている経由情報165を参照し、選択(予約)されたスレイブSP140を特定する。   In step S6, the data control unit 133 of the standby SP 130 refers to the via information 165 stored in the storage unit 131, and specifies the selected (reserved) slave SP 140.

ステップS7で、スタンバイSP130のデータ制御部133は、選択されたスレイブSP140のデータ経由部142に、代替経路の形成依頼を送信する。   In step S7, the data control unit 133 of the standby SP 130 transmits an alternative path formation request to the data passing unit 142 of the selected slave SP 140.

ステップS8で、スレイブSP140のデータ経由部142は、マスタSP120のデータ制御部123に、データ経由部142に設定されているIPアドレスやPort番号を含む接続先情報、及び代替経路の形成依頼を、送信する。ここで、データ経由部142のIPアドレスを、192.168.200とし、ポート番号を、1001とする。そのため、ステップS8では、スレイブSP140のデータ経由部142は、IPアドレスが192.168.200で、ポート番号が1001の接続先情報を、マスタSP120のデータ制御部123に送信する。   In step S8, the data passing unit 142 of the slave SP 140 sends, to the data control unit 123 of the master SP 120, connection destination information including the IP address and port number set in the data passing unit 142, and a request for forming an alternative path. Send. Here, the IP address of the data passing unit 142 is 192.168.200, and the port number is 1001. Therefore, in step S8, the data passing unit 142 of the slave SP 140 transmits connection destination information having an IP address of 192.168.200 and a port number of 1001 to the data control unit 123 of the master SP 120.

ステップS9で、マスタSP120のデータ制御部123は、代替経路の形成依頼を受信すると、IPアドレスが192.168.200で、ポート番号が1001の接続先情報を用いて、スレイブSP140との間の通信路を形成する。具体的には、データ制御部123は、データ制御部123とデータ経由部142の間のコネクションを確立する。   In step S9, when the data control unit 123 of the master SP 120 receives the request to form an alternative path, it uses the connection destination information with an IP address of 192.168.200 and a port number of 1001 to communicate with the slave SP 140. Form a communication path. Specifically, the data control unit 123 establishes a connection between the data control unit 123 and the data relay unit 142.

ステップS10で、マスタSP120のデータ制御部123は、同期部122との通信路を形成する。同期部122とデータ制御部123との間の通信路は、具体的には、ソケットを利用したプロセス間通信のための論理的な通信路である。   In step S10, the data control unit 123 of the master SP 120 forms a communication path with the synchronization unit 122. The communication path between the synchronization unit 122 and the data control unit 123 is specifically a logical communication path for inter-process communication using a socket.

ステップS11で、マスタSP120のデータ制御部123は、スレイブSP140のデータ経由部142に、代替経路の形成依頼に対応する処理が完了したことを示す情報を送信する。   In step S11, the data control unit 123 of the master SP 120 transmits, to the data passing unit 142 of the slave SP 140, information indicating that the process corresponding to the request for forming the alternative path has been completed.

ステップS12で、マスタSP120のデータ制御部123は、選択(予約)されたスレイブSP140が、代替経路として選択済みであることを示す情報を、記憶部121の経由情報165に追加する。ステップS12の処理は、ステップS11と並列されて行われてもよい。また、ステップS12の処理は、ステップS11よりも先に行われても良い。   In step S12, the data control unit 123 of the master SP 120 adds information indicating that the selected (reserved) slave SP 140 has already been selected as an alternative route to the via information 165 of the storage unit 121. The process of step S12 may be performed in parallel with step S11. Also, the process of step S12 may be performed before step S11.

ステップS13で、スレイブSP140のデータ経由部142は、スタンバイSP130のデータ制御部133に、マスタSP120のデータ制御部123側で代替経路の形成依頼に対応する処理が完了したことを示す情報を送信する。併せて、スレイブSP140のデータ経由部142は、データ経由部142に設定されているIPアドレスやPort番号を含む接続先情報を、スタンバイSP130のデータ制御部133に送信する。データ経由部142は、スレイブSP140のデータ制御部123に送信する接続先情報は、ステップS8の接続先情報とは、ポート番号が異なる。例えば、ステップS13で送信する接続先情報は、データ経由部142のIPアドレスを、192.168.200とポート番号を、1000である。   In step S13, the data passing unit 142 of the slave SP 140 transmits, to the data control unit 133 of the standby SP 130, information indicating that the process corresponding to the request for forming the alternative path has been completed on the data control unit 123 side of the master SP 120. . At the same time, the data passing unit 142 of the slave SP 140 transmits connection destination information including the IP address and port number set in the data passing unit 142 to the data control unit 133 of the standby SP 130. The data passing unit 142 transmits the connection destination information transmitted to the data control unit 123 of the slave SP 140 to a port number different from the connection destination information in step S8. For example, the connection destination information transmitted in step S13 has an IP address of the data passing unit 142 of 192.168.200 and a port number of 1000.

ステップS14で、スタンバイSP130のデータ制御部133は、受信した接続情報に含まれるIPアドレスやPort番号を用いて、スレイブSP140との間の通信路を形成する。具体的には、データ制御部133は、データ制御部133とデータ経由部142の間のコネクションを確立する。   In step S14, the data control unit 133 of the standby SP 130 forms a communication path with the slave SP 140 using the IP address and port number included in the received connection information. Specifically, the data control unit 133 establishes a connection between the data control unit 133 and the data relay unit 142.

以上のように、データ経由部142とマスタSP120のデータ制御部123との間の通信路をデータ制御部123が形成するとともに、データ経由部142とスタンバイSP130のデータ制御部133との間の通信路をデータ制御部133が形成する。その結果、スレイブSP140(より具体的にはデータ経由部142)は、マスタSP120とスタンバイSP130の間のデータの送受信を中継することが可能となる。   As described above, the data control unit 123 forms a communication path between the data passing unit 142 and the data control unit 123 of the master SP 120, and communication between the data passing unit 142 and the data control unit 133 of the standby SP 130. The data control unit 133 forms a path. As a result, the slave SP 140 (more specifically, the data relay unit 142) can relay transmission and reception of data between the master SP 120 and the standby SP 130.

なお、図7は、通信路151で障害が発生した場合の例である。通信路152で障害が発生した場合は、ステップS1〜S7・S14と同様の処理をマスタSP120が行い、ステップS8・S10・S12と同様の処理をスタンバイSP130が行う。また、通信路152で障害が発生した場合は、ステップS8の送信はスレイブSP140からスタンバイSP130への送信に置き換えられ、ステップS13の送信はスレイブSP140からマスタSP120への送信に置き換えられる。   FIG. 7 is an example in the case where a failure occurs in the communication path 151. When a failure occurs in the communication path 152, the master SP 120 performs the same processing as steps S1 to S7 and S14, and the standby SP 130 performs the same processing as steps S8, S10, and S12. When a failure occurs in the communication path 152, the transmission in step S8 is replaced with the transmission from the slave SP 140 to the standby SP 130, and the transmission in step S13 is replaced with the transmission from the slave SP 140 to the master SP 120.

図8は、経由情報の例を説明する図である。マスタSP120の経由情報165及びスレイブSP130の経由情報166は、自SPが通信可能なスレイブSP140についての情報、スレイブSP140への問い合わせが済んだか否かを示す問い合わせ情報、経由状況情報、リスク指標値、選択情報を含む。図8の経由情報の例は、図5に示すスタンバイSP130の経由情報166の例である。   FIG. 8 is a diagram for explaining an example of the route information. Master SP 120 via information 165 and slave SP 130 via information 166 are information on slave SP 140 with which the own SP can communicate, inquiry information indicating whether inquiry to slave SP 140 has been completed, via situation information, risk index value, Contains selection information. The example of the route information of FIG. 8 is an example of the route information 166 of the standby SP 130 shown in FIG.

図8の経由情報には、スタンバイSP130が通信可能なスレイブSP140として、スレイブSP140a〜140nを示す情報(例えばスレイブSP140a〜140nそれぞれの識別子)が含まれる。スタンバイSP130の経由情報166は、スタンバイSP130が通信可能なスレイブSP140の情報として、検出部134が検出した情報処理装置103a〜103nにそれぞれ搭載されたスレイブSP140a〜140nの各々を示す情報を含む。なお、マスタSP120の経由情報165では、マスタSP120が通信可能なスレイブSP140の情報として、検出部124が検出した情報処理装置103a〜103nにそれぞれ搭載されたスレイブSP140a〜140nの各々を示す情報が含まれる。   The via information in FIG. 8 includes information (for example, an identifier of each of the slave SPs 140a to 140n) indicating the slave SP 140a to 140n as the slave SP 140 with which the standby SP 130 can communicate. The route information 166 of the standby SP 130 includes, as information of the slave SP 140 with which the standby SP 130 can communicate, information indicating each of the slave SPs 140 a to 140 n mounted on the information processing apparatuses 103 a to 103 n detected by the detector 134. The route information 165 of the master SP 120 includes, as the information on the slave SP 140 with which the master SP 120 can communicate, information indicating each of the slave SPs 140 a to 140 n mounted on the information processing apparatuses 103 a to 103 n detected by the detection unit 124. Be

図8の経由情報の例は、スタンバイSP130が通信可能なスレイブSP140の各々への問い合わせが済んだか否かを示す問い合わせ情報を含む。問い合わせ情報は、スタンバイSP130のデータ制御部133がスレイブSP140に、スレイブSPデータ163を、係数情報164を用いて指標化するように求める計算命令を、既に送信したかどうかを示す情報である。スタンバイSP130のデータ制御部133が、既にスレイブSP140に対して計算命令を送信済みである場合、問い合わせ情報には、計算命令が送信済みであることを示す「済」が設定される。スレイブSP140に対して計算命令がまだ送信されていない場合、問い合わせ情報には、計算命令が送信されていないことを示す「未」が設定される。なお、マスタSP120の経由情報165でも、同様に、スレイブSP140に対して計算命令が送られているかを示す情報が、問い合わせ情報に設定される。   The example of the route information in FIG. 8 includes inquiry information indicating whether or not each standby SP 130 has made an inquiry to each of the slave SPs 140 with which it can communicate. The inquiry information is information indicating whether or not the data control unit 133 of the standby SP 130 has already transmitted to the slave SP 140 a calculation instruction to index the slave SP data 163 using the coefficient information 164. When the data control unit 133 of the standby SP 130 has already sent the calculation instruction to the slave SP 140, “Done” indicating that the calculation instruction has been sent is set in the inquiry information. If a calculation instruction has not been sent to slave SP 140, the inquiry information is set to “not yet” indicating that the calculation instruction has not been sent. Also in the transit information 165 of the master SP 120, similarly, information indicating whether a calculation instruction is sent to the slave SP 140 is set in the inquiry information.

図8の経由情報は、スタンバイSP130が通信可能なスレイブSP140の各々に対応する経由状況情報を含む。経由状況情報は、各スレイブSP140の通信状況を示す情報である。経由状況情報は、「経由OK」、「経由NG」、「経由予約中」、「経由中」、「不明」などの値により示される。経由状況情報は、リスク指標値の計算命令に応じて、スレイブSP140から受信される。「経由OK」は、スレイブSP140が、マスタSP120とスタンバイSP130の両方と通信可能であることを示す。「経由NG」は、スレイブSP140が、マスタSP120又はスタンバイSP130の少なくともどちらか一方と、通信ができない状態を示す。スタンバイSP130の経由情報166内における「経由予約中」は、マスタSP120側からスレイブSP140が代替経路の形成依頼を受けている状態を示す。なお、マスタSP120の経由情報165における「経由予約中」は、スタンバイSP130側からスレイブSP140が代替経路の形成依頼を受けている状態を示す。「経由中」は、該スレイブSP140が、既に代替経路として使用されていることを示す。「不明」は、スレイブSP140がマスタSP120及びスタンバイSP130と通信可能であるか否かということが、未確認であるため不明である、ということを示す。また、「不明」は、スレイブSP140に搭載されている処理装置などのハードウェア装置の状態が不明であることも示す。   The route information in FIG. 8 includes the route status information corresponding to each slave SP 140 with which the standby SP 130 can communicate. The passing situation information is information indicating the communication situation of each slave SP 140. The passage status information is indicated by values such as “via OK”, “via NG”, “via via reservation”, “via via”, “unknown” and the like. The passing situation information is received from the slave SP 140 in accordance with the calculation instruction of the risk index value. "By way OK" indicates that the slave SP 140 can communicate with both the master SP 120 and the standby SP 130. "By way NG" indicates that the slave SP 140 can not communicate with at least one of the master SP 120 and the standby SP 130. The “via-reserved” in the via information 166 of the standby SP 130 indicates that the slave SP 140 has received a request for forming an alternative route from the master SP 120 side. The “via-reserved” in the via information 165 of the master SP 120 indicates a state in which the slave SP 140 has received a request for forming an alternative path from the standby SP 130 side. "By way through" indicates that the slave SP 140 is already used as an alternative path. "Unknown" indicates that whether or not the slave SP 140 can communicate with the master SP 120 and the standby SP 130 is unknown because it is unconfirmed. “Unknown” also indicates that the state of a hardware device such as a processing device mounted on the slave SP 140 is unknown.

リスク指標値は、スレイブSP140のデータ経由部142が、記憶部141の係数情報164に含まれる情報を用いて、スレイブSPデータ163から、データ転送に悪影響を与える要因を指標化した値である(詳しくは、図9とともに後述する)。リスク指標値は、スレイブSP140からスタンバイSP130に送信され、経由情報165の一部として記憶部131に書き込まれる。リスク指標値は、データ転送に悪影響を与える要因を指標化した値であるため、数値が小さい(悪影響が少ない)ものほど好ましい。図8の経由情報166では、スレイブSP140aに対するリスク指標値は1、スレイブSP140bに対するリスク指標値は25、スレイブSP140nに対するリスク指標値は20である。すると、リスク指標値が最も小さいスレイブSP140aが、データ転送に悪影響を与える要因が少なく、データを中継するのに望ましいと判断できる。そのため、マスタSP120のデータ制御部123及びスタンバイSP130のデータ制御部133は、代替経路を形成するために用いるスレイブSP140を選択する場合に、リスク指標値の値が最も小さいスレイブSP140を選択する。   The risk index value is a value obtained by indexing the factor that adversely affects data transfer from the slave SP data 163 using the information included in the coefficient information 164 of the storage unit 141 by the data passing unit 142 of the slave SP 140 (see FIG. The details will be described later with reference to FIG. The risk index value is transmitted from the slave SP 140 to the standby SP 130 and written to the storage unit 131 as part of the route information 165. The risk index value is a value obtained by indexing factors that adversely affect data transfer, so the smaller the value (the less adverse effect), the better. In the route information 166 of FIG. 8, the risk index value for slave SP 140a is 1, the risk index value for slave SP 140b is 25, and the risk index value for slave SP 140n is 20. Then, the slave SP 140a with the smallest risk index value has few factors that adversely affect data transfer, and it can be determined that it is desirable to relay data. Therefore, the data control unit 123 of the master SP 120 and the data control unit 133 of the standby SP 130 select the slave SP 140 having the smallest value of the risk index value when selecting the slave SP 140 used to form the alternative path.

選択情報は、各スレイブSP140が、代替経路として選択されているかを示す情報である。マスタSP120のデータ制御部123及びスタンバイSP130のデータ制御部133は、代替経路の形成に用いたスレイブSP140に対応する選択情報に、「選択」を設定する。なお、代替経路として用いられないスレイブSP140に対応する選択情報には、「未選択」が設定される。   The selection information is information indicating whether each slave SP 140 is selected as an alternative path. The data control unit 123 of the master SP 120 and the data control unit 133 of the standby SP 130 set “selection” in the selection information corresponding to the slave SP 140 used for forming the alternative path. In addition, "not selected" is set to the selection information corresponding to slave SP 140 which is not used as an alternative path.

図9は、係数情報の例を説明する図である。係数情報164は、スレイブSP140の記憶部141に予め設定されている。係数情報164は、スレイブSP140が搭載されている自情報処理装置103の状態を指標化するために用いられる。   FIG. 9 is a diagram for explaining an example of coefficient information. The coefficient information 164 is preset in the storage unit 141 of the slave SP 140. The coefficient information 164 is used to index the state of the self information processing apparatus 103 in which the slave SP 140 is mounted.

スレイブSP140は、自情報処理装置内のプロセッサ(処理装置)やメモリなどのハードウェア装置を管理する。実際には、スレイブSP140は、各処理装置などのハードウェア装置を管理する管理部143を備える。データ経由部142は、マスタSP120のデータ制御部123又はスタンバイSP130のデータ制御部133から計算命令を受信すると、管理部143に、各ハードウェア装置の状態を問い合わせる。データ経由部142は、管理部143から各処理装置の状態を示す情報(すなわち、スレイブSPデータ163の少なくとも一部)を受け取ると、管理部143から受け取った情報と記憶部141内の係数情報164とを用いて、リスク指標値を算出する。   The slave SP 140 manages hardware devices such as a processor (processing device) and a memory in the own information processing device. In practice, the slave SP 140 includes a management unit 143 that manages hardware devices such as processing devices. When receiving the calculation instruction from the data control unit 123 of the master SP 120 or the data control unit 133 of the standby SP 130, the data passing unit 142 inquires of the management unit 143 the state of each hardware device. When data passing unit 142 receives information indicating the state of each processing device from management unit 143 (that is, at least a part of slave SP data 163), data passage unit 142 receives the information received from management unit 143 and coefficient information 164 in storage unit 141. To calculate the risk index value.

ここで、係数情報164は、処理装置などのハードウェア装置の状態を示す情報と、その状態情報により示される状態がスレイブSP140を介したデータ送信に悪影響を与える程度を指標化した指標値と、を含む。換言すれば、各指標値は、各状態に対応する係数である。ハードウェア装置の状態には、以下のような例がある。
・パーティションON実行中(高負荷処理中)
・パーティションON実行中(低負荷処理中)
・パーティションON状態
・パーティションOFF実行中
・パーティションOFF状態
・一部のハードウェア装置が故障
・I/O装置が接続されている状態
・4つの情報処理装置が1つのパーティションに所属
・3つの情報処理装置が1つのパーティションに所属
・2つの情報処理装置が1つのパーティションに所属
・1つの情報処理装置が1つのパーティションに所属
Here, the coefficient information 164 is information indicating the state of a hardware device such as a processing device, and an index value that indexes the degree to which the state indicated by the state information adversely affects data transmission via the slave SP 140. including. In other words, each index value is a coefficient corresponding to each state. There are the following examples of the state of the hardware device.
-Partition ON is in progress (during high load processing)
-Partition ON is in progress (low load processing)
-Partition ON state-Partition OFF in progress-Partition OFF state-Some hardware devices have failed-I / O devices are connected-Four information processing devices belong to one partition-Three information processing Device belongs to one partition-Two information processing devices belong to one partition-One information processing device belongs to one partition

上記のような、ハードウェア装置の状態情報の各々に対応して、係数情報164では、指標値が設定されている。1つのパーティションには1つ以上の情報処理装置が所属し、1つのパーティション上では1つのOperating System(OS)が実行される。具体的には、1つのパーティションに所属する1つ以上の情報処理装置に搭載された1つ以上の処理装置により、1つのOSが実行される。こうして、1つのパーティションに所属する1つ以上の情報処理装置により、論理的に1つの情報処理装置が実現される。   Index values are set in the coefficient information 164 corresponding to each of the above-described state information of the hardware device. One or more information processing apparatuses belong to one partition, and one operating system (OS) is executed on one partition. Specifically, one OS is executed by one or more processing devices mounted on one or more information processing apparatuses belonging to one partition. Thus, one information processing apparatus is logically realized by one or more information processing apparatuses belonging to one partition.

パーティションONとは、1つ以上の情報処理装置を、論理的に1つの情報処理装置として動作させるための処理であり、論理的にパーティションを形成する処理である。パーティションON実行(準備)処理は、高負荷の期間と、低負荷の期間に分けられる。高負荷の期間のほうが、低負荷の期間よりも、データ送信に悪影響を及ぼす。そのため、図9の係数情報164では、「パーティションON実行中(高負荷処理中)」の指標値は50であり、「パーティションON実行中(低負荷処理中)」の指標値は40である。「パーティションON状態」では、1つ以上の情報処理装置を論理的に1つの情報処理装置として動作させる環境が既に整っているため、情報処理装置に対するパーティション設定の処理は行われない。「パーティションON実行中」よりも「パーティションON状態」の方が、データ送信に悪影響を及ぼす要因が少ない。そのため、「パーティションON状態」には、指標値30が設定されている。   Partition ON is processing for causing one or more information processing apparatuses to logically operate as one information processing apparatus, and processing for forming partitions logically. The partition ON execution (preparation) process is divided into a high load period and a low load period. The high load period adversely affects data transmission than the low load period. Therefore, in the coefficient information 164 of FIG. 9, the index value of “partition ON in progress (high load processing)” is 50, and the index value of “partition ON in progress (low load processing)” is 40. In the "partition ON state", since the environment for operating one or more information processing apparatuses logically as one information processing apparatus is already established, the process of partition setting for the information processing apparatus is not performed. There are fewer factors that adversely affect data transmission in "partition ON state" than "partition ON in progress". Therefore, the index value 30 is set in the "partition ON state".

「パーティションOFF実行中」は、論理的に1つの情報処理装置として動作していた環境を止める処理を実行している最中であることを示す。「パーティションOFF実行中」は、OSが停止されるため、OSが実行されている「パーティションON状態」よりもデータ送信に悪影響を及ぼす要因が少ない。そのため、「パーティションOFF実行中」には、指標値20が設定されている。「パーティションOFF状態」は、既にパーティションOFF処理が完了しているため、各情報処理装置が、パーティションに関連する処理をしていない状態である。「パーティションOFF状態」は、「パーティションOFF実行中」よりもデータ送信に悪影響を及ぼす要因が少ない。そのため、「パーティションOFF状態」には、指標値10が設定されている。   “Partition OFF in progress” indicates that processing for stopping the environment which has logically been operated as one information processing apparatus is being executed. In “partition off in progress”, the OS is stopped, so there are fewer factors that adversely affect data transmission than in the “partition on state” in which the OS is running. Therefore, the index value 20 is set in "partition OFF in progress". In the “partition off state”, since the partition off process has already been completed, each information processing apparatus is not in a process related to the partition. The "partition off state" has less factors that adversely affect data transmission than "partition off in progress". Therefore, an index value of 10 is set in the “partition OFF state”.

スレイブSP140が搭載されている情報処理装置103に含まれる処理装置のうち、一部のハードウェア装置が故障している場合は、当該スレイブSP140を介したデータ送信に悪影響があることが考えられる。そのため、一部のハードウェア装置が故障している場合の指標値には、100が設定されている。スレイブSP140が搭載されている情報処理装置103にI/O装置が接続されている場合、スレイブSP140内の該I/O装置を別の処理に使用する可能性があるため、スレイブSP140のデータ送信処理に悪影響が及ぶことが考えられる。そのため、I/O装置が接続されている場合の指標値には、20が設定されている。   If a part of the hardware devices of the processing devices included in the information processing device 103 in which the slave SP 140 is mounted is broken, it is conceivable that data transmission via the slave SP 140 is adversely affected. Therefore, 100 is set as the index value in the case where some hardware devices fail. When an I / O device is connected to the information processing device 103 in which the slave SP 140 is mounted, there is a possibility that the I / O device in the slave SP 140 may be used for another process, so data transmission of slave SP 140 is performed. It is possible that the processing is adversely affected. Therefore, 20 is set as the index value when the I / O device is connected.

係数情報164では、更に、パーティションに所属する情報処理装置の数に応じて、指標値が設定されている。例えば、ある処理装置が搭載されている情報処理装置が所属するパーティションに所属する情報処理装置の数が3のとき、当該処理装置の状態情報は、「3つの情報処理装置が1つのパーティションに所属」と表される。例えば、情報処理装置が4つあると、4つの情報処理装置のうち少なくとも1つの情報処理装置に障害が発生する確率は、情報処理装置が1つの場合の約4倍となる。そのため、1つのパーティションに所属する情報処理装置が4つの場合、指標値は40と設定されている。1つのパーティションに所属する情報処理装置が1つの場合、指標値は10と設定されている。   In the coefficient information 164, index values are further set according to the number of information processing apparatuses belonging to the partition. For example, when the number of information processing apparatuses belonging to a partition to which an information processing apparatus on which a certain processing apparatus is mounted belongs is 3, state information of the processing apparatus indicates that "three information processing apparatuses belong to one partition Is represented. For example, when there are four information processing devices, the probability that a failure occurs in at least one of the four information processing devices is about four times that in the case where one information processing device is present. Therefore, when there are four information processing apparatuses belonging to one partition, the index value is set to 40. If one information processing apparatus belongs to one partition, the index value is set to 10.

なお、上記の指標値に設定されている値は、変更可能であり、数値を限定するものではない。また、処理装置などのハードウェア装置の状態も、更に異なる状態を示す情報があってよい。   In addition, the value set to said index value is changeable, and does not limit a numerical value. Further, the state of a hardware device such as a processing device may further include information indicating a further different state.

データ経由部142は、スレイブSPデータ163により表される処理装置の状態に対応した指標値を足し合わせることで、リスク指標値を算出する。マスタSP120のデータ制御部123及びスレイブSP130のデータ制御部133は、データ経由部142からリスク指標値を受信すると、リスク指標値の小さい情報処理装置103(より具体的にはスレイブSP140)を、代替経路の形成のために選択する。   The data passing unit 142 calculates a risk index value by adding together index values corresponding to the state of the processing device represented by the slave SP data 163. When the data control unit 123 of the master SP 120 and the data control unit 133 of the slave SP 130 receive the risk index value from the data passing unit 142, they substitute the information processing apparatus 103 (more specifically, the slave SP 140) having a small risk index value. Choose for route formation.

図10は、マスタSPの代替経路形成処理の例を説明するフローチャートである。検出部124は、同期部122が同期部132にSPデータを送信するのに用いる通信路152の障害がある場合に、障害があることを検出する(ステップS101)。通信路152に障害がない場合(ステップS101でNO)、検出部124は、ステップS101の処理(すなわち通信路152の監視)を繰り返す。通信路152に障害がある場合(ステップS101でYES)、検出部124は、データ制御部123に、障害が発生していることを通知する(ステップS102)。   FIG. 10 is a flow chart for explaining an example of the alternative route formation processing of the master SP. If there is a failure in the communication path 152 used by the synchronization unit 122 to transmit SP data to the synchronization unit 132, the detection unit 124 detects that there is a failure (step S101). If there is no failure in the communication path 152 (NO in step S101), the detection unit 124 repeats the process of step S101 (that is, monitoring of the communication path 152). If there is a failure in the communication path 152 (YES in step S101), the detection unit 124 notifies the data control unit 123 that a failure has occurred (step S102).

データ制御部123は、経由情報165を参照し、マスタSP120と通信可能なスレイブSP140があるかを判定する(ステップS103)。マスタSP120と通信可能なスレイブSP140がない場合(ステップS103でNO)、マスタSP120は、代替経路形成処理を終了する。マスタSP120と通信可能なスレイブSP1401つ以上がある場合(ステップS103でYES)、データ制御部123は、通信可能な全スレイブSP140に、リスク指標値を計算するよう求める計算命令を送信する(ステップS104)。   The data control unit 123 refers to the route information 165 and determines whether there is a slave SP 140 that can communicate with the master SP 120 (step S103). If there is no slave SP 140 that can communicate with the master SP 120 (NO in step S 103), the master SP 120 ends the alternative path formation process. If there is one or more slave SP 140 that can communicate with master SP 120 (YES in step S 103), data control unit 123 transmits a calculation instruction to calculate a risk index value to all communicable slave SPs 140 (step S 104). ).

データ制御部123は、リスク指標値を、通信可能な全スレイブSP140から受信したかを判定する(ステップS105)。通信可能な全スレイブSP140からリスク指標値を受信していない場合(ステップS105でNO)、データ制御部123は、ステップS105の処理を繰り返す。通信可能な全スレイブSP140からリスク指標値を受信した場合(ステップS105でYES)、データ制御部123は、リスク指標値の最も小さいスレイブSP140を選択する(ステップS106)。   The data control unit 123 determines whether the risk index value has been received from all the communicable slaves SP 140 (step S105). If the risk index value has not been received from all communicable slaves SP 140 (NO in step S 105), the data control unit 123 repeats the process of step S 105. When the risk index value is received from all communicable slaves SP 140 (YES in step S 105), the data control unit 123 selects the slave SP 140 having the smallest risk index value (step S 106).

データ制御部123は、選択したスレイブSP140を用いて代替経路を形成する(ステップS107)。代替経路を形成すると、データ制御部123は、代替経路形成処理を終了する。代替経路が形成されると、マスタSP120の同期部122は、データ制御部123と代替経路を介して、スタンバイSP130のデータ制御部133にSPデータを送信する。   The data control unit 123 forms an alternative path using the selected slave SP 140 (step S107). After forming the alternative path, the data control unit 123 ends the alternative path formation process. When the alternative path is formed, the synchronization unit 122 of the master SP 120 transmits the SP data to the data control unit 133 of the standby SP 130 via the data control unit 123 and the alternative path.

図11は、スタンバイSPの代替経路形成処理の例を説明するフローチャートである。検出部134は、同期部132が同期部122にSPデータを送信するのに用いる通信路151の障害がある場合に、障害があることを検出する(ステップS201)。通信路151に障害がない場合(ステップS201でNO)、検出部134は、ステップS201の処理(すなわち通信路151の監視)を繰り返す。通信路151に障害がある場合(ステップS201でYES)、検出部134は、データ制御部133に、障害が発生していることを通知する(ステップS202)。   FIG. 11 is a flow chart for explaining an example of a standby SP alternative path formation process. If there is a failure in the communication path 151 used by the synchronization unit 132 to transmit SP data to the synchronization unit 122, the detection unit 134 detects that there is a failure (step S201). If there is no failure in the communication path 151 (NO in step S201), the detection unit 134 repeats the process of step S201 (that is, monitoring of the communication path 151). If there is a failure in the communication path 151 (YES in step S201), the detection unit 134 notifies the data control unit 133 that a failure has occurred (step S202).

データ制御部133は、経由情報166を参照し、スタンバイSP130と通信可能なスレイブSP140があるかを判定する(ステップS203)。スタンバイSP130と通信可能なスレイブSP140がない場合(ステップS203でNO)、スタンバイSP130は、代替経路形成処理を終了する。スタンバイSP130と通信可能なスレイブSP1401つ以上がある場合(ステップS203でYES)、データ制御部133は、通信可能な全スレイブSP140に、リスク指標値を計算するよう求める計算命令を送信する(ステップS204)。   The data control unit 133 refers to the route information 166 and determines whether there is a slave SP 140 that can communicate with the standby SP 130 (step S203). If there is no slave SP 140 that can communicate with the standby SP 130 (NO in step S 203), the standby SP 130 ends the alternative path formation processing. If there is one or more slave SPs 140 that can communicate with the standby SP 130 (YES in step S203), the data control unit 133 transmits a calculation instruction for calculating the risk index value to all the communicable slaves SP 140 (step S204). ).

データ制御部133は、リスク指標値を、通信可能な全スレイブSP140から受信したかを判定する(ステップS205)。通信可能な全スレイブSP140からリスク指標値を受信していない場合(ステップS205でNO)、データ制御部133は、ステップS205の処理を繰り返す。通信可能な全スレイブSP140からリスク指標値を受信した場合(ステップS205でYES)、データ制御部133は、リスク指標値の最も小さいスレイブSP140を選択する(ステップS206)。   The data control unit 133 determines whether the risk index value has been received from all communicable slaves SP 140 (step S205). If the risk index value has not been received from all communicable slaves SP 140 (NO in step S 205), the data control unit 133 repeats the process of step S 205. When the risk index value is received from all communicable slaves SP 140 (YES in step S 205), the data control unit 133 selects the slave SP 140 having the smallest risk index value (step S 206).

データ制御部133は、選択したスレイブSP140を用いて代替経路を形成する(ステップS207)。ステップS207の詳細は、図7を参照して説明したとおりである。代替経路を形成すると、データ制御部133は、代替経路形成処理を終了する。代替経路が形成されると、スタンバイSP130の同期部132は、データ制御部133と代替経路を介して、マスタSP120のデータ制御部123にSPデータを送信する。   The data control unit 133 forms an alternative path using the selected slave SP 140 (step S207). The details of step S207 are as described with reference to FIG. After forming the alternative path, the data control unit 133 ends the alternative path formation process. When an alternative path is formed, the synchronization unit 132 of the standby SP 130 transmits SP data to the data control unit 123 of the master SP 120 via the data control unit 133 and the alternative path.

図12A及び図12Bは、スレイブSPのリスク指標値の算出処理の例を説明するフローチャートである。データ経由部142は、マスタSP120のデータ制御部123又はスタンバイSP130のデータ制御部133からリスク指標値を算出するようい求める計算命令を受信すると、図12A〜12Bの算出処理を開始する。   12A and 12B are flowcharts illustrating an example of the process of calculating the risk index value of slave SP. Upon receiving the calculation instruction for calculating the risk index value from the data control unit 123 of the master SP 120 or the data control unit 133 of the standby SP 130, the data passing unit 142 starts the calculation process of FIGS. 12A to 12B.

検出部144は、スレイブSP140が、マスタSP120とスタンバイSP130の双方と通信可能かを判定する(ステップS301)。スレイブSP140がマスタSP120とスタンバイSP130の双方と通信可能な場合(ステップS301でYES)、データ経由部142は、情報処理装置103に搭載された各ハードウェア装置の状態を管理部143に問い合わせる(ステップS302)。データ経由部142は、各ハードウェア装置の状態を示すスレイブSPデータ163を管理部143から受け取る。そして、データ経由部142は、受け取ったスレイブSPデータ163により表されるハードウェア装置の状態に対応する指標値が、係数情報164に含まれるかを判定する(ステップS303)。なお、データ経由部142は、少なくとも1台のハードウェア装置について、当ハードウェア装置の状態に対応する指標値が係数情報164に含まれるかを判定する。処理装置の状態に対応する指標値が係数情報164に含まれない場合(ステップS303でNO)、データ経由部142は、計算命令の送信元であるデータ制御部123又はデータ制御部133に、「不明」を示す情報を送信する(ステップS304)。スレイブSP140がマスタSP120とスタンバイSP130のうち少なくとも一方と通信できない場合(ステップS301でYES)、データ経由部142は、計算命令の送信元であるデータ制御部123又はデータ制御部133に、「経由NG」を示す情報を送信する(ステップS305)。ステップS304又はステップS305の処理が完了すると、スレイブSP140は、リスク指標値の算出処理を終了する。   The detection unit 144 determines whether the slave SP 140 can communicate with both the master SP 120 and the standby SP 130 (step S301). When slave SP 140 can communicate with both master SP 120 and standby SP 130 (YES in step S 301), data relay unit 142 inquires of management unit 143 the status of each hardware device installed in information processing apparatus 103 (step S302). The data passing unit 142 receives slave SP data 163 indicating the state of each hardware device from the managing unit 143. Then, the data passing unit 142 determines whether the index information corresponding to the state of the hardware device represented by the received slave SP data 163 is included in the coefficient information 164 (step S303). The data passing unit 142 determines, for at least one hardware device, whether the coefficient information 164 includes an index value corresponding to the state of the hardware device. When the index value corresponding to the state of the processing device is not included in the coefficient information 164 (NO in step S303), the data passing unit 142 sends the calculation instruction to the data control unit 123 or the data control unit 133 which is the transmission source. Information indicating "unknown" is transmitted (step S304). If slave SP 140 can not communicate with at least one of master SP 120 and standby SP 130 (YES in step S 301), data relay unit 142 sends a “NG via” to data control unit 123 or data control unit 133 that is the transmission source of the calculation instruction. Is transmitted (step S305). When the process of step S304 or step S305 is completed, the slave SP 140 ends the process of calculating the risk index value.

少なくとも1台以上のハードウェア装置の状態に対応する指標値が状態情報164に含まれる場合(ステップS303でYES)、データ経由部142は、ハードウェア装置の状態に対応する指標値を全て足し合わせることでリスク指標値を算出する(ステップS306)。なお、ハードウェア装置が複数台ある場合には、各ハードウェア装置の状態に対応するリスク指標値を、更に合計する。データ経由部142は、データ経由部142を含むスレイブSP140が搭載された自情報処理装置103が、すでに経由予約中又は経由中かを判定する(ステップS307)。なお、「経由予約中」・「経由中」などの情報は、データ経由部142の内部データとして保持されている。   When the index value corresponding to the state of at least one or more hardware devices is included in the state information 164 (YES in step S303), the data passing unit 142 adds all index values corresponding to the state of the hardware device. Thus, the risk index value is calculated (step S306). When there are a plurality of hardware devices, the risk index value corresponding to the state of each hardware device is further summed. The data passing unit 142 determines whether the own information processing apparatus 103 equipped with the slave SP 140 including the data passing unit 142 is already under reservation or passing (step S307). Note that information such as “via via reservation” and “via via” is held as internal data of the data via unit 142.

該情報処理装置103が、経由予約中や経由中でない場合(ステップS307でNO)、データ経由部142は、リスク指標値と「経由OK」を示す予約情報を、計算命令の送信元であるデータ制御部123又はデータ制御部133に送信する(ステップS308)。該情報処理装置103が経由予約中または経由中である場合(ステップS307でYES)、データ経由部142は、データ経由部142を含むスレイブSP140が搭載された情報処理装置103が経由中であるかを判定する(ステップS309)。該情報処理装置103が経由中でない場合(ステップS309でNO)、データ経由部142は、リスク指標値と「経由予約中」を示す予約情報を、計算命令の送信元であるデータ制御部123又はデータ制御部133に送信する(ステップS310)。該情報処理装置103が経由中の場合(ステップS309でYES)、データ経由部142は、リスク指標値と「経由中」を示す予約情報を、計算命令の送信元であるデータ制御部123又はデータ制御部133に送信する(ステップS311)。ステップS308、ステップS310又はステップS311の処理が完了すると、スレイブSP140は、リスク指標値の算出処理を終了する。   When the information processing apparatus 103 is in transit reservation or not in transit (NO in step S307), the data transit unit 142 transmits the risk index value and the reservation information indicating “pass through OK” to the transmission source of the calculation instruction. It transmits to the control part 123 or the data control part 133 (step S308). When the information processing apparatus 103 is in transit reservation or in transit (YES in step S307), the data transit unit 142 determines whether the information processing apparatus 103 equipped with the slave SP 140 including the data transit unit 142 is in transit. Is determined (step S309). When the information processing apparatus 103 is not passing through (NO in step S309), the data passing unit 142 transmits the calculation instruction, which is the transmission source of the calculation instruction, to the risk index value and the reservation information indicating "via reservation". It transmits to the data control unit 133 (step S310). When the information processing apparatus 103 is in transit (YES in step S309), the data transit unit 142 transmits the risk index value and the reservation information indicating “in transit” to the data control unit 123 or the data that is the transmission source of the calculation instruction. It transmits to the control part 133 (step S311). When the process of step S308, step S310 or step S311 is completed, the slave SP 140 ends the process of calculating the risk index value.

図13A及び図13Bは、スレイブSPの選択処理の例を説明するフローチャートである。図12A及び図12Bに示したように、リスク指標値と経由状態を示す予約情報がスレイブSP140からマスタSP120のデータ制御部123又はスタンバイSP130のデータ制御部133に送信される。リスク指標値と予約情報を受信すると、マスタSP120のデータ制御部123又はスタンバイSP130のデータ制御部133は、受信したリスク指標値と予約情報にしたがって、経由情報165内の経由状況情報とリスク指標値を更新する。経由情報165の更新後、データ制御部123又はデータ制御部133は図13A及び図13Bの選択処理を開始する。以下では説明の便宜上、マスタSP120のデータ制御部123がスレイブSP140の選択処理を開始する場合について、具体的に説明する。   13A and 13B are flowcharts illustrating an example of slave SP selection processing. As shown in FIGS. 12A and 12B, the risk index value and the reservation information indicating the via state are transmitted from the slave SP 140 to the data control unit 123 of the master SP 120 or the data control unit 133 of the standby SP 130. Upon receiving the risk index value and the reservation information, the data control unit 123 of the master SP 120 or the data control unit 133 of the standby SP 130, according to the received risk index value and reservation information, the passing situation information and the risk index value in the via information 165. Update After updating the passing information 165, the data control unit 123 or the data control unit 133 starts the selection process of FIGS. 13A and 13B. Hereinafter, for convenience of description, a case where the data control unit 123 of the master SP 120 starts the selection process of the slave SP 140 will be specifically described.

マスタSP120のデータ制御部123は、経由情報165を参照し、経由OKのスレイブSP140があるかを判定する(ステップS401)。経由OKのスレイブSP140についてのエントリが経由情報165に含まれる場合(ステップS401でYES)、データ制御部123は、経由情報165を参照し、経由OKのスレイブSP140の中でリスク指標値の数値が一番小さいスレイブSP140を選択する(ステップS402)。データ制御部123は、選択したスレイブSP140のデータ経由部142に、代替経路の形成依頼を送信する(ステップS403)。   The data control unit 123 of the master SP 120 refers to the via information 165, and determines whether there is a slave SP 140 of via OK (step S401). When the entry for the via OK slave SP 140 is included in the via information 165 (YES in step S 401), the data control unit 123 refers to the via information 165 and the numerical value of the risk index value in the via OK slave SP 140 is The smallest slave SP 140 is selected (step S402). The data control unit 123 transmits an alternative path formation request to the data passing unit 142 of the selected slave SP 140 (step S403).

例えば図6に例示したように、通信路151と通信路152にほぼ同時に障害が発生した場合、リスク指標値の計算命令が、データ制御部123とデータ制御部133の各々からほぼ同時にデータ経由部142に送信される。この場合、リスク指標値と「経由OK」という予約情報が、データ経由部142から、データ制御部123とデータ制御部133の各々に対して、ほぼ同時に送信され得る。また、この場合、図7のステップS7に関して説明した代替経路の形成依頼も、データ制御部123とデータ制御部133の各々からほぼ同時にデータ経由部142に送信され得る。つまり、データ制御部123とデータ制御部133の各々が、ほぼ同時にステップS403の処理を実行する場合があり得る。この場合、データ経由部142は、先に受信した形成依頼にしたがって、図7のステップS8〜S13のような処理を行う。   For example, as illustrated in FIG. 6, when a failure occurs in the communication path 151 and the communication path 152 almost simultaneously, the calculation instruction of the risk index value is transmitted from the data control unit 123 and the data control unit 133 almost simultaneously. It is sent to 142. In this case, the risk index value and the reservation information “via via” can be transmitted from the data transit unit 142 to each of the data control unit 123 and the data control unit 133 almost simultaneously. Further, in this case, the request for forming the alternative route described in regard to step S7 of FIG. That is, each of the data control unit 123 and the data control unit 133 may execute the process of step S403 almost simultaneously. In this case, the data relay unit 142 performs the processes in steps S8 to S13 of FIG. 7 in accordance with the formation request received earlier.

例えば、データ経由部142がデータ制御部133から先に形成依頼を受信した場合、データ経由部142は、図7のステップS13に示すように、形成依頼に対応する処理が完了したことをデータ制御部133に通知する。この通知は、換言すれば、形成依頼に対する「OK」という返答である。また、データ経由部142がデータ制御部133から先に形成依頼を受信した場合、データ経由部142は、データ制御部123に対しては、「NG」という返答を返す。「NG」という返答は、データ経由部142が既に「経由予約中」であるためデータ制御部123からの形成依頼に応えられないことを示す。   For example, when the data relay unit 142 receives the formation request from the data control unit 133 first, the data relay unit 142 performs data control that the process corresponding to the formation request has been completed, as shown in step S13 of FIG. 7. It notifies part 133. This notification is, in other words, a response "OK" to the formation request. When the data relay unit 142 receives the formation request from the data control unit 133 first, the data relay unit 142 returns a response of “NG” to the data control unit 123. The response “NG” indicates that the data relay unit 142 can not answer the formation request from the data control unit 123 because the data relay unit 142 is already “via reservation”.

ステップS403〜S406は、通信路151と通信路152にほぼ同時に障害が発生する場合に2つの異なる代替経路が形成されるようにするためのステップである。具体的には、データ制御部123は、ステップS402で選択したスレイブSP140のデータ経由部142からの返答が、OKかを判定する(ステップS404)。選択したスレイブSP140を経由する代替経路の形成が可能である場合(ステップS404でYES)、データ制御部123は、経由情報165のうち、選択したスレイブSP140に対応する選択情報に、「選択」を設定する(ステップS405)。選択したスレイブSP140を経由する代替経路の形成ができない場合(ステップS404でNO)、データ制御部123は、経由情報165のうち、選択したスレイブSP140に対応する経由状況情報を「経由予約中」に変更する(ステップS406)。ステップS406が終了すると、データ制御部123は、処理をステップS401から繰り返す。   Steps S403 to S406 are steps for forming two different alternative paths when failures occur in the communication path 151 and the communication path 152 almost simultaneously. Specifically, the data control unit 123 determines whether the response from the data passing unit 142 of the slave SP 140 selected in step S402 is OK (step S404). If it is possible to form an alternative path passing through the selected slave SP 140 (YES in step S 404), the data control unit 123 selects “select” in the selection information corresponding to the selected slave SP 140 in the transit information 165. It sets (step S405). If the alternative path through the selected slave SP 140 can not be formed (NO in step S 404), the data control unit 123 sets the transit status information corresponding to the selected slave SP 140 in the transit information 165 to “via via reservation”. The change is made (step S406). When step S406 ends, the data control unit 123 repeats the process from step S401.

経由OKのスレイブSP140についてのエントリが経由情報165に含まれない場合(ステップS401でNO)、データ制御部123は、経由情報165を参照し、経由予約中又は経由中と設定されているスレイブSP140があるかを判定する(ステップS407)。経由情報165に経由予約中又は経由中と設定されているスレイブSP140がない場合(ステップS407でNO)、データ制御部123は、スレイブSP140を経由する代替経路を形成することができないと判定し、選択処理を終了する(ステップS408)。   If the entry for the via OK slave SP 140 is not included in the via information 165 (NO in step S 401), the data control unit 123 refers to the via information 165, and the slave SP 140 is set to be via reservation or via. It is determined whether there is any (step S407). If there is no slave SP 140 that is set as being reserved or via in the via information 165 (NO in step S 407), the data control unit 123 determines that an alternative route via the slave SP 140 can not be formed. The selection process is ended (step S408).

経由情報165において経由予約中又は経由中と設定されているスレイブSP140がある場合(ステップS407でYES)、データ制御部123は、経由予約中又は経由中と設定されているスレイブSP140を選択する(ステップS409)。なお、経由予約中又は経由中と設定されているスレイブSP140は、多くても1つしか存在しないことに注意されたい。ステップS409の処理が終了すると、データ制御部123は、ステップS405から処理を開始する。なお、通信路151で障害がある場合には、図13A〜13BのステップS401〜S410の処理と同様の処理を、スタンバイSP130のデータ制御部133が実行する。   If there is a slave SP 140 that is set as being in transit reservation or in transit in the transit information 165 (YES in step S 407), the data control unit 123 selects the slave SP 140 which is set in transit reservation or in transit ( Step S409). It should be noted that there is only one slave SP 140 which is set to be in transit reservation or in transit reservation. When the process of step S409 ends, the data control unit 123 starts the process from step S405. When there is a failure in the communication path 151, the data control unit 133 of the standby SP 130 executes the same process as the process of steps S401 to S410 in FIGS. 13A and 13B.

図14は、代替経路の形成処理の例(その1)を説明するフローチャートである。マスタSP120のデータ制御部123は、同期部122に、SPデータを送信する処理の停止命令を送信する(ステップS501)。同期部122は、SPデータの送信処理を停止する(ステップS502)。データ制御部123は、同期部122に設定されているIPアドレスとPort番号を含む接続先情報を、記憶部121にバックアップする(ステップS503)。データ制御部123は、同期部122の接続先情報に、データ制御部123に割り当てられているIPアドレスとPort番号を設定する(ステップS504)。   FIG. 14 is a flowchart illustrating an example (part 1) of the process of forming an alternative path. The data control unit 123 of the master SP 120 transmits, to the synchronization unit 122, an instruction to stop the process of transmitting the SP data (step S501). The synchronization unit 122 stops the transmission process of the SP data (step S502). The data control unit 123 backs up the connection destination information including the IP address and the port number set in the synchronization unit 122 to the storage unit 121 (step S503). The data control unit 123 sets the IP address and port number assigned to the data control unit 123 in the connection destination information of the synchronization unit 122 (step S504).

データ制御部123は、同期部122を再起動する命令を同期部122に送信する(ステップS505)。すると、同期部122は、再起動する(ステップS506)。同期部122は、再起動により、接続先情報として設定されたIPアドレスとPort番号(すなわち、データ制御部123に割り当てられているIPアドレスとPort番号)を認識し、データ制御部123との間の通信路を形成する(ステップS507)。ステップS501〜S507は、図7のステップS1〜S5と類似である。   The data control unit 123 transmits an instruction to restart the synchronization unit 122 to the synchronization unit 122 (step S505). Then, the synchronization unit 122 restarts (step S506). The synchronization unit 122 recognizes the IP address and port number set as connection destination information (that is, the IP address and port number assigned to the data control unit 123) by restarting, and the synchronization unit 122 performs communication with the data control unit 123. Form a communication path (step S507). Steps S501 to S507 are similar to steps S1 to S5 of FIG.

データ制御部123は、経由情報165を参照し、選択(予約)されたスレイブSP140を特定する(ステップS508)。データ制御部123は、選択したスレイブSP140に、代替経路の形成依頼を送信する(ステップS509)。ステップS508〜S509は、図7のステップS6〜S7と類似である。   The data control unit 123 refers to the route information 165 and specifies the selected (reserved) slave SP 140 (step S 508). The data control unit 123 transmits an alternative path formation request to the selected slave SP 140 (step S509). Steps S508-S509 are similar to steps S6-S7 of FIG.

データ制御部123は、代替経路形成依頼に対応する処理が完了したことを示す情報を、スレイブSP140のデータ経由部142から受信したかを判定する(ステップS510)。代替経路の形成依頼に対応する処理が完了したことを示す情報を、スレイブSP140のデータ経由部142から受信していない場合(ステップS510でNO)、データ制御部123は、ステップS510の処理を繰り返す。   The data control unit 123 determines whether the information indicating that the process corresponding to the alternative path formation request has been completed has been received from the data transit unit 142 of the slave SP 140 (step S510). If the information indicating that the process corresponding to the request for formation of the alternative path has been completed is not received from data passing unit 142 of slave SP 140 (NO in step S510), data control unit 123 repeats the process of step S510. .

なお、図13AのステップS403〜S406に関して説明したように、まれに、データ制御部123がデータ経由部142から「NG」という返答を受信する場合がある。ただし、図示の簡単化のため、図14ではこの場合について省略されている。「NG」という返答を受信した場合、データ制御部123は図14の処理を終了する。   As described in regard to steps S403 to S406 in FIG. 13A, in rare cases, the data control unit 123 may receive a response of “NG” from the data passing unit 142. However, for simplification of the drawing, this case is omitted in FIG. If the response “NG” is received, the data control unit 123 ends the process of FIG.

他方、代替経路の形成依頼に対応する処理が完了したことを示す情報を、スレイブSP140のデータ経由部142から受信した場合(ステップS510でYES)、データ制御部123は、データ経由部142との通信路を形成する(ステップS511)。なお、代替経路の形成依頼に対応する処理が完了したことを示す情報の送信は、図7のステップS13と類似である。また、この情報は、形成依頼に対する「OK」という返答である(図13AのステップS404を参照)。ステップS511は図7のステップS14と類似である。   On the other hand, when the information indicating that the process corresponding to the request for formation of the alternative path is completed is received from data passing unit 142 of slave SP 140 (YES in step S510), data control unit 123 A communication path is formed (step S511). The transmission of the information indicating that the process corresponding to the request for formation of the alternative path has been completed is similar to step S13 in FIG. Further, this information is a response “OK” to the formation request (see step S404 in FIG. 13A). Step S511 is similar to step S14 of FIG.

データ制御部123は、同期部122に、SPデータの同期処理の開始命令を送信する(ステップS512)。マスタSP120の同期部122は、データ経由部142を介したスタンバイSP130の同期部132へのSPデータの送信を開始する(ステップS513)。データ制御部123は、代替経路の形成処理を終了する。なお、通信路151で障害が発生した場合には、図14のS501〜S513の処理と同様の処理を、スタンバイSP130のデータ制御部133と同期部132が実行する。   The data control unit 123 transmits an instruction to start synchronization processing of SP data to the synchronization unit 122 (step S512). The synchronization unit 122 of the master SP 120 starts transmission of SP data to the synchronization unit 132 of the standby SP 130 via the data passing unit 142 (step S513). The data control unit 123 ends the process of forming an alternative path. When a failure occurs in the communication path 151, the data control unit 133 and the synchronization unit 132 of the standby SP 130 execute the same processes as the processes of S501 to S513 in FIG.

図15は、代替経路の形成処理の例(その2)を説明するフローチャートである。図15の処理は、図14のステップS509の代替経路の形成依頼をマスタSP120側から受信したスレイブSP140において実行される処理の例である。なお、図14のステップS509の代替経路の形成依頼をスレイブSP140がスタンバイ130から受信した場合も、スレイブSP140は図15と類似の処理を実行する(図7も参照)。   FIG. 15 is a flowchart illustrating an example (part 2) of the process of forming an alternative path. The process of FIG. 15 is an example of the process executed by the slave SP 140 which has received the request for forming the alternative path in step S 509 of FIG. 14 from the master SP 120 side. Also when slave SP 140 receives a request for forming an alternative path in step S 509 of FIG. 14 from standby 130, slave SP 140 executes processing similar to that of FIG. 15 (see also FIG. 7).

データ経由部142は、スタンバイSP130のデータ制御部133に、データ経由部142に設定されているIPアドレスとPort番号を含む接続先情報および代替経路の形成依頼を送信する(ステップS601)。ステップS601は図7のステップS8と類似である。データ経由部142は、スタンバイSP130側での代替経路形成処理が完了したかを判定する(ステップS602)。例えば、データ経由部142は、代替経路の形成依頼に対応する処理が完了したことを示す情報(図7のステップS11で送信される情報と類似の情報)がデータ制御部133から受信されたか否かを判定する。   The data passing unit 142 transmits, to the data control unit 133 of the standby SP 130, connection destination information including the IP address and Port number set in the data passing unit 142 and a request for forming an alternative path (step S601). Step S601 is similar to step S8 of FIG. The data passing unit 142 determines whether the alternative path formation process on the standby SP 130 side is completed (step S602). For example, the data passing unit 142 receives, from the data control unit 133, information (information similar to the information transmitted in step S11 of FIG. 7) indicating that the process corresponding to the request for forming the alternative path has been completed. Determine if

スタンバイSP130側での代替経路の形成処理が完了していない場合(ステップS602でNO)、データ経由部142は、ステップS602の処理を繰り返す。スタンバイSP130側での代替経路の形成が完了した場合(ステップS602でYES)、データ経由部142は、スレイブSP130側での代替経路の形成処理が完了したことを、マスタSP120のデータ制御部123に送信する(ステップS603)。ステップS603の通知は、図7のステップS13の通知と類似である。なお、ステップS603では、併せてデータ経由部142は、データ経由部142に設定されているIPアドレスとPort番号を含む接続先情報を、マスタSPのデータ制御部123に送信する。ステップS603の処理が完了すると、図14のステップS510の処理が開始される。   If the process of forming an alternative path on the standby SP 130 side has not been completed (NO in step S602), the data passing unit 142 repeats the process of step S602. When the formation of the alternative path on the standby SP 130 side is completed (YES in step S602), the data relay unit 142 notifies the data control unit 123 of the master SP 120 that the process of forming the alternative path on the slave SP 130 side is completed. It transmits (step S603). The notification in step S603 is similar to the notification in step S13 of FIG. In step S603, the data passing unit 142 also transmits connection destination information including the IP address and port number set in the data passing unit 142 to the data control unit 123 of the master SP. When the process of step S603 is completed, the process of step S510 of FIG. 14 is started.

図16は、代替経路の形成処理の例(その3)を説明するフローチャートである。図16の処理は、図15のステップS601の代替経路の形成依頼を受信した後の、スタンバイSP130側の処理の例である。   FIG. 16 is a flowchart illustrating an example (part 3) of the process of forming an alternative path. The process of FIG. 16 is an example of the process on the side of the standby SP 130 after receiving the request for forming an alternative path in step S601 of FIG.

スタンバイSP130のデータ制御部133は、代替経路の形成依頼を接続先情報とともに受信すると、受信した接続先情報に含まれるIPアドレスやPort番号を用いて、スレイブSP140との通信路を形成する(ステップS701)。データ制御部133は、同期部132との通信路を形成する(ステップS702)。データ制御部133は、スタンバイSP130のデータ経由部142に、代替経路の形成依頼(つまりステップS601で送信された依頼)に対応する処理が完了したことを示す情報を送信する(ステップS703)。ステップS701〜S703は、図7のステップS9〜S11と類似である。ステップS703の処理が完了すると、図15のステップS602に処理が移行する。なお、通信路151で障害がある場合は、図16のステップS701〜S703と類似の処理を、マスタSP120が実行する(図7のステップS9〜S11を参照)。   When the data control unit 133 of the standby SP 130 receives the formation request of the alternative path together with the connection destination information, the data control unit 133 forms a communication path with the slave SP 140 using the IP address and port number included in the received connection destination information (step S701). The data control unit 133 forms a communication path with the synchronization unit 132 (step S702). The data control unit 133 transmits, to the data passing unit 142 of the standby SP 130, information indicating that the process corresponding to the request for forming the alternative path (that is, the request transmitted in step S601) is completed (step S703). Steps S701 to S703 are similar to steps S9 to S11 of FIG. When the process of step S703 is completed, the process proceeds to step S602 of FIG. When there is a failure in the communication path 151, the master SP 120 executes a process similar to steps S701 to S703 in FIG. 16 (see steps S9 to S11 in FIG. 7).

図17は、通信路の障害が回復した後の処理の例を説明するフローチャートである。検出部124は、通信路152の障害の回復を検出する(ステップS801)。検出部124は、データ制御部123に、通信路152の障害が回復したことを示す情報を送信する(ステップS802)。データ制御部123は、経由情報165を参照し、代替経路としてスレイブSP140を使用しているかを判定する(ステップS803)。代替経路としてスレイブSP140を使用していない場合(ステップS803でNO)、データ制御部123は、図17の処理を終了する。代替経路としてスレイブSP140を使用している場合(ステップS803でYES)、データ制御部123は、同期部122に、SPデータの送信を停止するよう求める停止命令を送信する(ステップS804)。   FIG. 17 is a flowchart for explaining an example of processing after the failure of the communication path is recovered. The detection unit 124 detects the recovery of the failure of the communication path 152 (step S801). The detection unit 124 transmits, to the data control unit 123, information indicating that the failure of the communication path 152 has been recovered (step S802). The data control unit 123 refers to the route information 165 and determines whether the slave SP 140 is used as an alternative route (step S 803). If the slave SP 140 is not used as an alternative path (NO in step S 803), the data control unit 123 ends the process of FIG. When slave SP 140 is used as an alternative path (YES in step S 803), data control unit 123 transmits a stop instruction to stop transmission of SP data to synchronization unit 122 (step S 804).

同期部122は、SPデータの送信を停止する(ステップS805)。データ制御部123は、図14のステップS504で同期部122に設定した接続先情報をリセットする(ステップS806)。データ制御部123は、図14のステップS503で記憶部121にバックアップした接続先情報を参照し、同期部122の接続先として、スタンバイSP130の同期部132のIPアドレスおよびPort番号を設定する(ステップS807)。データ制御部123は、同期部122の再起動をする命令を、同期部122に送信する(ステップS808)。   The synchronization unit 122 stops transmission of the SP data (step S805). The data control unit 123 resets the connection destination information set in the synchronization unit 122 in step S504 in FIG. 14 (step S806). The data control unit 123 refers to the connection destination information backed up in the storage unit 121 in step S 503 of FIG. 14 and sets the IP address and port number of the synchronization unit 132 of the standby SP 130 as the connection destination of the synchronization unit 122 (step S807). The data control unit 123 transmits an instruction to restart the synchronization unit 122 to the synchronization unit 122 (step S808).

同期部122は、再起動する(ステップS809)。同期部122は、スタンバイSP130の同期部132との間の通信路を形成する(ステップS810)。データ制御部123は、通信路の障害が回復した後の処理を終了する。なお、通信路151の障害の回復は、検出部134で検出する。通信路151の障害の回復については、スタンバイSP130が、図17と類似の処理を行う。   The synchronization unit 122 restarts (step S809). The synchronization unit 122 forms a communication path with the synchronization unit 132 of the standby SP 130 (step S810). The data control unit 123 ends the processing after the failure of the communication path is recovered. The recovery of the failure of the communication path 151 is detected by the detection unit 134. The standby SP 130 performs processing similar to that of FIG.

図18は、リスク指標値の再計算の処理の例を説明するフローチャートである。各スレイブSP140は、リスク指標値の算出結果をマスタSP120又はスタンバイSP130に送信した後も、定期的に、リスク指標値を算出しなおすことが好ましい。スレイブSP140のリスク指標値は、一定ではない。そのため、選択されたスレイブSP140のリスク指標値が、所定の閾値よりも高くなると、他のスレイブSP140を代替経路として用いることが望ましい。図18に示すスレイブSP140の処理は、定期的に行われることが好ましい。   FIG. 18 is a flowchart illustrating an example of the process of recalculating the risk index value. Each slave SP 140 preferably recalculates the risk index value periodically even after transmitting the calculation result of the risk index value to the master SP 120 or the standby SP 130. The risk index value of slave SP 140 is not constant. Therefore, when the risk index value of the selected slave SP 140 becomes higher than a predetermined threshold, it is desirable to use another slave SP 140 as an alternative path. The processing of the slave SP 140 shown in FIG. 18 is preferably performed periodically.

データ経由部164は、管理部143から処理装置の状態情報(具体的にはスレイブSPデータ163の少なくとも一部)を取得し、リスク指標値を算出する(ステップS901)。データ経由部164は、算出したリスク指標値が、所定の閾値よりも高いかを判定する(ステップS902)。算出したリスク指標値が所定の閾値よりも低い場合(ステップS902でNO)、データ経由部164は、リスク指標値の再計算処理を終了する。算出したリスク指標値が所定の閾値よりも高い場合(ステップS902でYES)、データ経由部164は、リスク指標値の計算命令の送信元のデータ制御部に、スレイブSP140の再選択命令を送信する(ステップS903)。データ経由部164は、再計算処理を終了する。   The data relay unit 164 acquires the status information of the processing apparatus (specifically, at least a part of the slave SP data 163) from the management unit 143, and calculates a risk index value (step S901). The data relay unit 164 determines whether the calculated risk index value is higher than a predetermined threshold (step S902). If the calculated risk index value is lower than the predetermined threshold (NO in step S902), the data relay unit 164 ends the recalculation process of the risk index value. If the calculated risk index value is higher than the predetermined threshold (YES in step S 902), data passing unit 164 transmits the reselection command of slave SP 140 to the data control unit of the transmission source of the risk index value calculation command. (Step S903). The data relay unit 164 ends the recalculation process.

データ制御部123は、再選択命令を受信すると、図10のステップS104〜S107の処理を実行する。データ制御部133は、再選択命令を受信すると、図11のステップS204〜S207の処理を実行する。   When the data control unit 123 receives the reselection instruction, the data control unit 123 executes the processes of steps S104 to S107 of FIG. When the data control unit 133 receives the reselection instruction, the data control unit 133 executes the processes of steps S204 to S207 of FIG.

以上のように、マスタSP120からスタンバイSP130にSPデータを送信するための通信路152で障害が発生しても、スレイブSP140を介して、マスタSP120はSPデータをスタンバイSP130に送信できる。また、スタンバイSP130からマスタSP120にSPデータを送信するための通信路151で障害が発生しても、スレイブSP140を介して、スタンバイSP130はSPデータをマスタSP120に送信できる。マスタSP120とスタンバイSP130とが同じSPデータを記憶することで、スタンバイSP130は、マスタSP120のバックアップとして動作可能な状態を維持することができる。   As described above, even if a failure occurs in the communication path 152 for transmitting SP data from the master SP 120 to the standby SP 130, the master SP 120 can transmit SP data to the standby SP 130 via the slave SP 140. Further, even if a failure occurs in the communication path 151 for transmitting SP data from the standby SP 130 to the master SP 120, the standby SP 130 can transmit SP data to the master SP 120 via the slave SP 140. By the master SP 120 and the standby SP 130 storing the same SP data, the standby SP 130 can maintain an operable state as a backup of the master SP 120.

100 BBシステム
101、102、103a〜103n、200 情報処理装置
110 I/O装置
120 マスタSP
121、131、141a〜141n 記憶部
122、132、145a〜145n 同期部
123、133 データ制御部
124、134、144a〜144n 検出部
130 スタンバイSP
140a〜140n スレイブSP
142a〜142n データ経由部
143a〜143n 管理部
151、152、153a〜153n、154a〜154n 通信路
161 マスタSPデータ
162 スタンバイSPデータ
163a〜163n スレイブSPデータ
164 係数情報
165、166 経由情報
210 CMU
220 SP
211、221、11 プロセッサ
212、222、12 メモリ
100 BB systems 101, 102, 103a to 103n, 200 information processing apparatus 110 I / O apparatus 120 master SP
121, 131, 141a to 141n storage unit 122, 132, 145a to 145n synchronization unit 123, 133 data control unit 124, 134, 144a to 144n detection unit 130 standby SP
140a to 140n slave SP
142a to 142n Data transit units 143a to 143n Management units 151, 152, 153a to 153n, 154a to 154n Communication path 161 Master SP data 162 Standby SP data 163a to 163n Slave SP data 164 Coefficient information 165, 166 Via information 210 CMU
220 SP
211, 221, 11 processor 212, 222, 12 memory

Claims (8)

複数の処理装置と、前記複数の処理装置を管理する複数の管理装置を含む情報処理システムであって、
データを記憶する第1の管理装置と、
前記データを前記第1の管理装置から通信路を介して受信し、受信した前記データを記憶する第2の管理装置と、
他の1台以上の管理装置と、を備え、
前記第1の管理装置は、前記通信路に障害が発生すると、前記他の1台以上の管理装置の状態に基づいて、前記他の1台以上の管理装置の中から、前記第1の管理装置および前記第2の管理装置と接続されている第3の管理装置を選択し、前記第3の管理装置を介して前記データを前記第2の管理装置に送信し、
前記第2の管理装置は、前記第2の管理装置が記憶する第2のデータを、前記通信路または別の通信路を介して前記第1の管理装置に送信し、
前記第2の管理装置が前記第2のデータの送信に用いる前記通信路または前記別の通信路に障害が発生すると、前記第2の管理装置は、前記他の1台以上の管理装置の状態に基づいて、前記他の1台以上の管理装置の中から、前記第3の管理装置または前記第3の管理装置とは異なる第4の管理装置を選択し、選択した前記第3の管理装置または選択した前記第4の管理装置を介して、前記第2のデータを前記第1の管理装置に送信し、
前記他の1台以上の管理装置の各々の状態は、当該他の管理装置が管理する1台以上の処理装置の状態が当該他の管理装置を介したデータ送信に悪影響を与える程度に基づく指標値により表され、
前記第1の管理装置は、前記指標値に基づいて前記第3の管理装置を選択し、
前記第2の管理装置は、前記指標値に基づいて前記第3の管理装置または前記第4の管理装置を選択する
ことを特徴とする情報処理システム。
An information processing system including a plurality of processing devices and a plurality of management devices managing the plurality of processing devices, the information processing system comprising:
A first management device for storing data;
A second management device that receives the data from the first management device via a communication path and stores the received data;
And one or more other management devices,
When a failure occurs in the communication path, the first management device performs the first management among the one or more other management devices based on the state of the one or more other management devices. A device and a third management device connected to the second management device, and transmitting the data to the second management device via the third management device ;
The second management device transmits second data stored by the second management device to the first management device via the communication path or another communication path.
If a failure occurs in the communication path used by the second management device for transmitting the second data or the other communication path, the second management device determines the state of the one or more other management devices. And select a fourth management device different from the third management device or the third management device among the one or more other management devices, and select the third management device Or transmitting the second data to the first management device via the selected fourth management device;
The state of each of the other one or more management devices is an indicator based on the degree to which the state of one or more processing devices managed by the other management device adversely affects data transmission via the other management device. Represented by a value,
The first management device selects the third management device based on the index value,
An information processing system, wherein the second management apparatus selects the third management apparatus or the fourth management apparatus based on the index value .
前記第1の管理装置は、前記第3の管理装置に、前記第3の管理装置のInternet Protocol(IP)アドレスとポート番号を含む第1の接続先情報を前記第1の管理装置へ送信させ、前記IPアドレスと前記ポート番号とは異なるポート番号を含む第2の接続先情報を、前記第2の管理装置へ送信させ、
前記第2の管理装置は、前記第2の接続先情報にしたがって、前記第2の管理装置と前記第3の管理装置との間の通信路を形成し、
前記第1の管理装置は、前記第1の接続先情報にしたがって、前記第1の管理装置と前記第3の管理装置との間の通信路を形成する
ことを特徴とする請求項1に記載の情報処理システム。
The first management device causes the third management device to transmit, to the first management device, first connection destination information including an Internet Protocol (IP) address and a port number of the third management device. Causing the second management apparatus to transmit second connection destination information including a port number different from the IP address and the port number;
The second management device forms a communication path between the second management device and the third management device according to the second connection destination information.
The first management apparatus, according to the first connection destination information, according to claim 1, characterized in that to form a communication path between the first management apparatus and the third management apparatus Information processing system.
前記第2の管理装置は、前記第3の管理装置を選択すると、前記第3の管理装置のInternet Protocol(IP)アドレスとポート番号を含む第1の接続先情報を、前記第3の管理装置から前記第1の管理装置および前記第2の管理装置へ送信させ、前記第1の接続先情報にしたがって、前記第2の管理装置と前記第3の管理装置との間の通信路を形成し、
前記第2の管理装置が前記第3の管理装置を選択した場合、前記第1の管理装置は、前記第1の接続先情報にしたがって、前記第1の管理装置と前記第3の管理装置との間の通信路を形成し、
前記第2の管理装置は、前記第4の管理装置を選択すると、前記第4の管理装置のIPアドレスとポート番号を含む第2の接続先情報を、前記第4の管理装置から前記第1の管理装置および前記第2の管理装置へ送信させ、前記第2の接続先情報にしたがって、前記第2の管理装置と前記第4の管理装置との間の通信路を形成し、
前記第2の管理装置が前記第4の管理装置を選択した場合、前記第1の管理装置は、前記第2の接続先情報にしたがって、前記第1の管理装置と前記第4の管理装置との間の通信路を形成する
ことを特徴とする請求項1に記載の情報処理システム。
When the second management device selects the third management device, the second management device receives first connection destination information including an Internet Protocol (IP) address and a port number of the third management device, the third management device. Transmission to the first management device and the second management device, and forming a communication path between the second management device and the third management device according to the first connection destination information ,
When the second management apparatus selects the third management apparatus, the first management apparatus performs the first management apparatus and the third management apparatus according to the first connection destination information. Form a communication path between
When the second management device selects the fourth management device, the second connection destination information including an IP address and a port number of the fourth management device is transmitted from the fourth management device to the first connection destination information. Forming a communication path between the second management apparatus and the fourth management apparatus according to the second connection destination information.
When the second management apparatus selects the fourth management apparatus, the first management apparatus performs the first management apparatus and the fourth management apparatus according to the second connection destination information. The information processing system according to claim 1 , forming a communication path between the two.
複数の処理装置と、前記複数の処理装置を管理する複数の管理装置とを含む情報処理システムの中の、第1の管理装置に、
前記第1の管理装置が記憶するデータを前記第1の管理装置から受信する第2の管理装置と前記第1の管理装置との間の通信路に発生する障害を検出し、
前記通信路に障害が発生すると、他の1台以上の管理装置の状態に基づいて、前記他の1台以上の管理装置の中から、前記第1の管理装置および前記第2の管理装置と接続されている第3の管理装置を選択し、
前記第3の管理装置を介して前記データを前記第2の管理装置に送信する
処理を実行させ
前記他の1台以上の管理装置の各々の状態は、当該他の管理装置が管理する1台以上の処理装置の状態が当該他の管理装置を介したデータ送信に悪影響を与える程度に基づく指標値により表され、
前記第1の管理装置に、前記指標値に基づいて前記第3の管理装置を選択させる処理をさらに実行させる
ことを特徴とするプログラム。
In a first management device of an information processing system including a plurality of processing devices and a plurality of management devices managing the plurality of processing devices,
Detecting a fault occurring in a communication path between a second management apparatus that receives data stored by the first management apparatus from the first management apparatus, and the first management apparatus;
When a failure occurs in the communication path, the first management device and the second management device are selected from among the one or more other management devices based on the state of the other one or more management devices. Select the third management device connected,
Transmitting the data to the second management device via the third management device ;
The state of each of the other one or more management devices is an indicator based on the degree to which the state of one or more processing devices managed by the other management device adversely affects data transmission via the other management device. Represented by a value,
Allowing the first management device to further execute a process of causing the third management device to be selected based on the index value
A program characterized by
前記第3の管理装置のInternet Protocol(IP)アドレスとポート番号を含む第1の接続先情報を前記第3の管理装置から前記第2の管理装置に送信させるとともに、前記第2の管理装置が前記第1の接続先情報にしたがって前記第2の管理装置と前記第3の管理装置との間の通信路を形成した後に前記第3の管理装置から前記第1の管理装置に前記IPアドレスと前記ポート番号と異なるポート番号を含む第2の接続先情報を送信させるための命令を、前記第3の管理装置に送信し、
前記第2の接続先情報を前記第3の管理装置から受信し、
前記第2の接続先情報にしたがって前記第3の管理装置との間の通信路を形成する
処理をさらに前記第1の管理装置に実行させる
ことを特徴とする請求項4に記載のプログラム。
The second management apparatus transmits first connection destination information including the Internet Protocol (IP) address and port number of the third management apparatus from the third management apparatus to the second management apparatus. After the communication path between the second management device and the third management device is formed according to the first connection destination information, the IP address and the IP address are transmitted from the third management device to the first management device. Transmitting an instruction to transmit second connection destination information including a port number different from the port number to the third management device;
Receiving the second connection destination information from the third management device;
The program according to claim 4 , wherein the first management apparatus further executes a process of forming a communication path with the third management apparatus according to the second connection destination information.
複数の処理装置と、前記複数の処理装置を管理する複数の管理装置を含む情報処理システムにおいて実行される情報処理方法であって、
データを記憶する第1の管理装置と、前記データを前記第1の管理装置から受信する第2の管理装置との間の通信路で障害が発生すると、前記第1の管理装置が、他の1台以上の管理装置の状態に基づいて、前記他の1台以上の管理装置の中から、前記第1の管理装置および前記第2の管理装置と接続されている第3の管理装置を選択し、前記第3の管理装置を介して前記データを前記第2の管理装置に送信し、
前記第2の管理装置が、前記第2の管理装置が記憶する第2のデータを、前記通信路または別の通信路を介して前記第1の管理装置に送信し、
前記第2の管理装置が前記第2のデータの送信に用いる前記通信路または前記別の通信路に障害が発生すると、前記第2の管理装置は、前記他の1台以上の管理装置の状態に基づいて、前記他の1台以上の管理装置の中から、前記第3の管理装置または前記第3の管理装置とは異なる第4の管理装置を選択し、選択した前記第3の管理装置または選択した前記第4の管理装置を介して、前記第2のデータを前記第1の管理装置に送信し、
前記他の1台以上の管理装置の各々の状態は、当該他の管理装置が管理する1台以上の処理装置の状態が当該他の管理装置を介したデータ送信に悪影響を与える程度に基づく指標値により表され、
前記第1の管理装置は、前記指標値に基づいて前記第3の管理装置を選択し、
前記第2の管理装置は、前記指標値に基づいて前記第3の管理装置または前記第4の管理装置を選択する
ことを特徴とする情報処理方法。
An information processing method executed in an information processing system including a plurality of processing devices and a plurality of management devices managing the plurality of processing devices,
When a failure occurs in a communication path between a first management device storing data and a second management device receiving the data from the first management device, the first management device performs another operation. Select a third management device connected to the first management device and the second management device from among the one or more other management devices based on the state of one or more management devices Sending the data to the second management device via the third management device ;
The second management device transmits second data stored by the second management device to the first management device via the communication path or another communication path;
If a failure occurs in the communication path used by the second management device for transmitting the second data or the other communication path, the second management device determines the state of the one or more other management devices. And select a fourth management device different from the third management device or the third management device among the one or more other management devices, and select the third management device Or transmitting the second data to the first management device via the selected fourth management device;
The state of each of the other one or more management devices is an indicator based on the degree to which the state of one or more processing devices managed by the other management device adversely affects data transmission via the other management device. Represented by a value,
The first management device selects the third management device based on the index value,
An information processing method characterized in that the second management apparatus selects the third management apparatus or the fourth management apparatus based on the index value .
前記第1の管理装置は、前記第3の管理装置に、前記第3の管理装置のInternet Protocol(IP)アドレスとポート番号を含む第1の接続先情報を前記第1の管理装置へ送信させ、前記IPアドレスと前記ポート番号と異なるポート番号を含む第2の接続先情報を、前記第2の管理装置へ送信させ、
前記第2の管理装置は、前記第2の接続先情報にしたがって、前記第2の管理装置と前記第3の管理装置との間の通信路を形成し、
前記第1の管理装置は、前記第1の接続先情報にしたがって、前記第1の管理装置と前記第3の管理装置との間の通信路を形成する
ことを特徴とする請求項6に記載の情報処理方法。
The first management device causes the third management device to transmit, to the first management device, first connection destination information including an Internet Protocol (IP) address and a port number of the third management device. Transmitting second connection destination information including a port number different from the IP address and the port number to the second management device;
The second management device forms a communication path between the second management device and the third management device according to the second connection destination information.
The first management apparatus, wherein according to said first connection destination information, in claim 6, characterized in that to form a communication path between the first management apparatus and the third management apparatus Information processing method.
前記第2の管理装置が、前記第3の管理装置を選択すると、前記第3の管理装置のInternet Protocol(IP)アドレスとポート番号を含む第1の接続先情報を、前記第3の管理装置から前記第1の管理装置および前記第2の管理装置へ送信させ、前記第1の接続先情報にしたがって、前記第2の管理装置と前記第3の管理装置との間の通信路を形成し、
前記第2の管理装置が前記第3の管理装置を選択した場合、前記第1の管理装置は、前記第1の接続先情報にしたがって、前記第1の管理装置と前記第3の管理装置との間の通信路を形成し、
前記第2の管理装置が、前記第4の管理装置を選択すると、前記第4の管理装置のIPアドレスとポート番号を含む第2の接続先情報を、前記第4の管理装置から前記第1の管理装置および前記第2の管理装置へ送信させ、前記第2の接続先情報にしたがって、前記第2の管理装置と前記第4の管理装置との間の通信路を形成し、
前記第2の管理装置が前記第4の管理装置を選択した場合、前記第1の管理装置は、前記第2の接続先情報にしたがって、前記第1の管理装置と前記第4の管理装置との間の通信路を形成する
ことを特徴とする請求項6に記載の情報処理方法。
When the second management apparatus selects the third management apparatus, the first connection destination information including the Internet Protocol (IP) address and port number of the third management apparatus is transmitted to the third management apparatus. Transmission to the first management device and the second management device, and forming a communication path between the second management device and the third management device according to the first connection destination information ,
When the second management apparatus selects the third management apparatus, the first management apparatus performs the first management apparatus and the third management apparatus according to the first connection destination information. Form a communication path between
When the second management device selects the fourth management device, second connection destination information including an IP address and a port number of the fourth management device is transmitted from the fourth management device to the first connection destination information. Forming a communication path between the second management apparatus and the fourth management apparatus according to the second connection destination information.
When the second management apparatus selects the fourth management apparatus, the first management apparatus performs the first management apparatus and the fourth management apparatus according to the second connection destination information. The information processing method according to claim 6 , forming a communication path between the two.
JP2014208274A 2014-10-09 2014-10-09 INFORMATION PROCESSING SYSTEM, PROGRAM, AND INFORMATION PROCESSING METHOD Expired - Fee Related JP6476718B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014208274A JP6476718B2 (en) 2014-10-09 2014-10-09 INFORMATION PROCESSING SYSTEM, PROGRAM, AND INFORMATION PROCESSING METHOD

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014208274A JP6476718B2 (en) 2014-10-09 2014-10-09 INFORMATION PROCESSING SYSTEM, PROGRAM, AND INFORMATION PROCESSING METHOD

Publications (2)

Publication Number Publication Date
JP2016082250A JP2016082250A (en) 2016-05-16
JP6476718B2 true JP6476718B2 (en) 2019-03-06

Family

ID=55956501

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014208274A Expired - Fee Related JP6476718B2 (en) 2014-10-09 2014-10-09 INFORMATION PROCESSING SYSTEM, PROGRAM, AND INFORMATION PROCESSING METHOD

Country Status (1)

Country Link
JP (1) JP6476718B2 (en)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001036510A (en) * 1999-07-16 2001-02-09 Matsushita Electric Ind Co Ltd Redundant control system and redundant line between devices

Also Published As

Publication number Publication date
JP2016082250A (en) 2016-05-16

Similar Documents

Publication Publication Date Title
US20100138687A1 (en) Recording medium storing failure isolation processing program, failure node isolation method, and storage system
JP4611922B2 (en) Control program, control method, and control apparatus
EP3291487B1 (en) Method for processing virtual machine cluster and computer system
US9208124B2 (en) Reset of processing core in multi-core processing system
US9697078B2 (en) Method and device for auto recovery storage of JBOD array
WO2013145325A1 (en) Information processing system, problem detection method and information processing device
JP6511739B2 (en) Redundant system and redundant method
JP5617304B2 (en) Switching device, information processing device, and fault notification control program
JP2013161252A (en) Redundant computer control program, method, and device
JP6697158B2 (en) Information management program, information management method, and information management device
JP5613119B2 (en) Master / slave system, control device, master / slave switching method, and master / slave switching program
JPWO2012160641A1 (en) Management apparatus, information processing apparatus, information processing system, and data transfer method
CN109189854B (en) Method and node equipment for providing continuous service
JP6476718B2 (en) INFORMATION PROCESSING SYSTEM, PROGRAM, AND INFORMATION PROCESSING METHOD
CN114448889A (en) Data processing method and device
JP5016696B2 (en) High availability system, server, high availability maintenance method and program
JP2009211279A (en) Handling data management server system
JP6511737B2 (en) Redundant system, redundant method and redundant program
JP4645435B2 (en) Information processing apparatus, communication load distribution method, and communication load distribution program
JP6111791B2 (en) Network management system, network management device, server, network management method, and program
JP6511738B2 (en) Redundant system, redundant method and redundant program
US10122588B2 (en) Ring network uplink designation
JP6310348B2 (en) COMMUNICATION DEVICE AND METHOD FOR CONTROLLING COMMUNICATION DEVICE
JP2016009216A (en) Redundant system and redundancy method
JP5887462B2 (en) Information processing system and operation management method of information processing system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170704

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180514

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180619

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180703

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190108

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190121

R150 Certificate of patent or registration of utility model

Ref document number: 6476718

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees