JP6551111B2 - Information processing apparatus, down determination method, cluster system, and program - Google Patents
Information processing apparatus, down determination method, cluster system, and program Download PDFInfo
- Publication number
- JP6551111B2 JP6551111B2 JP2015189314A JP2015189314A JP6551111B2 JP 6551111 B2 JP6551111 B2 JP 6551111B2 JP 2015189314 A JP2015189314 A JP 2015189314A JP 2015189314 A JP2015189314 A JP 2015189314A JP 6551111 B2 JP6551111 B2 JP 6551111B2
- Authority
- JP
- Japan
- Prior art keywords
- time
- transmission
- information processing
- heartbeat
- interval
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 220
- 238000000034 method Methods 0.000 title claims description 27
- 230000005540 biological transmission Effects 0.000 claims description 219
- 230000008859 change Effects 0.000 description 13
- 230000003111 delayed effect Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 238000012544 monitoring process Methods 0.000 description 7
- 101100425597 Solanum lycopersicum Tm-1 gene Proteins 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000001514 detection method Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000036541 health Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 230000007958 sleep Effects 0.000 description 1
Images
Landscapes
- Hardware Redundancy (AREA)
- Debugging And Monitoring (AREA)
Description
本発明は情報処理装置、ダウン判定方法、クラスタシステム、及びプログラムに関する。 The present invention relates to an information processing apparatus, a down determination method, a cluster system, and a program.
HA(High Availability:高可用性)クラスタシステムにおいて、各サーバが、互いの死活監視を行う手段として、ネットワーク通信(ハートビート)を使用する方法が知られている。この方法では、各サーバは、送信の動作として、所定の時間間隔でハートビートパケットを送信し、受信の動作として、相手サーバから送信されたハートビートパケットを待ち受ける。そして、サーバは、相手サーバからのハートビートパケットを所定時間内に受信できなかった場合(すなわち、受信がタイムアウトした場合)、相手サーバがダウンしたと判断する。また、ダウンした相手サーバで業務プログラムが稼働していた場合、自サーバで業務プログラムを起動して、業務を継続する。 In an HA (High Availability) cluster system, a method is known in which each server uses network communication (heartbeat) as means for monitoring each other's life and death. In this method, each server transmits a heartbeat packet at a predetermined time interval as a transmission operation, and waits for a heartbeat packet transmitted from the partner server as a reception operation. Then, when the server can not receive the heartbeat packet from the other server within a predetermined time (that is, when the reception times out), it determines that the other server is down. Also, when the business program is running on the other server that has gone down, the business server is started on the own server to continue the business.
また、ネットワーク通信を使用した死活監視については、例えば、特許文献1が知られている。特許文献1では、ヘルスチェックフレームを相手サーバに送信し、これに対する応答により死活監視を行う際、負荷が掛かっているために応答が遅延するようなサーバに対するヘルスチェックフレームの送信間隔を長く設定することが開示されている。
For life and death monitoring using network communication, for example,
ところで、近年、仮想マシン上でのHAクラスタシステムの構築が増えている。仮想マシンは、CPU(Central Processing Unit)等のハードウェアをホストOS(Operating System)又はハイパーバイザでエミュレートしているため、ホストOS又はハイパーバイザが高負荷になった場合、仮想マシンにリソースを割り当てられず、時刻のカウント(tick カウント)ですらも動作が安定しないことが多くある。時刻のカウントに遅延が生じると、上述のハートビートパケットの送信間隔を所定の時間間隔で行うことができなくなる。 Incidentally, in recent years, the construction of HA cluster systems on virtual machines has increased. Since a virtual machine emulates hardware such as a CPU (Central Processing Unit) with a host OS (Operating System) or a hypervisor, when the host OS or the hypervisor becomes heavily loaded, resources are allocated to the virtual machine. Even if it is not assigned, even the time count (tick count) is often unstable. If a delay occurs in the time count, the above-described heartbeat packet transmission interval can not be performed at a predetermined time interval.
サーバのシステム遅延によりハートビートパケットの送信間隔を所定の時間間隔で行うことができなくなると、このサーバが実際にはダウンを起こしていないにもかかわらず、ダウンしたと誤判定される恐れがある。そして、サーバのダウンの誤判定が発生すると、両方のサーバで業務が並行して稼働してしまい、HAクラスタシステムが不正な状態となる恐れがある。 If the heartbeat packet transmission interval cannot be performed at a predetermined time interval due to the system delay of the server, it may be erroneously determined that the server has gone down even though this server has not actually gone down. . If an erroneous determination that the server is down occurs, the business runs on both servers in parallel, and the HA cluster system may be in an illegal state.
これに対し、特許文献1では、遅延が発生したサーバに対するヘルスチェックフレームの送信間隔を長くするよう変更することにより、このサーバにかかっている負荷を増大させないようにする技術について開示しているに過ぎない。したがって、サーバのダウンの誤判定を抑制することが依然として求められている。
On the other hand,
本発明の目的は、このような課題を解決するためになされたものであり、ダウンの誤判定を抑制することができる情報処理装置、ダウン判定方法、クラスタシステム、及びプログラムを提供することにある。 An object of the present invention is to solve such a problem, and is to provide an information processing apparatus, a down determination method, a cluster system, and a program that can suppress erroneous determination of down. .
本発明の一態様にかかる情報処理装置は、自装置の時刻をカウントする時刻カウント手段と、送信側の装置がカウントした時刻による送信時刻が含まれるハートビートパケットを受信するハートビート受信手段と、前記ハートビート受信手段により受信された時間的に連続する2つの前記ハートビートパケットについての前記時刻カウント手段による2つの受信時刻の差が、該2つの前記ハートビートパケットに含まれる2つの送信時刻の差に基づいて算出される受信間隔よりも大きい場合に、タイムアウト時間を予め定められた時間よりも長くするタイムアウト時間変更手段と、前記タイムアウト時間内に前記送信側の装置からのハートビートパケットを前記ハートビート受信手段が受信しない場合、前記送信側の装置にダウンが発生したと判定するダウン判定手段とを有する。 An information processing apparatus according to an aspect of the present invention includes time counting means for counting the time of the apparatus itself, and heartbeat receiving means for receiving a heartbeat packet including a transmission time according to the time counted by the apparatus on the transmitting side. The difference between the two reception times by the time counting means for two heartbeat packets consecutive in time received by the heartbeat receiving means is the difference between the two transmission times included in the two heartbeat packets. Timeout time changing means for making the timeout time longer than a predetermined time when it is larger than the reception interval calculated based on the difference, and the heartbeat packet from the transmitting device within the timeout time When the heartbeat receiving means does not receive, the device on the sending side is down Determining and a down determination means.
また、本発明の一態様にかかるダウン判定方法は、送信側の装置がカウントした時刻による送信時刻が含まれるハートビートパケットを受信するハートビートパケット受信ステップと、受信した時間的に連続する2つの前記ハートビートパケットについての、受信側の装置のカウントした時刻による2つの受信時刻の差が、該2つの前記ハートビートパケットに含まれる2つの送信時刻の差に基づいて算出される受信間隔よりも大きい場合に、タイムアウト時間を予め定められた時間よりも長くするタイムアウト時間変更ステップと、前記タイムアウト時間内に前記送信側の装置からのハートビートパケットを受信しない場合、前記送信側の装置にダウンが発生したと判定するダウン判定ステップとを有する方法である。 The down determination method according to one aspect of the present invention includes a heartbeat packet receiving step for receiving a heartbeat packet including a transmission time according to a time counted by a transmission-side apparatus, and two received temporally continuous For the heartbeat packet, the difference between the two reception times depending on the time counted by the receiving device is larger than the reception interval calculated based on the difference between the two transmission times included in the two heartbeat packets. If it is larger, the timeout time changing step for making the timeout time longer than a predetermined time, and if the heartbeat packet from the transmitting device is not received within the timeout time, the transmitting device is downed. And a down determination step for determining that it has occurred.
また、本発明の一態様にかかるクラスタシステムは、複数の情報処理装置を備え、前記複数の情報処理装置は、それぞれ、自装置の時刻をカウントする時刻カウント手段と、設定された送信時間間隔で、前記複数の情報処理装置のうちの他の情報処理装置に、前記時刻カウント手段がカウントした時刻による送信時刻が含まれるハートビートパケットを送信するハートビート送信手段と、前記他の情報処理装置がカウントした時刻による送信時刻が含まれるハートビートパケットを、前記他の情報処理装置から受信するハートビート受信手段と、前記ハートビート受信手段により受信された時間的に連続する2つの前記ハートビートパケットについての前記時刻カウント手段による2つの受信時刻の差が、該2つの前記ハートビートパケットに含まれる2つの送信時刻の差に基づいて算出される受信間隔よりも大きい場合に、タイムアウト時間を予め定められた時間よりも長くするタイムアウト時間変更手段と、前記2つの受信時刻の差が、前記算出される受信間隔よりも小さい場合に、前記送信時間間隔を予め定められた時間間隔よりも短くする送信時間間隔変更手段と前記タイムアウト時間内に前記送信側の装置からのハートビートパケットを前記ハートビート受信手段が受信しない場合、前記送信側の装置にダウンが発生したと判定するダウン判定手段とを有する。 The cluster system according to an aspect of the present invention includes a plurality of information processing devices, and each of the plurality of information processing devices includes a time counting unit that counts the time of the own device, and a set transmission time interval. A heartbeat transmission unit that transmits a heartbeat packet including a transmission time according to a time counted by the time counting unit to another information processing device of the plurality of information processing devices, and the other information processing device. A heartbeat receiving unit that receives a heartbeat packet including a transmission time according to the counted time from the other information processing apparatus, and two heartbeat packets that are received in time by the heartbeat receiving unit. The difference between the two reception times by the time counting means is the two heartbeat packets A time-out period changing unit which makes the time-out period longer than a predetermined time when the time is larger than the reception interval calculated based on the difference between the two transmission times included, and the difference between the two reception times is Transmission time interval changing means for making the transmission time interval shorter than a predetermined time interval if smaller than the calculated reception interval, and the heartbeat packet from the transmitting device within the time-out time And a down determination unit configured to determine that a down has occurred in the apparatus on the transmission side when the beat reception unit does not receive the signal.
また、本発明の一態様にかかるプログラムは、送信側の装置がカウントした時刻による送信時刻が含まれるハートビートパケットを受信するハートビートパケット受信ステップと、受信した時間的に連続する2つの前記ハートビートパケットについての、受信側の装置のカウントした時刻による2つの受信時刻の差が、該2つの前記ハートビートパケットに含まれる2つの送信時刻の差に基づいて算出される受信間隔よりも大きい場合に、タイムアウト時間を予め定められた時間よりも長くするタイムアウト時間変更ステップと、前記タイムアウト時間内に前記送信側の装置からのハートビートパケットを受信しない場合、前記送信側の装置にダウンが発生したと判定するダウン判定ステップとを情報処理装置のコンピュータに実行させるプログラムである。 The program according to one aspect of the present invention includes a heartbeat packet receiving step for receiving a heartbeat packet including a transmission time according to a time counted by a transmission-side device, and two received hearts that are continuous in time. When the difference between two reception times according to the time counted by the receiving device for a beat packet is larger than the reception interval calculated based on the difference between the two transmission times included in the two heartbeat packets In addition, a timeout time changing step for making the timeout time longer than a predetermined time, and if a heartbeat packet from the transmitting device is not received within the timeout time, the transmitting device is down. The down determination step for determining A gram.
本発明によれば、ダウンの誤判定を抑制することができる情報処理装置、ダウン判定方法、クラスタシステム、及びプログラムを提供することができる。 According to the present invention, it is possible to provide an information processing apparatus, a down determination method, a cluster system, and a program capable of suppressing an erroneous determination of down.
<本発明にかかる実施の形態の概要>
実施の形態の説明に先立って、本発明にかかる実施の形態の概要を説明する。以下、本発明にかかる実施の形態の概要の説明として、情報処理装置10(図1参照)及び情報処理装置20(図2参照)を例として挙げる。
<Overview of the embodiment according to the present invention>
Prior to the description of the embodiments, an outline of the embodiments according to the present invention will be described. Hereinafter, the information processing apparatus 10 (see FIG. 1) and the information processing apparatus 20 (see FIG. 2) will be described as an example of the outline of the embodiment according to the present invention.
図1は、実施の形態にかかる情報処理装置の概要を示すブロック図である。情報処理装置10は、例えば、HAクラスタシステムを構成する複数のサーバのうちのいずれかである。情報処理装置10は、一例としては、仮想マシン上に構築されるが、物理環境で構築されてもよい。
FIG. 1 is a block diagram illustrating an outline of the information processing apparatus according to the embodiment. The
情報処理装置10は、HAクラスタシステムを構成する他の情報処理装置との間で、通信を行い、相互に死活監視を行う。より具体的には、情報処理装置10及びHAクラスタシステムを構成する他の情報処理装置は、それぞれ、予め定められた送信時間間隔で、ハートビートパケットを相手装置に対して送信する。また、情報処理装置10及びこの他の情報処理装置は、それぞれ、相手装置からのハートビートパケットを予め定められたタイムアウト時間内に受信できない場合、相手装置がダウンを起こしたと判定する。なお、ここでダウンは、情報処理装置(サーバ)のシステムダウンを指しており、HAクラスタシステム全体のシステムダウンではない。
The
ここで、情報処理装置10は、図1に示されるように、時刻カウント部11と、ハートビート受信部12と、タイムアウト時間変更部13と、ダウン判定部14とを有する。
Here, as illustrated in FIG. 1, the
時刻カウント部11は、情報処理装置10(自装置)の時刻をカウントする。また、ハートビート受信部12は、相手装置が送信したハートビートパケットを受信する。このハートビートパケットには、送信側の装置である相手装置がカウントした時刻による、当該パケットの送信時刻が含まれている。
The time counting unit 11 counts the time of the information processing apparatus 10 (self apparatus). In addition, the
タイムアウト時間変更部13は、ハートビート受信部12により受信された時間的に連続する2つのハートビートパケットの受信時刻の差が、これら2つのハートビートパケットに含まれる2つの送信時刻の差に基づいて算出される受信間隔よりも大きい場合に、タイムアウト時間を予め定められた時間よりも長くする。ここで、ハートビートパケットの受信時刻とは、ハートビートパケットの受信側である情報処理装置10の時刻カウント部11によりカウントされた時刻をいう。これに対し、2つのハートビートパケットに含まれる2つの送信時刻の差に基づいて算出される受信間隔は、送信側の時計に基づく送信間隔に対応しており、想定される受信間隔と言える。すなわち、タイムアウト時間変更部13は、前回受信したハートビートパケットと今回受信したハートビートパケットについて、自装置の時計に基づく受信間隔と、想定される受信間隔とを比較する。そして、タイムアウト時間変更部13は、自装置の時計に基づく受信間隔が、想定される受信間隔よりも大きい場合、タイムアウト時間を長くするよう変更する。
The time-out
ダウン判定部14は、送信側の装置である相手装置からのハートビートパケットをハートビート受信部12がタイムアウト時間内に受信しない場合、相手装置にダウンが発生したと判定する。
When the
ここで、相手装置が高負荷状態に陥り、相手装置における時刻カウントに遅延が生じた状況を想定する。この場合、相手装置は、所定の送信時間間隔T1でハートビートパケットを送信するために、当該装置の時刻カウントで送信時間間隔T1がカウントされる度に、ハートビートパケットを送信する。しかしながら、時刻カウントに遅延が生じているため、実際の送信時間間隔は、T1よりも大きいT2となっている。ただし、送信されるハートビートパケットには、当該装置の時計がカウントした送信時刻が付されているため、ハートビートパケットに付された送信時刻の間隔を見る限り、送信時間間隔はT1である。 Here, it is assumed that the opposite device is in a high load state and a delay occurs in the time count in the opposite device. In this case, in order to transmit the heartbeat packet at the predetermined transmission time interval T1, the partner device transmits the heartbeat packet every time the transmission time interval T1 is counted by the time count of the device. However, since there is a delay in time count, the actual transmission time interval is T2, which is larger than T1. However, since the transmission time counted by the clock of the device is attached to the heartbeat packet to be transmitted, the transmission time interval is T1 as long as the transmission time interval attached to the heartbeat packet is seen.
このとき、情報処理装置10のタイムアウト時間変更部13は、相手装置から送信された時間的に連続する2つのハートビートパケットについて、以下のように判定する。すなわち、タイムアウト時間変更部13は、両ハートビートパケットの自装置の時計に基づく受信間隔はT2であり、ハートビートパケットに付された送信時刻から得られる想定される受信間隔T1よりも大きいと判定する。このため、タイムアウト時間変更部13は、タイムアウト時間を所定の時間よりも長い時間へと変更する。
At this time, the timeout
したがって、情報処理装置10によれば、相手装置に遅延が発生した場合に、タイムアウト時間が長くなるように変更されるので、相手装置がダウンしたとダウン判定部14が判定することを防ぐことができる。すなわち、ダウンが発生していないにもかかわらずダウしていると判定してしまう誤判定を抑制することができる。
Therefore, according to the
次に、本発明にかかる実施の形態の概要のもう一例について説明する。図2は、実施の形態にかかる情報処理装置の概要を示すブロック図である。情報処理装置20も情報処理装置10と同様、例えば、HAクラスタシステムを構成する複数のサーバのうちのいずれかである。情報処理装置20も、一例としては、仮想マシン上に構築されるが、物理環境で構築されてもよい。
Next, another example of the outline of the embodiment according to the present invention will be described. FIG. 2 is a block diagram illustrating an overview of the information processing apparatus according to the embodiment. Similarly to the
情報処理装置20も、HAクラスタシステムを構成する他の情報処理装置との間で、通信を行い、相互に死活監視を行う。なお、具体的な死活監視方法は、上述した通りである。
The
ここで、情報処理装置20は、図2に示されるように、時刻カウント部21と、ハートビート受信部22と、ハートビート送信部23と、送信時間間隔変更部24とを有する。
Here, as illustrated in FIG. 2, the
時刻カウント部21は、情報処理装置20(自装置)の時刻をカウントする。また、ハートビート受信部22は、相手装置が送信したハートビートパケットを受信する。
The
ハートビート送信部23は、設定された送信時間間隔で、ハートビートパケットを相手装置に対して送信する。ここで、ハートビート送信部23が送信するハートビートパケットには、時刻カウント部21がカウントした時刻による送信時刻が含まれる。なお、ハートビート受信部22が受信するハートビートパケットも同様に、送信側の装置である相手装置がカウントした時刻による、当該パケットの送信時刻を含んでいる。
The
送信時間間隔変更部24は、ハートビート受信部22により受信された時間的に連続する2つのハートビートパケットの受信時刻の差が、これら2つのハートビートパケットに含まれる2つの送信時刻の差に基づいて算出される受信間隔よりも小さい場合に、自装置が送信するハートビートパケットの送信時間間隔を予め定められた時間間隔よりも短くする。
The transmission time
すなわち、送信時間間隔変更部24は、前回受信したハートビートパケットと今回受信したハートビートパケットについて、自装置の時計に基づく受信間隔と、想定される受信間隔とを比較する。そして、送信時間間隔変更部24は、自装置の時計に基づく受信間隔が、想定される受信間隔よりも小さい場合、送信時間間隔を短くするよう変更する。
That is, the transmission time
ここで、情報処理装置20が高負荷状態に陥り、時刻カウント部21による時刻カウントに遅延が生じた状況を想定する。ここで、相手装置から受信したハートビートパケットに記載されている送信時刻から算出される送信時間間隔がT1であるとする。しかし、時刻カウント部21の時刻カウントには遅延が生じているため、時刻カウント部21による連続する2つのハートビートパケットの受信間隔は、T1よりも短いT3となってしまう。
Here, it is assumed that the
このとき、情報処理装置20の送信時間間隔変更部24は、相手装置から送信された時間的に連続する2つのハートビートパケットについて、以下のように判定する。すなわち、送信時間間隔変更部24は、両ハートビートパケットの自装置の時計に基づく受信間隔はT3であり、ハートビートパケットに付された送信時刻から得られる想定される受信間隔T1よりも小さいと判定する。このため、送信時間間隔変更部24は、送信時間間隔を所定の時間間隔よりも短い時間間隔へと変更する。
At this time, the transmission time
したがって、情報処理装置20によれば、自装置に遅延が発生した場合に、自装置が送信するハートビートパケットの送信時間間隔が短くなるように変更される。これにより、実際の送信時間間隔が延びることを抑制することができる。したがって、情報処理装置20がダウンしたと相手装置に誤判定されてしまうことを抑制することができる。
Therefore, according to the
<実施の形態の説明>
以下、実施の形態の詳細について説明する。図3は、実施の形態にかかるHAクラスタシステム1の構成を示すブロック図である。図3に示すように、HAクラスタシステム1は、情報処理装置30A、情報処理装置30Bを有する。情報処理装置30A及び情報処理装置30Bは、ネットワーク31を介して、相互に通信可能に接続されている。なお、ネットワーク31は、有線ネットワークでもよいし、無線ネットワークでもよい。以下、情報処理装置30Aと30Bの総称として、情報処理装置30ということがある。
<Description of the embodiment>
The details of the embodiment will be described below. FIG. 3 is a block diagram showing the configuration of the
HAクラスタシステム1において、情報処理装置30A又は情報処理装置30Bのいずれか一方が、稼働系として動作し、他方が待機系として動作する。例えば、HAクラスタシステム1は、通常時、稼働系として動作している情報処理装置30により所定のサービスを提供し、稼働系として動作している情報処理装置30に異常が発生した際に、フェールオーバーを実施し、待機系であった情報処理装置30が稼働系として動作して所定のサービスを提供する。なお、図3で示した例では、HAクラスタシステム1は、2つの情報処理装置から構成されているが、3つ以上の情報処理装置から構成されてもよい。
In the
情報処理装置30A及び情報処理装置30Bは、HAクラスタシステム1を構成するサーバであり、仮想マシン上に構築されている。したがって、情報処理装置30A及び情報処理装置30Bは、コンピュータとしての機能を備えている。なお、本実施の形態では、情報処理装置30が仮想マシン上に構築されているものとして説明するが、情報処理装置30は物理環境で構築されてもよい。
The
情報処理装置30A及び情報処理装置30Bは、通信を行い、相互に死活監視を行う。より具体的には、情報処理装置30Aは、予め定められた送信時間間隔で、ハートビートパケットを情報処理装置30Bに対して送信する。また、情報処理装置30Bも、予め定められた送信時間間隔で、ハートビートパケットを情報処理装置30Aに対して送信する。なお、情報処理装置30Aにおける送信時間間隔と、情報処理装置30Bにおける送信時間間隔は、同じとは限らない。
The
また、情報処理装置30Aは、情報処理装置30Bからのハートビートパケットを予め定められたタイムアウト時間内に受信できない場合、情報処理装置30Bがダウンを起こしたと判定する。同様に、情報処理装置30Bは、情報処理装置30Aからのハートビートパケットを予め定められたタイムアウト時間内に受信できない場合、情報処理装置30Aがダウンを起こしたと判定する。なお、情報処理装置30Aにおけるタイムアウト時間と、情報処理装置30Bにおけるタイムアウト時間は、同じとは限らない。
Further, when the
以下、情報処理装置30の具体的構成について説明するが、情報処理装置30Bは情報処理装置30Aと同様の構成を備えるため、以下では、情報処理装置30Aの構成についてのみ説明し、情報処理装置30Bの構成の説明を省略する。図4は、実施の形態にかかる情報処理装置30A(30B)の構成を示すブロック図である。
Hereinafter, the specific configuration of the information processing apparatus 30 will be described. Since the
情報処理装置30Aは、設定値情報記憶部300と、時刻カウント部301と、ハートビート送信部302と、ハートビート受信部303と、ダウン判定部304と、タイムアウト時間変更部305と、送信時間間隔変更部306とを有する。
The
時刻カウント部301、ハートビート送信部302、ハートビート受信部303、ダウン判定部304、タイムアウト時間変更部305、及び送信時間間隔変更部306は、例えば、CPUの制御によって、プログラムが実行されることによって実現できる。より具体的には、メモリなどの記憶装置に格納されたプログラムを、CPUの制御によって実行して実現する。また、各構成要素は、プログラムによるソフトウェアで実現することに限ることなく、ハードウェア、ファームウェア、及びソフトウェアのうちのいずれかの組み合わせ等により実現してもよい。
For example, the
設定値情報記憶部300は、例えばメモリ、ストレージなどの記憶装置であり、上述の送信時間間隔の設定値及び上述のタイムアウト時間の設定値を記憶する。時刻カウント部301は、情報処理装置30Aの時刻をカウントする。ただし、時刻カウント部301による時刻のカウントは、情報処理装置30Aの負荷状況等に応じて、遅延する可能性がある。
The setting value
ハートビート送信部302は、設定値情報記憶部300に記憶された設定値を参照し、設定された送信時間間隔で、ハートビートパケットを情報処理装置30Bに対して送信する。ハートビート送信部302が送信するハートビートパケットには、時刻カウント部301がカウントした時刻による送信時刻が含まれる。
The
ハートビート受信部303は、情報処理装置30Bが送信したハートビートパケットを受信する。なお、情報処理装置30Bが送信するハートビートパケットには、情報処理装置30Bの時刻カウント部301がカウントした時刻による送信時刻が含まれている。
The
ダウン判定部304は、設定値情報記憶部300に記憶された設定値を参照し、設定されたタイムアウト時間内に情報処理装置30Bからのハートビートパケットをハートビート受信部303が受信しない場合、情報処理装置30Bにダウンが発生したと判定する。
The down
タイムアウト時間変更部305は、ハートビート受信部303により受信された時間的に連続する情報処理装置30Bからの2つのハートビートパケットの受信時刻の差が、これら2つのハートビートパケットに含まれる2つの送信時刻の差に基づいて算出される受信間隔よりも大きい場合に、タイムアウト時間を予め定められた時間よりも長い時間へと変更する。すなわち、タイムアウト時間変更部305は、設定値情報記憶部300に記憶されたタイムアウト時間の設定値を書き換える。
The time-out
言い換えると、タイムアウト時間変更部305は、情報処理装置30Bから前回受信したハートビートパケットの時刻カウント部301による受信時刻と情報処理装置30Bから今回受信したハートビートパケットの時刻カウント部301による受信時刻との差が、ハートビートパケットに含まれる送信時刻から算出される想定される受信間隔よりも大きい場合に、タイムアウト時間を変更する。
In other words, the timeout
具体的には、以下の式(1)を満たす場合に、タイムアウト時間変更部305は、タイムアウト時間を所定値よりも長い時間へと変更する。
Specifically, when the following formula (1) is satisfied, the timeout
Tn−Tn-1>T ・・・(1) T n −T n−1 > T (1)
ここで、Tnは今回受信したハートビートパケットの時刻カウント部301による受信時刻を示し、Tn-1は、前回受信したハートビートパケットの時刻カウント部301による受信時刻を示す。Tは、受信した2つのハートビートパケットに基づく、想定される受信間隔であり、例えば、以下の式(2)のように算出される。
Here, T n indicates the reception time of the heartbeat packet received this time by the
T=Tm−Tm-1 ・・・(2) T = T m −T m−1 (2)
ここで、Tmは今回受信したハートビートパケットに含まれる送信時刻を示し、Tm-1は、前回受信したハートビートパケッに含まれる送信時刻を示す。 Here, T m indicates the transmission time included in the currently received heartbeat packet, and T m-1 indicates the transmission time included in the previously received heartbeat packet.
このようにタイムアウト時間変更部305は、上記式(1)が満たされる場合、相手装置すなわち情報処理装置30Bに遅延が発生していると判断し、タイムアウト時間を延ばす。
Thus, when the above formula (1) is satisfied, the timeout
タイムアウト時間変更部305による変更後のタイムアウト時間は、例えば、予め定められた固定値であってもよいし、変更前のタイムアウト時間に対する固定倍率の時間であってもよい。すなわち、タイムアウト時間変更部305は、上記式(1)が満たされる場合、通常時のタイムアウト時間の例えば2倍の時間に変更してもよい。また、これに限らず、タイムアウト時間変更部305は、時間的に連続する2つのハートビートパケットの時刻カウント部301による受信時刻の差と、想定される受信間隔との乖離の程度に応じた時間だけタイムアウト時間を長くしてもよい。これにより、情報処理装置30Bの遅延の度合いに応じてタイムアウト時間を変更できるため、ダウン誤検知をより減らすことが可能となる。
The timeout time after the change by the timeout
また、タイムアウト時間変更部305は、タイムアウト時間を所定値よりも長い時間に変更した後、情報処理装置30Bの遅延が解消した際には、タイムアウト時間を所定値に戻すよう再度変更する。すなわち、情報処理装置30Bから前回受信したハートビートパケットの時刻カウント部301による受信時刻と情報処理装置30Bから今回受信したハートビートパケットの時刻カウント部301による受信時刻との差が、ハートビートパケットに含まれる送信時刻から算出される想定される受信間隔に等しくなった場合、タイムアウト時間変更部305は、タイムアウト時間を予め定められた時間へ戻す。さらに言い換えると、タイムアウト時間変更部305は、式(1)を満たした後、Tn−Tn-1=Tとなると、タイムアウト時間を元に戻す。
In addition, after the timeout
送信時間間隔変更部306は、ハートビート受信部303により受信された時間的に連続する情報処理装置30Bからの2つのハートビートパケットの受信時刻の差が、これら2つのハートビートパケットに含まれる2つの送信時刻の差に基づいて算出される受信間隔よりも小さい場合に、ハートビートパケットの送信時間間隔を予め定められた時間間隔よりも短くする。すなわち、送信時間間隔変更部306は、設定値情報記憶部300に記憶された送信時間間隔の設定値を書き換える。
The transmission time
具体的には、以下の式(3)を満たす場合に、送信時間間隔変更部306は、送信時間間隔を所定値よりも短い時間間隔へと変更する。
Specifically, when the following formula (3) is satisfied, the transmission time
Tn−Tn-1<T ・・・(3) T n −T n−1 <T (3)
このように送信時間間隔変更部306は、上記式(3)が満たされる場合、自装置すなわち情報処理装置30Aに遅延が発生していると判断し、送信時間間隔の設定値を小さくする。
As described above, when the above equation (3) is satisfied, the transmission time
送信時間間隔変更部306による変更後の送信時間間隔は、例えば、予め定められた固定値であってもよいし、変更前の送信時間間隔に対する固定倍率の時間間隔であってもよい。すなわち、送信時間間隔変更部306は、上記式(3)が満たされる場合、通常時の送信時間間隔の例えば1/2倍の時間間隔に変更してもよい。また、これに限らず、送信時間間隔変更部306は、時間的に連続する2つのハートビートパケットの時刻カウント部301による受信時刻の差と、想定される受信間隔との乖離の程度に応じた時間だけ送信時間間隔を短くしてもよい。これにより、自装置の遅延の度合いに応じて送信時間間隔を変更できるため、相手装置にダウン誤検知されることをより減らすことが可能となる。
The transmission time interval after the change by the transmission time
また、送信時間間隔変更部306は、ハートビートパケットの送信時間間隔を短くするよう変更した後、自装置の遅延が解消した際には、送信時間間隔を所定値に戻すよう再度変更する。すなわち、情報処理装置30Bから前回受信したハートビートパケットの時刻カウント部301による受信時刻と情報処理装置30Bから今回受信したハートビートパケットの時刻カウント部301による受信時刻との差が、ハートビートパケットに含まれる送信時刻から算出される想定される受信間隔に等しくなった場合、送信時間間隔変更部306は、送信時間間隔を予め定められた時間間隔へ戻す。さらに言い換えると、送信時間間隔変更部306は、式(3)満たした後、Tn−Tn-1=Tとなると、送信時間間隔を元に戻す。
Further, the transmission time
ここで、具体例を交えて情報処理装置30の動作について説明する。
(遅延が発生し始めた時の動作例)
まず、遅延の初期段階の動作について説明する。
情報処理装置30A及び情報処理装置30Bのハートビートパケットの送信時間間隔の現在の設定値は、いずれも1であるとする。すなわち、通常時の送信時間間隔が1であるものと仮定する。また、情報処理装置30A及び情報処理装置30Bのタイムアウト時間の現在の設定値は、いずれも3であるとする。すなわち、通常時のタイムアウト時間が3であるものと仮定する。ここで、情報処理装置30Bに遅延が発生したとする。
Here, the operation of the information processing apparatus 30 will be described with a specific example.
(Example of operation when delay starts to occur)
First, the operation at the initial stage of the delay will be described.
It is assumed that the current setting values of the heartbeat packet transmission time intervals of the
図5は、実際の時刻と、情報処理装置30Aの時刻カウント部301による時刻と、情報処理装置30Bの時刻カウント部301による時刻とを比較する表であり、遅延が発生し始めた時の一例を示している。
FIG. 5 is a table comparing the actual time, the time by the
情報処理装置30Aは遅延が発生していないため、情報処理装置30Aにおける時刻カウント部301による時刻と実際の時刻との間にずれがない。このため、情報処理装置30Aの送信時間間は、実際の時刻を基準として見ても、1である。これに対し、情報処理装置30Bは遅延が発生しているため、情報処理装置30Bにおける時刻カウント部301による時刻は、実際の時刻に比べて遅れている。このため、情報処理装置30Bは、自身の時刻カウント部301の時刻に従って、設定された送信時間間隔でハートビートパケットを送信するが、実際の時刻における時刻1と時刻3での送信となってしまっている。このため、情報処理装置30Bの送信時間間隔は、実際の時刻を基準としてみると、2である。
Since no delay occurs in the
ここで、情報処理装置30Aは、次のように動作する。情報処理装置30Aが情報処理装置30Bから受信した直近の2つのハートビートパケットに含まれる時刻情報は、1と2である。これに対し、受信時刻(情報処理装置30Aの時刻カウント部301による時刻)は、1と3である。すなわち、Tm=2、Tm−1=1、Tn=3、Tn−1=1である。したがって、上記式(1)が満たされるため、情報処理装置30Aのタイムアウト時間変更部305は、タイムアウト時間の設定値を例えば6に変更する。
Here, the
一方、情報処理装置30Bは、次のように動作する。情報処理装置30Bが情報処理装置30Aから受信した直近の2つのハートビートパケットに含まれる時刻情報は、2と3である。これに対し、受信時刻(情報処理装置30Bの時刻カウント部301による時刻)は、1.5と2である。すなわち、Tm=3、Tm−1=2、Tn=2、Tn−1=1.5である。したがって、上記式(3)が満たされるため、情報処理装置30Bの送信時間間隔変更部306は、ハートビートパケットの送信時間間隔の設定値を例えば0.5に変更する。
On the other hand, the
(遅延が拡大した時の動作例)
次に、情報処理装置30Bにおいて、遅延が拡大した時の動作について説明する。すなわち、情報処理装置30Bが遅延の初期段階の後の本格的な遅延状態に陥った際の動作について説明する。なお、情報処理装置30Aのハートビートパケットの送信時間間隔の現在の設定値は1のままである。これに対し、情報処理装置30Bのハートビートパケットの送信時間間隔の現在の設定値は、0.5に変更されている。また、情報処理装置30Bのタイムアウト時間の現在の設定値は、3のままである。これに対し、情報処理装置30Aのタイムアウト時間の現在の設定値は、6に変更されている。
(Example of operation when delay is expanded)
Next, in the
図6は、実際の時刻と、情報処理装置30Aの時刻カウント部301による時刻と、情報処理装置30Bの時刻カウント部301による時刻とを比較する表であり、本格的な遅延状態に陥った際の一例を示している。なお、図6では、理解を容易にするために、表中に記載の開始時刻は1としている。
FIG. 6 is a table comparing the actual time, the time measured by the
情報処理装置30Aは遅延が発生していないため、情報処理装置30Aの送信時間間隔は、実際の時刻を基準として見ても、1である。これに対し、情報処理装置30Bは遅延が拡大しているため、情報処理装置30Bにおける時刻カウント部301による時刻は、実際の時刻に比べてさらに遅れている。このため、情報処理装置30Bは、自身の時刻カウント部301の時刻に従って、設定された送信時間間隔(0.5)でハートビートパケットを送信するが、実際の時刻における時刻1と時刻6での送信となってしまっている。このため、情報処理装置30Bの送信時間間隔は、実際の時刻を基準としてみると、5である。
Since no delay occurs in the
ここで、情報処理装置30Aは、次のように動作する。情報処理装置30Aが情報処理装置30Bから受信した直近の2つのハートビートパケットに含まれる時刻情報は、1と1.5である。これに対し、受信時刻(情報処理装置30Aの時刻カウント部301による時刻)は、1と6である。すなわち、Tm=1.5、Tm−1=1、Tn=6、Tn−1=1である。したがって、上記式(1)が満たされるため、情報処理装置30Aのタイムアウト時間変更部305は、タイムアウト時間の設定値を変更値である6のまま維持する。
Here, the
ここで、情報処理装置30Aにおけるタイムアウト時間は6に設定されているため、情報処理装置30Bの送信時間間隔が5(=Tn−Tn−1)であるが、情報処理装置30Aのダウン判定部304は、情報処理装置30Bをダウンしていると検知しない。すなわち、ダウン判定部304は、誤検知しない。
Here, since the timeout time in the
一方、情報処理装置30Bは、次のように動作する。情報処理装置30Bが情報処理装置30Aから受信した直近の2つのハートビートパケットに含まれる時刻情報は、5と6である。これに対し、受信時刻(情報処理装置30Bの時刻カウント部301による時刻)は、1.4と1.5である。すなわち、Tm=6、Tm−1=5、Tn=1.5、Tn−1=1.4である。したがって、上記式(3)が満たされるため、情報処理装置30Bの送信時間間隔変更部306は、ハートビートパケットの送信時間間隔の設定値を変更値である0.5のまま維持する。
On the other hand, the
(遅延が解消した時の動作例)
次に、情報処理装置30Bにおいて、遅延が解消した時の動作について説明する。なお、情報処理装置30Aのハートビートパケットの送信時間間隔の現在の設定値は1のままであり、情報処理装置30Bのハートビートパケットの送信時間間隔の現在の設定値は、0.5のままである。また、情報処理装置30Bのタイムアウト時間の現在の設定値は、3のままであり、情報処理装置30Aのタイムアウト時間の現在の設定値は、6のままである。
(Example of operation when delay is eliminated)
Next, an operation when the delay is eliminated in the
図7は、実際の時刻と、情報処理装置30Aの時刻カウント部301による時刻と、情報処理装置30Bの時刻カウント部301による時刻とを比較する表であり、遅延が解消した時の一例を示している。なお、図7では、理解を容易にするために、表中に記載の開始時刻は1としている。
FIG. 7 is a table for comparing the actual time, the time by the
情報処理装置30Aは遅延が発生していないため、情報処理装置30Aの送信時間間隔は、実際の時刻を基準として見ても、1である。情報処理装置30Bは遅延が解消しており、情報処理装置30Bにおける時刻カウント部301による時刻と実際の時刻との間にずれがない。ただし、情報処理装置30Bの送信時間間隔は、0.5に設定されているため、情報処理装置30Bは、実際の時刻を基準として見ても、0.5間隔でハートビートパケットを送信する。
Since no delay occurs in the
ここで、情報処理装置30Aは、次のように動作する。情報処理装置30Aが情報処理装置30Bから受信した直近の2つのハートビートパケットに含まれる時刻情報は、2.5と3である。また、受信時刻(情報処理装置30Aの時刻カウント部301による時刻)も、2.5と3である。すなわち、Tm=3、Tm−1=2.5、Tn=3、Tn−1=2.5である。したがって、Tn−Tn-1=Tとなるため、情報処理装置30Aのタイムアウト時間変更部305は、タイムアウト時間の設定値を元の値である3に戻す。
Here, the
一方、情報処理装置30Bは、次のように動作する。情報処理装置30Bが情報処理装置30Aから受信した直近の2つのハートビートパケットに含まれる時刻情報は、2と3である。また、受信時刻(情報処理装置30Bの時刻カウント部301による時刻)も、2と3である。すなわち、Tm=3、Tm−1=2、Tn=3、Tn−1=2である。したがって、Tn−Tn-1=Tとなるため、情報処理装置30Bの送信時間間隔変更部306は、ハートビートパケットの送信時間間隔の設定値を元の値である1に戻す。
On the other hand, the
次に、情報処理装置30におけるハートビートパケットの送信処理及び受信処理に関わる動作についてフローチャートに基づいて説明する。 Next, operations relating to transmission processing and reception processing of heartbeat packets in the information processing apparatus 30 will be described based on a flowchart.
図8は、情報処理装置30におけるハートビートパケットの送信処理に関わる動作について示すフローチャートである。 FIG. 8 is a flowchart illustrating an operation related to a heartbeat packet transmission process in the information processing apparatus 30.
ステップ100(S100)において、ハートビート送信部302は、ハートビートパケットに時刻カウント部301によりカウントされた現在の時刻情報を入れる。
In step 100 (S100), the
ステップ101(S101)において、ハートビート送信部302は、相手サーバにハートビートパケットを送信する。
In step 101 (S101), the
ステップ102(S102)において、ハートビート送信部302は、設定値情報記憶部300を参照し、現在設定されている送信時間間隔だけスリープする。設定されている送信時間間隔が経過すると、再びステップ100〜102の処理を行う。
In step 102 (S102), the
図9は、情報処理装置30におけるハートビートパケットの受信処理に関わる動作について示すフローチャートである。 FIG. 9 is a flowchart illustrating an operation related to a heartbeat packet reception process in the information processing apparatus 30.
ステップ200(S200)において、ハートビート受信部303は、相手サーバから送信されるハートビートパケットを待ち受ける。ハートビート受信部303が設定されているタイムアウト時間内に相手サーバからハートビートパケットを受信できない場合、処理はステップ201へ移行する。これに対し、ハートビート受信部303が設定されているタイムアウト時間内に相手サーバからハートビートパケットを受信した場合、処理はステップ202へ移行する。
In step 200 (S200), the
ステップ201(S201)では、ダウン判定部304が、相手サーバがダウンしていると判定する。
In step 201 (S201), the
一方、ステップ202(S202)では、相手サーバ又は自サーバの遅延が判定される。具体的には、TnとTn−1の差分とTmとTm−1の差分とが比較され、上記式(1)又は上記式(3)が満たされるか否かが判定される。上記式(3)を満たす場合、自サーバが遅延しているとして、処理はステップ203へ移行する。また、上記式(1)を満たす場合、相手サーバが遅延しているとして、処理はステップ204へ移行する。さらに、上記式(1)も式(3)も満たさない場合、遅延が発生していなものとして、処理はステップ205へ移行する。なお、処理は、ステップ203、204又は205を実施後、再び、ステップ200に戻る。
On the other hand, in step 202 (S202), the delay of the other server or the own server is determined. Specifically, the difference between T n and T n-1 and the difference between T m and T m-1 are compared, and it is determined whether the above equation (1) or the above equation (3) is satisfied. . When the above equation (3) is satisfied, the processing shifts to step 203 on the assumption that the own server is delayed. If the above equation (1) is satisfied, the processing shifts to step 204, assuming that the other server is delayed. Furthermore, when neither the above formula (1) nor the formula (3) is satisfied, it is assumed that no delay has occurred, and the process proceeds to step 205. The process returns to step 200 again after performing
ステップ203(S203)では、送信時間間隔変更部306が、ハートビートパケットの送信時間間隔を予め定められた時間間隔よりも短くするよう設定値を変更する。なお、既に、予め定められた時間間隔よりも短い設定値へと変更済みである場合には、送信時間間隔変更部306は、変更された設定値を維持する。
In step 203 (S203), the transmission time
ステップ204(S204)では、タイムアウト時間変更部305が、タイムアウト時間を予め定められた時間よりも長くするよう設定値を変更する。なお、既に、予め定められた時間よりも長い設定値へと変更済みである場合には、タイムアウト時間変更部305は、変更された設定値を維持する。
In step 204 (S204), the timeout
ステップ205(S205)では、送信時間間隔変更部306は、送信時間間隔の設定値を予め定められた時間間隔(通常時の送信時間間隔)へと戻す。なお、既に、設置値が通常時の送信時間間隔である場合には、送信時間間隔変更部306は、現在の設定値を維持する。また、タイムアウト時間変更部305は、タイムアウト時間の設定値を予め定められた時間(通常時のタイムアウト時間)へと戻す。なお、既に、設置値が通常時のタイムアウト時間である場合には、タイムアウト時間変更部305は、現在の設定値を維持する。
In step 205 (S205), the transmission time
以上、実施の形態について説明した。
ところで、ダウンの誤判定を抑制する方法としては、上記の方法以外に、例えば、以下のような方法も考え得る。
The embodiment has been described above.
By the way, as a method of suppressing an erroneous determination of down, for example, the following method can be considered in addition to the above method.
例えば、タイムアウト時間の設定値を常に長く設定しておくことで、相手サーバに遅延が発生しても、相手サーバをサーバダウンと誤検知しにくくすることができる。しかし、この方法では、タイムアウト時間の設定値が常に長いため、実際にサーバダウンが発生した場合に、それが検知されるまでに常に多くの時間を要してしまうというデメリットがある。サーバダウンを検知するまでに多くの時間を要すると、クラスタシステムにより提供される業務プログラムはその間、停止したままの状態となってしまい好ましくない。 For example, by setting the setting value of the timeout time long at all times, even if a delay occurs in the other server, it is possible to make it difficult for the other server to be erroneously detected as a server down. However, this method has a demerit that since the set value of the timeout time is always long, it takes a lot of time until the server down is actually detected. If it takes a long time to detect a server down, the business program provided by the cluster system remains in a stopped state during that time, which is not preferable.
また、他の方法として、例えば、ハートビートの送信間隔の設定値を常に短く設定しておくことで、自サーバに遅延が発生しても、遅延の影響を受けにくくすることができる。すなわち、相手サーバに、サーバダウンと誤検知されることを防ぐことができる。しかし、この方法の場合、正常時も送信間隔が短いため、余計なネットワーク負荷をかけることになる。 As another method, for example, by setting the setting value of the heartbeat transmission interval to be always short, even if a delay occurs in the own server, it is difficult to be affected by the delay. That is, it is possible to prevent the partner server from erroneously detecting that the server is down. However, in this method, since the transmission interval is short even when normal, an extra network load is applied.
また、例えば、ハートビートの受信がタイムアウトした場合、ネットワーク経由で強制的に相手サーバを電源断することで、誤検知であったとしても強制的にサーバを停止させるという方法も考えられる。これにより、両方のサーバで業務プログラムが並行して稼働してしまうことを防ぐことができる。しかし、強制的にサーバを電源断することはサーバのファイルシステムの破壊を招く可能性があるというデメリットがある。 Also, for example, when heartbeat reception times out, it is conceivable to forcibly shut down the server even if it is a false detection by forcibly powering off the other server via the network. Thereby, it is possible to prevent the business program from operating in parallel on both servers. However, forcibly powering off the server has the disadvantage that the file system of the server may be destroyed.
また、別の方法として、例えば、システム外の第3者(例えば、BMC(Baseboard Management Controller)や、仮想マシンを用いる場合におけるホストOS等から、サーバの電源状態を確認することで、サーバの起動状態を確認することができる。しかし、システム外の第3者等の信頼性は、その第3者等のシステム構成に依存する。また、サーバの電源状態が分かったとしても、その上で動作しているクラスタの状態までは判断できない。さらに、当然ながら、システム外の第3者等が存在していないとこの方法は採用できない。 As another method, for example, a third party outside the system (for example, a BMC (Baseboard Management Controller), a host OS in the case of using a virtual machine, etc., confirming the power state of the server to start the server However, the reliability of the third party outside the system depends on the system configuration of the third party, etc. Even if the power status of the server is known, it operates on it. You can not judge the state of the cluster you are in. Furthermore, of course, this method can not be adopted unless there is a third party outside the system.
これに対し、上記実施の形態にかかるHAクラスタシステム1によれば、上述の欠点を補いつつ、ダウンの誤判定を抑制することができる。これにより複数のサーバで業務が並行して稼働してしまい、HAクラスタシステムが不正な状態となることを防ぐことができる。
On the other hand, according to
なお、本発明は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。例えば、上記の実施の形態では、算出される受信間隔(T)は、式(2)に示される定義に限らず、予め定められた許容誤差を含んでもよい。この場合、例えば、タイムアウト時間変更部305において用いられる受信間隔Tは、以下の式(4)により表されてもよい。なお、TEは、許容誤差を表す。
Note that the present invention is not limited to the above-described embodiment, and can be changed as appropriate without departing from the spirit of the present invention. For example, in the above embodiment, the calculated reception interval (T) is not limited to the definition shown in equation (2), but may include a predetermined tolerance. In this case, for example, the reception interval T used in the timeout
T=Tm−Tm-1+TE ・・・(4) T = T m -T m-1 + T E ··· (4)
また、この場合、例えば、送信時間間隔変更部306において用いられる受信間隔Tは、以下の式(5)により表されてもよい。
Also, in this case, for example, the reception interval T used in the transmission time
T=Tm−Tm-1−TE ・・・(5) T = T m -T m-1 -T E ··· (5)
また、上記の実施の形態では、情報処理装置30は、タイムアウト時間変更部305及び送信時間間隔変更部306を備えるものとして説明したが、タイムアウト時間変更部305又は送信時間間隔変更部306のいずれか一方を備える構成としてもよい。ただし、情報処理装置30は、タイムアウト時間変更部305及び送信時間間隔変更部306の両方を備えることが好ましい。これは、次のような理由による。
In the above embodiment, the information processing apparatus 30 is described as including the timeout
送信時間間隔変更部306のみの場合、遅延が発生しているサーバ側の状態によっては送信間隔が短過ぎると、設定通りに動作できない可能性がある。特に、ホストOS又はハイパーバイザ側の高負荷によって仮想サーバの遅延が発生している場合、エミュレートされた仮想サーバのNIC(Network Interface Card)及びネットワークも健全に動作できていない可能性がある。また、タイムアウト時間を延ばし過ぎると、本当にサーバが停止した場合に検知が遅くなるため、タイムアウト時間を際限なく長くすることはできない。このため、タイムアウト時間の変更のみに頼るのは好ましくない。したがって、タイムアウト時間変更部305及び送信時間間隔変更部306を併用することで、タイムアウト時間を際限なく長くすることなく、サーバの停止を誤検知することを防ぐことができる。
In the case of only the transmission time
また、プログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば光磁気ディスク)、CD−ROM(Read Only Memory)、CD−R、CD−R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(random access memory))を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。 The program can be stored using various types of non-transitory computer readable media and supplied to a computer. Non-transitory computer readable media include tangible storage media of various types. Examples of non-transitory computer readable media are magnetic recording media (eg flexible disk, magnetic tape, hard disk drive), magneto-optical recording media (eg magneto-optical disk), CD-ROM (Read Only Memory), CD-R, CD-R / W, semiconductor memory (for example, mask ROM, PROM (Programmable ROM), EPROM (Erasable PROM), flash ROM, RAM (random access memory)) are included. Also, the programs may be supplied to the computer by various types of transitory computer readable media. Examples of transitory computer readable media include electrical signals, optical signals, and electromagnetic waves. The temporary computer readable medium can provide the program to the computer via a wired communication path such as electric wire and optical fiber, or a wireless communication path.
また、例えば、上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)
自装置の時刻をカウントする時刻カウント手段と、
送信側の装置がカウントした時刻による送信時刻が含まれるハートビートパケットを受信するハートビート受信手段と、
前記ハートビート受信手段により受信された時間的に連続する2つの前記ハートビートパケットについての前記時刻カウント手段による2つの受信時刻の差が、該2つの前記ハートビートパケットに含まれる2つの送信時刻の差に基づいて算出される受信間隔よりも大きい場合に、タイムアウト時間を予め定められた時間よりも長くするタイムアウト時間変更手段と、
前記タイムアウト時間内に前記送信側の装置からのハートビートパケットを前記ハートビート受信手段が受信しない場合、前記送信側の装置にダウンが発生したと判定するダウン判定手段と
を有する情報処理装置。
(付記2)
前記タイムアウト時間変更手段は、前記タイムアウト時間を変更した場合、前記2つの受信時刻の差が、前記算出される受信間隔に等しいとき、前記タイムアウト時間を前記予め定められた時間へ戻す
付記1に記載の情報処理装置。
(付記3)
設定された送信時間間隔で、前記時刻カウント手段がカウントした時刻による送信時刻が含まれるハートビートパケットを送信するハートビート送信手段と、
前記2つの受信時刻の差が、前記算出される受信間隔よりも小さい場合に、前記送信時間間隔を予め定められた時間間隔よりも短くする送信時間間隔変更手段と
をさらに有する付記1又は2に記載の情報処理装置。
(付記4)
前記送信時間間隔変更手段は、前記送信時間間隔を変更した場合、前記2つの受信時刻の差が、前記算出される受信間隔に等しいとき、前記送信時間時間を前記予め定められた時間間隔へ戻す
付記3に記載の情報処理装置。
(付記5)
前記算出される受信間隔は、予め定められた許容誤差を含む
付記1乃至4のいずれか1項に記載の情報処理装置。
(付記6)
前記タイムアウト時間変更手段は、前記2つの受信時刻の差と前記算出される受信間隔との乖離の程度に応じた時間だけ前記タイムアウト時間を長くする
付記1に記載の情報処理装置。
(付記7)
前記信時間間隔変更手段は、前記2つの受信時刻の差と前記算出される受信間隔との乖離の程度に応じた時間だけ前記送信時間間隔を短くする
付記3に記載の情報処理装置。
(付記8)
送信側の装置がカウントした時刻による送信時刻が含まれるハートビートパケットを受信するハートビートパケット受信ステップと、
受信した時間的に連続する2つの前記ハートビートパケットについての、受信側の装置のカウントした時刻による2つの受信時刻の差が、該2つの前記ハートビートパケットに含まれる2つの送信時刻の差に基づいて算出される受信間隔よりも大きい場合に、タイムアウト時間を予め定められた時間よりも長くするタイムアウト時間変更ステップと、
前記タイムアウト時間内に前記送信側の装置からのハートビートパケットを受信しない場合、前記送信側の装置にダウンが発生したと判定するダウン判定ステップと
を有するダウン判定方法。
(付記9)
設定された送信時間間隔で、ハートビートパケットを送信するハートビートパケット送信ステップと、
前記2つの受信時刻の差が、前記算出される受信間隔よりも小さい場合に、前記送信時間間隔を予め定められた時間間隔よりも短くする送信時間間隔変更ステップと
をさらに有し、
前記ハートビートパケット送信ステップで送信されるハートビートパケットは、該ハートビートパケットを送信する装置のカウントした時刻による送信時刻を含む
する付記8に記載のダウン判定方法。
(付記10)
複数の情報処理装置を備え、
前記複数の情報処理装置は、それぞれ、
自装置の時刻をカウントする時刻カウント手段と、
設定された送信時間間隔で、前記複数の情報処理装置のうちの他の情報処理装置に、前記時刻カウント手段がカウントした時刻による送信時刻が含まれるハートビートパケットを送信するハートビート送信手段と、
前記他の情報処理装置がカウントした時刻による送信時刻が含まれるハートビートパケットを、前記他の情報処理装置から受信するハートビート受信手段と、
前記ハートビート受信手段により受信された時間的に連続する2つの前記ハートビートパケットについての前記時刻カウント手段による2つの受信時刻の差が、該2つの前記ハートビートパケットに含まれる2つの送信時刻の差に基づいて算出される受信間隔よりも大きい場合に、タイムアウト時間を予め定められた時間よりも長くするタイムアウト時間変更手段と、
前記2つの受信時刻の差が、前記算出される受信間隔よりも小さい場合に、前記送信時間間隔を予め定められた時間間隔よりも短くする送信時間間隔変更手段と
前記タイムアウト時間内に前記送信側の装置からのハートビートパケットを前記ハートビート受信手段が受信しない場合、前記送信側の装置にダウンが発生したと判定するダウン判定手段と
を有するクラスタシステム。
(付記11)
送信側の装置がカウントした時刻による送信時刻が含まれるハートビートパケットを受信するハートビートパケット受信ステップと、
受信した時間的に連続する2つの前記ハートビートパケットについての、受信側の装置のカウントした時刻による2つの受信時刻の差が、該2つの前記ハートビートパケットに含まれる2つの送信時刻の差に基づいて算出される受信間隔よりも大きい場合に、タイムアウト時間を予め定められた時間よりも長くするタイムアウト時間変更ステップと、
前記タイムアウト時間内に前記送信側の装置からのハートビートパケットを受信しない場合、前記送信側の装置にダウンが発生したと判定するダウン判定ステップと
を情報処理装置のコンピュータに実行させるプログラム。
(付記12)
設定された送信時間間隔で、前記情報処理装置のカウントした時刻による送信時刻が含まれるハートビートパケットを送信するハートビートパケット送信ステップと、
前記2つの受信時刻の差が、前記算出される受信間隔よりも小さい場合に、前記送信時間間隔を予め定められた時間間隔よりも短くする送信時間間隔変更ステップと
をさらに前記コンピュータに実行させる付記11に記載のプログラム。
Also, for example, part or all of the above-described embodiment may be described as in the following appendices, but is not limited to the following.
(Supplementary Note 1)
Time counting means for counting the time of its own device;
A heartbeat receiving means for receiving a heartbeat packet including a transmission time according to a time counted by a transmission side device;
The difference between the two reception times by the time counting means for the two temporally consecutive heartbeat packets received by the heartbeat reception means is the difference between the two transmission times included in the two heartbeat packets. Timeout time changing means for making the timeout time longer than a predetermined time when it is larger than the reception interval calculated based on the difference;
An information processing apparatus comprising: a down determination unit that determines that a down has occurred in the transmission side device when the heartbeat reception unit does not receive a heartbeat packet from the transmission side device within the timeout period.
(Supplementary Note 2)
The timeout time changing means returns the timeout time to the predetermined time when the difference between the two reception times is equal to the calculated reception interval when the timeout time is changed. Information processing equipment.
(Supplementary Note 3)
A heartbeat transmission means for transmitting a heartbeat packet including a transmission time according to a time counted by the time counting means at a set transmission time interval;
(Supplementary Note 4)
When the transmission time interval is changed, the transmission time interval changing means returns the transmission time time to the predetermined time interval when the difference between the two reception times is equal to the calculated reception interval. The information processing apparatus according to
(Supplementary Note 5)
The information processing apparatus according to any one of
(Supplementary Note 6)
The information processing apparatus according to
(Appendix 7)
The information processing apparatus according to
(Supplementary Note 8)
A heartbeat packet receiving step for receiving a heartbeat packet including a transmission time according to a time counted by a transmitting device;
The difference between the two reception times according to the counted time of the device on the receiving side with respect to the two temporally consecutive heartbeat packets received is the difference between the two transmission times included in the two heartbeat packets. A time-out time changing step for making the time-out time longer than a predetermined time when the reception interval is larger than the reception interval calculated based on
A down determination method comprising: a down determination step of determining that a down has occurred in the transmission side device when a heartbeat packet from the transmission side device is not received within the timeout period.
(Appendix 9)
A heartbeat packet transmission step for transmitting heartbeat packets at a set transmission time interval;
A transmission time interval changing step for shortening the transmission time interval below a predetermined time interval when the difference between the two reception times is smaller than the calculated reception interval; and
The down determination method according to appendix 8, wherein the heartbeat packet transmitted in the heartbeat packet transmission step includes a transmission time according to a time counted by a device that transmits the heartbeat packet.
(Supplementary Note 10)
Equipped with multiple information processing devices,
The plurality of information processing devices are each
Time counting means for counting the time of its own device;
A heartbeat transmission means for transmitting a heartbeat packet including a transmission time according to a time counted by the time counting means to another information processing apparatus among the plurality of information processing apparatuses at a set transmission time interval;
A heartbeat receiving means for receiving a heartbeat packet including a transmission time according to a time counted by the other information processing apparatus from the other information processing apparatus;
The difference between the two reception times by the time counting means for the two temporally consecutive heartbeat packets received by the heartbeat reception means is the difference between the two transmission times included in the two heartbeat packets. Timeout time changing means for making the timeout time longer than a predetermined time when it is larger than the reception interval calculated based on the difference;
A transmission time interval changing means for reducing the transmission time interval to be shorter than a predetermined time interval when the difference between the two reception times is smaller than the calculated reception interval; A cluster system comprising: a down determination unit that determines that a down has occurred in the transmission-side device if the heartbeat reception unit does not receive a heartbeat packet from the device;
(Supplementary Note 11)
A heartbeat packet receiving step for receiving a heartbeat packet including a transmission time according to a time counted by a transmitting device;
The difference between the two reception times according to the counted time of the device on the receiving side with respect to the two temporally consecutive heartbeat packets received is the difference between the two transmission times included in the two heartbeat packets. A time-out time changing step for making the time-out time longer than a predetermined time when the reception interval is larger than the reception interval calculated based on
A program for causing a computer of an information processing device to execute a down determination step of determining that a down has occurred in the transmission side device when a heartbeat packet from the transmission side device is not received within the timeout period.
(Supplementary Note 12)
A heartbeat packet transmitting step of transmitting a heartbeat packet including a transmission time according to a time counted by the information processing device at a set transmission time interval;
An additional note that causes the computer to further execute a transmission time interval changing step of making the transmission time interval shorter than a predetermined time interval when a difference between the two reception times is smaller than the calculated reception interval. The program described in 11.
1 HAクラスタシステム
10、20、30A、30B 情報処理装置
11、21、301 時刻カウント部
12、22、303 ハートビート受信部
13、305 タイムアウト時間変更部
14、304 ダウン判定部
23、302 ハートビート送信部
24、306 送信時間間隔変更部
31 ネットワーク
300 設定値情報記憶部
1
Claims (10)
送信側の装置がカウントした時刻による送信時刻が含まれるハートビートパケットを受信するハートビート受信手段と、
前記ハートビート受信手段により受信された時間的に連続する2つの前記ハートビートパケットについての前記時刻カウント手段による2つの受信時刻の差が、該2つの前記ハートビートパケットに含まれる2つの送信時刻の差に基づいて算出される受信間隔よりも大きい場合に、タイムアウト時間を予め定められた時間よりも長くするタイムアウト時間変更手段と、
前記タイムアウト時間内に前記送信側の装置からのハートビートパケットを前記ハートビート受信手段が受信しない場合、前記送信側の装置にダウンが発生したと判定するダウン判定手段と
を有する情報処理装置。 Time counting means for counting the time of the own device;
A heartbeat receiving means for receiving a heartbeat packet including a transmission time according to a time counted by a transmission side device;
The difference between the two reception times by the time counting means for the two temporally consecutive heartbeat packets received by the heartbeat reception means is the difference between the two transmission times included in the two heartbeat packets. Timeout time changing means for making the timeout time longer than a predetermined time when it is larger than the reception interval calculated based on the difference;
An information processing apparatus comprising: a down determination unit that determines that a down has occurred in the transmission side device when the heartbeat reception unit does not receive a heartbeat packet from the transmission side device within the timeout period.
請求項1に記載の情報処理装置。 The timeout time changing means, when changing the timeout time, returns the timeout time to the predetermined time when the difference between the two reception times is equal to the calculated reception interval. Information processor as described.
前記2つの受信時刻の差が、前記算出される受信間隔よりも小さい場合に、前記送信時間間隔を予め定められた時間間隔よりも短くする送信時間間隔変更手段と
をさらに有する請求項1又は2に記載の情報処理装置。 Heartbeat transmission means for transmitting a heartbeat packet including the transmission time according to the time counted by the time counting means at a set transmission time interval;
Transmission time interval changing means for making the transmission time interval shorter than a predetermined time interval when the difference between the two reception times is smaller than the calculated reception interval. The information processing apparatus according to claim 1.
請求項1乃至3のいずれか1項に記載の情報処理装置。 The information processing apparatus according to any one of claims 1 to 3, wherein the calculated reception interval includes a predetermined allowable error.
請求項1に記載の情報処理装置。 The information processing apparatus according to claim 1, wherein the timeout time changing unit lengthens the timeout time by a time according to a degree of difference between the difference between the two reception times and the calculated reception interval.
受信した時間的に連続する2つの前記ハートビートパケットについての、受信側の装置のカウントした時刻による2つの受信時刻の差が、該2つの前記ハートビートパケットに含まれる2つの送信時刻の差に基づいて算出される受信間隔よりも大きい場合に、タイムアウト時間を予め定められた時間よりも長くするタイムアウト時間変更ステップと、
前記タイムアウト時間内に前記送信側の装置からのハートビートパケットを受信しない場合、前記送信側の装置にダウンが発生したと判定するダウン判定ステップと
を有するダウン判定方法。 A heartbeat packet receiving step for receiving a heartbeat packet including a transmission time according to a time counted by a transmitting device;
The difference between the two reception times according to the counted time of the device on the receiving side with respect to the two temporally consecutive heartbeat packets received is the difference between the two transmission times included in the two heartbeat packets. A time-out time changing step for making the time-out time longer than a predetermined time when the reception interval is larger than the reception interval calculated based on
A down determination method comprising: a down determination step of determining that a down has occurred in the transmission side device when a heartbeat packet from the transmission side device is not received within the timeout period.
前記2つの受信時刻の差が、前記算出される受信間隔よりも小さい場合に、前記送信時間間隔を予め定められた時間間隔よりも短くする送信時間間隔変更ステップと
をさらに有し、
前記ハートビートパケット送信ステップで送信されるハートビートパケットは、該ハートビートパケットを送信する装置のカウントした時刻による送信時刻を含む
請求項6に記載のダウン判定方法。 Heartbeat packet transmission step of transmitting a heartbeat packet at a set transmission time interval;
A transmission time interval changing step of making the transmission time interval shorter than a predetermined time interval if the difference between the two reception times is smaller than the calculated reception interval.
The down determination method according to claim 6, wherein the heartbeat packet transmitted in the heartbeat packet transmission step includes a transmission time based on a counted time of a device that transmits the heartbeat packet.
前記複数の情報処理装置は、それぞれ、
自装置の時刻をカウントする時刻カウント手段と、
設定された送信時間間隔で、前記複数の情報処理装置のうちの他の情報処理装置に、前記時刻カウント手段がカウントした時刻による送信時刻が含まれるハートビートパケットを送信するハートビート送信手段と、
前記他の情報処理装置がカウントした時刻による送信時刻が含まれるハートビートパケットを、前記他の情報処理装置から受信するハートビート受信手段と、
前記ハートビート受信手段により受信された時間的に連続する2つの前記ハートビートパケットについての前記時刻カウント手段による2つの受信時刻の差が、該2つの前記ハートビートパケットに含まれる2つの送信時刻の差に基づいて算出される受信間隔よりも大きい場合に、タイムアウト時間を予め定められた時間よりも長くするタイムアウト時間変更手段と、
前記2つの受信時刻の差が、前記算出される受信間隔よりも小さい場合に、前記送信時間間隔を予め定められた時間間隔よりも短くする送信時間間隔変更手段と
前記タイムアウト時間内に送信側の装置からのハートビートパケットを前記ハートビート受信手段が受信しない場合、前記送信側の装置にダウンが発生したと判定するダウン判定手段と
を有するクラスタシステム。 Equipped with multiple information processing devices,
The plurality of information processing devices are each
Time counting means for counting the time of its own device;
A heartbeat transmission means for transmitting a heartbeat packet including a transmission time according to a time counted by the time counting means to another information processing apparatus among the plurality of information processing apparatuses at a set transmission time interval;
A heartbeat receiving means for receiving a heartbeat packet including a transmission time according to a time counted by the other information processing apparatus from the other information processing apparatus;
The difference between the two reception times by the time counting means for the two temporally consecutive heartbeat packets received by the heartbeat reception means is the difference between the two transmission times included in the two heartbeat packets. Timeout time changing means for making the timeout time longer than a predetermined time when it is larger than the reception interval calculated based on the difference;
When the difference between the two reception times is smaller than the calculated reception interval, transmission time interval changing means for making the transmission time interval shorter than a predetermined time interval; A cluster system comprising: a down determination unit that determines that a down has occurred in the device on the transmitting side when the heartbeat receiving unit does not receive a heartbeat packet from the device.
受信した時間的に連続する2つの前記ハートビートパケットについての、受信側の装置のカウントした時刻による2つの受信時刻の差が、該2つの前記ハートビートパケットに含まれる2つの送信時刻の差に基づいて算出される受信間隔よりも大きい場合に、タイムアウト時間を予め定められた時間よりも長くするタイムアウト時間変更ステップと、
前記タイムアウト時間内に前記送信側の装置からのハートビートパケットを受信しない場合、前記送信側の装置にダウンが発生したと判定するダウン判定ステップと
を情報処理装置のコンピュータに実行させるプログラム。 A heartbeat packet receiving step for receiving a heartbeat packet including a transmission time according to a time counted by a transmitting device;
The difference between the two reception times according to the counted time of the device on the receiving side with respect to the two temporally consecutive heartbeat packets received is the difference between the two transmission times included in the two heartbeat packets. A time-out time changing step for making the time-out time longer than a predetermined time when the reception interval is larger than the reception interval calculated based on
A program for causing a computer of an information processing apparatus to execute a down determination step of determining that a down has occurred in the apparatus on the transmitting side when a heartbeat packet from the apparatus on the transmitting side is not received within the timeout time.
前記2つの受信時刻の差が、前記算出される受信間隔よりも小さい場合に、前記送信時間間隔を予め定められた時間間隔よりも短くする送信時間間隔変更ステップと
をさらに前記コンピュータに実行させる請求項9に記載のプログラム。 A heartbeat packet transmission step of transmitting a heartbeat packet including the transmission time according to the time counted by the information processing apparatus at the set transmission time interval;
A transmission time interval changing step of making the transmission time interval shorter than a predetermined time interval if the difference between the two reception times is smaller than the calculated reception interval. The program of item 9.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2015189314A JP6551111B2 (en) | 2015-09-28 | 2015-09-28 | Information processing apparatus, down determination method, cluster system, and program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2015189314A JP6551111B2 (en) | 2015-09-28 | 2015-09-28 | Information processing apparatus, down determination method, cluster system, and program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2017068309A JP2017068309A (en) | 2017-04-06 |
| JP6551111B2 true JP6551111B2 (en) | 2019-07-31 |
Family
ID=58494767
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2015189314A Active JP6551111B2 (en) | 2015-09-28 | 2015-09-28 | Information processing apparatus, down determination method, cluster system, and program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP6551111B2 (en) |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN109991893A (en) * | 2017-12-29 | 2019-07-09 | 深圳市云海物联科技有限公司 | A switch control box |
| CN114244754B (en) * | 2021-11-30 | 2022-08-19 | 慧之安信息技术股份有限公司 | Equipment online state calculation method and device |
| CN117294750B (en) * | 2023-11-27 | 2024-03-01 | 杭州涂鸦信息技术有限公司 | Method and device for adjusting MQTT heartbeat frequency |
Family Cites Families (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH09293030A (en) * | 1996-04-25 | 1997-11-11 | Nec Eng Ltd | Response monitoring timer setting system |
| JP4465905B2 (en) * | 2001-04-16 | 2010-05-26 | 株式会社デンソー | Electronic control unit |
| WO2008126325A1 (en) * | 2007-03-30 | 2008-10-23 | Fujitsu Limited | Cluster system, software updating method, service provision node, and program for service provision |
| JP2009271857A (en) * | 2008-05-09 | 2009-11-19 | Toshiba Corp | Computer system |
| JP5979095B2 (en) * | 2013-08-06 | 2016-08-24 | 富士ゼロックス株式会社 | Information processing system, information processing apparatus, and program |
-
2015
- 2015-09-28 JP JP2015189314A patent/JP6551111B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| JP2017068309A (en) | 2017-04-06 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN110825544B (en) | Computing node and failure detection method and cloud data processing system thereof | |
| CN103201724B (en) | Providing application high availability in highly-available virtual machine environments | |
| CN110740072B (en) | Fault detection method, device and related equipment | |
| US9210059B2 (en) | Cluster system | |
| US10547499B2 (en) | Software defined failure detection of many nodes | |
| CN109921942B (en) | Cloud platform switching control method, device, system and electronic equipment | |
| JPWO2019049433A1 (en) | Cluster system, cluster system control method, server device, control method, and program | |
| JP6551111B2 (en) | Information processing apparatus, down determination method, cluster system, and program | |
| CN110224880A (en) | A kind of heartbeat inspecting method and monitoring device | |
| JP6183931B2 (en) | Cluster system, server apparatus, cluster system management method, and program | |
| US10868860B2 (en) | Information processing device and information processing system | |
| JP2008172592A (en) | Cluster system, computer and abnormality detection method thereof | |
| JP5613119B2 (en) | Master / slave system, control device, master / slave switching method, and master / slave switching program | |
| US11314573B2 (en) | Detection of event storms | |
| JP2011203941A (en) | Information processing apparatus, monitoring method and monitoring program | |
| JP6838334B2 (en) | Cluster system, server, server operation method, and program | |
| US8917609B2 (en) | Line monitoring apparatus and line monitoring method | |
| JP5483784B1 (en) | CONTROL DEVICE, COMPUTER RESOURCE MANAGEMENT METHOD, AND COMPUTER RESOURCE MANAGEMENT PROGRAM | |
| JP4863984B2 (en) | Monitoring processing program, method and apparatus | |
| KR101883251B1 (en) | Apparatus and method for determining failover in virtual system | |
| JP2022054351A (en) | Monitoring system and fault monitoring method | |
| JP7708461B1 (en) | SERVER, PROCESSING SYSTEM, PROCESSING METHOD, AND PROGRAM | |
| US11150980B2 (en) | Node device, recovery operation control method, and non-transitory computer readable medium storing recovery operation control program | |
| CN103873429B (en) | Determine method and the node of node state | |
| JP2012093868A (en) | Service providing system, service providing server, service providing method, and program |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180806 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190425 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190604 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190617 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6551111 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |