Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP7143609B2 - COMMUNICATION DEVICE, COMMUNICATION METHOD, AND PROGRAM - Google Patents
[go: Go Back, main page]

JP7143609B2 - COMMUNICATION DEVICE, COMMUNICATION METHOD, AND PROGRAM - Google Patents

COMMUNICATION DEVICE, COMMUNICATION METHOD, AND PROGRAM Download PDF

Info

Publication number
JP7143609B2
JP7143609B2 JP2018061184A JP2018061184A JP7143609B2 JP 7143609 B2 JP7143609 B2 JP 7143609B2 JP 2018061184 A JP2018061184 A JP 2018061184A JP 2018061184 A JP2018061184 A JP 2018061184A JP 7143609 B2 JP7143609 B2 JP 7143609B2
Authority
JP
Japan
Prior art keywords
communication device
communication
failure
data
request signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018061184A
Other languages
Japanese (ja)
Other versions
JP2019176284A (en
Inventor
修作 内堀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2018061184A priority Critical patent/JP7143609B2/en
Publication of JP2019176284A publication Critical patent/JP2019176284A/en
Application granted granted Critical
Publication of JP7143609B2 publication Critical patent/JP7143609B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Small-Scale Networks (AREA)

Description

本発明は、通信装置、通信方法、プログラムに関する。 The present invention relates to a communication device, communication method, and program.

近年、ディープラーニングの学習のように膨大な計算量ニーズの高まりにより、GPGPU(General-purpose computing on graphics processing units)等の多数のPCIe(PCI Express)デバイスを接続する大規模システムが構成されている。一つのPCIeデバイスで障害が発生した場合に他のPCIeデバイスに障害が波及しないようにすることが要求されている。一般的にPCIeデバイスは障害発生時にホストサーバに対して障害通知を行いホストサーバが障害発生デバイスの障害処理を実施する。なおネットワーク上の輻輳に基づいてネットワーク制御を行う関連技術が特許文献1に開示されている。 In recent years, due to the increasing need for enormous amount of calculation such as learning of deep learning, large-scale systems connecting many PCIe (PCI Express) devices such as GPGPU (General-purpose computing on graphics processing units) are being constructed. . It is required to prevent the failure from spreading to other PCIe devices when a failure occurs in one PCIe device. In general, when a failure occurs, the PCIe device notifies the host server of the failure, and the host server performs failure processing of the failed device. Japanese Patent Application Laid-Open No. 2002-200001 discloses a related technique for performing network control based on congestion on the network.

特許文献1の段落0005には、クレジットベースシステムに関する記載がある。クレジットベースシステムは、当該文献の段落0005に記載されているように、伝送データのロスを減少することを保障する技術であり、データの受信側の状態と、送信側と受信側との間にあるすべてのノードの状態とを考慮して制御される。具体的には受信側のノードの状態が、クレジットの発信によって送信側に通知される。クレジットはデータを受信する能力を示すものであり、始めに受信側のノードにより生成される。続いて、このクレジットは上流にある送信側のノードへ返される。そして送信側のノードにおいて、受信側ノードのデータを受信する能力が判断される。 Paragraph 0005 of Patent Document 1 describes a credit-based system. The credit-based system, as described in paragraph 0005 of the document, is a technology that ensures a reduction in transmission data loss, and the state of the data receiver and the relationship between the sender and receiver. It is controlled by considering the state of all nodes. Specifically, the state of the node on the receiving side is notified to the transmitting side by sending credits. Credits indicate the ability to receive data and are initially generated by the receiving node. This credit is then returned upstream to the sending node. Then, at the sending node, the ability of the receiving node to receive the data is determined.

特開平8-56222号公報JP-A-8-56222

ところで上述のようなPCIe(PCI Express)デバイスを利用したクレジットベースシステムにおいて障害が発生した場合、障害に関する処理を行うパケットも通常パケットと同等の経路を流れるため、パケットが詰まるような障害が発生すると障害に関する処理を行うことが出来ない。またそのような場合には正常なPCIeデバイスのパケットも処理されず、一つのPCIeデバイスで障害が発生した場合に他のPCIeデバイスに障害が波及してしまうという課題がある。 By the way, when a failure occurs in a credit-based system using a PCIe (PCI Express) device as described above, packets that perform failure-related processing flow through the same route as normal packets, so if a failure such as packet clogging occurs It is not possible to process failures. Also, in such a case, packets of normal PCIe devices are not processed, and if a failure occurs in one PCIe device, there is a problem that the failure spreads to other PCIe devices.

そこでこの発明は、上述の課題を解決する通信装置、通信方法、プログラムを提供することを目的としている。 SUMMARY OF THE INVENTION Accordingly, an object of the present invention is to provide a communication device, a communication method, and a program that solve the above problems.

本発明の第1の態様によれば、通信装置は、中継装置を介して通信接続された相手側通信装置の受信可能データ量に基づくデータ量の送信データを前記相手側通信装置へPCI(Peripheral Component Interconnect)Expressの通信規格に基づいて送信するデータ送信部と、前記送信データの前記相手側通信装置との間の通信経路に障害が発生しているかを検出する障害検出部と、前記障害を検出した場合に前記通信経路との接続を切断すると判定する切断判定部と、を備えることを特徴とする。 According to the first aspect of the present invention, a communication device sends transmission data of a data amount based on a receivable data amount of a counterpart communication device connected via a relay device to the counterpart communication device via a PCI (Peripheral) a data transmission unit that transmits based on the communication standard of Component Interconnect (Component Interconnect) Express; a failure detection unit that detects whether a failure has occurred in a communication path between the transmission data and the communication device on the opposite side ; and a disconnect determination unit that determines to disconnect the communication path when it is detected.

本発明の第2の態様によれば、通信方法は、中継装置を介して通信接続された相手側通信装置の受信可能データ量に基づくデータ量の送信データを前記相手側通信装置へPCI(Peripheral Component Interconnect)Expressの通信規格に基づいて送信し、前記送信データの前記相手側通信装置との間の通信経路に障害が発生しているかを検出し、前記障害を検出した場合に前記通信経路との接続を切断すると判定することを特徴とする。 According to a second aspect of the present invention, a communication method transmits transmission data of a data amount based on a receivable data amount of a counterpart communication device connected via a relay device to the counterpart communication device via PCI (Peripheral). (Component Interconnect) Express communication standard, detects whether there is a failure in the communication path between the transmission data and the communication device of the other party, and if the failure is detected, the communication path It is characterized in that it is determined that the connection between the

本発明の第3の態様によれば、プログラムは、通信装置のコンピュータを、中継装置を介して通信接続された相手側通信装置の受信可能データ量に基づくデータ量の送信データを前記相手側通信装置へPCI(Peripheral Component Interconnect)Expressの通信規格に基づいて送信するデータ送信手段、前記送信データの前記相手側通信装置との間の通信経路に障害が発生しているかを検出する障害検出手段、前記障害を検出した場合に前記通信経路との接続を切断する接続手段、として機能させることを特徴とする。 According to the third aspect of the present invention, the program causes the computer of the communication device to send the transmission data of the data amount based on the receivable data amount of the communication device of the other party connected via the relay device to the communication device of the other party. data transmission means for transmitting data to a device based on the PCI (Peripheral Component Interconnect) Express communication standard; fault detection means for detecting whether a fault has occurred in a communication path between the transmission data and the other party communication device ; It is characterized by functioning as connection means for disconnecting the communication path when the failure is detected.

本発明によれば、他の通信装置に障害が波及することを抑制することができる。 ADVANTAGE OF THE INVENTION According to this invention, it can suppress that a failure spreads to other communication apparatuses.

本発明の一実施形態による通信システムの構成を示すブロック図である。1 is a block diagram showing the configuration of a communication system according to one embodiment of the present invention; FIG. 本発明の一実施形態による通信装置のハードウェア構成を示す図である。1 is a diagram showing the hardware configuration of a communication device according to one embodiment of the present invention; FIG. 本発明の一実施形態による通信モジュールの機能ブロック図である。FIG. 3 is a functional block diagram of a communication module according to one embodiment of the present invention; 本発明の一実施形態による障害検出部の機能ブロックを示す第一の図である。FIG. 4 is a first diagram showing functional blocks of a failure detection unit according to one embodiment of the present invention; 本発明の一実施形態によるクライアント側の通信装置の処理フローを示す第一の図である。FIG. 2 is a first diagram showing a processing flow of a client-side communication device according to an embodiment of the present invention; 本発明の一実施形態による障害検出部の機能ブロックを示す第二の図である。FIG. 10 is a second diagram showing functional blocks of the failure detection unit according to one embodiment of the present invention; 本発明の一実施形態によるクライアント側の通信装置の処理フローを示す第二の図である。FIG. 4B is a second diagram showing the processing flow of the client-side communication device according to the embodiment of the present invention; 本発明の一実施形態による通信装置の最小構成を示す図である。1 is a diagram showing the minimum configuration of a communication device according to one embodiment of the present invention; FIG.

以下、本発明の一実施形態による通信システムを図面を参照して説明する。
図1は同実施形態による通信システムの構成を示すブロック図である。
図1で示すように、通信システムは、ホスト側の通信装置100と、クライアント側の通信装置300とが、中継装置200を介して接続されている。通信装置100、中継装置200、通信装置300はそれぞれPCIe(PCI Express)の通信機能を有する通信デバイスを搭載し、当該PCIe(PCI Express)で規定された通信機能を用いて通信を行う。なお当該PCIe(PCI Express)で規定された通信機能においてはクレジットベースの通信を行う。具体的には送信側が、相手側通信装置の受信可能データ量を検知し、当該受信可能データ量に基づくデータ量の送信データを相手側通信装置へ送信する。例えば送信側は、相手側通信装置の受信可能データ量を検知し、当該受信可能データ量以下のデータ量の送信データを相手側通信装置へ送信する。これにより、相手側通信装置は自装置で受信可能なデータ量の送信データのみを受信して処理することができる。
A communication system according to an embodiment of the present invention will be described below with reference to the drawings.
FIG. 1 is a block diagram showing the configuration of a communication system according to the same embodiment.
As shown in FIG. 1 , in the communication system, a host-side communication device 100 and a client-side communication device 300 are connected via a relay device 200 . The communication device 100, the relay device 200, and the communication device 300 are each equipped with a communication device having a PCIe (PCI Express) communication function, and perform communication using the communication function defined by the PCIe (PCI Express). Note that the communication function specified by PCIe (PCI Express) performs credit-based communication. Specifically, the transmitting side detects the amount of data that can be received by the communication device of the other party, and transmits the transmission data of the amount based on the amount of data that can be received to the communication device of the other party. For example, the transmitting side detects the amount of data that can be received by the communication device of the other party, and transmits transmission data having a data amount equal to or less than the amount of data that can be received by the communication device of the other party. As a result, the partner communication device can receive and process only the amount of transmission data that can be received by itself.

通信システムを構成するクライアント側の通信装置300は、通信経路の障害を検出し、障害を検出した場合には、通信経路との接続を切断すると判定する。そしてクライアント側の通信装置300は通信経路との接続を切断する。本実施形態による通信システムは、クレジットベースで通信制御を行うためパケットの廃棄が原則行われない通信システムである。しかしながら本実施形態による通信システムは、障害を検出した通信装置300が通信経路との接続を切断し、これによりパケットが中継装置200等で破棄されるため、パケット詰まり等の輻輳状態が解消される。これにより、クライアント側の通信装置300は他のデバイスに障害が波及することを防ぐことを特徴とする。 A client-side communication device 300 constituting a communication system detects a failure in a communication path, and determines to disconnect from the communication path when a failure is detected. Then, the communication device 300 on the client side disconnects from the communication path. The communication system according to the present embodiment is a communication system in which, in principle, packets are not discarded because communication control is performed on a credit basis. However, in the communication system according to the present embodiment, the communication device 300 that detects a failure disconnects from the communication path, and the packet is discarded by the relay device 200 or the like, thereby resolving congestion such as packet clogging. . As a result, the communication device 300 on the client side is characterized by preventing the failure from spreading to other devices.

図2は通信装置のハードウェア構成を示す図である。
図2で示すようにクライアント側の通信装置300は、CPU(Central Processing Unit)301、ROM(Read Only Memory)302、RAM(Random Access Memory)303、通信モジュール304を備える。通信モジュールは、PCIe(PCI Express)の通信機能により他装置と通信を行う。
なおホスト側の通信装置100および中継装置200も同様のハードウェア構成を備えるものとする。
FIG. 2 is a diagram showing the hardware configuration of the communication device.
As shown in FIG. 2 , the client-side communication device 300 includes a CPU (Central Processing Unit) 301 , a ROM (Read Only Memory) 302 , a RAM (Random Access Memory) 303 and a communication module 304 . The communication module communicates with other devices by the communication function of PCIe (PCI Express).
It is assumed that the communication device 100 and the relay device 200 on the host side also have the same hardware configuration.

図3は通信装置に備わる通信モジュールの機能ブロック図である。
通信モジュール304は図3に図示するように、データ送信部31、リンク制御部32、障害検出部33、切断判定部34の各機能部を備える。
データ送信部31は、相手側通信装置であるホスト側の通信装置100の受信可能データ量に基づくデータ量の送信データを通信装置100へ送信する。つまりデータ送信部31はクレジットベースの通信規定に基づく通信制御を通信相手との間で行う。
障害検出部33は、送信データの通信経路に障害が発生しているかを検出する。
切断判定部34は、障害が検出された場合に通信経路との接続を切断すると判定する。
リンク制御部32は、通信相手との間のリンク制御を行う。例えば切断判定部34によって障害が検出された場合に自装置に接続する通信経路との接続を切断する。
FIG. 3 is a functional block diagram of a communication module provided in the communication device.
As shown in FIG. 3, the communication module 304 includes functional units such as a data transmission unit 31, a link control unit 32, a failure detection unit 33, and a disconnection determination unit .
The data transmission unit 31 transmits to the communication device 100 the amount of transmission data based on the amount of data that can be received by the communication device 100 on the host side, which is the other communication device. In other words, the data transmission unit 31 performs communication control with the communication partner based on the credit-based communication regulations.
The fault detection unit 33 detects whether a fault has occurred in the communication path of the transmission data.
The disconnect determination unit 34 determines to disconnect the communication path when a failure is detected.
The link control unit 32 performs link control with a communication partner. For example, when a failure is detected by the disconnection determination unit 34, the connection with the communication path connected to the own device is disconnected.

図4は障害検出部の機能ブロックを示す第一の図である。
障害検出部33は、リクエスト信号送信部331、応答信号判定部332、監視部333を備える。
リクエスト信号送信部331は第一リクエスト信号を相手側通信装置であるホスト側の通信装置100に送信する。
応答信号判定部332は第一リクエスト信号に対する応答信号がホスト側の通信装置100から受信できたかを判定する。
監視部333は第一リクエスト信号の送信時刻から応答信号の受信時刻までの時間がタイマにより計測する所定時間以内かを判定する。
FIG. 4 is a first diagram showing functional blocks of the failure detection unit.
The fault detector 33 includes a request signal transmitter 331 , a response signal determiner 332 and a monitor 333 .
The request signal transmission unit 331 transmits the first request signal to the communication device 100 on the host side, which is the other communication device.
The response signal determination unit 332 determines whether a response signal to the first request signal has been received from the communication device 100 on the host side.
The monitoring unit 333 determines whether the time from the transmission time of the first request signal to the reception time of the response signal is within a predetermined time measured by a timer.

図5はクライアント側の通信装置の処理フローを示す第一の図である。
次にクライアント側の通信装置300の処理フローについて順を追って説明する。
まず監視部333がリクエスト信号送信部331に対してホスト側の通信装置100への第一リクエスト信号の送信要求を出力する。監視部333は当該送信要求を行った時刻からタイマをリセットした後にタイマを作動させる。タイマは所定時間をカウントダウンするタイマである。所定時間は一例としては3秒や5秒などの時間であってよい。
FIG. 5 is a first diagram showing the processing flow of the communication device on the client side.
Next, the processing flow of the communication device 300 on the client side will be described step by step.
First, the monitoring unit 333 outputs to the request signal transmitting unit 331 a request to transmit the first request signal to the communication device 100 on the host side. The monitoring unit 333 resets the timer from the time when the transmission request is made, and then activates the timer. The timer is a timer that counts down a predetermined time. The predetermined time may be, for example, a time such as 3 seconds or 5 seconds.

リクエスト信号送信部331は第一リクエスト信号の送信要求を取得する。リクエスト信号送信部331はこの送信要求に基づいて、第一リクエスト信号を通信装置100に対して送信する(ステップS101)。第一リクエスト信号はリンク制御部32が用いるPCI Expressの通信プロトコルに基づいて送信される。 The request signal transmission unit 331 acquires the transmission request of the first request signal. The request signal transmission unit 331 transmits the first request signal to the communication device 100 based on this transmission request (step S101). The first request signal is transmitted based on the PCI Express communication protocol used by the link control unit 32 .

第一リクエスト信号を受信した通信装置100は応答信号を通信装置300へ送信する。応答信号判定部332はリンク制御部32が用いるPCI Expressの通信プロトコルに基づいて応答信号を受信する(ステップS102)。応答信号判定部332は応答信号の受信を判定すると、監視部333に応答信号を受信したことを示す信号を出力する。監視部333は応答信号の受信がタイマでカウントする時間の満了前であるかを判定する(ステップS103)。監視部333は応答信号の受信がタイマでカウントする時間の満了前である場合には第一リクエスト信号の送信要求を出力する処理を繰り返す。監視部333は応答信号の受信がタイマでカウントする時間の満了後である場合や、応答信号の受信が無い場合には、障害が発生したと判定する(ステップS104)。なお応答信号の受信時刻がタイマのカウント満了時刻と一致した場合には障害発生無と判定してよい。 The communication device 100 that has received the first request signal transmits a response signal to the communication device 300 . The response signal determination unit 332 receives the response signal based on the PCI Express communication protocol used by the link control unit 32 (step S102). When the response signal determining section 332 determines that the response signal has been received, it outputs a signal indicating that the response signal has been received to the monitoring section 333 . The monitoring unit 333 determines whether or not the response signal is received before the time counted by the timer expires (step S103). If the response signal is received before the time counted by the timer expires, the monitoring unit 333 repeats the process of outputting the transmission request of the first request signal. When the response signal is received after the time counted by the timer expires or when no response signal is received, the monitoring unit 333 determines that a failure has occurred (step S104). If the reception time of the response signal coincides with the count expiration time of the timer, it may be determined that no fault has occurred.

監視部333は障害発生と判定した場合にはリンク制御部32に障害発生を通知する。リンク制御部32は障害発生の通知を受けると、自装置に接続する通信ネットワークケーブルの通信経路を切断するための制御信号を生成する。リンク制御部32は当該制御信号に基づいて通信経路の切断を行う(ステップS105)。リンク制御部32はリセット信号を生成して、当該リセット信号に基づいて通信経路の一時切断を行うようにしてもよい。監視部333のタイマのカウント時間は、リンク制御部32に設定されているタイムアウト値が示す時間と同じ時間であることが望ましい。監視部333は、障害発生と判定した場合にはホスト側の通信装置100に対して、割り込み等で障害発生を通知しても良い。 When the monitoring unit 333 determines that a failure has occurred, it notifies the link control unit 32 of the failure occurrence. Upon receiving the failure notification, the link control unit 32 generates a control signal for disconnecting the communication path of the communication network cable connected to the own device. The link control unit 32 disconnects the communication path based on the control signal (step S105). The link control unit 32 may generate a reset signal and temporarily disconnect the communication path based on the reset signal. It is desirable that the count time of the timer of the monitoring unit 333 is the same as the time indicated by the timeout value set in the link control unit 32 . When the monitoring unit 333 determines that a failure has occurred, the monitoring unit 333 may notify the communication device 100 on the host side of the failure by interrupting or the like.

このような処理を行う通信装置300は、パケットが詰まるようなリンク障害を検出した場合には通信経路の通信接続を切断する。これにより、図1に示すようなPCIe(PCI Express)の通信機能を有する通信デバイスを搭載した各通信装置を有する通信システムは、障害が発生した可能性がある通信装置は切断し、これにより中継装置200は通信が切断した通信装置300から発信された送信データを破棄する。従って、送信データであるパケットが詰まるような障害が回避され、他の通信装置300に障害が波及することを抑制することができる。 The communication device 300 that performs such processing cuts off the communication connection of the communication path when detecting a link failure such as a packet clogging. As a result, a communication system having each communication device equipped with a communication device having a PCIe (PCI Express) communication function as shown in FIG. The device 200 discards the transmission data transmitted from the communication device 300 with which communication has been cut off. Therefore, it is possible to avoid problems such as clogging of packets, which are transmission data, and prevent the problems from spreading to other communication devices 300 .

また通信装置300は障害の発生の検知に基づいて通信経路との接続を切断した後も再接続を試みる。つまり、障害検出部33は通信経路との接続の切断が行われた後に、繰り返し通信経路に障害が発生しているかを検出する(ステップS106)。リンク制御部32は、通信経路に障害が発生していない場合に通信経路に接続されるホスト側の通信装置100との再接続の制御を行う(ステップS107)。これによりホスト側の通信装置100とクライアント側の通信装置300の間の通信を再開することができる。障害検出部33は通信装置300の処理が終了となるかを判定する(ステップS108)。通信装置300は終了でない場合にはステップS101からの処理を繰り返す。 Further, the communication device 300 attempts reconnection even after disconnecting from the communication path based on detection of the occurrence of a failure. In other words, the failure detection unit 33 repeatedly detects whether a failure has occurred in the communication path after the connection with the communication path is disconnected (step S106). The link control unit 32 controls reconnection with the host-side communication device 100 connected to the communication path when there is no failure in the communication path (step S107). As a result, the communication between the communication device 100 on the host side and the communication device 300 on the client side can be resumed. The failure detection unit 33 determines whether the processing of the communication device 300 is finished (step S108). The communication device 300 repeats the processing from step S101 if it is not finished.

図6は障害検出部の機能ブロックを示す第二の図である。
障害検出部33は、監視部333、リクエスト信号受信部334、記憶部335を備える。
リクエスト信号受信部334は相手側通信装置である通信装置100から第二リクエスト信号を受信する。
記憶部335は第二リクエスト信号の識別情報を記憶する。
監視部333は第二リクエスト信号の受信時刻から次の第二リクエスト信号の受信時刻までの時間がタイマにより計測する所定時間以内かを判定する。
障害検出部33は、所定時間以内に次の第二リクエスト信号を受信できない場合に通信経路に障害が発生していることを検出する。
FIG. 6 is a second diagram showing functional blocks of the failure detection unit.
The failure detection unit 33 includes a monitoring unit 333 , a request signal reception unit 334 and a storage unit 335 .
The request signal receiving unit 334 receives the second request signal from the communication device 100, which is the other communication device.
The storage unit 335 stores the identification information of the second request signal.
The monitoring unit 333 determines whether the time from the reception time of the second request signal to the reception time of the next second request signal is within the predetermined time measured by the timer.
The fault detection unit 33 detects that a fault has occurred in the communication path when the next second request signal cannot be received within a predetermined time.

図4、図5を用いて説明した障害発生の判定の処理は、以下のように図6、図7による処理に代えてもよい。
ホスト側の通信装置100は、予め設定された時間間隔で通信装置300に対して第二リクエスト信号を送信する。第二リクエスト信号は、例えば当該信号に識別番号が記録される。ホスト側の通信装置100は第二リクエスト信号を送信する度に、その信号に含める識別番号を1つずつインクリメントする。
The failure determination processing described with reference to FIGS. 4 and 5 may be replaced with the processing shown in FIGS. 6 and 7 as follows.
The host-side communication device 100 transmits a second request signal to the communication device 300 at preset time intervals. As for the second request signal, for example, an identification number is recorded in the signal. Each time the host-side communication device 100 transmits the second request signal, it increments the identification number included in the signal by one.

リクエスト信号受信部334は第二リクエスト信号を受信する(ステップS201)。第二リクエスト信号はリンク制御部32が用いるPCI Expressの通信プロトコルに基づいて受信される。リクエスト信号受信部334は第二リクエスト信号に含まれる識別番号と受信時刻を記憶部335に記録する(ステップS202)。 The request signal receiving unit 334 receives the second request signal (step S201). The second request signal is received based on the PCI Express communication protocol used by the link control unit 32 . The request signal receiving unit 334 records the identification number and the reception time included in the second request signal in the storage unit 335 (step S202).

監視部333は記憶部335に記録される第二リクエスト信号の識別番号とその受信時刻を定期的に読み込む。監視部333は最初の第二リクエスト信号の受信に基づいてタイマをカウントし、次の第二リクエスト信号の受信時刻がカウント時間の満了前であるかを判定する(ステップS203)。監視部333は第二リクエスト信号の受信がタイマでカウントする時間の満了前である場合には第二リクエスト信号に含まれる情報の監視を繰り返す。監視部333は次の第二リクエスト信号の受信時刻がタイマでカウントする時間の満了後である場合や、次の第二リクエスト信号の受信が無い場合には、障害が発生したと判定する(ステップS204)。なお第二リクエスト信号の受信時刻がタイマのカウント満了時刻と一致した場合には障害発生無と判定してよい。 The monitoring unit 333 periodically reads the identification number of the second request signal and the reception time recorded in the storage unit 335 . The monitoring unit 333 counts the timer based on the first reception of the second request signal, and determines whether the reception time of the next second request signal is before the expiration of the count time (step S203). If the second request signal is received before the time counted by the timer expires, the monitoring unit 333 repeats monitoring of the information included in the second request signal. The monitoring unit 333 determines that a failure has occurred when the reception time of the next second request signal is after the time counted by the timer expires or when the next second request signal is not received (step S204). If the reception time of the second request signal coincides with the count expiration time of the timer, it may be determined that no fault has occurred.

監視部333は障害発生と判定した場合にはリンク制御部32に障害発生を通知する。リンク制御部32は障害発生の通知を受けると、自装置に接続する通信ネットワークケーブルの通信経路を切断するための制御信号を生成する。リンク制御部32は当該制御信号に基づいて通信経路の切断を行う(ステップS205)。 When the monitoring unit 333 determines that a failure has occurred, it notifies the link control unit 32 of the failure occurrence. Upon receiving the failure notification, the link control unit 32 generates a control signal for disconnecting the communication path of the communication network cable connected to the own device. The link control unit 32 disconnects the communication path based on the control signal (step S205).

このような処理を行う通信装置300は、パケットが詰まるようなリンク障害を検出した場合には通信経路の通信接続を切断する。これにより、図1に示すようなPCIe(PCI Express)の通信機能を有する通信デバイスを搭載した各通信装置を有する通信システムは、障害が発生した可能性がある通信装置は切断し、これにより中継装置200は通信が切断した通信装置300から発信された送信データを破棄する。従って、送信データであるパケットが詰まるような障害が回避され、他の通信装置300に障害が波及することを抑制することができる。 The communication device 300 that performs such processing cuts off the communication connection of the communication path when detecting a link failure such as a packet clogging. As a result, a communication system having each communication device equipped with a communication device having a PCIe (PCI Express) communication function as shown in FIG. The device 200 discards the transmission data transmitted from the communication device 300 with which communication has been cut off. Therefore, it is possible to avoid problems such as clogging of packets, which are transmission data, and prevent the problems from spreading to other communication devices 300 .

また通信装置300は障害の発生の検知に基づいて通信経路との接続を切断した後も再接続を試みる。つまり、障害検出部33の監視部333は通信経路との接続の切断が行われた後に、記憶部に次の第二リクエスト信号の識別番号が記録されたかを検出する(ステップS206)。リンク制御部32は、次の第二リクエスト信号の識別番号が記録されている場合には、通信経路に障害が発生していないと判定し、通信経路に接続されるホスト側の通信装置100との再接続の制御を行う(ステップS207)。これによりホスト側の通信装置100とクライアント側の通信装置300の間の通信を再開することができる。障害検出部33は通信装置300の処理が終了となるかを判定する(ステップS208)。通信装置300は終了でない場合にはステップS201からの処理を繰り返す。 Further, the communication device 300 attempts reconnection even after disconnecting from the communication path based on detection of the occurrence of a failure. In other words, the monitoring unit 333 of the failure detection unit 33 detects whether or not the identification number of the next second request signal is recorded in the storage unit after the connection with the communication path is disconnected (step S206). If the identification number of the next second request signal is recorded, the link control unit 32 determines that no failure has occurred in the communication path, and reconnection control (step S207). As a result, the communication between the communication device 100 on the host side and the communication device 300 on the client side can be resumed. The failure detection unit 33 determines whether the processing of the communication device 300 ends (step S208). The communication device 300 repeats the processing from step S201 if the processing is not finished.

以上、本発明の実施形態について説明したが、上述の処理によれば、送信データであるパケットが詰まるような障害が回避され、他の通信装置300に障害が波及することを抑制することができる。 The embodiment of the present invention has been described above. According to the above-described processing, it is possible to avoid problems such as jamming of packets, which are transmission data, and prevent the problems from spreading to other communication devices 300. .

図8は通信装置の最小構成を示す図である。
通信装置300は少なくともデータ送信部31、障害検出部33、切断判定部34を備えればよい。
データ送信部31は、相手側通信装置であるホスト側の通信装置100の受信可能データ量に基づくデータ量の送信データを通信装置100へ送信する。
障害検出部33は、送信データの通信経路に障害が発生しているかを検出する。
切断判定部34は、障害が検出された場合に通信経路との接続を切断すると判定する。
FIG. 8 is a diagram showing the minimum configuration of a communication device.
The communication device 300 may include at least the data transmission unit 31, the failure detection unit 33, and the disconnection determination unit .
The data transmission unit 31 transmits to the communication device 100 the amount of transmission data based on the amount of data that can be received by the communication device 100 on the host side, which is the other communication device.
The fault detection unit 33 detects whether a fault has occurred in the communication path of the transmission data.
The disconnect determination unit 34 determines to disconnect the communication path when a failure is detected.

上述の各装置は内部に、コンピュータシステムを有している。そして、上述した各処理の過程は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータが読み出して実行することによって、上記処理が行われる。ここでコンピュータ読み取り可能な記録媒体とは、磁気ディスク、光磁気ディスク、CD-ROM、DVD-ROM、半導体メモリ等をいう。また、このコンピュータプログラムを通信回線によってコンピュータに配信し、この配信を受けたコンピュータが当該プログラムを実行するようにしても良い。 Each of the devices described above has an internal computer system. Each process described above is stored in a computer-readable recording medium in the form of a program, and the above process is performed by reading and executing this program by a computer. Here, the computer-readable recording medium refers to magnetic disks, magneto-optical disks, CD-ROMs, DVD-ROMs, semiconductor memories, and the like. Alternatively, the computer program may be distributed to a computer via a communication line, and the computer receiving the distribution may execute the program.

また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。 Further, the program may be for realizing part of the functions described above. Further, it may be a so-called difference file (difference program) that can realize the above-described functions in combination with a program already recorded in the computer system.

100、300・・・通信装置
200・・・中継装置
31・・・データ送信部
32・・・リンク制御部
33・・・障害検出部
34・・・切断判定部
331・・・リクエスト信号送信部
332・・・応答信号判定部
333・・・監視部
334・・・リクエスト信号受信部
335・・・記憶部
100, 300... Communication device 200... Relay device 31... Data transmission unit 32... Link control unit 33... Failure detection unit 34... Disconnection determination unit 331... Request signal transmission unit 332... Response signal determination unit 333... Monitoring unit 334... Request signal receiving unit 335... Storage unit

Claims (6)

中継装置を介して通信接続された相手側通信装置の受信可能データ量に基づくデータ量の送信データを前記相手側通信装置へPCI(Peripheral Component Interconnect)Expressの通信規格に基づいて送信するデータ送信部と、
前記送信データの前記相手側通信装置との間の通信経路に障害が発生しているかを検出する障害検出部と、
前記障害を検出した場合に前記通信経路との接続を切断すると判定する切断判定部と、
を備える通信装置。
A data transmission unit that transmits transmission data of a data amount based on the amount of data that can be received by a counterpart communication device connected via a relay device to the counterpart communication device based on the PCI (Peripheral Component Interconnect) Express communication standard. When,
a failure detection unit that detects whether a failure has occurred in a communication path between the transmission data and the communication device of the other party ;
a disconnect determination unit that determines to disconnect the communication path when the failure is detected;
A communication device comprising:
第一リクエスト信号を前記相手側通信装置へ送信するリクエスト信号送信部と、を備え、
前記障害検出部は、前記第一リクエスト信号に対する応答信号の受信ができない場合に前記通信経路に障害が発生していることを検出する
請求項1に記載の通信装置。
a request signal transmission unit that transmits a first request signal to the counterpart communication device,
The communication device according to claim 1, wherein the failure detection unit detects that a failure has occurred in the communication path when a response signal to the first request signal cannot be received.
前記相手側通信装置から第二リクエスト信号を受信するリクエスト信号受信部と、を備え、
前記障害検出部は、前記第二リクエスト信号を受信できない場合に前記通信経路に障害が発生していることを検出する
請求項1に記載の通信装置。
a request signal receiving unit that receives a second request signal from the counterpart communication device,
The communication device according to claim 1, wherein the failure detection unit detects that a failure has occurred in the communication path when the second request signal cannot be received.
前記障害検出部は前記通信経路との接続の切断が行われた後に、繰り返し前記通信経路に障害が発生しているかを検出し、
前記通信経路に障害が発生していない場合に前記通信経路に接続される前記相手側通信装置との再接続の制御を行うリンク制御部をさらに備える
請求項1から請求項3の何れか一項に記載の通信装置。
The failure detection unit repeatedly detects whether a failure has occurred in the communication path after the connection with the communication path is disconnected,
4. The device according to any one of claims 1 to 3, further comprising a link control unit that controls reconnection with the communication device connected to the communication path when no failure has occurred in the communication path. The communication device according to .
中継装置を介して通信接続された相手側通信装置の受信可能データ量に基づくデータ量の送信データを前記相手側通信装置へPCI(Peripheral Component Interconnect)Expressの通信規格に基づいて送信し、
前記送信データの前記相手側通信装置との間の通信経路に障害が発生しているかを検出し、
前記障害を検出した場合に前記通信経路との接続を切断すると判定する
通信方法。
transmitting data amount based on the amount of data that can be received by a counterpart communication device connected via a relay device to the counterpart communication device based on PCI (Peripheral Component Interconnect) Express communication standards;
detecting whether a failure has occurred in a communication path between the transmission data and the communication device of the other party ;
A communication method that determines to cut the connection with the communication path when the failure is detected.
通信装置のコンピュータを、
中継装置を介して通信接続された相手側通信装置の受信可能データ量に基づくデータ量の送信データを前記相手側通信装置へPCI(Peripheral Component Interconnect)Expressの通信規格に基づいて送信するデータ送信手段、
前記送信データの前記相手側通信装置との間の通信経路に障害が発生しているかを検出する障害検出手段、
前記障害を検出した場合に前記通信経路との接続を切断する接続手段、
として機能させるプログラム。
the computer of the communication device,
Data transmission means for transmitting transmission data having a data amount based on the amount of data that can be received by the communication device of the other party connected via the relay device to the communication device of the other party based on the communication standard of PCI (Peripheral Component Interconnect) Express. ,
failure detection means for detecting whether or not a failure has occurred in a communication path between the transmission data and the counterpart communication device ;
connection means for disconnecting the communication path when the failure is detected;
A program that acts as a
JP2018061184A 2018-03-28 2018-03-28 COMMUNICATION DEVICE, COMMUNICATION METHOD, AND PROGRAM Active JP7143609B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018061184A JP7143609B2 (en) 2018-03-28 2018-03-28 COMMUNICATION DEVICE, COMMUNICATION METHOD, AND PROGRAM

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018061184A JP7143609B2 (en) 2018-03-28 2018-03-28 COMMUNICATION DEVICE, COMMUNICATION METHOD, AND PROGRAM

Publications (2)

Publication Number Publication Date
JP2019176284A JP2019176284A (en) 2019-10-10
JP7143609B2 true JP7143609B2 (en) 2022-09-29

Family

ID=68167329

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018061184A Active JP7143609B2 (en) 2018-03-28 2018-03-28 COMMUNICATION DEVICE, COMMUNICATION METHOD, AND PROGRAM

Country Status (1)

Country Link
JP (1) JP7143609B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112312513B (en) * 2019-07-29 2021-12-03 华为技术有限公司 Method and apparatus for link failure recovery
US11226879B2 (en) * 2020-05-08 2022-01-18 International Business Machines Corporation Fencing non-responding ports in a network fabric

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002082848A (en) 2000-09-07 2002-03-22 Fuji Heavy Ind Ltd Client / server system
JP2009176284A (en) 2007-12-25 2009-08-06 Fuji Xerox Co Ltd File sharing system
JP2010109733A (en) 2008-10-30 2010-05-13 Iwatsu Electric Co Ltd Packet communication method
JP2010212825A (en) 2009-03-09 2010-09-24 Oki Networks Co Ltd Communication system, sip server, sip terminal, and security communication method
JP2010532607A (en) 2007-06-29 2010-10-07 インターナショナル・ビジネス・マシーンズ・コーポレーション PCI Express packet digest modification device, system and method
JP2017157963A (en) 2016-02-29 2017-09-07 キヤノン株式会社 COMMUNICATION DEVICE, COMMUNICATION METHOD, AND PROGRAM

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11161577A (en) * 1997-11-28 1999-06-18 Matsushita Electric Works Ltd Server

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002082848A (en) 2000-09-07 2002-03-22 Fuji Heavy Ind Ltd Client / server system
JP2010532607A (en) 2007-06-29 2010-10-07 インターナショナル・ビジネス・マシーンズ・コーポレーション PCI Express packet digest modification device, system and method
JP2009176284A (en) 2007-12-25 2009-08-06 Fuji Xerox Co Ltd File sharing system
JP2010109733A (en) 2008-10-30 2010-05-13 Iwatsu Electric Co Ltd Packet communication method
JP2010212825A (en) 2009-03-09 2010-09-24 Oki Networks Co Ltd Communication system, sip server, sip terminal, and security communication method
JP2017157963A (en) 2016-02-29 2017-09-07 キヤノン株式会社 COMMUNICATION DEVICE, COMMUNICATION METHOD, AND PROGRAM

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
伊藤 玄蕃 GENNBA ITOU,管理ツールの仕組みと応用 ネットワーク管理のテクノロジー,月刊アスキードットテクノロジーズ 第15巻 第3号 ASCII.technologies,日本,株式会社アスキー・メディアワークス,2010年01月23日,第15巻,p.68-p.87

Also Published As

Publication number Publication date
JP2019176284A (en) 2019-10-10

Similar Documents

Publication Publication Date Title
KR101593168B1 (en) Physical one direction communication device and method thereof
US6658595B1 (en) Method and system for asymmetrically maintaining system operability
CN110740072B (en) Fault detection method, device and related equipment
CN110808873B (en) Method and device for detecting link failure
CN108418710B (en) Distributed monitoring system, method and device
CN104518914B (en) Link switch-over method and equipment
CN102970167B (en) The fault detection method of network node, network node and system in group system
US8792350B2 (en) Network relay system, network relay device, and congested state notifying method
CN102957607B (en) A kind of link switch-over method and relevant apparatus, system
KR20220014796A (en) System and Method for Identifying Compromised Electronic Controller Using Intentionally Induced Error
US7924737B2 (en) Signal degrade detecting method, signal restoration detecting method, devices for those methods, and traffic transmission system
JP2019029960A (en) Detection device, detection method, and detection program
JP7143609B2 (en) COMMUNICATION DEVICE, COMMUNICATION METHOD, AND PROGRAM
JP2008278357A (en) Communication line disconnecting apparatus
CN105490837A (en) Network monitoring processing method and device
CN112866187B (en) Path switching method and path switching device
CN109039761B (en) Method and device for processing fault link in cluster control channel
JP2007180891A (en) Communication device, packet transmission control method used therefor, and program
JP5050014B2 (en) Network monitoring system
JP2010041385A (en) Router and congestion control method
CN117194116A (en) Data caching method, device, equipment and medium
CN103746856A (en) Method for preventing service interruption and network equipment
CN105872003A (en) Data processing method, device and system based on P2P (Peer-to-Peer) network
US10616094B2 (en) Redirecting flow control packets
CN110601972A (en) Message transmission method and device and intelligent elastic architecture system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211026

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211223

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220301

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220427

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220816

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220829

R151 Written notification of patent or utility model registration

Ref document number: 7143609

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151