Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JPS6132702B2 - - Google Patents
[go: Go Back, main page]

JPS6132702B2 - - Google Patents

Info

Publication number
JPS6132702B2
JPS6132702B2 JP56047242A JP4724281A JPS6132702B2 JP S6132702 B2 JPS6132702 B2 JP S6132702B2 JP 56047242 A JP56047242 A JP 56047242A JP 4724281 A JP4724281 A JP 4724281A JP S6132702 B2 JPS6132702 B2 JP S6132702B2
Authority
JP
Japan
Prior art keywords
microcomputer
microcomputers
operation monitoring
data area
shared memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP56047242A
Other languages
Japanese (ja)
Other versions
JPS57164345A (en
Inventor
Yoshuki Horikoshi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP56047242A priority Critical patent/JPS57164345A/en
Publication of JPS57164345A publication Critical patent/JPS57164345A/en
Publication of JPS6132702B2 publication Critical patent/JPS6132702B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Hardware Redundancy (AREA)
  • Debugging And Monitoring (AREA)
  • Multi Processors (AREA)

Description

【発明の詳細な説明】 本発明は、共有メモリ方式複合マイクロコンピ
ユータシステムにおける複合マイクロコンピユー
タ障害検知方式に関する。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to a composite microcomputer failure detection method in a shared memory type composite microcomputer system.

従来、マイクロコンピユータの動作、不動作の
検知は、マイクロコンピユータの外部に設けたウ
オツチドツグタイマをマイクロコンピユータから
の指令で周期的に起動させ、マイクロコンピユー
タに障害が生じたときにはウオツチドツグタイマ
への指令を停止し、ウオツチドツグタイマをタイ
ムアウトさせることによつてマイクロコンピユー
タの不動作を検知していた。
Conventionally, the operation or non-operation of a microcomputer has been detected by periodically starting a watchdog timer installed outside the microcomputer based on a command from the microcomputer, and when a failure occurs in the microcomputer, the watchdog timer is activated. Non-operation of the microcomputer was detected by stopping commands to the timer and causing the watchdog timer to time out.

しかし、この方式は単一のマイクロコンピユー
タの不動作検知には有効であるが、複数のマイク
ロコンピユータが結合された複合マイクロコンピ
ユータにおいては、マイクロコンピユータが相互
にその不動作を検知しなければならず十分なもの
ではなかつた。
However, although this method is effective for detecting non-operation of a single microcomputer, in a composite microcomputer in which multiple microcomputers are combined, the microcomputers must mutually detect non-operation. It wasn't enough.

本発明は、これら単独のウオツチドツグタイマ
では不可能であつた複合マイクロコンピユータに
おける不動作マイクロコンピユータの確実なる検
知を、特別のハードウエアを用いることなく、各
マイクロコンピユータ共通の共有メモリに設けた
動作監視カウンタからの増分状態を示すデータを
周期的にサンプリングし、この値を比較するだけ
で簡単に行なえるようにした複合マイクロコンピ
ユータの障害検知方式の提供を目的とする。
The present invention provides reliable detection of inactive microcomputers in a complex microcomputer, which was impossible with a single watchdog timer, in a shared memory common to each microcomputer without using special hardware. The object of the present invention is to provide a fault detection method for a complex microcomputer that can be easily carried out by periodically sampling data indicating an incremental state from an operation monitoring counter and comparing the values.

以下、本発明を図面に示す実施例に基づいて説
明する。
Hereinafter, the present invention will be explained based on embodiments shown in the drawings.

第1図は、複数のマイクロコンピユータが各マ
イクロコンピユータから共通に呼出すことのでき
る共有メモリを介して相互に結合された状態の複
合マイクロコンピユータを示す。1,2,3
,……,1nはそれぞれマイクロコンピユータ
であり、これらのマイクロコンピユータ1,2
,3,……,1nはそれぞれ主メモリ2
,2,……,2nを設けている。3は各マ
イクロコンピユータ1,1,1,……1n
から共通に呼出すことのできる共有メモリで、各
マイクロコンピユータ1,1,1,……,
1nに対応し、かつその指令によつてそれぞれ増
分する動作監視カウンタC1,C2,C3,……,Cn
を設けている。これら動作監視カウンタC1
C2,C3,……,Cnは、共有メモリ3上の特定番
地のデータをマイクロコンピユータのレジスタ
(図示せず)に読出し、そのデータの値に1を加
えてから再び共有、各メモリ3上の同じメモリ番
地に格納することによつて増分がなされる。
FIG. 1 shows a composite microcomputer in which a plurality of microcomputers are interconnected through a shared memory that can be called in common from each microcomputer. 1 1 , 2 2 , 3
3 , ..., 1n are microcomputers, respectively, and these microcomputers 1 1 , 2
2 , 3 3 , ..., 1n are the main memories 2 1 , 1n, respectively.
2 2 , 2 3 , ..., 2n are provided. 3 is each microcomputer 1 1 , 1 2 , 1 3 , ... 1n
A shared memory that can be commonly accessed from each microcomputer 1 1 , 1 2 , 1 3 , ...,
Operation monitoring counters C 1 , C 2 , C 3 , ..., Cn corresponding to 1n and incremented by the commands respectively
has been established. These operation monitoring counters C 1 ,
C 2 , C 3 , . The increment is made by storing to the same memory location above.

一方、マイクロコンピユータ1,1,1
,……,1nの主メモリ2,2,2,…
…,2nには、それぞれ自己を除く各マイクロコ
ンピユータに対応したデータを格納する新データ
領域NDと旧データ領域ODが設けてあり、各新デ
ータ領域NDは、共有メモリ3上のそれぞれ対応
する動作監視カウンタCの値を周期的にサンプリ
ングして格納し、各旧データ領域ODは、新デー
タ領域における前回のサンプリング値を移送して
格納している。そして、これら各新データ領域の
値と旧データ領域の値を比較し、各マイクロコン
ピユータの動作、不動作を検知する。したがつ
て、例えばマイクロコンピユータ1において
は、その主メモリ2にマイクロコンピユータ1
,1,……,1nに対応する新データ領域
ND2,ND3,……,NDnと旧データ領域OD2
OD3,……,ODnが設けてあり、これらデータ領
域の値を比較することによつてマイクロコンピユ
ータ1,1,……,1nの動作、不動作を検
知する。
On the other hand, microcomputers 1 1 , 1 2 , 1
3 , ..., 1n main memories 2 1 , 2 2 , 2 3 , ...
..., 2n are provided with a new data area ND and an old data area OD that store data corresponding to each microcomputer except for itself, and each new data area ND stores data corresponding to each microcomputer on the shared memory 3. The value of the monitoring counter C is periodically sampled and stored, and each old data area OD transfers and stores the previous sampling value in the new data area. The values of each new data area and the old data area are then compared to detect whether each microcomputer is operating or not. Therefore, for example, in the microcomputer 11 , the main memory 21 contains the microcomputer 1.
New data area corresponding to 2 , 1 3 , ..., 1n
ND 2 , ND 3 , ..., NDn and old data area OD 2 ,
OD 3 , . . . , ODn are provided, and the operation or non-operation of the microcomputers 1 2 , 1 3 , . . . , 1n is detected by comparing the values of these data areas.

なお、共有メモリ3上の動作監視カウンタCの
増分周期とこれら動作監視カウンタCの値をマイ
クロコンピユータ側でサンプリングする周期との
関係は、サンプリング周期を増分周期よりも長く
設定することにより、動作監視カウンタが1回増
分する間に2回以上サンプリングしないようにし
てある。
Note that the relationship between the increment period of the operation monitoring counter C on the shared memory 3 and the period at which the values of these operation monitoring counters C are sampled on the microcomputer side is such that the operation monitoring can be performed by setting the sampling period longer than the increment period. The counter is incremented once to avoid sampling more than once.

次に、第2図に基づいて本発明による不動作マ
イクロコンピユータの検知手段を具体的に説明す
る。第2図は、各マイクロコンピユータ1,1
,1,……,1nが共有メモリ3上の各動作
監視カウンタC1,C2,C3,……,Cnを所定の周
期で増分させ、それをマイクロコンピユータ1
が自己に対応する動作監視カウンタC1以外の各
動作監視カウンタC2,C3,……,Cnの値を、増
分周期の最大周期より長い周期でサンプリング
し、その都度、今回サンプリングした新データ領
域の値と前回サンプリングした旧データ領域の値
との比較を行なつている状態を示している。な
お、後述するが、第2図ではマイクロコンピユー
タCnが故障して不動作状態となつている例を示
している。
Next, based on FIG. 2, the means for detecting an inoperable microcomputer according to the present invention will be specifically explained. Figure 2 shows each microcomputer 1 1 , 1
2 , 1 3 , .
samples the values of the operation monitoring counters C 2 , C 3 , . This shows a state in which the value of the area is being compared with the value of the old data area that was sampled last time. As will be described later, FIG. 2 shows an example in which the microcomputer Cn has failed and is in an inoperable state.

各マイクロコンピユータ1,1,……,1
nがサンプリング周期間に各動作監視カウンタ
C2,C3,……,Cnを増分するカウント値が、マ
イクロコンピユータ1が2、マイクロコンピユ
ータ1が4、マイクロコンピユータ1nが2だ
とすると、サンプリングタイミングt2とt3におけ
る新データ領域ND2,ND3,……,NDnの値と旧
データ領域OD2,OD3,……,ODnの値との比較
差、すなわち動作監視カウンタC2,C3,……,
Cnのカウント値はそれぞれ2,4,2であり、
各マイクロコンピユータ1,1,……,1n
が正常に動作していることを示している。しか
し、サンプリングタイムt4の場合は、動作監視カ
ウンタC2とC3のカウント値はそれぞれ2と4で
あるが、動作監視カウンタCnのカウント値は、
前回のサンプリング時t3から一度もカウントされ
ていない零の状態であるから、マイクロコンピユ
ータ1と1は正常に動作しているものの、マ
イクロコンピユータ1nは正常に動作していない
ことを示している。したがつて、これによりマイ
クロコンピユータ1はマイクロコンピユータ1
nの不動作を検知する。この場合、説明はしてな
いが、同じ手段で各マイクロコンピユータ1
,……,1n-1もマイクロコンピユータ1n
の不動作を検知する。
Each microcomputer 1 2 , 1 3 , ..., 1
n is each operation monitoring counter during the sampling period.
If the count values for incrementing C 2 , C 3 , ..., Cn are 2 for microcomputer 1 2 , 4 for microcomputer 1 3 , and 2 for microcomputer 1n, then the new data area ND at sampling timings t 2 and t 3 2 , ND 3 , ..., NDn and the old data area OD 2 , OD 3 , ..., ODn, that is, the operation monitoring counter C 2 , C 3 , ...,
The count values of Cn are 2, 4, and 2, respectively.
Each microcomputer 1 2 , 1 3 , ..., 1n
indicates that it is working properly. However, at sampling time t4 , the count values of the operation monitoring counters C2 and C3 are 2 and 4, respectively, but the count value of the operation monitoring counter Cn is
Since it is in a state of zero and has not been counted since the previous sampling time t3 , this indicates that microcomputers 1, 2 , and 1, and 3 are operating normally, but microcomputer 1n is not operating normally. There is. Therefore, with this, microcomputer 1 1 becomes microcomputer 1
Detect n's non-operation. In this case, although not explained, each microcomputer 1 2 ,
1 3 ,...,1n -1 is also a microcomputer 1n
Detects non-operation.

なお、新データ領域NDから旧データ領域ODへ
のデータの移送は、両データ領域における値の比
較が行なわれると同時になされるようにしてある
ので、移送タイミングを原因とするカウント値の
誤差は生じない。
Note that data is transferred from the new data area ND to the old data area OD at the same time as the values in both data areas are compared, so errors in count values due to transfer timing may occur. do not have.

また、第2図の鎖線で示す如くカウンタ値が通
常の値より小さいときは、マイクロコンピユータ
は正常に動作しているものとするが、場合によつ
ては不動作状態にあるとすることもできる。
Furthermore, when the counter value is smaller than the normal value as shown by the chain line in Figure 2, it is assumed that the microcomputer is operating normally, but in some cases it may be assumed that it is in an inactive state. .

以上の如く本発明によれば、複数のマイクロコ
ンピユータが各マイクロコンピユータから共通に
呼出すことのできる共有メモリを介して相互に結
合された複合マイクロコンピユータシステムにお
ける、各マイクロコンピユータの動作状態を特別
のハードウエア等を用いることなく各マイクロコ
ンピユータが相互に監視できるので、各マイクロ
コンピユータにウオツチドツグタイマを個々に設
ける必要がなく、簡単かつ確実に不動作マイクロ
コンピユータの検知を行なうことができる。そし
て、この障害検知方式は、複合マイクロコンピユ
ータシステムにおいていずれかのマイクロコンピ
ユータが障害を生じた際に、他のマイクロコンピ
ユータでこれを救済するための基本的手段を提供
することができる。
As described above, according to the present invention, in a composite microcomputer system in which a plurality of microcomputers are interconnected via a shared memory that can be called in common from each microcomputer, the operating status of each microcomputer can be checked using a special hardware. Since each microcomputer can mutually monitor each other without using any hardware or the like, there is no need to provide a watchdog timer for each microcomputer, and an inactive microcomputer can be easily and reliably detected. This fault detection method can provide a basic means for relieving the problem with other microcomputers when any one of the microcomputers in the complex microcomputer system becomes faulty.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は複数のコンピユータが各コンピユータ
から共通に呼出すことのできる共有メモリを介し
て結合された複合マイクロコンピユータにおける
本方式の概念図、第2図は本方式による不動作コ
ンピユータの検知手段説明図である。 1,1,1,……,1n:マイクロコン
ピユータ、2,2,2,……,2n:主メ
モリ、ND1,ND2,ND3,……,NDn:新データ
領域、OD1,OD2,OD3,……,ODn:旧データ
領域、3:共有メモリ、C1,C2,C3,……,
Cn:動作監視カウンタ。
Fig. 1 is a conceptual diagram of this method in a composite microcomputer in which multiple computers are connected via a shared memory that can be commonly called from each computer, and Fig. 2 is an explanatory diagram of the method for detecting an inactive computer using this method. It is. 1 1 , 1 2 , 1 3 , ..., 1n: Microcomputer, 2 1 , 2 2 , 2 3 , ..., 2n: Main memory, ND 1 , ND 2 , ND 3 , ..., NDn: New data Area, OD 1 , OD 2 , OD 3 , ..., ODn: Old data area, 3: Shared memory, C 1 , C 2 , C 3 , ...,
Cn: Operation monitoring counter.

Claims (1)

【特許請求の範囲】[Claims] 1 複数のマイクロコンピユータを、これらの各
マイクロコンピユータに共通な共有メモリを介し
て相互に結合した共有メモリ式複合マイクロコン
ピユータシステムにおいて、前記各マイクロコン
ピユータに、自己を除く他の各マイクロコンピユ
ータ用の新データ領域とこの新データ領域内の直
前のデータを移送格納する旧データ領域とを備え
た主メモリを設け、また、前記共有メモリ上に、
前記各マイクロコンピユータの指令によつて増分
可能なマイクロコンピユータ動作監視カウンタを
各マイクロコンピユータに対応して設け、前記各
マイクロコンピユータが自己に対応する動作監視
カウンタ以外の前記各動作監視カウンタの内容
を、動作監視カウンタの増分周期より長い周期で
サンプリングして自己のマイクロコンピユータの
前記各新データ領域に格納し、同時に、この各新
データ領域の値と前記各旧データ領域の値との比
較を行ない、その比較結果に所定の差のある前記
マイクロコンピユータは動作中であると判定し、
比較結果に差のない前記マイクロコンピユータは
不動作であると判定することにより、複合マイク
ロコンピユータにおける不動作のマイクロコンピ
ユータを検知する複合マイクロコンピユータの障
害検知方式。
1. In a shared memory composite microcomputer system in which a plurality of microcomputers are interconnected via a shared memory common to each of these microcomputers, each of the microcomputers has a new A main memory including a data area and an old data area for transferring and storing immediately preceding data in the new data area is provided, and on the shared memory,
A microcomputer operation monitoring counter that can be incremented by a command from each microcomputer is provided corresponding to each microcomputer, and each of the microcomputers stores the contents of each operation monitoring counter other than the operation monitoring counter corresponding to itself. sampling at a cycle longer than the increment cycle of the operation monitoring counter and storing it in each of the new data areas of its own microcomputer, and at the same time comparing the values of each of the new data areas with the values of each of the old data areas; The microcomputer with a predetermined difference in the comparison result is determined to be in operation,
A failure detection method for a composite microcomputer that detects an inoperable microcomputer in the composite microcomputer by determining that the microcomputers with no difference in comparison results are inoperable.
JP56047242A 1981-04-01 1981-04-01 Failure detecting system for composite microcomputer Granted JPS57164345A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56047242A JPS57164345A (en) 1981-04-01 1981-04-01 Failure detecting system for composite microcomputer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56047242A JPS57164345A (en) 1981-04-01 1981-04-01 Failure detecting system for composite microcomputer

Publications (2)

Publication Number Publication Date
JPS57164345A JPS57164345A (en) 1982-10-08
JPS6132702B2 true JPS6132702B2 (en) 1986-07-29

Family

ID=12769750

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56047242A Granted JPS57164345A (en) 1981-04-01 1981-04-01 Failure detecting system for composite microcomputer

Country Status (1)

Country Link
JP (1) JPS57164345A (en)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61141043A (en) * 1984-12-14 1986-06-28 Fuji Electric Co Ltd Abnormality detection system in system for making redundant
JPS6224330A (en) * 1985-07-24 1987-02-02 Hitachi Ltd Multiprocessor failure detection method
JPS62263554A (en) * 1986-05-09 1987-11-16 Fujitsu Ltd Shared memory duplex system
JPS63100563A (en) * 1986-10-16 1988-05-02 Nissin Electric Co Ltd Faulty processor detecting system
JPH0656584B2 (en) * 1986-11-21 1994-07-27 本田技研工業株式会社 Operating state monitoring device in a split processing system using multiple computers
JPH01136248A (en) * 1987-11-24 1989-05-29 Meidensha Corp Fault detecting and switching device
JPH01100238U (en) * 1987-12-23 1989-07-05
JPH061461B2 (en) * 1989-09-13 1994-01-05 理化工業株式会社 CPU control method
JP2503287B2 (en) * 1990-04-05 1996-06-05 富士通株式会社 Multi-function computer with survival confirmation function
JP7028124B2 (en) * 2018-09-25 2022-03-02 オムロン株式会社 CPU unit, CPU unit control method, information processing program, and recording medium

Also Published As

Publication number Publication date
JPS57164345A (en) 1982-10-08

Similar Documents

Publication Publication Date Title
US4894828A (en) Multiple sup swap mechanism
JP3481737B2 (en) Dump collection device and dump collection method
KR20000011834A (en) Method and appratus for providing failure detection and recovery with predetermined degree of replication for distributed applications in a network
JPS594054B2 (en) Multiprocessor failure detection method
JPS6132702B2 (en)
US4395755A (en) Information processing system and logout process therefor
JP2687927B2 (en) External bus failure detection method
US6810489B1 (en) Checkpoint computer system utilizing a FIFO buffer to re-synchronize and recover the system on the detection of an error
EP0125797B1 (en) Interrupt signal handling apparatus
JPH0736721A (en) Control method for multiplex computer system
JPS5827538B2 (en) Mutual monitoring method
JPH04266141A (en) Stack overflow detection system
JP2870250B2 (en) Microprocessor runaway monitor
JPS5917467B2 (en) Control computer backup method
EP0655686B1 (en) Retry control method and device for control processor
JP3110124B2 (en) Failure detection method in multi-computer system
JPS6218059B2 (en)
JPH04275664A (en) Mutual monitoring method and device between processors
JPS6128146B2 (en)
JP2518652B2 (en) Interrupt diagnostic device for multi-bus synchronous system
JPS6155748A (en) Electronic computer system
JPH1063530A (en) Redundant system
JPH0797327B2 (en) Failure detection method
JPS5838808B2 (en) Data transfer method in multiprocessor system
JPH0588944A (en) Input/output control and monitor system for information processing system