JP6398658B2 - アプリケーション・データを回復する方法 - Google Patents
アプリケーション・データを回復する方法 Download PDFInfo
- Publication number
- JP6398658B2 JP6398658B2 JP2014240195A JP2014240195A JP6398658B2 JP 6398658 B2 JP6398658 B2 JP 6398658B2 JP 2014240195 A JP2014240195 A JP 2014240195A JP 2014240195 A JP2014240195 A JP 2014240195A JP 6398658 B2 JP6398658 B2 JP 6398658B2
- Authority
- JP
- Japan
- Prior art keywords
- node
- memory
- memory controller
- application
- failover
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/1658—Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/203—Failover techniques using migration
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/2025—Failover techniques using centralised failover control functionality
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/2028—Failover techniques eliminating a faulty processor or activating a spare
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Hardware Redundancy (AREA)
- Debugging And Monitoring (AREA)
- Techniques For Improving Reliability Of Storages (AREA)
Description
・アプリケーションの最も最近の可能な状態(標準的なチェックポイントが使われる場合の過去の何らかの距離のところからのバージョンではなく)が回復されるので、ノードの障害後に繰り返される必要のある計算の量が非常に著しく軽減される。
・解における正確さが失われない。これに対し、障害を起こしたノード上で解を生き残った解から補間すると、誤差が増す結果となりうる。
(付記1)
インターコネクトによって接続された複数のノードを有するコンピュータ・システムにおいて障害を起こしたノードのメモリからアプリケーション・データを回復し、該アプリケーション・データを置換ノードに書き込む方法であって、
前記コンピュータ・システムのノードがアプリケーションを実行し、該アプリケーションはアプリケーション・データを生成し、該アプリケーションの最も最近の状態をノード・メモリに記憶し;
前記ノードが障害を起こし;
前記障害を起こしたノードのノード・メモリはその後、フェイルオーバー・メモリ・コントローラを使って制御され;
前記フェイルオーバー・メモリ・コントローラは前記アプリケーション・データを前記障害を起こしたノードのノード・メモリから前記置換ノードのノード・メモリに前記インターコネクトを通じてコピーする、
方法。
(付記2)
前記アプリケーションが走っており、前記ノード障害の前に、前記アプリケーションはノード・メモリの一部を、前記障害を起こしたノードおよび/または前記置換ノードのノード・メモリにおいて前記アプリケーションによって利用可能または利用不能であると登録する、
付記1記載の方法。
(付記3)
前記アプリケーションが前記一部を前記フェイルオーバー・メモリ・コントローラに登録する、付記2記載の方法。
(付記4)
前記障害を起こしたノードのノード・メモリが前記障害後に補助電力を供給され、補助電源は前記フェイルオーバー・メモリ・コントローラによって制御される、付記1または2記載の方法。
(付記5)
前記補助電源が、前記フェイルオーバー・メモリ・コントローラと一緒に設けられたバッテリーの形である、付記1ないし4のうちいずれか一項記載の方法。
(付記6)
前記補助電源が、前記障害の前およびあとに前記フェイルオーバー・メモリ・コントローラに給電する、付記1ないし5のうちいずれか一項記載の方法。
(付記7)
前記補助電源が、前記フェイルオーバー・メモリ・コントローラのインターコネクト接続に給電する、付記1ないし6のうちいずれか一項記載の方法。
(付記8)
前記補助電力は、前記障害を起こしたノードのプロセッサまたはノード・メモリ・コントローラのような別のコンポーネントを介してではなく、前記ノード・メモリに直接供給される、付記1ないし7のうちいずれか一項記載の方法。
(付記9)
前記フェイルオーバー・メモリ・コントローラは、前記障害を起こしたノードのプロセッサまたはノード・メモリ・コントローラのような別のコンポーネントを介してではなく、前記インターコネクトに直接結合される、付記1ないし8のうちいずれか一項記載の方法。
(付記10)
前記コンピュータ・システムの管理プロセスがノードをモニタリングし、前記ノード障害を検出し、前記置換ノードを同定し、前記フェイルオーバー・メモリ・コントローラに前記アプリケーション・データを前記障害を起こしたノードのノード・メモリから前記置換ノードのノード・メモリにコピーするよう命令する、付記1ないし9のうちいずれか一項記載の方法。
(付記11)
前記管理プロセスがまた、前記置換ノード上の前記アプリケーションを再開する、付記10記載の方法。
(付記12)
補助電源および/またはフェイルオーバー・メモリ・コントローラが単一のノードのためにまたは一群のノードのために設けられる、付記1ないし11のうちいずれか一項記載の方法。
(付記13)
それぞれが独自のノード・メモリおよびノード・メモリ・コントローラを有する、インターコネクトによって接続された複数のノードを有するコンピュータ・システム上でアプリケーションを走らせているときに、障害を起こしたノードからの回復において使うためのフェイルオーバー・メモリ・コントローラであって、
当該フェイルオーバー・メモリ・コントローラは前記障害を起こしたノードの前記メモリ・コントローラおよび/またはメモリに接続するよう動作可能であり;
当該フェイルオーバー・メモリ・コントローラは、前記障害を起こしたノードのノード・メモリに記憶されているアプリケーション・データの、置換ノードのノード・メモリへの、前記インターコネクトを通じた転送を制御するよう構成されている、
フェイルオーバー・メモリ・コントローラ。
(付記14)
前記フェイルオーバー・メモリ・コントローラは、前記コンピュータ・システム内のノードから自律的である、付記13記載のフェイルオーバー・メモリ・コントローラ。
(付記15)
それぞれが独自のノード・メモリおよびノード・メモリ・コントローラを有する複数のノードと;
それらのノード上でアプリケーションを実行するときに障害を起こしたノードからの回復において使うためのフェイルオーバー・メモリ・コントローラと;
それらのノードおよび前記フェイルオーバー・メモリ・コントローラを接続するインターコネクトとを有するコンピュータ・システムであって、
前記フェイルオーバー・メモリ・コントローラは障害を起こしたノードの前記メモリ・コントローラおよび/またはメモリに接続するよう動作可能であり;
前記フェイルオーバー・メモリ・コントローラは、前記障害を起こしたノードのノード・メモリに記憶されているアプリケーション・データの、置換ノードのノード・メモリへの、前記インターコネクトを通じた転送を制御するよう構成されている、
コンピュータ・システム。
(付記16)
前記フェイルオーバー・メモリ・コントローラが各ノードのために設けられる、
付記15記載のコンピュータ・システム。
(付記17)
前記フェイルオーバー・メモリ・コントローラは、ノードの電力およびインターコネクト接続とは別個の電力接続およびインターコネクト接続を有する、
付記15または16記載のコンピュータ・システム。
(付記18)
フェイルオーバー・メモリ・コントローラおよびそれぞれノード・メモリを含む複数のノードを有するコンピュータ・システム上で走るデーモンであって、前記複数のノードおよびフェイルオーバー・メモリ・コントローラはみなインターコネクトによって接続されており、
当該デーモンは前記ノード上でのアプリケーションの実行をモニタリングし、
当該デーモンはノード障害を検出し、置換ノードを同定し、前記フェイルオーバー・メモリ・コントローラに、前記障害を起こしたノードのノード・メモリから前記置換ノードのノード・メモリに前記インターコネクトを通じてアプリケーション・データをコピーするよう命令する、
デーモン。
S20 アプリケーション・データを生成し、アプリケーションの最新の状態をノード・メモリに記憶
S30 ノード障害?
S40 フェイルオーバー・メモリ・コントローラが、障害を起こしたノードのノード・メモリを制御
S50 フェイルオーバー・メモリ・コントローラが、障害を起こしたノードのメモリから置換ノードのノード・メモリにデータをコピー
S110 アプリケーション開始
S120 ノード障害
S130 障害を起こしたノード上のメモリの内容はアプリケーションにとって失われる
S210 アプリケーション開始
S220 アプリケーションがメモリをフェイルオーバー・メモリ・コントローラに登録
S230 ノード障害
S240 ノード障害がデーモンによって検出される
S250 新たなホスト・ノードを開始
S260 フェイルオーバー・メモリ・コントローラを介してメモリを回復
S270 新しいホスト上でアプリケーションを開始
S280 復旧
20A ノード
20B 新しいノード
30 フェイルオーバー・メモリ・コントローラ
40 バッテリー
50 メモリ・コントローラ
60 メモリ
70 マネージャ(管理デーモン)
80 CPU
90 HDD
100 ネットワーク
Claims (19)
- インターコネクトによって接続された複数のノードを有するコンピュータ・システムにおいて障害を起こしたノードのメモリからアプリケーション・データを回復し、該アプリケーション・データを置換ノードに書き込む方法であって、
前記コンピュータ・システムのノードがアプリケーションを実行し、該アプリケーションはアプリケーション・データを生成し、該アプリケーションの最も最近の状態をノード・メモリに記憶し;
前記ノードが障害を起こし;
前記障害を起こしたノードのノード・メモリはその後、フェイルオーバー・メモリ・コントローラを使って制御され;
前記フェイルオーバー・メモリ・コントローラは前記アプリケーション・データを前記障害を起こしたノードのノード・メモリから前記置換ノードのノード・メモリに前記インターコネクトを通じてコピーし、
前記アプリケーションが走っている間であって前記ノード障害の前に、前記アプリケーションは、前記障害を起こしたノードおよび/または前記置換ノードのノード・メモリにおいて前記アプリケーションによって利用可能または利用不能であるノード・メモリの一部を登録する、
方法。 - 前記アプリケーションが、前記利用可能または利用不能であるノード・メモリの一部を登録することを、前記障害を起こしたノードが内部的に前記アプリケーションにメモリを割り当てた後に行なう、
請求項1記載の方法。 - 前記アプリケーションが前記一部を前記フェイルオーバー・メモリ・コントローラに登録する、請求項2記載の方法。
- 前記障害を起こしたノードのノード・メモリが前記障害後に補助電力を供給され、補助電源は前記フェイルオーバー・メモリ・コントローラによって制御される、請求項1または2記載の方法。
- 前記補助電源が、前記フェイルオーバー・メモリ・コントローラと一緒に設けられたバッテリーの形である、請求項1ないし4のうちいずれか一項記載の方法。
- 前記補助電源が、前記障害の前およびあとに前記フェイルオーバー・メモリ・コントローラに給電する、請求項1ないし5のうちいずれか一項記載の方法。
- 前記補助電源が、前記フェイルオーバー・メモリ・コントローラのインターコネクト接続に給電する、請求項1ないし6のうちいずれか一項記載の方法。
- 前記補助電力は、前記障害を起こしたノードのプロセッサまたはノード・メモリ・コントローラのような別のコンポーネントを介してではなく、前記ノード・メモリに直接供給される、請求項1ないし7のうちいずれか一項記載の方法。
- 前記フェイルオーバー・メモリ・コントローラは、前記障害を起こしたノードのプロセッサまたはノード・メモリ・コントローラのような別のコンポーネントを介してではなく、前記インターコネクトに直接結合される、請求項1ないし8のうちいずれか一項記載の方法。
- 前記コンピュータ・システムの管理プロセスがノードをモニタリングし、前記ノード障害を検出し、前記置換ノードを同定し、前記フェイルオーバー・メモリ・コントローラに前記アプリケーション・データを前記障害を起こしたノードのノード・メモリから前記置換ノードのノード・メモリにコピーするよう命令する、請求項1ないし9のうちいずれか一項記載の方法。
- 前記管理プロセスがまた、前記置換ノード上の前記アプリケーションを再開する、請求項10記載の方法。
- 補助電源および/またはフェイルオーバー・メモリ・コントローラが単一のノードのためにまたは一群のノードのために設けられる、請求項1ないし11のうちいずれか一項記載の方法。
- それぞれが独自のノード・メモリおよびノード・メモリ・コントローラを有する、インターコネクトによって接続された複数のノードを有するコンピュータ・システム上でアプリケーションを走らせているときに、障害を起こしたノードからの回復において使うためのフェイルオーバー・メモリ・コントローラであって、
当該フェイルオーバー・メモリ・コントローラは前記障害を起こしたノードの前記メモリ・コントローラおよび/またはメモリに接続するよう動作可能であり;
当該フェイルオーバー・メモリ・コントローラは、前記障害を起こしたノードのノード・メモリに記憶されているアプリケーション・データの、置換ノードのノード・メモリへの、前記インターコネクトを通じた転送を制御するよう構成されており、
前記アプリケーションが走っている間であって前記ノード障害の前に、前記アプリケーションは、前記障害を起こしたノードおよび/または前記置換ノードのノード・メモリにおいて前記アプリケーションによって利用可能または利用不能であるノード・メモリの一部を登録する、
フェイルオーバー・メモリ・コントローラ。 - 前記フェイルオーバー・メモリ・コントローラは、前記コンピュータ・システム内のノードから自律的である、請求項13記載のフェイルオーバー・メモリ・コントローラ。
- それぞれが独自のノード・メモリおよびノード・メモリ・コントローラを有する複数のノードと;
それらのノード上でアプリケーションを実行するときに障害を起こしたノードからの回復において使うためのフェイルオーバー・メモリ・コントローラと;
それらのノードおよび前記フェイルオーバー・メモリ・コントローラを接続するインターコネクトとを有するコンピュータ・システムであって、
前記フェイルオーバー・メモリ・コントローラは障害を起こしたノードの前記メモリ・コントローラおよび/またはメモリに接続するよう動作可能であり;
前記フェイルオーバー・メモリ・コントローラは、前記障害を起こしたノードのノード・メモリに記憶されているアプリケーション・データの、置換ノードのノード・メモリへの、前記インターコネクトを通じた転送を制御するよう構成されており、
前記アプリケーションが走っている間であって前記ノード障害の前に、前記アプリケーションは、前記障害を起こしたノードおよび/または前記置換ノードのノード・メモリにおいて前記アプリケーションによって利用可能または利用不能であるノード・メモリの一部を登録する、
コンピュータ・システム。 - 前記フェイルオーバー・メモリ・コントローラが各ノードのために設けられる、
請求項15記載のコンピュータ・システム。 - 前記フェイルオーバー・メモリ・コントローラは、ノードの電力およびインターコネクト接続とは別個の電力接続およびインターコネクト接続を有する、
請求項15または16記載のコンピュータ・システム。 - フェイルオーバー・メモリ・コントローラおよびそれぞれノード・メモリを含む複数のノードを有するコンピュータ・システム上で走るデーモンであって、前記複数のノードおよびフェイルオーバー・メモリ・コントローラはみなインターコネクトによって接続されており、
当該デーモンは前記ノード上でのアプリケーションの実行をモニタリングし、
当該デーモンはノード障害を検出し、置換ノードを同定し、前記フェイルオーバー・メモリ・コントローラに、前記障害を起こしたノードのノード・メモリから前記置換ノードのノード・メモリに前記インターコネクトを通じてアプリケーション・データをコピーするよう命令し、
前記アプリケーションが走っている間であって前記ノード障害の前に、前記アプリケーションは、前記障害を起こしたノードおよび/または前記置換ノードのノード・メモリにおいて前記アプリケーションによって利用可能または利用不能であるノード・メモリの一部を登録する、
デーモン。 - 前記アプリケーションが前記複数のノードによって分散式に実行される、請求項1ないし12のうちいずれか一項記載の方法。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP14165974.8A EP2937785B1 (en) | 2014-04-25 | 2014-04-25 | A method of recovering application data |
| EP14165974.8 | 2014-04-25 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2015210812A JP2015210812A (ja) | 2015-11-24 |
| JP6398658B2 true JP6398658B2 (ja) | 2018-10-03 |
Family
ID=50624447
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2014240195A Expired - Fee Related JP6398658B2 (ja) | 2014-04-25 | 2014-11-27 | アプリケーション・データを回復する方法 |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US9852033B2 (ja) |
| EP (1) | EP2937785B1 (ja) |
| JP (1) | JP6398658B2 (ja) |
Families Citing this family (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2015016832A1 (en) | 2013-07-30 | 2015-02-05 | Hewlett-Packard Development Company, L.P. | Recovering stranded data |
| US9785480B2 (en) | 2015-02-12 | 2017-10-10 | Netapp, Inc. | Load balancing and fault tolerant service in a distributed data system |
| US20170046212A1 (en) * | 2015-08-13 | 2017-02-16 | Qualcomm Incorporated | Reducing system downtime during memory subsystem maintenance in a computer processing system |
| US11223681B2 (en) | 2020-04-10 | 2022-01-11 | Netapp, Inc. | Updating no sync technique for ensuring continuous storage service in event of degraded cluster state |
| US12282662B2 (en) | 2022-08-29 | 2025-04-22 | Hewlett Packard Enterprise Development Lp | Chassis servicing and migration in a scale-up NUMA system |
| US20250355747A1 (en) * | 2024-05-14 | 2025-11-20 | Bank Of America Corporation | Systems and methods for migrating application functionality using advanced computational models for data analysis and automated processing |
Family Cites Families (22)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0683314B2 (ja) * | 1985-07-01 | 1994-10-19 | 株式会社日立製作所 | 呼情報救済方式 |
| US5632013A (en) | 1995-06-07 | 1997-05-20 | International Business Machines Corporation | Memory and system for recovery/restoration of data using a memory controller |
| US5708771A (en) | 1995-11-21 | 1998-01-13 | Emc Corporation | Fault tolerant controller system and method |
| US5724501A (en) * | 1996-03-29 | 1998-03-03 | Emc Corporation | Quick recovery of write cache in a fault tolerant I/O system |
| US6360331B2 (en) * | 1998-04-17 | 2002-03-19 | Microsoft Corporation | Method and system for transparently failing over application configuration information in a server cluster |
| US6898727B1 (en) * | 2000-03-22 | 2005-05-24 | Emc Corporation | Method and apparatus for providing host resources for an electronic commerce site |
| US6675316B1 (en) * | 2000-07-12 | 2004-01-06 | International Business Machines Corporation | Method and system for recovery of the state of a failed CPU/cache/memory node in a distributed shared memory system |
| US6952792B2 (en) * | 2002-03-19 | 2005-10-04 | International Business Machines Corporation | Failover system for storage area network |
| US7028154B2 (en) * | 2002-06-18 | 2006-04-11 | Hewlett-Packard Development Company, L.P. | Procedure to reduce copy time for data backup from short-term to long-term memory |
| US7085886B2 (en) | 2003-05-28 | 2006-08-01 | International Buisness Machines Corporation | Autonomic power loss recovery for a multi-cluster storage sub-system |
| US7293197B2 (en) * | 2003-08-13 | 2007-11-06 | Micro Memory Llc | Non-volatile memory with network fail-over |
| US7536506B2 (en) * | 2004-06-21 | 2009-05-19 | Dot Hill Systems Corporation | RAID controller using capacitor energy source to flush volatile cache data to non-volatile memory during main power outage |
| US7337277B2 (en) * | 2004-11-18 | 2008-02-26 | International Business Machines Corporation | Apparatus, system, and method for flushing cache data |
| JP4572138B2 (ja) * | 2005-04-26 | 2010-10-27 | Necインフロンティア株式会社 | サーバ装置、サーバシステム、及びサーバシステムでの系切り換え方法 |
| US8099627B1 (en) | 2005-06-28 | 2012-01-17 | Symantec Operating Corporation | Persistent images of distributed shared memory segments and in-memory checkpoints |
| US7814065B2 (en) * | 2005-08-16 | 2010-10-12 | Oracle International Corporation | Affinity-based recovery/failover in a cluster environment |
| US7533197B2 (en) | 2006-11-08 | 2009-05-12 | Sicortex, Inc. | System and method for remote direct memory access without page locking by the operating system |
| US8055933B2 (en) * | 2009-07-21 | 2011-11-08 | International Business Machines Corporation | Dynamic updating of failover policies for increased application availability |
| US8555105B2 (en) * | 2010-04-12 | 2013-10-08 | International Business Machines Corporation | Fallover policy management in high availability systems |
| US9684573B2 (en) * | 2010-04-29 | 2017-06-20 | Veritas Technologies Llc | Dismounting a storage volume |
| US9329952B2 (en) * | 2010-12-07 | 2016-05-03 | International Business Machines Corporation | Reducing application downtime during failover |
| US9336103B1 (en) * | 2014-04-02 | 2016-05-10 | Veritas Us Ip Holdings Llc | Using a network bubble across multiple hosts on a disaster recovery site for fire drill testing of a multi-tiered application |
-
2014
- 2014-04-25 EP EP14165974.8A patent/EP2937785B1/en not_active Not-in-force
- 2014-11-06 US US14/534,383 patent/US9852033B2/en not_active Expired - Fee Related
- 2014-11-27 JP JP2014240195A patent/JP6398658B2/ja not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2015210812A (ja) | 2015-11-24 |
| EP2937785A1 (en) | 2015-10-28 |
| US20150309893A1 (en) | 2015-10-29 |
| EP2937785B1 (en) | 2016-08-24 |
| US9852033B2 (en) | 2017-12-26 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6398658B2 (ja) | アプリケーション・データを回復する方法 | |
| US8307363B2 (en) | Virtual machine system, restarting method of virtual machine and system | |
| US11704197B2 (en) | Basic input/output system (BIOS) device management | |
| US11226859B2 (en) | Systems and methods for error recovery | |
| US8219851B2 (en) | System RAS protection for UMA style memory | |
| US20160328229A1 (en) | System and method of online firmware update for baseboard management controller (bmc) devices | |
| US7007192B2 (en) | Information processing system, and method and program for controlling the same | |
| US9195553B2 (en) | Redundant system control method | |
| CN104836850A (zh) | 一种实例节点管理的方法及管理设备 | |
| JP2009516277A (ja) | 少なくとも2つのレジスタ付き処理ユニットを有するシステムにおいてエラーを除去する装置および方法 | |
| US10379931B2 (en) | Computer system | |
| CN108268302B (zh) | 实现设备启动的方法和装置 | |
| US20150082085A1 (en) | Multi-transactional system using transactional memory logs | |
| CN105653405A (zh) | 一种通用引导程序的故障处理方法及系统 | |
| EP2804105B1 (en) | Method of improving fault tolerance in a computing system arranged to find a computational solution | |
| CN116991637B (zh) | 嵌入式系统的运行控制方法及装置、电子设备及存储介质 | |
| JP3022768B2 (ja) | 仮想計算機システム | |
| CN115378800A (zh) | 无服务器架构分布式容错系统、方法、装置、设备及介质 | |
| US12554600B2 (en) | Single voting processor architecture | |
| US12197290B2 (en) | Lockstep processor recovery for vehicle applications | |
| JP7056057B2 (ja) | 情報処理装置、情報処理方法、情報処理システム、及び、コンピュータ・プログラム | |
| US20120233420A1 (en) | Fault-tolerant system, memory control method, and computer-readable recording medium storing programs | |
| US20070038849A1 (en) | Computing system and method | |
| Fu et al. | Research on rtos-integrated tmr for fault tolerant systems | |
| Lee et al. | Reliable Software Distributed Shared Memory Using Page Migration |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170804 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180418 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180515 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180627 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180807 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180820 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6398658 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| LAPS | Cancellation because of no payment of annual fees |