JP6944252B2 - Information processing device - Google Patents
Information processing device Download PDFInfo
- Publication number
- JP6944252B2 JP6944252B2 JP2017042397A JP2017042397A JP6944252B2 JP 6944252 B2 JP6944252 B2 JP 6944252B2 JP 2017042397 A JP2017042397 A JP 2017042397A JP 2017042397 A JP2017042397 A JP 2017042397A JP 6944252 B2 JP6944252 B2 JP 6944252B2
- Authority
- JP
- Japan
- Prior art keywords
- hardware
- time
- logical partition
- module
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
Description
本発明は、鉄道分野などの高い安全性が要求される分野で使用されるタブレット端末などの情報処理装置に関する。 The present invention relates to an information processing device such as a tablet terminal used in a field such as a railway field where high safety is required.
鉄道の分野では、例えば鉄道設備の保守作業において、タブレット端末を用いて係員へ様々な情報支援を行うことがある。このような場合、タブレット端末が異常動作し、係員が異常動作に気付かないと、作業の継続が困難になるばかりでなく、係員の安全、列車の安全又は列車の安定した運行に支障が生じる恐れがある。
特許文献1には、端末装置の情報処理に異常が生じたときに、この異常を速やかに発見できるようにした技術が提案されている。特許文献1の端末装置では、1台の端末装置の中で情報処理が二重に行われ、二重の処理結果の表示が時分割で交互に出力される。これにより、一方の情報処理に異常動作があれば、交互の表示出力に差異が生じ、使用者は、異常動作に速やかに気付くことができる。
In the field of railways, for example, in the maintenance work of railway equipment, various information support may be provided to the staff using a tablet terminal. In such a case, if the tablet terminal operates abnormally and the staff does not notice the abnormal operation, not only will it be difficult to continue the work, but also the safety of the staff, the safety of the train, or the stable operation of the train may be hindered. There is.
Patent Document 1 proposes a technique that enables prompt detection of an abnormality when an abnormality occurs in the information processing of the terminal device. In the terminal device of Patent Document 1, information processing is performed twice in one terminal device, and the display of the double processing result is alternately output in a time division manner. As a result, if there is an abnormal operation in one of the information processing, a difference occurs in the alternate display output, and the user can quickly notice the abnormal operation.
タブレット端末の異常動作は、OS(Operating System)のエラーに起因するもの、OS上で動作するアプリケーション・プログラム(以下「アプリケーション」と略す。)のエラーに起因するものに加え、ハードウェアのエラーに起因するものがある。
ハードウェアのエラーによりOS又はアプリケーションが停止した場合、これにより表示画像に変化が生じれば、タブレット端末の異常動作の発見が容易となる。しかしながら、表示画像の変化が無いままアプリケーション等が停止すると、異常動作の発見が遅れる場合がある。
Abnormal operation of the tablet terminal is caused by an error of the OS (Operating System), an error of an application program (hereinafter abbreviated as "application") running on the OS, and a hardware error. There is something to cause.
When the OS or application is stopped due to a hardware error, if the displayed image changes due to this, it becomes easy to detect the abnormal operation of the tablet terminal. However, if the application or the like is stopped without changing the displayed image, the detection of abnormal operation may be delayed.
また、特許文献1の技術のように情報処理を二重に行うといったソフトウェア対策だけでは、二重の情報処理の一方がエラーとなるような限られた条件のハードウェアエラーにしか対処することができない。従って、例えば、OSが停止するようなハードウェアエラーが生じた場合、特許文献1の技術では、異常動作の発見が遅れる場合がある。 In addition, software measures such as double information processing as in the technique of Patent Document 1 can deal only with hardware errors under limited conditions such that one of the double information processing causes an error. Can not. Therefore, for example, when a hardware error that causes the OS to stop occurs, the technique of Patent Document 1 may delay the discovery of abnormal operation.
本発明は、アプリケーションの実行中にハードウェアの異常を検出できる情報処理装置を提供することを目的とする。さらに、本発明は、ハードウェアの異常の予兆を検出でき、これにより、ハードウェアエラーに起因してアプリケーションが異常動作する前に、情報処理装置を交換するなどフェールセーフな対応をとることのできる情報処理装置を提供することを目的とする。 An object of the present invention is to provide an information processing device capable of detecting a hardware abnormality during execution of an application. Further, the present invention can detect a sign of a hardware abnormality, thereby taking a fail-safe measure such as replacing an information processing device before the application malfunctions due to a hardware error. The purpose is to provide an information processing device.
本発明は、上記目的を達成するため、
中央演算処理装置、メモリ及び表示装置を含むハードウェアと、
前記ハードウェアのリソースを複数に分割した第1論理パーティションと第2論理パーティションとを含む複数の論理パーティションを管理する仮想化部と、
前記第1論理パーティションで動作し、ユーザ・アプリケーションがゲストOSを介して稼動される仮想マシンと、
前記第2論理パーティションで動作し、前記ハードウェアの診断を行う診断モジュールと、
を備えることを特徴とする情報処理装置とした。
In order to achieve the above object, the present invention
Hardware including central processing unit, memory and display device,
A virtualization unit that manages a plurality of logical partitions including a first logical partition and a second logical partition in which the hardware resources are divided into a plurality of partitions, and a virtualization unit.
A virtual machine that operates in the first logical partition and the user application is operated via the guest OS.
A diagnostic module that operates in the second logical partition and diagnoses the hardware,
The information processing device is characterized by being equipped with.
この構成によれば、ユーザ・アプリケーションが稼動する第1論理パーティションと異なる第2論理パーティションにおいて診断モジュールがハードウェアの診断を行う。従って、ユーザ・アプリケーションの実行中でも、ユーザ・アプリケーションの実行を妨げずにハードウェアの診断を行い、ハードウェアの異常の予兆を検出することができる。 According to this configuration, the diagnostic module diagnoses the hardware in the second logical partition different from the first logical partition in which the user application runs. Therefore, even while the user application is being executed, the hardware can be diagnosed without interfering with the execution of the user application, and a sign of a hardware abnormality can be detected.
ここで、前記診断モジュールは、前記ハードウェアを用いて検査用の処理を実行し、前記検査用の処理の結果と、前記検査用の処理に要した時間とに基づいて、前記ハードウェアの診断を行う構成とするとよい。
この構成によれば、処理結果に異常は生じないものの、例えばハードウェア内部のエラー訂正等の影響により検査用の処理に要した時間が長くなるような異常の予兆を検出することができる。そして、予兆の段階で異常を検出することで、ハードウェアが異常動作してユーザ・アプリケーションが停止してしまうような状況を回避することができる。
Here, the diagnostic module executes an inspection process using the hardware, and diagnoses the hardware based on the result of the inspection process and the time required for the inspection process. It is preferable to have a configuration that performs.
According to this configuration, although no abnormality occurs in the processing result, it is possible to detect a sign of an abnormality in which the time required for the inspection processing becomes long due to the influence of, for example, error correction inside the hardware. Then, by detecting the abnormality at the sign stage, it is possible to avoid a situation in which the hardware operates abnormally and the user application is stopped.
さらに、前記診断モジュールは、前記第2論理パーティションへの前記リソースの割当率を示す情報と、前記検査用の処理に掛かった実時間とから、前記ハードウェアにより前記検査用の処理に費やされたプロセス時間を計算し、前記プロセス時間を前記検査用の処理に要した時間と見なして前記ハードウェアの診断を行う構成としてもよい。 Further, the diagnostic module is devoted to the inspection process by the hardware from the information indicating the allocation ratio of the resource to the second logical partition and the real time taken for the inspection process. The hardware may be diagnosed by calculating the process time and regarding the process time as the time required for the inspection process.
例えば中央演算処理装置のリソースが分割されて第1論理パーティションと第2論理パーティションとに割り当てられている場合を想定する。この場合、第2論理パーティションのリソースを用いて検査用の処理を実行すると、検査用の処理に掛かった実時間は、第2論理パーティションへのリソースの割当率に応じて変化する。そこで、上記の構成によれば、ハードウェアが検査用の処理に費やしたプロセス時間に基づいてハードウェアの診断を行う。これにより、ユーザ・アプリケーションが動作している状態でも、検査用の処理に要した時間を適切に判定し、ハードウェアの診断を正確に行うことができる。 For example, assume that the resources of the central processing unit are divided and allocated to the first logical partition and the second logical partition. In this case, when the inspection process is executed using the resources of the second logical partition, the real time required for the inspection process changes according to the allocation rate of the resources to the second logical partition. Therefore, according to the above configuration, the hardware is diagnosed based on the process time spent by the hardware for the inspection process. As a result, even when the user application is running, the time required for the inspection process can be appropriately determined, and the hardware can be accurately diagnosed.
さらに、前記割当率を示す情報には、前記第2論理パーティションに割り当てられた前記中央演算処理装置のコア数、時分割によって前記第2論理パーティションにより専有される前記中央演算処理装置の時間、及び前記中央演算処理装置の動作クロック周波数が含まれる構成としてもよい。
このような構成により、複数のコアを含み、動作クロック周波数が可変な情報処理装置に対応して、ハードウェアの診断を正確に行うことができる。
Further, the information indicating the allocation rate includes the number of cores of the central processing unit allocated to the second logical partition, the time of the central processing unit occupied by the second logical partition by time division, and the time of the central processing unit. The configuration may include the operating clock frequency of the central processing unit.
With such a configuration, it is possible to accurately diagnose the hardware corresponding to the information processing apparatus including a plurality of cores and having a variable operating clock frequency.
さらに、本発明に係る情報処理装置は、前記第2論理パーティションで動作し、前記診断モジュールにより診断の結果が異常である場合に、前記ハードウェアを用いて異常を報知する報知モジュールを備えてもよい。
この構成によれば、ハードウェアエラーにより情報処理装置が異常動作する前に、ハードウェアの異常の予兆を使用者に報知することができる。これにより、ユーザは、情報処理装置の交換を行うなどのフェールセーフな対応をとることができる。
Further, the information processing apparatus according to the present invention may include a notification module that operates in the second logical partition and notifies the abnormality by using the hardware when the diagnosis result by the diagnosis module is abnormal. good.
According to this configuration, it is possible to notify the user of a sign of a hardware abnormality before the information processing apparatus malfunctions due to a hardware error. As a result, the user can take fail-safe measures such as exchanging the information processing device.
本発明によれば、アプリケーションの実行中にハードウェアの異常の予兆を検出でき、これにより、ハードウェアエラーに起因してアプリケーションが異常動作する前に、情報処理装置を交換するなどフェールセーフな対応をとることができる。 According to the present invention, it is possible to detect a sign of a hardware abnormality during execution of an application, thereby fail-safe measures such as replacing an information processing device before the application malfunctions due to a hardware error. Can be taken.
以下、本発明の実施の形態について図面を参照して詳細に説明する。
図1は、本発明の実施形態に係る情報処理装置を示す構成図である。図2は、本発明の実施形態に係る情報処理装置の論理構造を示す構成図である。
本発明の実施形態に係る情報処理装置1は、例えばタブレット端末であり、図1に示すように、CPU(Central Processing Unit:中央演算処理装置)11、不揮発性メモリ12、メモリ16、表示装置17、タッチパネル18及び通信装置19を備える。表示装置17は、例えば液晶ディスプレイなどの画像表示が可能な装置である。タッチパネル18は表示装置17上に設けられ、指又はデジタルペンなどを近接させることで近接した位置の情報を入力できる入力装置である。
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
FIG. 1 is a configuration diagram showing an information processing device according to an embodiment of the present invention. FIG. 2 is a configuration diagram showing a logical structure of the information processing apparatus according to the embodiment of the present invention.
The information processing device 1 according to the embodiment of the present invention is, for example, a tablet terminal, and as shown in FIG. 1, a CPU (Central Processing Unit) 11, a
不揮発性メモリ12には、仮想化環境を構築する仮想化OSプログラム13が格納され、さらに、仮想マシン記憶部14と、監視パーティション記憶部15とが設けられる。仮想マシン記憶部14には、ゲストOSプログラム32aとユーザ・アプリケーション31とが格納される。監視パーティション記憶部15には、監視ソフトウェア41が格納される。
The
<仮想化システムの構成>
情報処理装置1の起動時、CPU11は、先ず、仮想化OSプログラム13を実行する。これにより、図2に示すように、仮想化部24、仮想化部インタフェース52、サービス・ソフトウェア51、仮想マシン33及び高信頼型アプリケーション・インタフェース42が実現される。以下、アプリケーション・インタフェースを「API」と記す。
<Virtualization system configuration>
When the information processing device 1 is started, the
仮想化部24は、ハードウェア・リソース25を時分割或いは複数の領域に分割した複数の論理パーティションを構築し、これらの管理を行う。複数の論理パーティションには、ゲストパーティション(第1論理パーティションに相当)21、監視パーティション22(第2論理パーティションに相当)及びシステムパーティション23が含まれる。また、仮想化部24は、各パーティション間のデータの送受信を行う。ゲストパーティション21と監視パーティション22とは、仮想化部24を介してデータの送受信が可能である他、互いに独立している。従って、ゲストパーティション21で情報処理上の異常が発生しても、この異常が監視パーティション22の情報処理へ容易に波及することはない。
The
仮想化部インタフェース52は、サービス・ソフトウェア51と仮想化部24又はハードウェア・リソース25とを結ぶためのAPIを有するサブシステムである。サービス・ソフトウェア51は、仮想化環境の管理のために仮想化部24が利用する各種のサービスを提供する。
The
仮想マシン33は、ゲストパーティション21上で動作し、ハードウェア・リソース25を模擬して、ゲストOS32とハードウェア・リソース25とを結ぶソフトウェアである。仮想マシン33は、1つの情報処理装置のように振る舞うことで、ゲストOS32は仮想マシン33上で稼動する。仮想マシン33は、ゲストパーティション21に割り当てられたハードウェア・リソース25に加え、仮想化部24と通信を行うための機能モジュールを備える。ゲストOS32は、この機能モジュールを駆動するためのドライバがインストールされることで、機能モジュールを介して仮想化部24と通信を行うことが可能となる。
The
高信頼型API42は、監視パーティション22上のソフトウェアと仮想化部24又はハードウェア・リソース25とを結ぶための高信頼型のAPIを有するサブシステムである。高信頼型のAPIとしては、例えばPOSIX(Portable operating system interface)などを採用できる。
The highly
<ゲストパーティション>
ゲストパーティション21においては、CPU11の分割されたリソースが、仮想マシン記憶部14のゲストOSプログラム32aを実行する。これにより、図2に示すように、仮想マシン33上でゲストOS32が動作する。さらに、CPU11の分割されたリソースは、ゲストOS32において仮想マシン記憶部14のユーザ・アプリケーション31を実行する。これにより、ゲストOS32上でユーザ・アプリケーション31が動作する。図2においてユーザ・アプリケーション31は、メモリ16に展開されてCPU11によって実行されているプロセスの状態を表わしている。
<Guest partition>
In the
ゲストOS32は、例えば一般的なタブレット端末用のOSである。ゲストOS32は、仮想マシン33を1つの物理マシンのように認識し、1つの物理マシン上で動作するときと同様に動作する。さらに、ゲストOS32には、仮想化部24とデータの送受信を行うための機能モジュールのドライバが組み込まれ、これにより、ゲストOS32と仮想化部24との間でデータの送受信が可能となる。
ユーザ・アプリケーション31は、例えば、鉄道設備の保守作業を支援する支援ソフトウェアである。ユーザ・アプリケーション31は、1つの物理マシン上で動作する場合と同様に、仮想マシン33上で動作する。
The
The
<監視パーティション>
監視パーティション22においては、CPU11の分割されたリソースが、監視パーティション記憶部15の監視ソフトウェア41を実行する。これにより、高信頼型API42上で監視ソフトウェア41が動作する。図2において監視ソフトウェア41は、メモリ16に展開されてCPU11によって実行されているプロセスの状態を表わしている。
監視ソフトウェア41は、主にユーザ・アプリケーション31の動作の監視と異常報知とを行う。監視ソフトウェア41は、図2に示すように、キープ・アライブ・モジュール411、報知モジュール412、診断モジュール413、ロギングモジュール414、演算照合モジュール415及び状態監視(health monitor)モジュール416を備える。
<Monitoring partition>
In the
The
キープ・アライブ・モジュール411は、ゲストパーティション21上のアプリケーションと繰り返し通信を行って、アプリケーションの動作確認を行う。
診断モジュール413は、情報処理装置1の起動時と動作中とにハードウェアの診断処理を行う。
ロギングモジュール414は、仮想マシン33上のゲストOS32と通信を行って、ユーザ・アプリケーションによる通信等のアクセスログ及び操作ログの収集および保存を行う。
The keep-
The
The
報知モジュール412は、例えば表示装置17の出力によって使用者に報知を行う。監視パーティション22には、ゲストパーティション21よりも高い優先度で表示装置17のリソースが割り当てられている。これにより、仮にゲストパーティション21から表示装置17に画像出力が行われているときであっても、報知モジュール412はこの画像に上書きするように表示装置17に画像を出力することができる。情報処理装置1が振動装置又は表示ランプなどの報知デバイスを有する場合には、報知モジュール412はこれらの報知デバイスを動作させて報知を行ってもよい。
The
演算照合モジュール415は、ユーザ・アプリケーション31から照合要求がなされた処理について自ら同様の処理を行って処理結果を照合する。演算照合モジュール415は、この照合の処理によりユーザ・アプリケーション31の異常動作を検出する。
状態監視モジュール416は、監視パーティション22内で生じた例外又はタイムアウトに応じた所定の処理を実行する。
The
The
<CPU診断処理>
続いて、診断モジュール413によるCPU11の診断処理について、フローチャートとシーケンス図とを参照しながら説明する。
図3は、CPUの診断処理の流れを示すシーケンス図である。図4は、診断モジュールにより実行されるCPUの診断処理の手順を示すフローチャートである。
<CPU diagnostic processing>
Subsequently, the diagnostic processing of the
FIG. 3 is a sequence diagram showing the flow of the diagnostic processing of the CPU. FIG. 4 is a flowchart showing a procedure of CPU diagnostic processing executed by the diagnostic module.
診断モジュール413は、図3に示すように、ユーザ・アプリケーション31が実行されている間、CPU11の診断処理J1、J1aを定期的に繰り返し実行する。診断処理J1、J1aが開始されると、先ず、診断モジュール413は検査処理J2を実行する。検査処理J2において診断モジュール413は、実時間の計測を開始し(図4のステップS11)、所定の演算処理を実行し(ステップS12)、実時間T1の計測を終了する(ステップS13)。
As shown in FIG. 3, the
検査処理J2が終了すると、診断モジュール413は、演算結果が正常か否かを判別する(ステップS14)。その結果、診断モジュール413は、正常な演算結果が得られなければ異常と判定する。一方、演算結果が正常である場合、続いて、診断モジュール413は、検査処理J2に要した時間からCPU11に異常の予兆が無いか判定する。
When the inspection process J2 is completed, the
一般に、CPU11及びメモリ16には、内部に記憶されたデータの一部が反転されるようなエラーが生じても、デバイス内でこれを検出しかつ訂正を行うエラー訂正機能が備わる。そして、エラーがある場合と無い場合とで処理に費やす時間が変化する。また、メモリ16には、不良となったブロックを管理対象から外し、以後に使用されないようにする機能が備わるものがあり、不良ブロックが検出された際には、これに対処するための処理により時間が費やされる。さらに、不揮発性の領域を有するメモリ16の場合では、セルの劣化によって不揮発性の領域の書込時間が長くなることがある。このような機能及び作用があるため、劣化によりハードウェアエラーが生じるような場合には、その前段でハードウェア内部のエラー訂正の動作等により、処理に要する時間が長くなる。
Generally, the
そこで、診断モジュール413は、CPU11がステップS12の演算処理に要した時間に基づいてCPU11に異常の予兆が無いか判定する。しかし、CPU11は、ステップS12の演算処理を、ユーザ・アプリケーション31の処理と並列して実行している。従って、ステップS12の演算処理の開始から終了までに掛かった実時間には、CPU11がユーザ・アプリケーション31の処理に費やした時間が含まれる。すなわち、CPU11が内部でエラー訂正等が行われずに、正常にステップS12の演算処理を実行したとしても、監視パーティション22へのCPU11のリソースの割当率に基づいて、処理に掛かった実時間が変化する。
Therefore, the
そこで、診断モジュール413は、先ず、監視パーティション22のCPU11のリソースの割当率μを仮想化部24から読み出す(ステップS15)。割当率の情報には、監視パーティション22に割り当てられたCPU11のコア数、時分割により割り当てられたCPU時間、演算処理中の動作クロック周波数が含まれる。CPU時間とは、時分割により監視パーティション22の処理が専有するCPU11の時間を意味する。監視パーティション22に割り当てられたCPU11のリソースの割当率μは、例えば、コア数、CPU時間、CPU11の動作クロック周波数の各要素の割当率を乗算して数値化することができる。ここで、コア数の割当率は、最大のコア数に対する、割り当てられたコア数の割合により表わせばよい。また、CPU時間の割当率は、割り当てられた時分割の割合により表わせばよい。動作クロックの周波数の割当率は、最速となる周波数に対する演算処理中の周波数の割合により表わせばよい。
Therefore, the
次に、診断モジュール413は、ステップS13で計測された実時間T1と割当率μとからステップS12の演算処理に費やされたCPU11のプロセス時間Tpを計算する(ステップS16)。プロセス時間Tpは、例えば実時間T1と割当率μとを乗算して得られる。プロセス時間Tpを計算したら、診断モジュール413は、プロセス時間TpがCPU11の異常の予兆と判断できる閾値Tth1と比較する(ステップS17)。ここで、プロセス時間Tpが閾値Tth1以下であれば判定結果は正常となり、閾値Tth1より長ければ判定結果は異常となる。
Next, the
ステップS17の結果がYESであれば、診断モジュール413は、正常の判定により1回の診断処理J1を終了する。ステップS17の結果がNOであれば、診断モジュール413は、異常の判定により、仮想化部24へゲストパーティション21の停止要求を行い(ステップS18)、報知モジュール412へCPU11の異常を報知する表示要求を行う(ステップS19)。そして、診断処理J1aが終了される。
If the result of step S17 is YES, the
図3の異常の予兆が検出された診断処理J1aのシーケンスに示すように、仮想化部24へゲストパーティション停止要求が発行されると、仮想化部24は、ゲストパーティション21へのハードウェア・リソース25の割当を停止する。これにより、仮想マシン33、ゲストOS32、ユーザ・アプリケーション31が停止する。さらに、異常判定J3がなされて報知モジュール412へ異常を報知する表示要求がなされると、報知モジュール412が表示装置17へ例えば「CPU異常」などの異常を報知する画像出力を行う。このとき、たとえ表示装置17にユーザ・アプリケーション31の画像出力が行われていても、報知モジュール412はこの画像に上書きするように異常を報知する画像出力を行うことができる。なお、情報処理装置1が振動装置又は表示ランプなどの報知デバイスを有する場合には、報知モジュール412はこれらの報知デバイスを動作させて報知を行ってもよい。
As shown in the sequence of the diagnostic process J1a in which the sign of the abnormality is detected in FIG. 3, when the guest partition stop request is issued to the
<メモリ診断処理>
続いて、診断モジュール413によるメモリ16の診断処理について、フローチャートとシーケンス図とを参照しながら説明する。
図5は、メモリの診断処理の流れを示すシーケンス図である。図6は、診断モジュールにより実行されるメモリの診断処理の手順を示すフローチャートである。
<Memory diagnostic processing>
Subsequently, the diagnostic processing of the
FIG. 5 is a sequence diagram showing a flow of memory diagnostic processing. FIG. 6 is a flowchart showing a procedure of memory diagnostic processing executed by the diagnostic module.
診断モジュール413は、図5に示すように、ユーザ・アプリケーション31が実行されている間、メモリ16の診断処理J5、J5aを定期的に繰り返し実行する。診断処理J5、J5aが開始されると、先ず、診断モジュール413は検査処理J6を実行する。メモリ16の検査処理J6において診断モジュール413は、実時間の計測を開始し(図6のステップS21)、メモリ16に所定のリード・ライト処理を実行し(ステップS22)、実時間T1の計測を終了する(ステップS23)。リード・ライト処理において診断モジュール413は、監視パーティション22に割り当てられたメモリ16の領域に、所定のビットパターンのデータを書き込み、その後、このデータを読み出す。
As shown in FIG. 5, the
検査処理J6が終了すると、診断モジュール413は、処理結果が正常か否かを判別する(ステップS24)。すなわち、診断モジュール413は、読み出したデータのビットパターンが書き込んだものと同一か否かを判別する。同一であれば正常を示し、異なれば異常を示す。判別の結果、診断モジュール413は、正常な処理結果が得られなければ異常と判定する。一方、処理結果が正常である場合、診断モジュール413は、検査処理J6に要したプロセス時間Tpからメモリ16に異常の予兆が生じていないか判定する。
When the inspection process J6 is completed, the
上述したように、メモリ16にハードウェアエラーが生じるような場合には、その前段でメモリ16の内部のエラー訂正の動作、或いは、不揮発性の領域への書込み時間の増大により、メモリ16へのリード・ライト処理に要する時間が長くなる。また、リード・ライト処理に掛かる実時間は、監視パーティション22に割り当てられるハードウェア・リソースの割当率、具体的にはCPU11のリソースの割当率に基づいて変化する。
As described above, when a hardware error occurs in the
従って、診断モジュール413は、CPU11がステップS22のリード・ライト処理に要したプロセス時間Tpに基づいてメモリ16の異常の予兆の有無を判定する。検査処理J6を実行したら、診断モジュール413は、監視パーティション22のCPU11のリソースの割当率μを仮想化部24から読み出す(ステップS25)。割当率μは、図4で示したものと同一である。
Therefore, the
次に、診断モジュール413は、ステップS23で計測された実時間T1と割当率μとからステップS22のリード・ライト処理に費やされたCPU11のプロセス時間Tpを計算する(ステップS26)。プロセス時間Tpは、例えば実時間T1と割当率μとを乗算して得ることができる。続いて、診断モジュール413は、プロセス時間Tpがメモリ16の異常の予兆と判断できる閾値Tth2と比較する(ステップS27)。ここで、プロセス時間Tpが閾値Tth2以下であれば判定結果は正常となり、閾値Tth2より長ければ判定結果は異常となる。
Next, the
ステップS27の結果がYESであれば、診断モジュール413は、正常の判定により1回の診断処理J5を終了する。ステップS27の結果がNOであれば、診断モジュール413は、異常の判定により、仮想化部24へゲストパーティション21の停止要求を行い(ステップS28)、報知モジュール412へメモリ16の異常を報知する表示要求を行う(ステップS29)。そして、診断処理J5aが終了される。
If the result of step S27 is YES, the
図5の異常の予兆が検出された診断処理J5aのシーケンスに示すように、仮想化部24へゲストパーティション停止要求が発行されると、仮想化部24は、ゲストパーティション21へのハードウェア・リソース25の割当を停止する。これにより、仮想マシン33、ゲストOS32、ユーザ・アプリケーション31が停止する。さらに、異常判定J7がなされて報知モジュール412へ異常を報知する表示要求がなされると、報知モジュール412が表示装置17へ例えば「メモリ異常」などの異常を報知する画像出力を行う。このとき、たとえ表示装置17にユーザ・アプリケーション31の画像出力が行われていても、報知モジュール412はこの画像に上書きするように異常を報知する画像出力を行うことができる。なお、情報処理装置1が振動装置又は表示ランプなどの報知デバイスを有する場合には、報知モジュール412はこれらの報知デバイスを動作させて報知を行ってもよい。
As shown in the sequence of the diagnostic process J5a in which the sign of the abnormality is detected in FIG. 5, when the guest partition stop request is issued to the
以上のように、本実施形態の情報処理装置1によれば、ユーザ・アプリケーション31が稼動するゲストパーティション21と異なる監視パーティション22において、診断モジュール413がハードウェアの診断を行う。従って、ユーザ・アプリケーション31の実行中でも、この実行を妨げることなくハードウェアの診断を行って、ハードウェアの異常の予兆を検出することができる。
また、本実施形態の情報処理装置1によれば、診断モジュール413は、検査処理J2、J6の処理結果だけでなく、検査処理J2、J6に要した時間に基づいてハードウェアの診断を行う。したがって、処理結果に異常が生じないものの、ハードウェア内部のエラー訂正等の影響により処理時間が長くなるようなハードウェアの異常の予兆を検出することができる。これにより、ハードウェアが異常動作してユーザ・アプリケーション31が停止してしまうような状況を事前に回避できる。例えば、使用者は、ユーザ・アプリケーション31に異常が生じる前に、異常の予兆により情報処理装置1を再起動したり、情報処理装置1を交換したりするなどフェールセーフな対応をとることができる。
As described above, according to the information processing apparatus 1 of the present embodiment, the
Further, according to the information processing apparatus 1 of the present embodiment, the
さらに、本実施形態の情報処理装置1によれば、診断モジュール413は、監視パーティション22に割り当てられているハードウェアの割当率、具体的にはCPU11のリソースの割当率μを取得する。そして、診断モジュール413は、検査処理J2に掛かった実時間T1と割当率μとから、検査処理J2に要したプロセス時間Tpを計算し、プロセス時間Tpに基づいてハードウェアの診断を行う。このような処理により、ユーザ・アプリケーション31の実行に要する時間を除いて検査処理J2に要した時間を求めることができ、ハードウェアの診断を正確に行うことができる。
Further, according to the information processing apparatus 1 of the present embodiment, the
以上、本発明の各実施の形態について説明したが、本発明は上記の実施の形態に限られるものではない。例えば、上記実施形態では、ハードウェアの診断処理として診断モジュール413がCPU11とメモリ16との診断処理を行う例を示した。しかし、診断対象は、CPU11又はメモリ16に限られず、通信装置19又は不揮発性メモリ12など様々なハードウェアについても同様に診断対象とすることができる。また、上記実施形態では、監視ソフトウェア41は、ハードウェアの異常と判定した場合に、報知モジュール412によって使用者に異常を報知する構成を例にとって説明した。しかし、監視ソフトウェア41に、使用者に報知する以外のフェールセーフを実現するための処理を行う機能モジュールが設けられる場合、監視ソフトウェア41は、動作異常が確認された場合に、上記の機能モジュールを駆動する構成を採用してもよい。
Although each embodiment of the present invention has been described above, the present invention is not limited to the above-described embodiment. For example, in the above embodiment, an example is shown in which the
また、上記実施形態では、ハードウェア・リソースの割当率を示す情報として、CPU11のコア数、CPU時間、CPU11の動作クロックの周波数を例に挙げた。しかし、論理パーティションへのコアの割当ができないCPU、或いは、動作クロックの周波数が一定のCPUを用いている場合には、割当率を示す情報からコア数又は動作クロックの周波数の情報が省かれてもよい。また、CPU11のコア数、CPU時間、動作クロックの周波数の他に、割当率によって検査用の処理の時間に影響が生じるハードウェア・リソースがあれば、このリソースの割当率が考慮されてプロセス時間Tpが計算されてもよい。また、仮想化部は、ハイパーバイザー型であっても、ホストOS型であってもよい。その他、実施の形態で示した細部は、発明の趣旨を逸脱しない範囲で適宜変更可能である。
Further, in the above embodiment, the number of cores of the
1 情報処理装置
11 CPU
12 不揮発性メモリ
13 仮想化OSプログラム
14 仮想マシン記憶部
15 監視パーティション記憶部
16 メモリ
17 表示装置
18 タッチパネル
19 通信装置
21 ゲストパーティション(第1論理パーティション)
22 監視パーティション(第2論理パーティション)
23 システムパーティション
25 ハードウェア・リソース
31 ユーザ・アプリケーション
32 ゲストOS
33 仮想マシン
32a ゲストOSプログラム
41 監視ソフトウェア
42 高信頼型アプリケーション・インタフェース
51 サービス・ソフトウェア
52 仮想化部インタフェース
411 キープ・アライブ・モジュール
412 報知モジュール
413 診断モジュール
414 ロギングモジュール
415 演算照合モジュール
416 状態監視モジュール
1
12
22 Monitoring partition (second logical partition)
23
33
Claims (4)
前記ハードウェアのリソースを複数に分割した第1論理パーティションと第2論理パーティションとを含む複数の論理パーティションを管理する仮想化部と、
前記第1論理パーティションで動作し、ユーザ・アプリケーションがゲストOSを介し
て稼動される仮想マシンと、
前記第2論理パーティションで動作し、前記ハードウェアの診断を行う診断モジュールと、
を備え、
前記診断モジュールは、前記ハードウェアを用いて検査用の処理を実行し、前記検査用の処理の結果と、前記検査用の処理に要した時間とに基づいて、前記ハードウェアの診断を行うことを特徴とする情報処理装置。 Hardware including central processing unit, memory and display device,
A virtualization unit that manages a plurality of logical partitions including a first logical partition and a second logical partition in which the hardware resources are divided into a plurality of partitions, and a virtualization unit.
A virtual machine that operates in the first logical partition and the user application is operated via the guest OS.
A diagnostic module that operates in the second logical partition and diagnoses the hardware,
With
The diagnostic module executes an inspection process using the hardware, and diagnoses the hardware based on the result of the inspection process and the time required for the inspection process. An information processing device characterized by.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017042397A JP6944252B2 (en) | 2017-03-07 | 2017-03-07 | Information processing device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017042397A JP6944252B2 (en) | 2017-03-07 | 2017-03-07 | Information processing device |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2018147277A JP2018147277A (en) | 2018-09-20 |
| JP6944252B2 true JP6944252B2 (en) | 2021-10-06 |
Family
ID=63592203
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2017042397A Active JP6944252B2 (en) | 2017-03-07 | 2017-03-07 | Information processing device |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP6944252B2 (en) |
Family Cites Families (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH02232711A (en) * | 1989-03-07 | 1990-09-14 | Fujitsu Ltd | Time-out signal generator for computer |
| JP2004030026A (en) * | 2002-06-24 | 2004-01-29 | Hitachi Ltd | Product expiration date monitoring method and monitoring system |
| JP4416626B2 (en) * | 2004-11-02 | 2010-02-17 | 富士通株式会社 | Processing time calculation program |
| JP2010134740A (en) * | 2008-12-05 | 2010-06-17 | Nec Corp | Timeout determination device, timeout determination method, and program |
| JP2014021577A (en) * | 2012-07-13 | 2014-02-03 | Nec Computertechno Ltd | Apparatus, system, method, and program for failure prediction |
| JP6060781B2 (en) * | 2013-04-03 | 2017-01-18 | 三菱電機株式会社 | Fault diagnosis apparatus and program |
| JP2015049876A (en) * | 2013-09-05 | 2015-03-16 | 株式会社日立製作所 | Test system and method |
| US9262190B2 (en) * | 2013-11-19 | 2016-02-16 | Xerox Corporation | Method and system for managing virtual machines in distributed computing environment |
-
2017
- 2017-03-07 JP JP2017042397A patent/JP6944252B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| JP2018147277A (en) | 2018-09-20 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US8024609B2 (en) | Failure analysis based on time-varying failure rates | |
| US7979749B2 (en) | Method and infrastructure for detecting and/or servicing a failing/failed operating system instance | |
| US8176365B2 (en) | Computer apparatus and processor diagnostic method | |
| WO2017063505A1 (en) | Method for detecting hardware fault of server, apparatus thereof, and server | |
| US9026865B2 (en) | Software handling of hardware error handling in hypervisor-based systems | |
| US20130013953A1 (en) | Health monitoring of applications in a guest partition | |
| CN103176876B (en) | A kind of computer On-line self-diagnosis method of highly effective and safe and self-checking unit | |
| CN104737134A (en) | System and method for operating system independent hardware verification | |
| US20130191678A1 (en) | In situ processor re-characterization | |
| US20160259578A1 (en) | Apparatus and method for detecting performance deterioration in a virtualization system | |
| TW201500919A (en) | System and method of remote debugging BMC | |
| JP5529686B2 (en) | Computer apparatus abnormality inspection method and computer apparatus using the same | |
| WO2013030976A1 (en) | Information processing device, method, and program | |
| JP6944252B2 (en) | Information processing device | |
| JP6217086B2 (en) | Information processing apparatus, error detection function diagnosis method, and computer program | |
| JP2012150661A (en) | Processor operation inspection system and its inspection method | |
| CN118093265A (en) | A PCIE device fault processing method and server | |
| JP2013206046A (en) | Information processing apparatus, start time diagnostic method, and program | |
| CN116340031A (en) | Computer system, method, and non-transitory computer readable medium for detecting deviation | |
| JP6944799B2 (en) | Information processing device | |
| JP2012181737A (en) | Computer system | |
| JP5733515B2 (en) | Embedded equipment with RAS function | |
| CN109086179B (en) | Processing method and device under program exception condition | |
| CN120723526B (en) | Methods and equipment for determining communication faults | |
| JP5832408B2 (en) | Virtual computer system and control method thereof |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200210 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210120 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210126 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210318 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210622 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210816 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210831 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210910 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6944252 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |