Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP7532882B2 - 障害判定装置、障害判定方法、及び、障害判定プログラム - Google Patents
[go: Go Back, main page]

JP7532882B2 - 障害判定装置、障害判定方法、及び、障害判定プログラム - Google Patents

障害判定装置、障害判定方法、及び、障害判定プログラム Download PDF

Info

Publication number
JP7532882B2
JP7532882B2 JP2020084899A JP2020084899A JP7532882B2 JP 7532882 B2 JP7532882 B2 JP 7532882B2 JP 2020084899 A JP2020084899 A JP 2020084899A JP 2020084899 A JP2020084899 A JP 2020084899A JP 7532882 B2 JP7532882 B2 JP 7532882B2
Authority
JP
Japan
Prior art keywords
fault determination
operating environment
fault
determination target
predetermined operating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020084899A
Other languages
English (en)
Other versions
JP2021179820A (ja
Inventor
剛 阿久津
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2020084899A priority Critical patent/JP7532882B2/ja
Publication of JP2021179820A publication Critical patent/JP2021179820A/ja
Application granted granted Critical
Publication of JP7532882B2 publication Critical patent/JP7532882B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • Computer And Data Communications (AREA)

Description

本発明は、障害判定装置、障害判定方法、及び、障害判定プログラムに関する。
現在、様々な分野において、多くのシンクライアントシステムが構築されている。シンクライアントシステムでは、例えば、仮想基盤上に大量の仮想PC(Personal Computer)を備え、コネクションブローカによって、ユーザに対して適切に仮想PCを割り当てる。コネクションブローカは、仮想基盤においてユーザに対するリソースの割り当て制御を行うコンポーネントである。ユーザは端末装置から仮想PCへ接続して仮想PCにおいて業務を行うことにより、端末装置側に情報を残すことなく実業務を行うことができる。
このようなシンクライアントシステムを運用するためには、例えば数千から数万台という多数の仮想PC、及びユーザごとの環境設定を反映するユーザプロファイル(ユーザ環境とも称する)等を、ユーザ数分管理する必要がある。そして、このような多数のユーザによって共有される仮想基盤の上で多数のユーザプロファイルのもとで動作する仮想PCは、様々な要因によって障害が発生することがあるので、障害への対応が困難となる。
例えばユーザ環境によって導入しているアプリケーションが異なることから、障害を適切に判定するためには多数のログを確認する必要がある。また、すべてのアプリケーションあるいはシステム管理機能が必ずしもログを正常に出力しているとは限らないことから、システムの正常性を示すログが得られたとしても、実際には障害が発生している場合もある。したがって、このような大規模なシンクライアントシステムにおける障害の判定を適切に行う技術への期待が高まってきている。
このような技術に関連する技術として、特許文献1には、端末装置と接続先装置との間の接続時間を、端末装置と接続先装置との組み合わせ毎に測定し、その測定結果に基づいて、接続先装置の動作が正常か否かを判断するシステムが開示されている。このシステムは、例えば判定対象が仮想PCを含むシンクライアントシステムである場合、コネクションブローカによって収集されるユーザによる仮想PCへの接続状況等を表す情報を利用して、当該仮想PCにおける障害の発生を判定する。
特許第6380774号公報
コンピュータシステムでは、例えばソフトウェアの更新あるいは追加など、その動作環境の設定が変更されることに起因して障害が発生することがある。このような障害は、例えば、当該動作環境に含まれる論理不正、あるいは、コンピュータシステムの構成と当該動作環境との組み合わせに存在する問題などによって発生する。例えば上述した大規模なシンクライアントシステムでは、多数のユーザによってユーザプロファイルの変更が頻繁に行われており、その変更に起因した様々な障害が発生する。したがって、障害を判定する対象装置に設定した動作環境が不正であるか否かを効率的に判定する技術が求められるが、特許文献1は、このような技術について、特に言及していない。
本発明の主たる目的は、障害を判定する対象装置に設定した動作環境が不正であるか否かを効率的に判定する障害判定装置等を提供することにある。
本発明の一態様に係る障害判定装置は、複数の障害判定対象装置のうち、所定の動作環境を設定する第一の障害判定対象装置と、前記所定の動作環境を設定しない第二の障害判定対象装置とを決定する決定手段と、前記第一の障害判定対象装置に対して前記所定の動作環境が設定されたのち、前記第一及び第二の障害判定対象装置の動作を監視する監視手段と、前記第一及び第二の障害判定対象装置の間において、前記動作の監視結果を比較し、その比較結果が基準を満たす場合に、前記所定の動作環境が不正であると判定する判定手段と、を備える。
上記目的を達成する他の見地において、本発明の一態様に係る障害判定方法は、情報処理装置によって、複数の障害判定対象装置のうち、所定の動作環境を設定する第一の障害判定対象装置と、前記所定の動作環境を設定しない第二の障害判定対象装置とを決定し、前記第一の障害判定対象装置に対して前記所定の動作環境が設定されたのち、前記第一及び第二の障害判定対象装置の動作を監視し、前記第一及び第二の障害判定対象装置の間において、前記動作の監視結果を比較し、その比較結果が基準を満たす場合に、前記所定の動作環境が不正であると判定する。
また、上記目的を達成する更なる見地において、本発明の一態様に係る障害判定プログラムは、複数の障害判定対象装置のうち、所定の動作環境を設定する第一の障害判定対象装置と、前記所定の動作環境を設定しない第二の障害判定対象装置とを決定する決定処理と、前記第一の障害判定対象装置に対して前記所定の動作環境が設定されたのち、前記第一及び第二の障害判定対象装置の動作を監視する監視処理と、前記第一及び第二の障害判定対象装置の間において、前記動作の監視結果を比較し、その比較結果が基準を満たす場合に、前記所定の動作環境が不正であると判定する判定処理と、をコンピュータに実行させる。
更に、本発明は、係る障害判定プログラム(コンピュータプログラム)が格納された、コンピュータ読み取り可能な、不揮発性の記録媒体によっても実現可能である。
本発明によれば、障害を判定する対象装置に設定した動作環境が不正であるか否かを効率的に判定できる障害判定装置等が得られる。
本発明の第1の実施形態に係るシンクライアントシステム1の構成を示すブロック図である。 本発明の第1の実施形態に係る仮想PC構成管理テーブル151のデータの内容を例示する図である。 本発明の第1の実施形態に係るアップデート管理テーブル152のデータの内容を例示する図である。 本発明の第1の実施形態に係るアップデート履歴テーブル153のデータの内容を例示する図である。 本発明の第1の実施形態に係る接続履歴テーブル154のデータの内容を例示する図である。 本発明の第1の実施形態に係るアップデート/接続履歴対応テーブル155のデータの内容を例示する図である。 本発明の第1の実施形態に係る基準テーブル156のデータの内容を例示する図である。 本発明の第1の実施形態に係る障害判定装置10が、一部の仮想PC21に対してソフトウェアの更新を行う動作を示すフローチャートである。 本発明の第1の実施形態に係る障害判定装置10が、仮想PC21に対して適用したソフトウェアの更新が不正であるか否かを判定する動作を示すフローチャートである。 本発明の第2の実施形態に係る障害判定装置50の構成を示すブロック図である。 本発明の各実施形態に係る障害判定装置を実現可能な情報処理装置900の構成を示すブロック図である。
以下、本発明の実施の形態について図面を参照して詳細に説明する。
<第1の実施形態>
図1は、本発明の第1の実施の形態に係るシンクライアントシステム1の構成を示すブロック図である。シンクライアントシステム1は、大別して、障害判定装置10、シンクライアントサーバ20、及び、端末装置30を有する。そして、障害判定装置10、シンクライアントサーバ20、及び、端末装置30は、通信ネットワーク40によって互いに通信可能に接続されている。通信ネットワーク40は、例えば、インターネットあるいはイントラネット等である。
シンクライアントサーバ20は、ハイパーバイザー22によって構築された仮想基盤の上で動作する仮想PC21-1乃至21-n(nは2以上の任意の整数)を備えている。尚、以降の本実施形態の説明において、仮想PC21-1乃至21-nをまとめて、あるいは仮想PC21-1乃至21-nのうちの任意のものを、仮想PC21と称する場合がある。尚、図1では紙面の都合上、シンクライアントサーバ20を1つのみ示しているが、シンクライアントシステム1は複数のシンクライアントサーバ20を有してもよい。シンクライアントシステム1が大規模なシステムである場合、複数のシンクライアントサーバ20が備える仮想PC21の総数は、例えば数千から数万程度である。
ユーザは、端末装置30を用いて、シンクライアントサーバ20におけるコネクションブローカ(不図示)よって自分に割り当てられた仮想PC21を使用する。即ち、ユーザは、端末装置30のユーザインタフェース(例えばキーボード及びマウス等)を介して仮想PC21に情報処理の実行を指示する。そしてユーザは、その仮想PC21によって実行された情報処理の結果を端末装置30のユーザインタフェース(例えば表示画面等)を介して確認する。尚、図1では紙面の都合上、端末装置30を1つのみ示しているが、シンクライアントシステム1は複数の端末装置30を有してもよい。
障害判定装置10は、仮想PC21の動作環境の設定を行い、当該動作環境の設定によって発生した障害を判定する(検出するとも称する)機能を有する、例えば後述する図11に例示する情報処理装置900のような装置である。このような障害は、例えば、当該動作環境に含まれる論理不正(論理バグ)、あるいは、仮想PC21の構成と当該動作環境との組み合わせに存在する問題(いわゆる相性の悪さ)などによって発生する。
動作環境の設定には、例えば、ソフトウェアのアップデート(更新)、ソフトウェアの新規追加、OS(Operating System)のパラメータの設定等が含まれる。本実施形態では、仮想PC21に対する様々な動作環境の設定のうち、ソフトウェアのアップデートを行う場合について説明することとするが、ソフトウェアのアップデート以外の動作環境の設定の場合も、シンクライアントシステム1の動作内容は同様である。
障害判定装置10は、決定部11、設定部12、監視部13、判定部14、及び記憶部15を備えている。決定部11、設定部12、監視部13、及び判定部14は、順に、決定手段、設定手段、監視手段、及び判定手段の一例である。
記憶部15は、例えば図11に例示するRAM(Random Access Memory)903あるいはハードディスク904のような記憶デバイスである。記憶部15は、仮想PC構成管理テーブル151、アップデート管理テーブル152、アップデート履歴テーブル153、接続履歴テーブル154、アップデート/接続履歴対応テーブル155、基準テーブル156を記憶している。記憶部15に記憶されたこれらの情報の詳細については後述する。
決定部11は、所定のタイミングに、記憶部15に記憶された、仮想PC構成管理テーブル151、アップデート管理テーブル152、アップデート履歴テーブル153に基づいて、ソフトウェアのアップデートを行う対象とする仮想PC21を決定する。決定部11は、この動作を定期的に行ってもよいし、あるいは、シンクライアントシステム1の管理者等によって入力された動作開始を指示する情報に応じて行ってもよい。
図2は、本実施形態に係る仮想PC構成管理テーブル151のデータの内容を例示する図である。仮想PC構成管理テーブル151は、仮想PC21の個々の構成を管理する情報である。仮想PC構成管理テーブル151、仮想PC21の個々に関する、OSの種別、CPU(Central Processing Unit)数、メモリ容量、ディスク容量、制御されるハイパーバイザーの識別子、使用するストレージの識別子、属するクループを表している。仮想PC構成管理テーブル151に含まれる情報(項目)は、図2に例示する情報とは異なってもよい。仮想PC構成管理テーブル151は、シンクライアントシステム1の管理者によって作成あるいは更新されてもよいし、あるいは、シンクライアントサーバ20のシステム管理機能によって生成あるいは更新されてもよい。
仮想PC構成管理テーブル151が表すグループは、仮想PC21の構成の類似性に基づいてクループ分けされた仮想PC21が属するグループの識別子を表す。図2に示す例では、仮想PC21-1、21-3、21-4、21-6は、OSの種別、CPU数、メモリ容量、ディスク容量、ハイパーバイザー、ストレージに関して、その構成が同等である。したがって、仮想PC21-1、21-3、21-4、21-6は、グループ1に分類されている。同様に、仮想PC21-2、21-5、21-8は、その構成が同等であり、グループ4に分類されている。
図3は、本実施形態に係るアップデート管理テーブル152のデータの内容を例示する図である。アップデート管理テーブル152は、仮想PC21に適用されるソフトウェアのアップデートの一覧を管理する情報であり、アップデートごとに、その名称と当該アップデートの対象となるOSの種別とが関連付けされた情報である。アップデート管理テーブル152に含まれる情報(項目)は、図3に例示する情報とは異なってもよい。
図3に例示するアップデート管理テーブル152によれば、例えば「アップデート#1」、「アップデート#3」は、OSがWindows10(登録商標)である仮想PC21に適用され、「アップデート#2」は、OSがWindows7(登録商標)である仮想PC21に適用される。アップデート管理テーブル152は、シンクライアントシステム1の管理者によって作成あるいは更新されてもよいし、あるいは、シンクライアントサーバ20のシステム管理機能によって生成あるいは更新されてもよい。あるシンクライアントサーバ20のシステム管理機能がアップデート管理テーブル152を生成する場合、当該システム管理機能は、例えば、別のシンクライアントサーバ20からアップデートに関する情報を入手すればよい。
図4は、本実施形態に係るアップデート履歴テーブル153のデータの内容を例示する図である。アップデート履歴テーブル153は、仮想PC21ごとに、上述したアップデート管理テーブル152によって示されるアップデートの適用履歴を表す情報である。アップデート履歴テーブル153に含まれる情報(項目)は、図4に例示する情報とは異なってもよい。
図4に例示するアップデート履歴テーブル153によれば、例えば仮想PC21-1は、「アップデート#1」に関しては4/1(4月1日)に適用済みであり、「アップデート#3」に関しては未適用である。尚、図2に例示する仮想PC構成管理テーブル151が示す通り、仮想PC21-1のOSはWindows10であり、図3に例示するアップデート管理テーブル152が示す通り、「アップデート#2」の適用対象のOSはWindows7である。したがって、仮想PC21-1は、「アップデート#2」に関しては適用対象外であるので、図4に例示するアップデート履歴テーブル153では、空欄で表している。
また、図4に例示するアップデート履歴テーブル153によれば、例えば、仮想PC21-2は、「アップデート#2」に関して、4/20(4月20日)に適用失敗となったことから未適用の状態にある。
図1に示す決定部11は、アップデート履歴テーブル153に基づき、アップデート管理テーブル152が示すアップデートのいずれかを選択する。例えば、図3に例示するアップデート履歴テーブル153によれば、多くの仮想PC21に対して「アップデート#3」が未適用であるので、決定部11は、仮想PC21に対して適用するソフトウェアのアップデートとして、「アップデート#3」を選択する。決定部11は、あるいは、管理者から入力された情報によって指示されたアップデートを選択してもよい。
本実施形態に係る障害判定装置10は、上述の通りに選択した「アップデート#3」を、「アップデート#3」の適用対象である全ての仮想PC21に対して一斉に適用することはせずに、まず、適用対象である仮想PC21のうちの一部に対して適用する。これは、「アップデート#3」を適用した仮想PCの動作と、「アップデート#3」を適用しない仮想PCの動作とを比較することによって、「アップデート#3」の適用に起因する障害が発生するか否かを確認するためである。
決定部11は、仮想PC構成管理テーブル151において、上述の通りに選択した「アップデート#3」の適用対象となる仮想PC21のグループのうち、属する仮想PC21の数が最も多いグループを求める。図1に例示する仮想PC構成管理テーブル151によれば、当該グループは、4つの仮想PC21-1、21-3、21-4、21-6が含まれるグループ1である。
決定部11は、上述の通りに求めたグループ1に属する4つの仮想PC21のうち、「アップデート#3」を適用する仮想PC21(第一の障害判定対象装置とも称する)と、適用しない仮想PC21(第二の障害判定対象装置とも称する)とを決定する。決定部11は、例えば、アップデートを適用する仮想PC21の数と適用しない仮想PC21の数が同等になるように決定すればよい。決定部11は、例えば後述する図6に例示する通り、グループ1に属する4つの仮想PC21のうち、仮想PC21-4及び21-6に対して「アップデート#3」を適用し、仮想PC21-1及び21-3に対して「アップデート#3」を適用しないことを決定する。決定部11は、上述の通りに決定した結果を、図1に示す設定部12に通知する。
設定部12は、決定部11から通知された決定結果にしたがって、仮想PC21-4及び21-6に対して「アップデート#3」を適用する。但し、「アップデート#3」のデータ(例えば仮想PC21において実行されるソフトウェアに対するパッチデータ等)は、例えば記憶部15に格納されていることとする。設定部12は、仮想PC21に対するソフトウェアのアップデートを行った場合、当該アップデートの適用結果を、アップデート履歴テーブル153に反映する。
監視部13は、仮想PC21の動作を監視し、その監視結果を表す接続履歴テーブル154を生成あるいは更新する。
図5は、本実施形態に係る接続履歴テーブル154のデータの内容を例示する図である。接続履歴テーブル154は、ユーザが端末装置30を使用して仮想PC21に接続した実績の履歴を表す情報であり、上述したコネクションブローカによって収集可能な情報である。即ち、監視部13は、コネクションブローカを介して、接続履歴テーブル154の生成あるいは更新に必要な情報を取得すればよい。
接続履歴テーブル154は、あるユーザによるある仮想PC21への接続に関して、接続開始時間、ユーザ名、接続先の仮想PC21、接続時間、及び、現在の接続状態を表す。接続履歴テーブル154に含まれる情報(項目)は、図5に例示する情報とは異なってもよい。
監視部13はさらに、同一のグループに属しあるソフトウェアのアップデートが適用された仮想PC21と適用されていない仮想PC21との動作の監視結果を表すアップデート/接続履歴対応テーブル155を、接続履歴テーブル154に基づいて生成する。
図6は、本実施形態に係るアップデート/接続履歴対応テーブル155のデータの内容を例示する図である。監視部13は、図6に例示する通り、上述した「アップデート#3」が適用されていない仮想PC21-1、21-3、及び、「アップデート#3」が適用された仮想PC21-4、21-6の接続履歴を接続履歴テーブル154から抽出し、その抽出結果を表すアップデート/接続履歴対応テーブル155を生成する。アップデート/接続履歴対応テーブル155に含まれる情報(項目)は、図6に例示する情報とは異なってもよい。
図1に示す判定部14は、アップデート/接続履歴対応テーブル155が表す仮想PC21の動作が、基準テーブル156が示す基準を満たすか否かを判定する。基準テーブル156は、ソフトウェアのアップデートを適用したことに起因する障害が発生したか否か(即ち、当該アップデートが不正であるか否か)を判定する際に用いる判定基準を表す。基準テーブル156は、例えば、シンクライアントシステム1の管理者によって作成される。
図7は、本実施形態に係る基準テーブル156のデータの内容を例示する図である。図7に例示する基準テーブル156によれば、仮想PC21の動作が下記の条件1及び2を両方とも満たす場合、判定部14は、仮想PC21に対して行ったソフトウェアのアップデートが不正であると判定する。
(条件1)ソフトウェアのアップデートが適用されていない仮想PC21に関して、継続接続時間が1時間以上であるユーザが1以上存在する。
(条件2)ソフトウェアのアップデートが適用された仮想PC21に関して、継続接続時間が2分以下であるユーザが2以上存在する。
上述の条件1及び2は、下記の考え方に基づく基準である。即ち、障害が発生していない状態において、ユーザは通常、仮想PC21を1時間以上使用する。それにもかかわらず、ソフトウェアのアップデートが適用された仮想PC21に関して、継続接続時間が2分以下のユーザが2以上(即ち複数)存在するということは、ソフトウェアのアップデートを適用したことに起因する障害が発生した可能性が高いと考えられる。尚、図7に例示する基準テーブル156が示す基準は一例であり、基準テーブル156が示す基準は、図7に例示する基準とは異なってもよい。
図6に例示するアップデート/接続履歴対応テーブル155によれば、「アップデート#3」が適用されていない仮想PC21-1、21-3を1時間以上継続して使用したユーザが3名存在する。そして、「アップデート#3」が適用された仮想PC21-4、21-6に関して、継続接続時間が2分以内であるユーザが2名存在する。この場合、図6に例示する仮想PC21の動作は、図7に例示する判定基準を満たすことから、判定部14は、仮想PC21-4、21-6に対して適用した「アップデート#3」が不正であると判定する。判定部14は、上述した判定結果を、図1に示す設定部12に通知する。
設定部12は、判定部14から通知された判定結果が「アップデート#3」が不正であることを示す場合、「アップデート#3」が適用された仮想PC21-4、21-6を、「アップデート#3」が適用される前の状態に戻す。
次に図8及び図9のフローチャートを参照して、本実施形態に係る障害判定装置10の動作(処理)について詳細に説明する。
図8に示すフローチャートは、障害判定装置10が、一部の仮想PC21に対してソフトウェアの更新(アップデート)を行う動作を示すフローチャートである。
決定部11は、所定のタイミングに、記憶部15から、仮想PC構成管理テーブル151、アップデート管理テーブル152、アップデート履歴テーブル153を読み出す(ステップS101)。決定部11は、アップデート履歴テーブル153に基づき、アップデート管理テーブル152が示すソフトウェアのアップデートのうちのいずれかを選択する(ステップS102)。
決定部11は、仮想PC構成管理テーブル151において、選択したソフトウェアのアップデートの適用対象となるグループのうち、属する仮想PC21の数が最も多いグループを求める(ステップS103)。決定部11は、求めたグループに属する仮想PC21のうち、ソフトウェアのアップデートを適用する仮想PC21と、適用しない仮想PC21とを決定する(ステップS104)。
設定部12は、決定部11によってソフトウェアのアップデートを適用すると決定された仮想PC21に対して、ソフトウェアのアップデートを適用し(ステップS105)、全体の処理は終了する。
図9に示すフローチャートは、障害判定装置10が、図8のフローチャートが示す動作によって仮想PC21に対して適用したソフトウェアのアップデートが不正であるか否かを判定する動作を示すフローチャートである。
監視部13は、仮想PC21の動作を監視し、監視結果を表す接続履歴テーブル154を生成し、生成した接続履歴テーブル154を記憶部15に格納する(ステップS201)。監視部13は、同一のグループに属しあるソフトウェアのアップデートが適用された仮想PC21と適用されていない仮想PC21との動作を表すアップデート/接続履歴対応テーブル155を、接続履歴テーブル154に基づいて生成し、記憶部15に格納する(ステップS202)。
判定部14は、アップデート/接続履歴対応テーブル155が表す仮想PC21の動作が、基準テーブル156が示す基準を満たすか否かを判定する(ステップS203)。仮想PC21の動作が基準を満たさない場合(ステップS204でNo)、判定部14は、当該アップデートが不正ではないと判定し(ステップS205)、全体の処理は終了する。
仮想PC21の動作が基準を満たす場合(ステップS204でYes)、判定部14は、当該アップデートが不正であると判定する(ステップS206)。設定部12は、当該アップデートが適用された仮想PC21の状態を、当該アップデートが適用される前の状態に戻し(ステップS207)、全体の処理は終了する。
本実施形態に係る障害判定装置10は、障害を判定する対象装置に設定した動作環境が不正であるか否かを効率的に判定することができる。その理由は、障害判定装置10は、対象装置の一部に対して当該動作環境を設定し、当該動作環境が設定された対象装置と当該動作環境が設定されていない対象装置との動作を比較して、その比較結果が基準を満たす場合に、当該動作環境が不正であると判定するからである。
以下に、本実施形態に係る障害判定装置10によって実現される効果について、詳細に説明する。
コンピュータシステムでは、例えばソフトウェアの更新あるいは追加など、その動作環境の設定が変更されることに起因して障害が発生することがある。このような障害は、例えば、当該動作環境に含まれる論理不正、あるいは、コンピュータシステムの構成と当該動作環境との組み合わせに存在する相性の問題などによって発生する。例えば大規模なシンクライアントシステムでは、多数のユーザによってユーザプロファイルの変更が頻繁に行われており、その変更に起因した様々な障害が発生する。したがって、障害を判定する対象装置に設定した動作環境が不正であるか否かを効率的に判定することが課題である。
このような課題に対して、本実施形態に係る障害判定装置10は、決定部11と監視部13と判定部14とを備え、例えば図1乃至図9を参照して上述した通り動作する。即ち、決定部11は、複数の仮想PC21のうち、所定の動作環境(例えばソフトウェアのアップデート)を設定する仮想PC21(第一の障害判定対象装置)と当該所定の動作環境を設定しない仮想PC21(第二の障害判定対象装置)とを決定する。監視部13は、上述の通り一部の仮想PC21に対して当該所定の動作環境が設定されたのち、当該所定の動作環境が設定された仮想PC21と当該所定の動作環境が設定されていない仮想PC21との動作を監視する。そして、判定部14は、当該所定の動作環境が設定された仮想PC21と当該所定の動作環境が設定されていない仮想PC21との動作の監視結果を比較し、その比較結果が基準テーブル156により示される基準を満たす場合に、当該所定の動作環境が不正であると判定する。
即ち、本実施形態に係る障害判定装置10は、所定の動作環境が不正か否かの判定に際し、例えば仮想PC21から出力されたログを解析するような複雑な処理を必要とせずに、所定の動作環境の設定の有無に伴う仮想PC21の動作の違いの比較という簡易な処理を行う。これにより、本実施形態に係る障害判定装置10は、障害を判定する対象装置に設定した動作環境が不正であるか否かを効率的に判定することができる。
また、本実施形態に係る障害判定装置10は、構成が類似するあるいは同等である仮想PC21の中から、所定の動作環境を設定する仮想PC21と所定の動作環境を設定しない仮想PC21とを決定して、それらの仮想PC21の動作を比較する。動作環境の設定に起因する障害は、仮想PC21の構成の違いに依存する場合があるので、障害判定装置10は、構成が類似する仮想PC21を判定対象とすることによって構成の違いによる影響を排除できるので、判定の精度を高めることができる。
また、本実施形態に係る障害判定装置10は、構成の類似性に基づいて複数のグループに分類された仮想PC21のうち、同一のグループに属する数が最も多い仮想PC21を、所定の動作環境を設定するあるいは設定しない仮想PC21に決定する。即ち、障害判定装置10は、判定対象とする仮想PC21をできるだけ多くすることによって、判定の精度を高めることができる。また、障害判定装置10に係る決定部11は、外部から(例えばシンクライアントシステム1の管理者により入力された情報により)、所定の動作環境を設定する仮想PC21の一つとして指定された仮想PC21と同一のグループに属する仮想PC2 1を、判定対象に決定してもよい。
また、本実施形態に係る障害判定装置10は、ユーザによる仮想PC21の継続使用時間を監視し、所定の動作環境の設定の有無に伴う仮想PC21の継続使用時間の違いが基準を満たす場合に、当該所定の動作環境が不正であると判定する。即ち、障害判定装置10は、仮想PC21の継続使用時間の比較という簡易な処理を行えばよいので、障害を判定する対象装置に設定した動作環境が不正であるか否かを、低コストかつ効率的に判定することができる。
また、上述した本実施形態では、障害判定装置10は、基準テーブル156が示す閾値を含む基準を用いて動作環境の不正を判定するが、障害判定装置10は、この判定を、例えば機械学習を行うことによって構築した学習済モデルを用いて行ってもよい。
また、上述した本実施形態では、障害判定装置10による障害の判定対象は仮想PCであるが、障害判定装置10は、例えば、物理マシンを障害の判定対象としてもよい。
また、上述した本実施形態では、障害判定装置10は、決定部11、設定部12、監視部13、判定部14を構成要素として備える単体の情報処理装置であるが、障害判定装置10は、これらの構成要素を実現する複数の情報処理装置によって構成されてもよい。
<第2の実施形態>
図10は、本発明の第2の実施形態に係る障害判定装置50の構成を示すブロック図である。
本実施形態に係る障害判定装置50は、決定部51、監視部52、及び、判定部53を備えている。
決定部51は、複数の障害判定対象装置のうち、所定の動作環境610を設定する第1の障害判定対象装置61と、所定の動作環境610を設定しない第2の障害判定対象装置62とを決定する。第1の障害判定対象装置61及び第2の障害判定対象装置62は、例えば、第1の実施形態に係る仮想PC21である。所定の動作環境610は、例えば、第1の障害判定対象装置61において実行されるソフトウェアのアップデート(更新)、及び、ソフトウェアの新規追加等を含む。
決定部51は、上述した決定を行うに際し、例えば、第1の実施形態に係る決定部11と同様に、仮想PC構成管理テーブル151、アップデート管理テーブル152、アップデート履歴テーブル153と同様な情報を用いてもよい。
監視部52は、第1の障害判定対象装置61に対して所定の動作環境610が設定されたのち、第1の障害判定対象装置61及び第2の障害判定対象装置62の動作を監視する。監視部52は、例えば、第1の実施形態に係る監視部13と同様に、監視結果を表す接続履歴テーブル154及びアップデート/接続履歴対応テーブル155と同様な情報を生成してもよい。
判定部53は、第1の障害判定対象装置61と第2の障害判定対象装置62との間において、動作の監視結果を比較し、その比較結果が基準530を満たす場合に、所定の動作環境610が不正であると判定する。基準530は、例えば、第1の実施形態に係る基準テーブル156と同様な基準であってもよい。
本実施形態に係る障害判定装置50は、障害を判定する対象装置に設定した動作環境が不正であるか否かを効率的に判定することができる。その理由は、障害判定装置50は、対象装置の一部に対して当該動作環境を設定し、当該動作環境が設定された対象装置と当該動作環境が設定されていない対象装置との動作を比較して、その比較結果が基準を満たす場合に、当該動作環境が不正であると判定するからである。
<ハードウェア構成例>
上述した各実施形態において図1、及び、図10に示した障害判定装置における各部は、専用のHW(HardWare)(電子回路)によって実現することができる。また、図1、及び、図10において、少なくとも、下記構成は、プロセッサによって実行される命令を含むソフトウェアプログラムの機能(処理)単位(ソフトウェアモジュール)と捉えることができる。
・決定部11及び51、
・設定部12、
・監視部13及び52、
・判定部14及び53、
・記憶部15における記憶制御機能。
但し、これらの図面に示した各部の区分けは、説明の便宜上の構成であり、実装に際しては、様々な構成が想定され得る。この場合のハードウェア環境の一例を、図11を参照して説明する。
図11は、本発明の各実施形態に係る障害判定装置を実現可能な情報処理装置900(コンピュータ)の構成を例示的に説明する図である。即ち、図11は、図1、及び、図10に示した障害判定装置を実現可能なコンピュータ(情報処理装置)の構成であって、上述した実施形態における各機能を実現可能なハードウェア環境を表す。
図11に示した情報処理装置900は、構成要素として下記を備えている。
・CPU(Central_Processing_Unit)901、
・ROM(Read_Only_Memory)902、
・RAM(Random_Access_Memory)903、
・ハードディスク(記憶装置)904、
・通信インタフェース905、
・バス906(通信線)、
・CD-ROM(Compact_Disc_Read_Only_Memory)等の記録媒体907に格納されたデータを読み書き可能なリーダライタ908、
・モニターやスピーカ、キーボード等の入出力インタフェース909。
即ち、上記構成要素を備える情報処理装置900は、これらの構成がバス906を介して接続された一般的なコンピュータである。情報処理装置900は、CPU901を複数備える場合もあれば、マルチコアにより構成されたCPU901を備える場合もある。
そして、上述した実施形態を例に説明した本発明は、図11に示した情報処理装置900に対して、次の機能を実現可能なコンピュータプログラムを供給する。その機能とは、その実施形態の説明において参照したブロック構成図(図1、及び、図10)における上述した構成、或いはフローチャート(図8、及び、図9)の機能である。本発明は、その後、そのコンピュータプログラムを、当該ハードウェアのCPU901に読み出して解釈し実行することによって達成される。また、当該装置内に供給されたコンピュータプログラムは、読み書き可能な揮発性のメモリ(RAM903)、または、ROM902やハードディスク904等の不揮発性の記憶デバイスに格納すれば良い。
また、前記の場合において、当該ハードウェア内へのコンピュータプログラムの供給方法は、現在では一般的な手順を採用することができる。その手順としては、例えば、CD-ROM等の各種記録媒体907を介して当該装置内にインストールする方法や、インターネット等の通信回線を介して外部よりダウンロードする方法等がある。そして、このような場合において、本発明は、係るコンピュータプログラムを構成するコード或いは、そのコードが格納された記録媒体907によって構成されると捉えることができる。
以上、上述した実施形態を模範的な例として本発明を説明した。しかしながら、本発明は、上述した実施形態には限定されない。即ち、本発明は、本発明のスコープ内において、当業者が理解し得る様々な態様を適用することができる。
1 シンクライアントシステム
10 障害判定装置
11 決定部
12 設定部
13 監視部
14 判定部
15 記憶部
151 仮想PC構成管理テーブル
152 アップデート管理テーブル
153 アップデート履歴テーブル
154 接続履歴テーブル
155 アップデート/接続履歴対応テーブル
156 基準テーブル
20 シンクライアントサーバ
21 仮想PC
22 ハイパーバイザー
30 端末装置
40 通信ネットワーク
50 障害判定装置
51 決定部
52 監視部
53 判定部
530 基準
61 第1の障害判定対象装置
610 所定の動作環境
62 第2の障害判定対象装置
900 情報処理装置
901 CPU
902 ROM
903 RAM
904 ハードディスク(記憶装置)
905 通信インタフェース
906 バス
907 記録媒体
908 リーダライタ
909 入出力インタフェース

Claims (10)

  1. 複数の障害判定対象装置のうち、所定の動作環境を設定する第一の障害判定対象装置と、前記所定の動作環境を設定しない第二の障害判定対象装置とを決定する決定手段と、
    前記第一の障害判定対象装置に対して前記所定の動作環境が設定されたのち、前記第一及び第二の障害判定対象装置の動作を監視する監視手段と、
    前記第一及び第二の障害判定対象装置の間において、前記動作の監視結果を比較し、その比較結果が基準を満たす場合に、前記所定の動作環境が不正であると判定する判定手段と、
    を備える障害判定装置。
  2. 前記決定手段は、構成が類似する前記障害判定対象装置を、前記第一及び第二の障害判定対象装置として決定する、
    請求項1に記載の障害判定装置。
  3. 前記決定手段は、構成の類似性に基づいて複数のグループに分類された前記複数の障害判定対象装置のうち、同一の前記グループに属する数が最も多い前記障害判定対象装置を、前記第一及び第二の障害判定対象装置として決定する、
    請求項2に記載の障害判定装置。
  4. 前記決定手段は、構成の類似性に基づいて複数のグループに分類された前記複数の障害判定対象装置のうち、外部から前記第一の障害判定対象装置の一つとして指定された前記障害判定対象装置と同一の前記グループに属する前記障害判定対象装置を、前記第一及び第二の障害判定対象装置として決定する、
    請求項2に記載の障害判定装置。
  5. 前記監視手段は、ユーザによる前記第一及び第二の障害判定対象装置の継続使用時間を監視し、
    前記判定手段は、前記第一の障害判定対象装置の継続使用時間が第一の閾値以下であるとともに、前記第二の障害判定対象装置の継続使用時間が第二の閾値以上である場合に、前記所定の動作環境が不正であると判定する、
    請求項1乃至請求項4のいずれか一項に記載の障害判定装置。
  6. 前記判定手段は、前記比較結果が前記基準を満たす前記第一の障害判定対象装置の個数が第三の閾値以上である場合に、前記所定の動作環境が不正であると判定する、
    請求項1乃至請求項5のいずれか一項に記載の障害判定装置。
  7. 前記第一の障害判定対象装置に対して前記所定の動作環境を設定したのち、前記判定手段によって、前記所定の動作環境が不正であると判定された場合、前記第一の障害判定対象装置の状態を、前記所定の動作環境を設定する前の状態に戻す設定手段をさらに備える、
    請求項1乃至請求項6のいずれか一項に記載の障害判定装置。
  8. 前記所定の動作環境の設定は、前記障害判定対象装置に関するソフトウェアの更新あるいは追加を表す、
    請求項1乃至請求項7のいずれか一項に記載の障害判定装置。
  9. 情報処理装置によって、
    複数の障害判定対象装置のうち、所定の動作環境を設定する第一の障害判定対象装置と、前記所定の動作環境を設定しない第二の障害判定対象装置とを決定し、
    前記第一の障害判定対象装置に対して前記所定の動作環境が設定されたのち、前記第一及び第二の障害判定対象装置の動作を監視し、
    前記第一及び第二の障害判定対象装置の間において、前記動作の監視結果を比較し、その比較結果が基準を満たす場合に、前記所定の動作環境が不正であると判定する、
    障害判定方法。
  10. 複数の障害判定対象装置のうち、所定の動作環境を設定する第一の障害判定対象装置と、前記所定の動作環境を設定しない第二の障害判定対象装置とを決定する決定処理と、
    前記第一の障害判定対象装置に対して前記所定の動作環境が設定されたのち、前記第一及び第二の障害判定対象装置の動作を監視する監視処理と、
    前記第一及び第二の障害判定対象装置の間において、前記動作の監視結果を比較し、その比較結果が基準を満たす場合に、前記所定の動作環境が不正であると判定する判定処理と、
    をコンピュータに実行させるための障害判定プログラム。
JP2020084899A 2020-05-14 2020-05-14 障害判定装置、障害判定方法、及び、障害判定プログラム Active JP7532882B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020084899A JP7532882B2 (ja) 2020-05-14 2020-05-14 障害判定装置、障害判定方法、及び、障害判定プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020084899A JP7532882B2 (ja) 2020-05-14 2020-05-14 障害判定装置、障害判定方法、及び、障害判定プログラム

Publications (2)

Publication Number Publication Date
JP2021179820A JP2021179820A (ja) 2021-11-18
JP7532882B2 true JP7532882B2 (ja) 2024-08-14

Family

ID=78511558

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020084899A Active JP7532882B2 (ja) 2020-05-14 2020-05-14 障害判定装置、障害判定方法、及び、障害判定プログラム

Country Status (1)

Country Link
JP (1) JP7532882B2 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008225681A (ja) 2007-03-09 2008-09-25 Oki Electric Ind Co Ltd クライアント端末の動作確認方法、通信システム、クライアント端末及び動作確認サーバ
US20180121322A1 (en) 2016-10-31 2018-05-03 Facebook, Inc. Methods and Systems for Testing Versions of Applications
US20180189046A1 (en) 2016-12-29 2018-07-05 Arris Enterprises Llc Method and System for Analytics-Based Updating of Networked Devices
US20190146774A1 (en) 2017-11-16 2019-05-16 Citrix Systems, Inc. Deployment routing of clients by analytics

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008225681A (ja) 2007-03-09 2008-09-25 Oki Electric Ind Co Ltd クライアント端末の動作確認方法、通信システム、クライアント端末及び動作確認サーバ
US20180121322A1 (en) 2016-10-31 2018-05-03 Facebook, Inc. Methods and Systems for Testing Versions of Applications
US20180189046A1 (en) 2016-12-29 2018-07-05 Arris Enterprises Llc Method and System for Analytics-Based Updating of Networked Devices
US20190146774A1 (en) 2017-11-16 2019-05-16 Citrix Systems, Inc. Deployment routing of clients by analytics

Also Published As

Publication number Publication date
JP2021179820A (ja) 2021-11-18

Similar Documents

Publication Publication Date Title
US11108859B2 (en) Intelligent backup and recovery of cloud computing environment
US11184434B2 (en) Top-of-rack switch replacement for hyper-converged infrastructure computing environments
US20220147409A1 (en) Identification and/or prediction of failures in a microservice architecture for enabling automatically-repairing solutions
JP4980792B2 (ja) 仮想計算機の性能監視方法及びその方法を用いた装置
EP3149591B1 (en) Tracking application deployment errors via cloud logs
US20150095597A1 (en) High performance intelligent virtual desktop infrastructure using volatile memory arrays
JP6788178B2 (ja) 設定支援プログラム、設定支援方法及び設定支援装置
WO2009110111A1 (ja) サーバ装置及びサーバ装置の異常検知方法及びサーバ装置の異常検知プログラム
US8949653B1 (en) Evaluating high-availability configuration
US9852007B2 (en) System management method, management computer, and non-transitory computer-readable storage medium
US10353786B2 (en) Virtualization substrate management device, virtualization substrate management system, virtualization substrate management method, and recording medium for recording virtualization substrate management program
EP3400528A1 (en) Deferred server recovery in computing systems
EP3591530B1 (en) Intelligent backup and recovery of cloud computing environment
JPWO2015040688A1 (ja) 計算機システムを管理する管理システム及びその管理方法
US20070180288A1 (en) Method, system and program for securing redundancy in parallel computing sytem
Kim et al. Availability modeling and analysis of a virtualized system using stochastic reward nets
EP3956771B1 (en) Timeout mode for storage devices
US8015432B1 (en) Method and apparatus for providing computer failover to a virtualized environment
US11615006B2 (en) Virtual network life cycle management
US9021078B2 (en) Management method and management system
JP5597293B2 (ja) 計算機システム及びプログラム
CN112714022A (zh) 多套集群的控制处理方法、装置及计算机设备
US11086615B2 (en) Virtual appliance upgrades in high-availability (HA) computing clusters
US11374815B2 (en) Network configuration diagram generate method and recording medium
JP7532882B2 (ja) 障害判定装置、障害判定方法、及び、障害判定プログラム

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20211019

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230417

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240702

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240715

R150 Certificate of patent or registration of utility model

Ref document number: 7532882

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150