JP6087673B2 - Workaround execution management system and workaround execution management method - Google Patents
Workaround execution management system and workaround execution management method Download PDFInfo
- Publication number
- JP6087673B2 JP6087673B2 JP2013050952A JP2013050952A JP6087673B2 JP 6087673 B2 JP6087673 B2 JP 6087673B2 JP 2013050952 A JP2013050952 A JP 2013050952A JP 2013050952 A JP2013050952 A JP 2013050952A JP 6087673 B2 JP6087673 B2 JP 6087673B2
- Authority
- JP
- Japan
- Prior art keywords
- work
- success rate
- work flow
- confirmed
- normal operation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本発明は、障害監視装置が検知したインシデントをサービスデスクがワークアラウンド(一次対応)を行う場合に、運用手順を自動実行するランブックオートメーションなどの作業自動実行システムにおけるワークアラウンドの確認作業を支援し、作業自動実行システム導入初期のリスクを軽減することができるワークアラウンド実行管理システム及びワークアラウンド実行管理方法に関する。 The present invention supports work-around confirmation work in an automatic work execution system such as runbook automation that automatically executes an operation procedure when a service desk performs work-around (primary response) on an incident detected by a failure monitoring device. The present invention relates to a work-around execution management system and a work-around execution management method that can reduce the initial risk of introducing an automatic work execution system.
近年のコンピュータシステムにおいては、日々発生する監視対象機器(顧客コンピュータ、仮想マシン)からの解決すべき案件や課題を含むメッセージに対して迅速かつ正確にワークアラウンド(一次対応)を行う際に、これらメッセージをインシデントとしてコンピュータ管理するインシデント管理システムが採用されている。このインシデント管理システムでは、監視対象機器からのメッセージに加えて顧客からの問合せや作業依頼もインシデントとしてとらえ、インシデント管理システムに登録し、この障害監視運用業務においては、サービスデスクが監視対象の機器などから日々発生するインシデントに対し、業務への影響を最小限に抑えることを目的として、関係者への連絡や一次対応を行っている。 In recent computer systems, when a workaround (primary response) is performed quickly and accurately on a message containing problems and issues to be solved from monitored devices (customer computers, virtual machines) that occur daily An incident management system that manages a message as an incident has been adopted. In this incident management system, in addition to messages from monitored devices, inquiries and work requests from customers are also regarded as incidents, which are registered in the incident management system. In order to minimize the impact on business operations for incidents that occur every day from the beginning, we contact the relevant parties and provide primary responses.
サービスデスクが実施するこれらのワークアラウンドは、顧客のコンピュータシステムの拡大や複雑化に伴い処理件数の増加や手順の複雑化を招き、この対策として、ランブックオートメーションなどの作業自動実行システムを導入して、ワークアラウンドを自動化する対策が取られている。 These workarounds conducted by the service desk lead to an increase in the number of processing and complexity of procedures as customers' computer systems expand and become complex, and as a countermeasure against this, we have introduced an automated work execution system such as runbook automation. Measures are taken to automate workarounds.
このワークアラウンドを自動化する技術が記載された文献としては、下記の特許文献1が挙げられる。該特許文献1には、不具合発生時に、自己の識別情報及び時刻データを含むインシデント情報を抽出するインシデントデータ抽出部と、予め定められている不具合の判定条件を示す判定条件データに基づいて、不具合が発生しているか否かを判定するチェックリスト処理部と、不具合が発生しているときは、発生している不具合を解消するために、判定条件データに予め対応付けられているコマンドを実行する修復コマンド実行部と、インシデントデータ及びコマンドの実行結果を示す情報を管理サーバへ送信する送信部とを各クライアントに設ける技術が記載されている。これによって、軽微な不具合の修復を自動化する。
The following
前述の特許文献1記載技術は、障害の内容に応じて復旧のためのコマンドを予め定義し、これを自動で実行することによって、サービスデスクが実施する作業を削減することができ、既に確立されたコマンドを順に実行する場合には有効であるが、複雑な手順をランブックオートメーションなどの技術を利用して実行に適用することが困難であるという課題があった。即ち、インシデント管理システムにおいては顧客によってコンピュータのハードウェア及びソフトウェアの構成が異なり、特にコマンドの結果に応じて複数の作業が分岐されて実行される場合があり、多種多様なインシデントに対応する一次対応を予め定義しても、これら一次対応が正常に実行可能かを人手により確認する必要があり、この確認作業が繁雑であり、ランブックオートメーションなどの技術を利用して実行に適用することが困難であるという課題があった。
The technique described in
即ち、自動化された手順は、適用の初期段階では、人が正常・異常を監視し、異常が発生した場合には、速やかに復旧するようなリカバリ手順を確立していないと、一時的に品質が劣化するリスクがあり、このためサービスデスクは、一定期間毎に自動化された手順を定期的に捕捉する作業が必要となり、運用が複雑及び煩雑であるという課題があった。 In other words, the automated procedure is used in the initial stage of application, when a person monitors normality / abnormality, and if a recovery procedure has been established that will promptly recover in the event of an abnormality, the quality is temporarily There is a risk that the service desk deteriorates. For this reason, the service desk needs to regularly capture an automated procedure every certain period, and there is a problem that the operation is complicated and complicated.
本発明の目的は、複数のインシデントに対するワークアラウンド(一次対応)の確認作業を支援して作業自動実行システム導入初期のリスクを軽減することができるワークアラウンド実行管理システム及びワークアラウンド実行管理方法を提供することである。 An object of the present invention, a work-around (primary response) workaround execution management system and the work-around execution management method of the confirmation work can reduce the risk of working automatic execution system initially introduced to support for multiple incidents Is to provide.
本発明は、テストを完了した作業フローの本番環境においてサービスデスクが作業フローの動作を監視する第1段階と、該第1段階において第1の成功率以上の正常動作が確認された作業フローの正常及び異常をサービスデスクに通知すると共に前記第1の成功率未満の正常動作が確認された作業フローを第1段階に下げる第2段階と、該第2段階において第2の成功率以上の正常動作が確認された作業フローの異常をサービスデスクに通知すると共に前記第2の成功率未満の正常動作が確認された作業フローを第2段階に下げる第3段階とを設定する。
そして本発明は、前記フロー名の作業フローを実行した際の第1から第3段階毎の成功率を含む実績情報を作業実績管理データベースに格納する第1工程と、第1段階において第1の成功率以上の正常動作が確認された作業フローの正常及び異常をサービスデスクに通知し、前記第1の成功率以上の正常動作が確認された作業フローを第2段階に上げる第2工程と、第2段階において第2の成功率以上の正常動作が確認された作業フローの異常をサービスデスクに通知し、前記第1の成功率以上の正常動作が確認された作業フローを第3段階に上げると共に第2の成功率未満の正常動作が確認された作業フローを第1段階に下げる第3工程と、第3段階において第2の成功率未満の正常動作が確認された作業フローを第2段階に下げる第4工程とを実行する。
The present invention relates to a first stage in which a service desk monitors a workflow operation in a production environment of a workflow that has been tested, and a workflow in which a normal operation of a first success rate or higher is confirmed in the first stage. A second stage for notifying the service desk of normality and abnormalities, and lowering the work flow in which normal operation less than the first success rate is confirmed to the first stage, and normal above the second success rate in the second stage A third stage is set for notifying the service desk of an abnormality in the workflow whose operation has been confirmed and lowering the work flow whose normal operation less than the second success rate has been confirmed to the second stage.
The present invention includes a first step of storing performance information including a success rate for each of the first to third stages in the work performance management database when the workflow having the flow name is executed, and a first step in the first stage. A second step of notifying the service desk of the normality and abnormality of the work flow confirmed to have a normal operation equal to or higher than the success rate, and raising the work flow confirmed to be normal operation equal to or higher than the first success rate to the second stage ; In the second stage, the service desk is notified of an abnormality in the work flow in which the normal operation of the second success rate or higher is confirmed, and the work flow in which the normal operation of the first success rate or higher is confirmed is raised to the third stage. And a third step for lowering the work flow in which the normal operation less than the second success rate is confirmed to the first stage, and a work flow in which the normal operation less than the second success rate is confirmed in the third step in the second stage. 4th work to lower To run the door.
本発明によるワークアラウンド実行管理システム及びワークアラウンド実行管理方法は、複数のインシデントに対するワークアラウンド(一次対応)の確認作業を支援して作業自動実行システム導入初期のリスクを軽減することができる。 The workaround execution management system and the workaround execution management method according to the present invention can support the workaround (primary response) confirmation work for a plurality of incidents, and can reduce the risk at the initial stage of the automatic work execution system introduction.
以下、本発明によるワークアラウンド実行管理方法を適用したワークアラウンド実行管理システムの一実施形態を図面を参照して詳細に説明するものであるが、まず、本実施形態によるワークアラウンド実行管理システムの原理を説明する。
[原理]
本実施形態によるワークアラウンド実行管理システムは、従来技術においてはサービスデスク14がワークアラウンド(一次対応)である作業フローのテストを完了し、本番環境にリリースした後、本番環境においても当該作業フロー全てのインシデントに対して有効(エラーが生じるか否か)か監視するため一定期間サービスデスク14が当該作業フローが正常に動作するか常時監視しなければならないものであった。これに対して本発明においては、まず、インシデントに対して付与された対応事例であるワークアラウンド(一次対応)の検証を段階的に行うため、この段階(Step)としてStep1〜Step3の検証段階として3段階を設定する。次いで、図4の適用イメージに示す如く、この検証を行う際の検証レベルを、サービスデスク14が作業フローのテストを完了し、本番環境にリリースした段階であるStep1と、該Step1の次に実装置において所定実行回数以上且つ一定成功率(第1の成功率)以上の実績を残した段階であるStep2と、該Step2の次に所定実行回数以上且つ一定成功率(第2の成功率)以上で実績を残した段階であるStep3との3段階として設定する。なお、前記検証段階は3段階に限られるものではなく更に多段とすることや、前記成功率及び又は所定実行回数はサービスデスク又は管理者のコンピュータ等の外部から変更できるように構成しても良い。
Hereinafter, an embodiment of a workaround execution management system to which a workaround execution management method according to the present invention is applied will be described in detail with reference to the drawings. First, the principle of the workaround execution management system according to the present embodiment will be described. Will be explained.
[principle]
In the workaround execution management system according to the present embodiment, in the prior art, after the
前記Step1では、作業フローの実行実績がない状態であるため、サービスデスクが人手で作業自動実行システム11を利用して作業フローを実行する段階であり、作業フローの実行に失敗しても、サービスデスク14が即時に対応することができる。
In
前記Step2では、ワークアラウンド実行管理システム8が作業自動実行システム11を起動し、作業フローを自動で実行し、実行結果を正常であってもサービスデスク14にメールなどで通知する段階である。
In
前記Step3では、ワークアラウンド実行管理システム8が作業自動実行システム11を起動し、作業フローを自動で実行し、実行結果が異常時のみサービスデスク14にメールなどで通知を行い、殆どサービスデスクの工数を必要としない段階である。また、Step2又はStep3において一定成功率以上作業フローが成功しない場合は、現在のStepレベルを低下(Step2→Step1、Step3→Step2)させる。
In
このように本発明によるワークアラウンド実行管理システムは、ワークアラウンド(一次対応)である作業フロー動作の検証レベルとして、作業フローの本番環境において、作業フローの多数のインシデントに対する検証レベルとして、次のStepを設定する。
・本番環境にリリースし、サービスデスク14が動作を監視する段階であるStep1。
・該Step1の次に実装置において一定成功率(第1の成功率)以上の実績を残し、作業フロー実行の正常及び異常をサービスデスク14に通知する段階であるStep2。
・該Step2の次に一定成功率(第2の成功率)以上で実績を残し、作業フロー実行が異常のときのみにサービスデスク14に通知する段階であるStep3。
前記Step2又はStep3において一定成功率以上作業フローが成功しない場合は現Stepレベルを下げることによって本システムは、作業を自動化する際のワークアラウンド(一次対応)である作業フローの動作の検証をサービスデスク14の常時監視を必要とせずに効率的に行うことができる。本実施形態においては、前記各Stepを検証段階とも呼ぶ。
As described above, the workaround execution management system according to the present invention uses the following Step as a verification level for a workflow operation that is a workaround (primary correspondence) as a verification level for a large number of incidents in the workflow in the production environment of the workflow. Set.
- released to the production environment, the
- constant success rate in real device to the next of the Step1 leaving (first success rate) or more results, a step of notifying the normal and abnormal workflow
· The following constant success rate of the Step2 leaving proven (second success rate) than a step of notifying only the
The S Tep2 or if workflow over a certain success rate in Step3 is not successful the system by Rukoto lowering the current Step level, verification of the operation of the workflow as a work-around (primary response) when automating work Can be efficiently performed without requiring constant monitoring of the
[構成]
本実施形態によるワークアラウンド実行管理システムを含むコンピュータシステムは、図1に示す如く、顧客コンピュータである複数の監視対象機器2に接続された障害監視装置3を設置したデータセンタ1と、該データセンタ1にネットワーク4を介して接続されて前記障害監視装置3からの障害メッセージをインシデントとして管理し、インシデントに対する一次対応の進捗状況を管理する監視センタ5とを備える。該監視センタ5は、次の構成を備える。
(1)インシデントに一意に付与されたインシデントID毎のインシデント発生日時・ホスト名・発生システム・顧客名・メッセージ・対応事例ID・対応事例のフロー名を格納するインシデントデータベース7。
(2)ネットワーク4を介して障害監視装置3から受信したインシデントをインシデントデータベース7に自動で登録するインシデント管理システム6。
(3)対応事例に一意に付与された対応事例ID毎の対応事例と検証段階(Step1〜Step3)毎の成功率・失敗率・実行回数・失敗回数等の実績情報を格納した作業実績管理データベース9。
(4)各処理ステップ毎の処理を実行する作業自動実行システム11と、前記インシデントがインシデントデータベース7に登録されたことを契機として起動され、インシデントデータベース7と作業実績管理データベース9の登録内容に基づいてパトランプ(信号灯)13を鳴動するか又は作業自動実行システム11を起動するかの何れかを決定するワークアラウンド実行管理システム8。
(5)該ワークアラウンド実行管理システム8が保存する作業実績管理データベース9に格納された実行結果(実績情報)を確認するための作業実績管理画面10。
(6)登録されたインシデントを参照し、インシデントに付加された対応事例に応じて対応手順書に基づいて一次対応を行うサービスデスク14のコンピュータ。
(7)前記作業自動実行システム11により実行された処理ステップである作業フロー15の結果を格納するデータベースである実行ログ12。
[Constitution]
As shown in FIG. 1, a computer system including a workaround execution management system according to the present embodiment includes a
(1)
(2) An
(3) A work performance management database storing performance information such as success cases, failure rates, execution times, failure times for each verification case (
(4) An automatic
(5) Work
(6) A computer of the
(7) An
なお、これら構成は、一般のコンピュータシステム同様に、CPU・メモリ・入出力機器・磁気ディスク装置・表示部を含むコンピュータ及びサーバ、データベース等のハードウェア並びにソフトウェアによって形成され前記パトランプ13は点灯する信号灯に限られるものではなく電子メール等のサービスデスク14に警告を発することができる他の手段であっても良い。
These components are formed by computer and server including CPU, memory, input / output device, magnetic disk device, display unit, hardware such as database, and software, and the
このように構成されたワークアラウンド実行管理システムを含むコンピュータシステムは、データセンタ1の障害監視装置3が監視対象機器2で発生した障害メッセージ(インシデントのメッセージ)を監視センタ5のインシデント管理システム6に送信する。このメッセージを受信したインシデント管理システム6が、インシデントデータベース7に受信したインシデントを自動で登録し、この登録を契機としてワークアラウンド実行管理システム8が、前記インシデントデータベース7及び作業実績管理データベース9の登録内容に基づいてパトランプ13を鳴動するか又は作業自動実行システム11を起動するかを後述の処理によって決定する。パトランプ13を鳴動した場合、サービスデスク14が作業自動実行システム11を使用して作業フロー15を手動で実行し、実行結果がNG(失敗)のとき、サービスデスク14が然るべき対策を行うように構成され、作業自動実行システム11が起動された場合、作業フロー15を自動で実行して、実行結果(実績情報)を実行ログ12に記録するように動作する。
The computer system including the workaround execution management system configured as described above transmits a failure message (incident message) generated by the
前記インシデントデータベース7は、IncidentTableを格納するものであって、図2に示す如く、次の項目情報から構成される。
(1)監視対象機器2から受信したメッセージ毎にインシデント管理システムが自動で採番した対応事例ID。
(2)当該インシデントが発生した発生日時。
(3)インシデントが発生した監視対象機器のホスト名。
(4)該監視対象機器にて稼働するアプリケーションシステムを表す発生システム。
(5)当該監視対象機器を利用する顧客名。
(6)当該監視対象機器から受信した実メッセージ。
(7)当該インシデントに対する障害解決を行うための対応事例(フロー名)。
(8)作業自動実行システム11が実行する作業フロー15のフロー名。
(9)実行状況。
The
(1) Corresponding case ID automatically assigned by the incident management system for each message received from the monitored
(2) Date and time when the incident occurred .
(3) Host name of the monitored device where the incident occurred .
(4) A generation system representing an application system operating on the monitored device .
(5) Name of the customer who uses the monitored device .
(6) An actual message received from the monitored device .
(7) Response example (flow name) for solving a failure for the incident .
(8) The flow name of the
(9) Execution status .
前記作業実績管理データベース9は、インシデント毎に付与される対応事例毎にそれぞれの事例の現在のStepと、各Stepでの実行回数と、各Stepでの成功回数と、各Stepでの失敗回数と、各Stepでの成功率と、各Stepでの失敗率などの運用実績情報を格納している。
The work
前記作業実績管理画面10は、インシデントの各検証段階(Step)の実行レベルに応じた「現在の状況」欄と「過去1週間の実行結果」欄から成る検証状況を表示するものであって、図5に示す如く、「現在の状況」欄は、事例ID毎に、対応事例と、現在のStepと、各Stepにおける実行回数と、各Stepでの成功回数と、各Stepでの失敗回数と、各Stepでの成功率と、各Stepでの失敗率などの各項目情報を運用実績情報として表示し、「過去1週間の実行結果」欄は、インシデントID毎に、対応事例と、実行区分と、実行結果の各項目情報を表示するものである。
The work
インシデント一覧画面は、図6に示す如く、前記インシデントID毎に、当該インシデントが発生した発生日時と、インシデントが発生した監視対象機器のホスト名と、該監視対象機器にて稼働するアプリケーションシステムを表す発生システムと、当該監視対象機器を利用する顧客名と、当該監視対象機器から受信した実メッセージと、当該インシデントに対する障害解決を行うための対応事例(フロー名)と、実行状況の各項目情報とから構成される。 As shown in FIG. 6, the incident list screen shows, for each incident ID, the date and time when the incident occurred, the host name of the monitored device where the incident occurred, and the application system running on the monitored device. The generation system, the name of the customer who uses the monitored device, the actual message received from the monitored device, the response case (flow name) for solving the fault for the incident, and the item information of the execution status Consists of
[動作]
さて、前述のように構成されたワークアラウンド実行管理システムは、図7に示す如く、次の各ステップを実行する。
(1)インシデント登録時にインシデント管理システム6から自動実行されたワークアラウンド実行管理システム8が起動されたとき、インシデントデータベース7から前記インシデントの対応事例IDと対応事例に定義されているフロー名を抽出するステップ701。
(2)該ステップ701で取得した対応事例IDに基づいて作業実績管理データベース9から現在のStep(検証レベル)を取得するステップ702。
(3)該ステップ702によって取得した現在のStepの検証レベルがStep1かStep2かStep3かを判定するステップ703。
[Operation]
Now, the workaround execution management system configured as described above executes the following steps as shown in FIG .
(1) When the workaround
(2)
(3)
(4)該ステップ703によってStep1の検証レベルと判定したとき、パトランプ13を鳴動させてサービスデスク14に作業フローを手動で実行させることを促すと共にワークアラウンド実行管理システム8がインシデント一覧画面(図6)の作業状況を「手動実行(Step1)」に更新するステップ704。
(5)該ステップ704による一連の作業実行終了まで待機するステップ705。
(6)前記ステップ704によるサービスデスクでの手動実行を実行ログ12を監視して作業終了まで待機すると共に実行結果を取得するステップ706。
(7)前記ステップ703によってStep2と判定されたとき、ワークアラウンド実行管理システム8に対して当該作業フローを実行指示するステップ707。
(8)該ステップ707による実行完まで待機するステップ708。
(4) When the verification level of
(5)
(6)
(7)
(8)
(9)実行完了後にステップ709によって結果を取得し、作業フローの実行結果が正常・異常に関わらず、サービスデスクに対して結果を通知するステップ709。
(10)前記ステップ703によってStep3と判定されたとき、ワークアラウンド実行管理システム8に対して当該作業フローを実行指示するステップ710。
(11)実行完了まで待機するステップ711。
(12)該ステップ710による実行完了後に結果を取得し、実行結果が正常か異常かを判定するステップ712。
(13)該ステップ712において異常と判定したときに異常が発生したことをサービスデスクに通知するステップ713。
(14)前記ステップ706とステップ709とステップ713とステップ712により正常と判定されたとき、各Stepの実行結果を作業実績管理データベース9に記録するステップ714。
(9)
(10)
(11)
(12)
(13)
(14)
(15)作業実績管理データベース9の現在のStepの実行結果を取得し、実行回数が5以上かつ成功率が80%以上か判定するステップ715。
(16)該ステップ715において実行回数が5以上かつ成功率が80%以上と判定したとき、処理中事例の「現在のStep」をランクアップするステップ716。
(17)前記ステップ715において実行回数が5以上かつ成功率が80%以上でないと判定したとき、現在のStepの実行結果を取得し失敗率が21%以上であるか否かを判定し、失敗率が21%以上でないと判定したときに処理を終了するステップ717。
(18)前記ステップ718において失敗率が21%以上であると判定したとき、現在のStep(検証レベル)を低下させて処理を終了するステップ718。
これらステップを実行することによって、各作業フローの運用実績により、サービスデスク14の関与を必要とする作業を変化させることによって、段階的に自動化の範囲を拡大することができる。
(15)
(16) When it is determined in
(17) When it is determined in
(18) When it is determined in
By executing these steps , the range of automation can be expanded step by step by changing the work requiring the involvement of the
本ワークアラウンド実行管理システムは、作業フローの本番環境において、作業フローの多数のインシデントに対する検証レベルとして、本番環境にリリースし、サービスデスク14が動作を監視する段階であるStep1と、該Step1の次に実装置において一定成功率(第1の成功率)以上の実績を残し、作業フロー実行の正常及び異常をサービスデスク14に通知する段階であるStep2と、該Step2の次に一定成功率(第2の成功率)以上で実績を残し、作業フロー実行が異常のときのみにサービスデスク14に通知する段階であるStep3との3段階として設定する。そして、前記Step2又はStep3において第1又は第2成功率未満の作業フローの段階を下げることによって、作業を自動化する際のワークアラウンド(一次対応)である作業フローの検証を効率的に行うことができる。
This word over click around execution management system, in a production environment workflow, and the verify level for a number of incidents of workflow, released into production,
1 データセンタ、2 監視対象機器、3 障害監視装置、
4 ネットワーク、5 監視センタ、6 インシデント管理システム、
7 インシデントデータベース、8 ワークアラウンド実行管理システム、
9 作業実績管理データベース、10 作業実績管理画面、
11 作業自動実行システム、12 実行ログ、13 パトランプ、
14 サービスデスク、15 作業フロー
1 data center, 2 monitored equipment, 3 fault monitoring device,
4 network, 5 monitoring center, 6 incident management system,
7 incident database, 8 workaround execution management system,
9 Work results management database, 10 Work results management screen,
11 work automatic execution system, 12 execution log, 13 patrol,
14 Service Desk, 15 Work Flow
Claims (8)
テストを完了した作業フローの本番環境においてサービスデスクが作業フローの動作を監視する第1段階と、該第1段階において第1の成功率以上の正常動作が確認された作業フローの正常及び異常をサービスデスクに通知すると共に前記第1の成功率未満の正常動作が確認された作業フローを第1段階に下げる第2段階と、該第2段階において第2の成功率以上の正常動作が確認された作業フローの異常をサービスデスクに通知すると共に前記第2の成功率未満の正常動作が確認された作業フローを第2段階に下げる第3段階とを設定しておき、
前記フロー名の作業フローを実行した際の前記第1から第3段階毎の成功率を含む実績情報を作業実績管理データベースに格納する第1工程と、
前記第1段階において第1の成功率以上の正常動作が確認された作業フローの正常及び異常をサービスデスクに通知し、前記第1の成功率以上の正常動作が確認された作業フローを第2段階に上げる第2工程と、
前記第2段階において第2の成功率以上の正常動作が確認された作業フローの異常をサービスデスクに通知し、前記第1の成功率以上の正常動作が確認された作業フローを第3段階に上げると共に第2の成功率未満の正常動作が確認された作業フローを第1段階に下げる第3工程と、
前記第3段階において第2の成功率未満の正常動作が確認された作業フローを第2段階に下げる第4工程とを実行するワークアラウンド実行管理システム。 An incident database that stores a message corresponding to an incident ID uniquely assigned to an incident and a flow name of a response case, an incident management system that registers a received incident in the incident database, and a work flow with the flow name are executed Confirming the work automatic execution system, the work result management database storing the result information including the success rate for each verification stage when the work flow of the flow name is executed, and the result information stored in the work result management database A work-around execution management system that displays a work result management screen and is connected to a service desk computer that controls the execution of the work flow, and manages the execution of the incident response work flow,
The first stage in which the service desk monitors the operation of the work flow in the production environment of the work flow that has been tested, and the normality and abnormality of the work flow in which the normal operation of the first success rate or higher is confirmed in the first stage. A second step of notifying the service desk and lowering the work flow in which the normal operation less than the first success rate is confirmed to the first step, and a normal operation exceeding the second success rate being confirmed in the second step. A third step of notifying the service desk of the abnormal work flow and lowering the work flow in which normal operation less than the second success rate is confirmed to the second step;
A first step of storing performance information including a success rate for each of the first to third stages when the work flow having the flow name is executed in a work performance management database;
The service desk is notified of the normality and abnormality of the work flow in which the normal operation equal to or higher than the first success rate is confirmed in the first stage, and the work flow in which the normal operation equal to or higher than the first success rate is confirmed to the second A second step to step up,
An abnormality in the work flow in which the normal operation equal to or higher than the second success rate is confirmed in the second stage is notified to the service desk, and the work flow in which the normal operation equal to or higher than the first success rate is confirmed is set to the third stage. And a third step of lowering the work flow in which normal operation less than the second success rate is confirmed to the first stage,
The third step second fourth Ruwa over click around execution management system to perform the steps of lowering the work flow that normal operation has been confirmed less than the success rate in the second stage of the.
前記コンピュータシステムに、
テストを完了した作業フローの本番環境においてサービスデスクが作業フローの動作を監視する第1段階と、該第1段階において第1の成功率以上の正常動作が確認された作業フローの正常及び異常をサービスデスクに通知すると共に前記第1の成功率未満の正常動作が確認された作業フローを第1段階に下げる第2段階と、該第2段階において第2の成功率以上の正常動作が確認された作業フローの異常をサービスデスクに通知すると共に前記第2の成功率未満の正常動作が確認された作業フローを第2段階に下げる第3段階とを設定させ、
前記フロー名の作業フローを実行した際の前記第1から第3段階毎の成功率を含む実績情報を作業実績管理データベースに格納する第1工程と、
前記第1段階において第1の成功率以上の正常動作が確認された作業フローの正常及び異常をサービスデスクに通知し、前記第1の成功率以上の正常動作が確認された作業フローを第2段階に上げる第2工程と、
前記第2段階において第2の成功率以上の正常動作が確認された作業フローの異常をサービスデスクに通知し、前記第1の成功率以上の正常動作が確認された作業フローを第3段階に上げると共に第2の成功率未満の正常動作が確認された作業フローを第1段階に下げる第3工程と、
前記第3段階において第2の成功率未満の正常動作が確認された作業フローを第2段階に下げる第4工程とを実行させるワークアラウンド実行管理方法。 An incident database that stores a message corresponding to an incident ID uniquely assigned to an incident and a flow name of a response case, an incident management system that registers a received incident in the incident database, and a work flow with the flow name are executed Confirming the work automatic execution system, the work result management database storing the result information including the success rate for each verification stage when the work flow of the flow name is executed, and the result information stored in the work result management database is connected to the service desk computer to control the execution of the workflow displays an operation result management screen for, a work Arau down de execution management method of a computer system for managing the execution of the workflow incident response,
In the computer system,
The first stage in which the service desk monitors the operation of the work flow in the production environment of the work flow that has been tested, and the normality and abnormality of the work flow in which the normal operation of the first success rate or higher is confirmed in the first stage. A second step of notifying the service desk and lowering the work flow in which the normal operation less than the first success rate is confirmed to the first step, and a normal operation exceeding the second success rate being confirmed in the second step. A third step of notifying the service desk of the abnormal work flow and lowering the work flow in which normal operation less than the second success rate is confirmed to the second step;
A first step of storing performance information including a success rate for each of the first to third stages when the work flow having the flow name is executed in a work performance management database;
The service desk is notified of the normality and abnormality of the work flow in which the normal operation equal to or higher than the first success rate is confirmed in the first stage, and the work flow in which the normal operation equal to or higher than the first success rate is confirmed to the second A second step to step up,
An abnormality in the work flow in which the normal operation equal to or higher than the second success rate is confirmed in the second stage is notified to the service desk, and the work flow in which the normal operation equal to or higher than the first success rate is confirmed is set to the third stage. And a third step of lowering the work flow in which normal operation less than the second success rate is confirmed to the first stage,
The third step second fourth step and Ruwa over click-around execution management method is run to lower the work flow that normal operation has been confirmed less than the success rate in the second step in.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2013050952A JP6087673B2 (en) | 2013-03-13 | 2013-03-13 | Workaround execution management system and workaround execution management method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2013050952A JP6087673B2 (en) | 2013-03-13 | 2013-03-13 | Workaround execution management system and workaround execution management method |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2014178777A JP2014178777A (en) | 2014-09-25 |
| JP6087673B2 true JP6087673B2 (en) | 2017-03-01 |
Family
ID=51698687
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2013050952A Expired - Fee Related JP6087673B2 (en) | 2013-03-13 | 2013-03-13 | Workaround execution management system and workaround execution management method |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP6087673B2 (en) |
Family Cites Families (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3449425B2 (en) * | 1993-02-23 | 2003-09-22 | 本田技研工業株式会社 | Computer network monitoring support system |
| JP2006023910A (en) * | 2004-07-07 | 2006-01-26 | Hitachi Ltd | Server failure recovery method and server failure recovery system |
| JP4533716B2 (en) * | 2004-10-13 | 2010-09-01 | 株式会社野村総合研究所 | Re-warning system for failure messages |
| JP4872262B2 (en) * | 2005-07-27 | 2012-02-08 | 日本電気株式会社 | Management support system, management support method, and management support program |
| JP5731223B2 (en) * | 2011-02-14 | 2015-06-10 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | Abnormality detection device, monitoring control system, abnormality detection method, program, and recording medium |
-
2013
- 2013-03-13 JP JP2013050952A patent/JP6087673B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2014178777A (en) | 2014-09-25 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US9049105B1 (en) | Systems and methods for tracking and managing event records associated with network incidents | |
| US10682761B2 (en) | System and method for detecting and fixing robotic process automation failures | |
| US10083110B2 (en) | Systems and methods for software testing and test management | |
| CN105518629B (en) | Cloud Deployment Infrastructure Validation Engine | |
| US20130079972A1 (en) | Maintenance systems and methods for use in analyzing maintenance data | |
| CN107329877B (en) | Air ticket business monitoring and executing system and method | |
| WO2019000963A1 (en) | Pre-inspection method for service system, server, and computer readable storage medium | |
| CN102611726A (en) | Monitoring alarm device and monitoring alarm method | |
| CN108846484A (en) | Fault self-recovery system, method, computer equipment and storage medium | |
| CN102789405A (en) | Automated testing method and system for mainboard | |
| CN110119325A (en) | Server failure processing method, device, equipment and computer readable storage medium | |
| CN109726048A (en) | Data recovery method and device in a transaction system | |
| US10664765B2 (en) | Labelling intervals using system data to identify unusual activity in information technology systems | |
| CN106169962A (en) | A kind of storage system failure monitoring method and system | |
| CN115292123A (en) | System exception handling method and device, storage medium and electronic equipment | |
| JP5613570B2 (en) | Batch job delay warning automatic alert system, automatic alert method, and program therefor | |
| CN111444032A (en) | Computer system fault repairing method, system and equipment | |
| JP6087673B2 (en) | Workaround execution management system and workaround execution management method | |
| CN106533812B (en) | Application server | |
| CN114924945A (en) | Test-driven service monitoring method, device, equipment and medium | |
| CN114490150A (en) | Method and system for abnormal positioning | |
| US9542250B2 (en) | Distributed maintenance mode control | |
| US8214452B2 (en) | Monitoring of windows on computers | |
| TW201945291A (en) | Water treatment equipment maintenance support device and maintenance support system | |
| JP2015095105A (en) | Recovery procedure update system, recovery procedure update method, and recovery support program |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160229 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161214 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161220 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170118 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170131 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170202 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6087673 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| LAPS | Cancellation because of no payment of annual fees |