Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP4198217B2 - Operation system and congestion control method in the operation system - Google Patents
[go: Go Back, main page]

JP4198217B2 - Operation system and congestion control method in the operation system - Google Patents

Operation system and congestion control method in the operation system Download PDF

Info

Publication number
JP4198217B2
JP4198217B2 JP25946797A JP25946797A JP4198217B2 JP 4198217 B2 JP4198217 B2 JP 4198217B2 JP 25946797 A JP25946797 A JP 25946797A JP 25946797 A JP25946797 A JP 25946797A JP 4198217 B2 JP4198217 B2 JP 4198217B2
Authority
JP
Japan
Prior art keywords
autonomous
message
agent
operation system
messages
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP25946797A
Other languages
Japanese (ja)
Other versions
JPH1196129A (en
Inventor
光 瀬社家
伸広 木村
雅典 古谷
成之 佐野
敦 内田
智之 水野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
NTT Inc
NTT Inc USA
Original Assignee
Fujitsu Ltd
Nippon Telegraph and Telephone Corp
NTT Inc USA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd, Nippon Telegraph and Telephone Corp, NTT Inc USA filed Critical Fujitsu Ltd
Priority to JP25946797A priority Critical patent/JP4198217B2/en
Publication of JPH1196129A publication Critical patent/JPH1196129A/en
Application granted granted Critical
Publication of JP4198217B2 publication Critical patent/JP4198217B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Computer And Data Communications (AREA)
  • Telephonic Communication Services (AREA)
  • Multi Processors (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、複数の通信装置を通信媒体を介して管理する汎用計算機を構成要素とするオペレーションシステムの輻輳規制技術に係り、特に、管理対象の通信装置から発行される複数の自律メッセージによって動的に輻輳規制を行うオペレーションシステムおよびその輻輳規制方法に関する。
【0002】
【従来の技術】
近年、ネットワークの多様化に伴い、大規模かつ複雑に構成されるネットワークを一元管理できるオペレーションシステムが要望されている。このような大規模集約が求められるオペレーションシステムにおいては、一つのオペレーションシステムで管理できる管理対象の数の増加を図らなければならず、その場合、一般に、多数の管理対象のネットワーク構成要素(例えば、交換機)から送出される多数のメッセージ(設備構成,実装情報などの静的メッセージや状態変更報告,警報報告などの動的メッセージ)を全てリアルタイムで処理しなければならず、オペレーションシステムの負荷が増大し、オペレーションシステムの構成要素である汎用計算機の処理能力をオーバしてしまうという問題が発生する。このような、オペレーションシステムの負荷の増大を如何に軽減するかは重要な研究課題であり、いくつかの研究発表が行われている。
【0003】
例えば、信学技報 SSE93-51 IN93-58 CS93-74(1993-09) PP.77-82 に記載されたもの(従来技術1という)では、オペレーションシステムの負荷を低減するために、ネットワーク構成要素である交換機で発生した事象の緊急度、すなわち、メッセージの重要度に着目し、重要度に応じてリアルタイム通知による監視情報の収集と非リアルタイム通知による監視情報の収集を切り分けている。具体的には、通常時は、重要度の高いメッセージのみをオペレーションシステムへ通知するようにしておき、重要度の低いメッセージは、オペレーションシステムの負荷の低い時間帯(例えば、夜間など)に定期的にログ収集処理を起動するようにしている。
【0004】
また、信学技報SSE95-129 (1995-12) PP.25-30 に記載されたもの(従来技術2という)では、OSI(Open System Interconnection:開放型システム相互接続)のシステム管理において、管理の対象となる複数の通信装置を持つエージェントに対しマネージャとなるオペレーションシステム内の複数の管理プログラムは個々に通信媒体を介してアソシエーションと呼ばれる論理回線を確立して通信を行うようにしており、その中で、オペレーションシステムは管理エージェント内の管理対象の状態を監視するため、管理プログラム毎に自律メッセージを分別する条件を管理エージェントの内の分別器に設定し、必要な自律メッセージのみ受信できるようにしている。
【0005】
【発明が解決しようとする課題】
上述したように、大規模集約が求められるオペレーションシステムでは、一つのオペレーションシステムで管理できる管理対象の数の増加を図る必要があるが、上記従来技術1では、重要度に応じてリアルタイム通知による監視情報の収集と非リアルタイム通知による監視情報の収集を切り分け、通常時は、重要度の高いメッセージのみをオペレーションシステムへ通知し、重要度の低いメッセージは、オペレーションシステムの負荷の低い時間帯に定期的に行うようにしているが、重要度の高いメッセージであるか重要度の低いメッセージであるかの判定のボーダーラインは予め静的に決められており、運転中に変更することがないので、状況に応じた輻輳規制制御を動的に行うことができない。
【0006】
また、上記従来技術2では、管理対象の数を増加する場合、オペレーションシステムは多数の管理対象となるエージェントに対しアソシエーションを確立し、通信装置の状態の監視を行う必要がある。ここでオペレーションシステムにおける管理対象プログラムは、一つのエージェントに対しアソシエーション毎に自分の欲する自律メッセージのみを受信するための分別条件を設定するため、一つのエージェントからオペレーションシステムに発行される自律メッセージ種別を限定される。しかし、管理プログラムで管理エージェントに設定できる分別条件は、自律メッセージの種別を限定することはできても単位時間に発行するメッセージ数までを限定することはできない。従って、オペレーションシステムの集約規模が拡大するにつれて管理対象となる通信装置の数が増大するため、オペレーションシステムでは、オペレーションシステム自身の処理性能を越える数の自律メッセージを管理エージェントより受信する可能性が高くなる。
【0007】
このように、一つもしくは複数の管理対象となる通信装置からオペレーションシステム自身の処理性能を越える数の自律メッセージを受信した場合、オペレーションシステムでは、汎用計算機のCPU、メモリなどのリソースネックにより輻輳状態となり、自律メッセージの表示遅延、制御コマンド投入不能などの障害を引き起こすことになる。また、大規模集約のオペレーションシステムにおいて、たとえ、ごく一部の管理対象エージェント/装置が自律メッセージ多発を引き起こしていても、オペレーションシステム自身が輻輳となっているため他の自律メッセージを多発していない管理対象エージェント/装置にまで、その監視/制御に支障をきたすこととなる。この事情は上記従来技術1でも同様である。
【0008】
大規模集約を行うオペレーションシステムにおいては、一部の管理対象エージェント/装置による自律メッセージ多発の事象に対し、オペレーションシステム自身の自衛のための自律メッセージの受信規制を動的に行い、オペレーションシステム自身の輻輳規制を行うことにより、他の自律メッセージ多発を起こしていない管理対象エージェント/装置の監視/制御にまで影響を及ぼさないようにすることが望ましいが、上記従来技術1や2に開示された構成ではそれは不可能である。
【0009】
本発明の目的は、上記事情に鑑み、大規模集約で通信装置の監視/制御を行うオペレーションシステムにおいて、いくつかの管理対象エージェントが自律メッセージを多発しても、オペレーションシステムがそれを動的にかつ自動的に検出し、管理対象エージェント自体からの自律メッセージ送出を規制するようにして、自律メッセージ多発によるオペレーションシステム自体の輻輳を、オペレーションシステムのリソースを消費することなく規制することができるオペレーションシステムおよび該オペレーションシステムにおける輻輳規制方法を提供することにある。
【0010】
【 課題を解決する手段】
上記目的を達成するために、本発明のオペレーションシステムは、個々の通信装置を持つエージェントからオペレーションシステムに対し自律メッセージが発行されたとき、該個々のエージェント(図1の16〜18,21〜23,26〜28)の自律メッセージの単位時間当たりの発行件数を計測する手段(同、メッセージカウンタ4,6,8)と、自律メッセージの単位時間当たりの発行件数が所定の閾値を越えたエージェントに対し、自律メッセージの重要性または緊急性に基づいて自律メッセージの発行を規制する規制条件を指定する信号を自動的に送り、当該エージェントからの自律メッセージの発行を規制する手段(同、分別条件制御部5,7,9)と、自律メッセージの発行を規制してから所定の時間経過後、当該エージェントに対し、前記自律メッセージの発行の規制を解除する信号を送信する手段(同、分別条件制御部5,7,9)と、輻輳状態であるか否かを示す輻輳フラグであって、該輻輳フラグがOFFの場合に、前記エージェントの自律メッセージの単位時間当たりの発行件数を計測するステップおよびそれに続く処理を行い、自律メッセージの重要性または緊急性に基づいて自律メッセージを規制する規制条件を指定する信号を送る際に該輻輳フラグをONにするとともに、該輻輳フラグがONの場合に、システムの待ちキュー数が予め決められた閾値未満の場合に受信した自律メッセージを管理プログラムに配信し、システムの待ちキュー数が予め決められた閾値以上の場合に受信した自律メッセージを破棄する輻輳フラグとを有することを特徴としている。
また、本発明のオペレーションシステムにおける輻輳規制方法は、複数の通信装置を持つエージェントからオペレーションシステムに対し自律メッセージが発行されたとき、それぞれのエージェントの自律メッセージの単位時間当たりの発行件数を計測するステップ(図2,図3のステップ103〜105)と、個々のエージェントごとに、単位時間当たりの自律メッセージの発行件数が所定の閾値を越えるか否かを判定するステップ(同、ステップ106)と、単位時間当たりの自律メッセージの発行件数が前記所定の閾値を越えたエージェントに対し、自律メッセージの重要性または緊急性に基づいて自律メッセージを規制する規制条件を指定する信号を自動的に送り、当該エージェントからくる自律メッセージを制限するステップ(同、ステップ109、図4のステップ203)と、当該エージェントからくる自律メッセージを制限してから所定の時間経過後、当該エージェントに対し、先の自律メッセージの制限を解除する信号を送信するステップ(図5のステップ304)と、輻輳状態であるか否かを示す輻輳フラグであって、該輻輳フラグがOFFの場合に、前記エージェントの自律メッセージの単位時間当たりの発行件数を計測するステップおよびそれに続く処理を行い、自律メッセージの重要性または緊急性に基づいて自律メッセージを規制する規制条件を指定する信号を送る際に該輻輳フラグをONにするとともに、該輻輳フラグがONの場合に、システムの待ちキュー数が予め決められた閾値未満の場合に受信した自律メッセージを管理プログラムに配信し、システムの待ちキュー数が予め決められた閾値以上の場合に受信した自律メッセージを破棄する輻輳フラグとからなることを特徴としている。また、前記エージェントの自律メッセージの単位時間当たりの発行件数を計測するステップは、該自律メッセージ受信毎に、該自律メッセージに対してサイクリックに付与されたメッセージカウント値と該自律メッセージを受信した時刻をテーブルに格納するサブステップと、該テーブルに基づいて単位時間当たりの自律メッセージの発行件数を推定するサブステップとからなることを特徴としている。
【0011】
【発明の実施の形態】
以下に、図面を参照しながら本発明の実施例について説明する。
図1は、本発明を複数の通信装置を管理する汎用計算機からなるオペレーションシステムに適用した構成概略図である。
図1において、1は複数の通信装置を管理するオペレーションシステム、2は汎用計算機、3は後述するエージェント15,20,25と通信を行う通信制御部、4,6,8は管理すべきエージェント毎に発行される単位時間当たりのメッセージ数を計測するメッセージカウンタ、5,7,9はメッセージカウンタからの要求を受け、管理すべきエージェントに分別条件を設定するための分別条件制御部、10は通信装置の監視/制御を司るシナリオを持った管理プログラム、11は各プログラムのタイマ登録要求に従い、所定の時刻にそれらプログラムの起動やプログラムへの電文送信を行うタイマ管理部、12,13,14はオペレーションシステムとエージェント間のアソシエーション、15,20,25はエージェント、16〜18,21〜23,26〜28はそれぞれエージェント15,20,25内の管理対象となる通信装置、19,24,29はそれぞれエージェント15,20,25における自律メッセージを分別する分別器である。
【0012】
図2は、単位時間当たりのメッセージ数を計測するのに用いるメッセージ受信数計測テーブルである。
次に、図2を用いて、メッセージ受信数計測テーブルの使用方法を説明する。まず、メッセージを受信する毎にそのメッセージに対するメッセージカウント値iとそのメッセージを受信した時刻tiをメッセージ受信数計測テーブルに順次書き込む。メッセージカウント値iは1から始めて最大nとする(図2参照)。メッセージ受信数計測テーブルのメッセージカウント値iが最大値nになって一巡すると、次からのメッセージは、再びメッセージカウント値1から始めメッセージ受信数計測テーブルに上書きをかける。なお、上書きをかける前に、一巡前に当該メッセージカウント値を書き込んだ時刻を索引し、上書きをかけようとしている新たな時刻(現在の時刻)とその索引時刻(1巡前の時刻)との差をとり、その差の時間がn個のメッセージを受信するのに充分大きな時間か否かを判定する。この処理により、1巡前の時刻と現在の時刻との間に受信したメッセージ数を知ることができる。これにより、逆に、単位時間当たりに受信するメッセージ数を推定することができる(=n/(現在の時刻−1巡前の時刻))。
【0013】
図3は、メッセージカウンタの処理フローチャートである。
図1において、管理プログラム10が分別条件制御部5,7,9を用いて、各エージェント15,20,25の分別器19,24,29に対し分別条件を設定し、全エージェントに対する自律メッセージ監視の準備が整った後、各メッセージカウンタ4,6,8が行う処理を、図3を用いて詳細に説明する。
【0014】
まず、各メッセージカウンタ4,6,8では、対応するエージェント15,20,25から自律メッセージを受信すると(ステップ101)、輻輳フラグがONかOFFかを判定する(ステップ102)。
判定の結果、輻輳フラグがOFFであれば、メッセージカウント値を増加した後(ステップ103;但し、メッセージカウント値の増加によりメッセージカウント値が図3のnを越えた場合、メッセージカウント値は再度1に戻るものとする)、現在時刻を収集し(ステップ104)、先の増加したメッセージカウント値をキーにして図3のメッセージ受信数計測テーブルから該キーに対応する時刻を収集し(ステップ105)、現在時刻とその収集した時刻の時間差が閾値未満であるか否かを判定する(ステップ106)。
【0015】
ステップ106での判定の結果、現在時刻とその収集時刻の時間差が閾値と等しいかそれ以上であれば(ステップ106:N)、該メッセージカウント値に対応するメッセージ受信数計測テーブルの欄を更新し(ステップ107)、管理プログラムに受信した自律メッセージを配信する(ステップ108)。
ステップ106での判定の結果、現在時刻とその収集時刻の時間差が閾値未満であれば(ステップ106:Y)、規定時間内に閾値以上のメッセージを受信したものとして輻輳フラグをONにして(ステップ109)、分別条件制御部へ閾値オーバー通知を発行する(ステップ110)。
【0016】
また、ステップ102の判定の結果、輻輳フラグがONの場合、システム内の待ちキュー数を収集し(ステップ111)、待ちキュー数が閾値未満であるか否かを判定する(ステップ112)。待ちキュー数が閾値未満であれば(ステップ112:Y)、未だ余裕があるものとして管理プログラムに自律メッセージを配信する(ステップ113)。逆に、待ちキュー数が閾値と等しいか越えた場合には(ステップ112:N)、余裕がないものとして自律メッセージを破棄する(ステップ114)。
【0017】
図4は、メッセージカウンタからの閾値オーバー通知を受信した場合の分別条件制御部の処理フローチャートである。
各分別条件制御部5,7,9はそれぞれ、メッセージカウンタ4,6,8から閾値オーバー通知を受信した場合(ステップ201)、図3のステップ106で閾値オーバーとなった対応する分別器19,24,29に設定されている現在の分別条件を保存する(ステップ202)。その後、上記閾値オーバーである旨を設定するとともに、対応するエージェントの分別器に対して規制条件を強化した分別条件を設定する(ステップ203)。ここで、規制条件を強化した分別条件とは、例えば、受信する自律メッセージをより重要度または緊急性の高いものに限定するなど、受信する自律メッセージに対する規制を強化する条件のことをいう。このように、規制条件を強化した分別条件を、閾値オーバーに対応する分別器19,24,29に設定してから、所定の時間経過後に図5の分別条件制御部の処理が起動されるようにタイマ管理部11に対してタイマ登録を行う(ステップ204)。
【0018】
図5は、タイマ管理部からの起動要求を受信した場合の分別条件制御部の処理フローチャートである。
図4のステップ204のタイマ管理部11に対するタイマ登録が終了し、タイマ登録された所定の時間経過後、タイマ管理部11から起動要求を受信すると(ステップ301)、システムにおける待ちキュー数を収集し(ステップ302)、待ちキュー数が閾値未満であるか否かを判定する(ステップ303)。
【0019】
ステップ303における判定の結果、待ちキュー数が閾値未満であれば(ステップ303:Y)、輻輳状態が解消したものとみなして、図4のステップ202で保存していた分別条件を、対象とするエージェントの分別器に設定し規制強化した分別条件を設定する前の状態に戻すとともに(ステップ304)、輻輳フラグをOFFにする(ステップ305)。
また、ステップ303における判定の結果、待ちキュー数が閾値と等しいか越えていた場合(ステップ303:N)、未だ輻輳が解消していないものとみなして、再度タイマ管理部へ所定の時間のタイマ登録を行う(ステップ306)。
【0020】
なお、上記実施例において、図4のステップ204および図5のステップ306でタイマ管理部11へ登録する「所定の時間」は通常の運用時に輻輳状態が変動する程度の適当な時間を予め固定的に決めておいてもよいが、例えば、輻輳状態がなかなか解消されない場合に所定の時間を長く設定するなど、状況に応じて変化させるようにしてもよい。
また、上記実施例では、通信装置の自律メッセージの単位時間当たりの発行件数の計測は、メッセージカウント値と自律メッセージを受信した時刻を格納したメッセージ受信数計測テーブルに基づいて行われているが、単位時間計測タイマで計測される単位時間内に受信される自律メッセージ数を直接検出するようにしてもよい。
【0021】
【発明の効果】
以上述べたように、本発明のオペレーションシステムおよびその輻輳規制方法によれば、いくつかの管理対象エージェントが自律メッセージを多発した場合でも、オペレーションシステムが動的にかつ自動的にそれを検出し、管理対象エージェント自体からの自律メッセージ送出を規制することにより、自律メッセージ多発によるオペレーションシステム自体の輻輳を、オペレーションシステムのリソースを消費することなく規制することが可能になる。
【図面の簡単な説明】
【図1】本発明の一実施例を説明するための図である。
【図2】本発明の一実施例における単位時間当たりのメッセージ受信数計測テーブルを説明するための図である。
【図3】本発明の一実施例におけるメッセージカウンタの処理フローチャートである。
【図4】本発明の一実施例におけるメッセージカウンタからの閾値オーバー通知を受信したときの分別条件制御部の処理フローチャートである。
【図5】本発明の一実施例におけるタイマ管理部からの起動要求を受信したときの分別条件制御部の処理フローチャートである。
【符号の説明】
1:オペレーションシステム
2:汎用計算機
3:通信制御部
4,6,8:メッセージカウンタ
5,7,9:分別条件制御部
10:管理プログラム
11:タイマ管理部
12,13,14:アソシエーション
15,20,25:エージェント
16〜18,21〜23,26〜28:通信装置
19,24,29:分別器
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a congestion control technology for an operation system including a general-purpose computer that manages a plurality of communication devices via a communication medium, and in particular, dynamically by a plurality of autonomous messages issued from managed communication devices. The present invention relates to an operation system that performs congestion regulation and a congestion regulation method thereof.
[0002]
[Prior art]
In recent years, with the diversification of networks, there has been a demand for an operation system capable of centrally managing a large and complex network. In such an operation system that requires large-scale aggregation, it is necessary to increase the number of management targets that can be managed by a single operation system. In that case, in general, a large number of managed network components (for example, Many messages (static messages such as equipment configuration, mounting information, and dynamic messages such as status change reports and alarm reports) sent from the exchange must be processed in real time, increasing the load on the operation system. However, there arises a problem that the processing capacity of the general-purpose computer that is a component of the operation system is exceeded. How to reduce such an increase in operation system load is an important research subject, and several research presentations have been made.
[0003]
For example, according to the one described in IEICE Technical Report SSE93-51 IN93-58 CS93-74 (1993-09) PP.77-82 (referred to as Conventional Technology 1), the network configuration is reduced to reduce the load on the operation system. Focusing on the urgency of an event that has occurred in an exchange, which is an element, that is, the importance of a message, the collection of monitoring information by real-time notification and the collection of monitoring information by non-real-time notification are separated according to the importance. Specifically, during normal times, only high-importance messages are reported to the operation system, and low-importance messages are regularly sent during times when the operation system is lightly loaded (for example, at night). The log collection process is started.
[0004]
Also, according to the one described in IEICE Technical Report SSE95-129 (1995-12) PP.25-30 (referred to as Prior Art 2), it is managed in the system management of OSI (Open System Interconnection). A plurality of management programs in the operation system serving as a manager for an agent having a plurality of communication devices targeted for communication individually establish a logical line called an association via a communication medium, and perform communication. In order to monitor the status of the management target in the management agent, the operation system sets the conditions for classifying autonomous messages for each management program in the classifier in the management agent so that only necessary autonomous messages can be received. ing.
[0005]
[Problems to be solved by the invention]
As described above, in an operation system that requires large-scale aggregation, it is necessary to increase the number of management targets that can be managed by one operation system. However, in the conventional technique 1, monitoring is performed by real-time notification according to importance. Separates the collection of monitoring information from information collection and non-real-time notification. In normal times, only high-importance messages are reported to the operation system, and low-priority messages are regularly sent during times when the operation system is lightly loaded. However, the borderline for determining whether the message is a high importance message or a low importance message is statically determined in advance and does not change during driving. It is not possible to dynamically perform congestion regulation control according to.
[0006]
Further, in the above-described conventional technique 2, when the number of management targets is increased, the operation system needs to establish associations with a number of agents to be managed and monitor the state of the communication device. Here, the managed program in the operation system sets the autonomous message type that is issued from one agent to the operation system in order to set the classification condition for receiving only the autonomous message that it desires for each association. Limited. However, the classification condition that can be set for the management agent by the management program cannot limit the number of messages issued per unit time even though the type of autonomous message can be limited. Accordingly, since the number of communication devices to be managed increases as the operation system aggregation scale increases, the operation system is more likely to receive autonomous messages from the management agent that exceed the processing performance of the operation system itself. Become.
[0007]
In this way, when the number of autonomous messages exceeding the processing performance of the operation system itself is received from one or more managed communication devices, the operation system is in a congested state due to resource bottlenecks such as the CPU and memory of the general-purpose computer. This causes problems such as delays in displaying autonomous messages and the inability to input control commands. Also, in a large-scale operation system, even if only a few managed agents / devices cause frequent autonomous messages, the operation system itself is congested and does not generate other autonomous messages. Even the management target agent / device is hindered in its monitoring / control. This situation is the same as in the prior art 1.
[0008]
In the operation system that performs large-scale aggregation, the reception of autonomous messages for the self-defense of the operation system itself is dynamically performed in response to the frequent occurrence of autonomous messages by some managed agents / devices. Although it is desirable not to affect the monitoring / control of other managed agents / devices that have not caused frequent occurrence of other autonomous messages by performing congestion control, the configurations disclosed in the above prior arts 1 and 2 Then it is impossible.
[0009]
In view of the above circumstances, an object of the present invention is to provide an operation system for monitoring / controlling communication devices with large-scale aggregation. Even if several managed agents frequently generate autonomous messages, the operation system dynamically In addition, an operation system that automatically detects and regulates autonomous message transmission from the managed agent itself to regulate congestion of the operation system itself due to frequent autonomous messages without consuming operation system resources. Another object of the present invention is to provide a congestion control method in the operation system.
[0010]
[Means for solving problems]
To achieve the above object, the operation system of the present invention, when the autonomous message is issued to the operating system from the agent with the individual communication device, the individual agents (in FIG. 1 16~18,21~23 26-28) means for measuring the number of autonomous messages issued per unit time (same as message counters 4, 6 and 8), and for agents whose number of autonomous messages issued per unit time exceeds a predetermined threshold. On the other hand, a means for automatically sending a signal specifying a restriction condition for restricting the issuance of an autonomous message based on the importance or urgency of the autonomous message and restricting the issuance of the autonomous message from the agent (same condition control as above) and parts 5,7,9), the elapsed time after issuing from the restriction of certain autonomous message, the agent To said means for transmitting a signal for releasing the restriction of the issuance of the autonomous message (same fractional condition control unit 5, 7, 9) and, a congestion flag indicating whether or not the congestion state, the congestion When the flag is OFF, specify the regulation condition to regulate the autonomous message based on the importance or urgency of the autonomous message by performing the step of measuring the number of autonomous messages issued per unit time of the agent and the subsequent processing The congestion flag is set to ON when sending a signal to be sent, and if the congestion flag is ON, the autonomous message received when the number of queues in the system is less than a predetermined threshold is delivered to the management program, and wherein a discarding congestion flag autonomous messages received when the wait queue of the system is equal to or higher than the threshold to a predetermined To have.
In the congestion control method in the operation system of the present invention, when an autonomous message is issued to an operation system from an agent having a plurality of communication devices, a step of measuring the number of autonomous messages issued per unit time of each agent (Steps 103 to 105 in FIGS. 2 and 3), a step of determining whether or not the number of autonomous messages issued per unit time exceeds a predetermined threshold for each individual agent (step 106). A signal that automatically specifies a regulation condition for regulating an autonomous message based on the importance or urgency of the autonomous message is automatically sent to an agent whose number of autonomous messages issued per unit time exceeds the predetermined threshold. step to limit the autonomous message coming from the agent (the same Step 109, the step 203) of FIG. 4, after a predetermined time has elapsed since the limit autonomous messages coming from the agent to the agent, sending a signal to release the restriction of the previous autonomous message (FIG. 5 Step 304) and a step of measuring the number of autonomous messages issued by the agent per unit time when the congestion flag is OFF, and subsequent processing. The congestion flag is set to ON when sending a signal designating a regulation condition for regulating the autonomous message based on the importance or urgency of the autonomous message, and the system waits when the congestion flag is ON. Deliver the received autonomous message to the management program when the number of queues is less than a predetermined threshold, Waiting queue of the stem is characterized by comprising a discarding congestion flag autonomous messages received not less than a predetermined threshold. In addition, the step of measuring the number of autonomous messages issued per unit time of the agent includes a message count value cyclically assigned to the autonomous message and a time when the autonomous message is received every time the autonomous message is received. Is stored in a table, and a sub-step of estimating the number of autonomous messages issued per unit time based on the table.
[0011]
DETAILED DESCRIPTION OF THE INVENTION
Embodiments of the present invention will be described below with reference to the drawings.
FIG. 1 is a schematic configuration diagram in which the present invention is applied to an operation system including a general-purpose computer that manages a plurality of communication devices.
In FIG. 1, 1 is an operation system that manages a plurality of communication devices, 2 is a general purpose computer, 3 is a communication control unit that communicates with agents 15, 20, and 25 to be described later, and 4, 6, and 8 are each agent to be managed. Counters for measuring the number of messages issued per unit time, 5, 7 and 9 receiving a request from the message counter, and a classification condition control unit for setting a classification condition for an agent to be managed, and 10 for communication A management program 11 having a scenario for monitoring / controlling the device, 11 is a timer management unit for starting the programs and transmitting messages to the programs at predetermined times in accordance with timer registration requests of the respective programs, and 12, 13, 14 Association between operation system and agent, 15, 20, 25 are agents, 16-18 21~23,26~28 communication apparatus respectively managed in the agent 15, 20, 25, 19,24,29 are fractionator for fractionating autonomous message in the agent 15, 20, 25, respectively.
[0012]
FIG. 2 is a message reception number measurement table used for measuring the number of messages per unit time.
Next, a method of using the message reception number measurement table will be described with reference to FIG. First, each time a message is received, the message count value i for that message and the time ti when the message is received are sequentially written in the message reception number measurement table. The message count value i starts from 1 and is at most n (see FIG. 2). When the message count value i in the message reception number measurement table reaches the maximum value n and completes a cycle, the next message starts again from the message count value 1 and overwrites the message reception number measurement table. Before overwriting, index the time when the message count value was written one round before, and the new time (current time) about to be overwritten and its index time (time one round before) The difference is taken and it is determined whether the difference is large enough to receive n messages. By this processing, the number of messages received between the time before the first round and the current time can be known. Thereby, conversely, the number of messages received per unit time can be estimated (= n / (current time-1time before the round)).
[0013]
FIG. 3 is a processing flowchart of the message counter.
In FIG. 1, the management program 10 sets classification conditions for the classifiers 19, 24, and 29 of the agents 15, 20, and 25 using the classification condition control units 5, 7, and 9, and monitors autonomous messages for all agents. 3 is described in detail with reference to FIG. 3.
[0014]
First, when each message counter 4, 6, 8 receives an autonomous message from the corresponding agent 15, 20, 25 (step 101), it determines whether the congestion flag is ON or OFF (step 102).
As a result of the determination, if the congestion flag is OFF, after the message count value is increased (step 103; however, if the message count value exceeds n in FIG. The current time is collected (step 104), and the time corresponding to the key is collected from the message reception number measurement table of FIG. 3 using the previously increased message count value as a key (step 105). Then, it is determined whether or not the time difference between the current time and the collected time is less than the threshold (step 106).
[0015]
If the result of determination in step 106 is that the time difference between the current time and the collection time is equal to or greater than the threshold (step 106: N), the message reception number measurement table column corresponding to the message count value is updated. (Step 107), the received autonomous message is distributed to the management program (Step 108).
If the time difference between the current time and the collection time is less than the threshold as a result of the determination in step 106 (step 106: Y), the congestion flag is set to ON (step 106: Y) as if a message exceeding the threshold was received within the specified time (step 109), an over-threshold notification is issued to the classification condition control unit (step 110).
[0016]
If the result of determination in step 102 is that the congestion flag is ON, the number of waiting queues in the system is collected (step 111), and it is determined whether or not the number of waiting queues is less than a threshold value (step 112). If the number of waiting queues is less than the threshold value (step 112: Y), an autonomous message is distributed to the management program assuming that there is still room (step 113). Conversely, when the number of waiting queues is equal to or exceeds the threshold (step 112: N), the autonomous message is discarded as having no room (step 114).
[0017]
FIG. 4 is a process flowchart of the classification condition control unit when a threshold-over notification is received from the message counter.
When the classification condition control units 5, 7, and 9 receive the threshold value over notification from the message counters 4, 6, and 8, respectively (step 201), the corresponding classifiers 19, The current classification conditions set in 24 and 29 are stored (step 202). After that, the fact that the threshold value is exceeded is set, and a classification condition that strengthens the restriction condition is set for the corresponding agent classifier (step 203). Here, the classification condition in which the restriction condition is strengthened refers to a condition for strengthening restriction on the received autonomous message, for example, by limiting the received autonomous message to one having higher importance or urgency. As described above, the classification condition control unit in FIG. 5 is activated after a predetermined time has elapsed since the classification condition with the stricter regulation condition set in the classifiers 19, 24, and 29 corresponding to the over-threshold. Then, timer registration is performed with respect to the timer management unit 11 (step 204).
[0018]
FIG. 5 is a processing flowchart of the classification condition control unit when the activation request from the timer management unit is received.
When the timer registration to the timer management unit 11 in step 204 of FIG. 4 is completed and a start request is received from the timer management unit 11 after a predetermined time has elapsed (step 301), the number of waiting queues in the system is collected. (Step 302), it is determined whether or not the number of waiting queues is less than a threshold (Step 303).
[0019]
If the result of determination in step 303 is that the number of waiting queues is less than the threshold value (step 303: Y), it is considered that the congestion state has been resolved, and the classification condition stored in step 202 in FIG. The state is returned to the state before setting the classification conditions set in the agent classifier and the regulations are strengthened (step 304), and the congestion flag is turned off (step 305).
If the result of determination in step 303 is that the number of waiting queues is equal to or exceeds the threshold value (step 303: N), it is considered that congestion has not yet been resolved, and the timer management unit again receives a timer for a predetermined time. Registration is performed (step 306).
[0020]
In the above embodiment, the “predetermined time” registered in the timer management unit 11 in step 204 in FIG. 4 and step 306 in FIG. 5 is fixed in advance to an appropriate time that the congestion state fluctuates during normal operation. However, it may be changed according to the situation, for example, by setting a predetermined time longer when the congestion state is not easily resolved.
In the above embodiment, the number of issued autonomous messages per unit time of the communication device is measured based on the message count measurement table storing the message count value and the time when the autonomous message was received. The number of autonomous messages received within the unit time measured by the unit time measurement timer may be directly detected.
[0021]
【The invention's effect】
As described above, according to the operation system and the congestion control method of the present invention, even when several managed agents frequently generate autonomous messages, the operation system dynamically and automatically detects it, By restricting autonomous message transmission from the managed agent itself, it becomes possible to restrict congestion of the operation system itself due to frequent occurrence of autonomous messages without consuming resources of the operation system.
[Brief description of the drawings]
FIG. 1 is a diagram for explaining an embodiment of the present invention.
FIG. 2 is a diagram for explaining a message reception count measurement table per unit time in an embodiment of the present invention.
FIG. 3 is a process flowchart of a message counter in an embodiment of the present invention.
FIG. 4 is a processing flowchart of a classification condition control unit when a threshold over notification is received from a message counter according to an embodiment of the present invention.
FIG. 5 is a processing flowchart of a classification condition control unit when an activation request is received from a timer management unit in one embodiment of the present invention.
[Explanation of symbols]
1: Operation system 2: General-purpose computer 3: Communication control units 4, 6, 8: Message counters 5, 7, 9: Classification condition control unit 10: Management program 11: Timer management units 12, 13, 14: Associations 15, 20 , 25: Agents 16-18, 21-23, 26-28: Communication devices 19, 24, 29: Separator

Claims (3)

それぞれが複数の通信装置を有する複数のエージェントと通信媒体を介して通信を行い、前記複数の通信装置を管理する汎用計算機を構成要素としたオペレーションシステムにおいて、
前記個々のエージェントからオペレーションシステムに対し自律メッセージが発行されたとき、該個々のエージェントの自律メッセージの単位時間当たりの発行件数を計測する手段と、
自律メッセージの単位時間当たりの発行件数が所定の閾値を越えたエージェントに対し、自律メッセージの重要性または緊急性に基づいて自律メッセージの発行を規制する規制条件を指定する信号を自動的に送り、当該エージェントからの自律メッセージの発行を規制する手段と、
自律メッセージの発行を規制してから所定の時間経過後、当該エージェントに対し、前記自律メッセージの発行の規制を解除する信号を送信する手段と、
輻輳状態であるか否かを示す輻輳フラグであって、
該輻輳フラグがOFFの場合に、前記エージェントの自律メッセージの単位時間当たりの発行件数を計測するステップおよびそれに続く処理を行い、自律メッセージの重要性または緊急性に基づいて自律メッセージを規制する規制条件を指定する信号を送る際に該輻輳フラグをONにするとともに、
該輻輳フラグがONの場合に、システムの待ちキュー数が予め決められた閾値未満の場合に受信した自律メッセージを管理プログラムに配信し、システムの待ちキュー数が予め決められた閾値以上の場合に受信した自律メッセージを破棄する輻輳フラグと
を具備することを特徴とするオペレーションシステム。
In an operation system comprising a general-purpose computer that performs communication via a communication medium with a plurality of agents each having a plurality of communication devices, and manages the plurality of communication devices ,
When the autonomous message to the operating system from the individual agents is issued, and means for measuring the issuance number per unit time of autonomous messages of the individual agents,
For agents whose number of autonomous messages issued per unit time exceeds a predetermined threshold, a signal is automatically sent to specify a regulation condition that restricts the issuing of autonomous messages based on the importance or urgency of autonomous messages. Means for restricting the issuing of autonomous messages from the agent;
Means for transmitting a signal for releasing the restriction on the issuance of the autonomous message to the agent after a predetermined time has passed since the issuance of the autonomous message was restricted;
A congestion flag indicating whether or not a congestion state,
A regulation condition for regulating the autonomous message based on the importance or urgency of the autonomous message by performing the step of measuring the number of autonomous messages issued per unit time of the agent and the subsequent processing when the congestion flag is OFF The congestion flag is turned on when sending a signal designating
When the congestion flag is ON, the received autonomous message is delivered to the management program when the number of waiting queues of the system is less than a predetermined threshold value, and the number of waiting queues of the system is equal to or larger than the predetermined threshold value. An operation system comprising a congestion flag for discarding a received autonomous message.
それぞれが複数の通信装置を有する複数のエージェントと通信媒体を介して通信を行い、前記複数の通信装置を管理する汎用計算機を構成要素としたオペレーションシステムにおける輻輳規制方法において、
前記個々のエージェントからオペレーションシステムに対し自律メッセージが発行されたとき、該個々のエージェントの自律メッセージの単位時間当たりの発行件数を計測するステップと、
前記個々のエージェントごとに、単位時間当たりの自律メッセージの発行件数が所定の閾値を越えるか否かを判定するステップと、
単位時間当たりの自律メッセージの発行件数が前記所定の閾値を越えたエージェントに対し、自律メッセージの重要性または緊急性に基づいて自律メッセージを規制する規制条件を指定する信号を自動的に送り、当該エージェントからくる自律メッセージを制限するステップと、
当該エージェントからくる自律メッセージを制限してから所定の時間経過後、当該エージェントに対し、先の自律メッセージの制限を解除する信号を送信するステップと、
輻輳状態であるか否かを示す輻輳フラグであって、
該輻輳フラグがOFFの場合に、前記エージェントの自律メッセージの単位時間当たりの発行件数を計測するステップおよびそれに続く処理を行い、自律メッセージの重要性または緊急性に基づいて自律メッセージを規制する規制条件を指定する信号を送る際に該輻輳フラグをONにするとともに、
該輻輳フラグがONの場合に、システムの待ちキュー数が予め決められた閾値未満の場合に受信した自律メッセージを管理プログラムに配信し、システムの待ちキュー数が予め決められた閾値以上の場合に受信した自律メッセージを破棄する輻輳フラグと
からなることを特徴とするオペレーションシステムにおける輻輳規制方法。
In the congestion control method in the operation system that performs communication via a communication medium with a plurality of agents each having a plurality of communication devices, and that includes a general-purpose computer that manages the plurality of communication devices ,
When an autonomous message is issued from the individual agent to the operation system, measuring the number of issued autonomous messages per unit time of the individual agent;
Determining whether the number of autonomous messages issued per unit time exceeds a predetermined threshold for each individual agent; and
A signal that automatically specifies a regulation condition for regulating an autonomous message based on the importance or urgency of the autonomous message is automatically sent to an agent whose number of autonomous messages issued per unit time exceeds the predetermined threshold. Limiting autonomous messages coming from agents;
Transmitting a signal for canceling the restriction of the previous autonomous message to the agent after a lapse of a predetermined time after restricting the autonomous message coming from the agent;
A congestion flag indicating whether or not a congestion state,
A regulation condition for regulating the autonomous message based on the importance or urgency of the autonomous message by performing the step of measuring the number of autonomous messages issued per unit time of the agent and the subsequent processing when the congestion flag is OFF The congestion flag is turned on when sending a signal designating
When the congestion flag is ON, the received autonomous message is delivered to the management program when the number of waiting queues of the system is less than a predetermined threshold value, and the number of waiting queues of the system is equal to or larger than the predetermined threshold value. A congestion control method in an operation system, comprising: a congestion flag for discarding a received autonomous message.
請求項2に記載のオペレーションシステムにおける輻輳規制方法において、
前記エージェントの自律メッセージの単位時間当たりの発行件数を計測するステップは、該自律メッセージ受信毎に、該自律メッセージに対してサイクリックに付与されたメッセージカウント値と該自律メッセージを受信した時刻をテーブルに格納するサブステップと、該テーブルに基づいて単位時間当たりの自律メッセージの発行件数を推定するサブステップとからなることを特徴とするオペレーションシステムにおける輻輳規制方法。
In the congestion control method in the operation system according to claim 2,
The step of measuring the number of autonomous messages issued per unit time of the agent is a table of a message count value cyclically assigned to the autonomous message and a time when the autonomous message is received for each reception of the autonomous message. And a sub-step for estimating the number of autonomous messages issued per unit time based on the table, and a congestion control method in an operation system.
JP25946797A 1997-09-25 1997-09-25 Operation system and congestion control method in the operation system Expired - Fee Related JP4198217B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP25946797A JP4198217B2 (en) 1997-09-25 1997-09-25 Operation system and congestion control method in the operation system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP25946797A JP4198217B2 (en) 1997-09-25 1997-09-25 Operation system and congestion control method in the operation system

Publications (2)

Publication Number Publication Date
JPH1196129A JPH1196129A (en) 1999-04-09
JP4198217B2 true JP4198217B2 (en) 2008-12-17

Family

ID=17334489

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25946797A Expired - Fee Related JP4198217B2 (en) 1997-09-25 1997-09-25 Operation system and congestion control method in the operation system

Country Status (1)

Country Link
JP (1) JP4198217B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5168219B2 (en) * 2009-04-15 2013-03-21 日本電気株式会社 State management system, state management method, management apparatus, management target apparatus, and program

Also Published As

Publication number Publication date
JPH1196129A (en) 1999-04-09

Similar Documents

Publication Publication Date Title
US5974518A (en) Smart buffer size adaptation apparatus and method
CA2496064C (en) System, method and computer program product for monitoring and controlling network connections from a supervisory operating system
US5696701A (en) Method and system for monitoring the performance of computers in computer networks using modular extensions
US9584617B2 (en) Allocating cache request in distributed cache system based upon cache object and marker identifying mission critical data
US9158649B2 (en) Methods and computer program products for generating a model of network application health
CN109450691B (en) Service gateway monitoring method, device and computer readable storage medium
CN109597837B (en) Time series data storage methods, query methods and related equipment
WO2019169724A1 (en) Server concurrency control method and device, computer device, and storage medium
US8174980B2 (en) Methods, systems, and computer readable media for dynamically rate limiting slowpath processing of exception packets
US20080225705A1 (en) Monitoring, Controlling, And Preventing Traffic Congestion Between Processors
CN113835985B (en) Method, device and equipment for monitoring and analyzing jamming reason
CN111611057A (en) Distributed retry method, device, electronic equipment and storage medium
US11880266B2 (en) Malfunction monitor for computing devices
JP2005018120A (en) Method for collecting apparatus information in network management system
CN109726151B (en) Method, apparatus, and medium for managing input-output stack
US20060224785A1 (en) Device and method for input and output of data
CN116016349B (en) Message scheduling method, device and system
CN116032842B (en) Congestion tolerance method, network device, storage medium and computer program product
JP4198217B2 (en) Operation system and congestion control method in the operation system
US20100146103A1 (en) Performance management system, information processing system, and information collecting method in performance management system
JP2001223694A (en) Network monitoring system
WO2026031989A1 (en) Parameter processing method and apparatus, product, device, and medium
CN112152876B (en) Method and device for acquiring packet loss information
JPH09282252A (en) Network management method
US10560317B2 (en) Subscription to a subset of switching events

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050215

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050405

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050715

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20050815

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050913

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20050927

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20051216

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20060929

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20061003

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20070119

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080530

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080811

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081001

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111010

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111010

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121010

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121010

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131010

Year of fee payment: 5

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees