JP7670167B2 - Resource management device and program - Google Patents
Resource management device and program Download PDFInfo
- Publication number
- JP7670167B2 JP7670167B2 JP2023565768A JP2023565768A JP7670167B2 JP 7670167 B2 JP7670167 B2 JP 7670167B2 JP 2023565768 A JP2023565768 A JP 2023565768A JP 2023565768 A JP2023565768 A JP 2023565768A JP 7670167 B2 JP7670167 B2 JP 7670167B2
- Authority
- JP
- Japan
- Prior art keywords
- load
- quality
- resource management
- service
- acquisition unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Debugging And Monitoring (AREA)
Description
本発明は、演算リソースを管理するリソース管理装置及びプログラムに関する。 The present invention relates to a resource management device and program for managing computational resources.
機械学習、人工知能(AI)、及び、IoT(Internet of Things)などの多くの分野で技術革新が進み、様々なデータを活用することで、サービスの高度化・付加価値の提供が盛んに行われている。このような処理では、大量の計算をする必要があり、そのための情報処理基盤が必須である。Technological innovation is progressing in many fields, including machine learning, artificial intelligence (AI), and the Internet of Things (IoT), and by utilizing various data, services are being actively improved and added value is being provided. This type of processing requires large amounts of calculations, and an information processing infrastructure is essential for this.
例えば、非特許文献1では、既存の情報処理基盤をアップデートしようとする試みが展開されてはいるものの、急速に増えていくデータに対して現代のコンピュータが対応しきれていない旨が指摘されている。また、非特許文献1では、今後さらなる進化を遂げていくためには、ムーアの法則を越える「ポストムーア技術」が確立されなければいけない旨が指摘されている。For example, Non-Patent Document 1 points out that, although attempts are being made to update existing information processing infrastructure, modern computers are unable to keep up with the rapid increase in data. Non-Patent Document 1 also points out that in order to achieve further evolution in the future, "post-Moore technology" that goes beyond Moore's Law must be established.
ポストムーア技術として、例えば、非特許文献2には、フローセントリックコンピューティングという技術が開示されている。フローセントリックコンピューティングにより、データのある場所で処理を行うというこれまでのコンピューティングの考えではなく、計算機能(演算リソース)が存在する場所にデータを移動して処理を行うという新たな概念が導入されている。As a post-Moore technology, for example, Non-Patent Document 2 discloses a technology called flow-centric computing. Flow-centric computing introduces a new concept of moving data to a location where a computing function (computing resource) is located and processing the data there, instead of the conventional computing idea of processing data where the data is located.
上記のようなフローセントリックコンピューティングを実現するためには、演算リソースをどのハードウェアにより構成するかを適切に管理する必要がある。例えば、管理が適切になされずに負荷の高い計算機のハードウェアにより演算リソースを構成すると、当該演算リソースでの処理に遅延が生じ得る。 To realize flow-centric computing as described above, it is necessary to properly manage which hardware constitutes the computing resources. For example, if the computing resources are constituted by the hardware of a computer with a high load without proper management, delays may occur in the processing of the computing resources.
本発明は、処理対象データを処理するサービスを分担して行う複数の演算リソースのハードウェア構成を適切に管理することを課題とする。 The objective of the present invention is to appropriately manage the hardware configuration of multiple computing resources that share the services of processing the data to be processed.
上記課題を解決するために、本発明のリソース管理装置は、複数の計算機からなる計算システムの一部のハードウェアを利用して構成され、処理対象データを処理するサービスを分担して行う複数の演算リソースのハードウェア構成を管理するリソース管理装置であって、前記サービスに要求される当該サービスの処理時間に関する品質を要求品質として取得する要求品質取得部と、第1ハードウェア構成の前記複数の演算リソースにより行われる前記サービスの前記計算システムの動作中の前記品質を見積もった結果を品質見積結果として取得する見積結果取得部と、前記品質見積結果が前記要求品質を満たさない場合に、前記複数の演算リソースのハードウェア構成を前記第1ハードウェア構成から前記第1ハードウェア構成とは異なる第2ハードウェア構成に前記計算システムの動作中に変更する構成制御部と、を備える。In order to solve the above problems, the resource management device of the present invention is configured using part of the hardware of a computing system consisting of multiple computers, and is a resource management device that manages the hardware configuration of multiple computing resources that share the service of processing data to be processed, and is equipped with a required quality acquisition unit that acquires the quality related to the processing time of the service required for the service as a required quality, an estimation result acquisition unit that acquires the result of estimating the quality of the service performed by the multiple computing resources of a first hardware configuration during operation of the computing system as a quality estimation result, and a configuration control unit that changes the hardware configuration of the multiple computing resources from the first hardware configuration to a second hardware configuration different from the first hardware configuration during operation of the computing system if the quality estimation result does not satisfy the required quality.
上記課題を解決するために、本発明のプログラムは、複数の計算機からなる計算システムの一部のハードウェアを利用して構成され、処理対象データを処理するサービスを分担して行う複数の演算リソースのハードウェア構成を管理するコンピュータに、前記サービスに要求される当該サービスの処理時間に関する品質を要求品質として取得する要求品質取得ステップと、第1ハードウェア構成の前記複数の演算リソースにより行われる前記サービスの前記計算システムの動作中の前記品質を見積もった結果を品質見積結果として取得する見積結果取得ステップと、前記品質見積結果が前記要求品質を満たさない場合に、前記複数の演算リソースのハードウェア構成を前記第1ハードウェア構成から前記第1ハードウェア構成とは異なる第2ハードウェア構成に前記計算システムの動作中に変更する構成制御ステップと、を実行させる。 In order to solve the above problem, the program of the present invention causes a computer that is configured using part of the hardware of a computing system consisting of multiple computers and manages the hardware configuration of multiple computing resources that share the service of processing the target data to execute the following steps: a required quality acquisition step of acquiring the quality related to the processing time of the service required for the service as a required quality; an estimation result acquisition step of acquiring, as a quality estimation result, a result of estimating the quality of the service performed by the multiple computing resources of a first hardware configuration while the computing system is operating; and a configuration control step of changing the hardware configuration of the multiple computing resources from the first hardware configuration to a second hardware configuration different from the first hardware configuration while the computing system is operating if the quality estimation result does not satisfy the required quality.
本発明によれば、処理対象データを処理するサービスを分担して行う複数の演算リソースのハードウェア構成が適切に管理される。 According to the present invention, the hardware configuration of multiple computing resources that share the service of processing the data to be processed is appropriately managed.
以下、本発明の実施の形態について図面を参照して説明する。以下の説明において同じ機能を有する要素、異なる機能を有するが互いに対応する要素などについては、適宜同じ符号を付して説明する。また、図面において、同じ機能を有するか互いに対応する複数の要素については、一部の要素にのみ符号を付している場合がある。 The following describes an embodiment of the present invention with reference to the drawings. In the following description, elements having the same function and elements having different functions but corresponding to each other are appropriately denoted by the same reference numerals. Also, in the drawings, for multiple elements having the same function or corresponding to each other, reference numerals may be denoted only for some of the elements.
[第1実施形態]
本実施形態に係るリソース管理装置10は、図1に示すように、計算システム20を構成する複数の計算機30-1~30-N(ただし、Nは2以上の自然数)のそれぞれとインターネット、ローカルエリアネットワーク(LAN)などのネットワークNWを介して通信可能に設けられている。リソース管理装置10は、計算システム20の一部のハードウェアである計算機30-1~30-Nの後述のアクセラレータ35を利用して構成され、処理対象データを処理するサービスを分担して行う複数の演算リソースRのハードウェア構成を管理する。より詳細には、リソース管理装置10は、各サービスについて、複数の演算リソースRをどのハードウェアにより実現するかを管理する。以下、計算機30-1~30-Nの構成を説明してから、リソース管理装置10の構成を説明する。計算機30-1~30-Nを総称して計算機30ともいう。
[First embodiment]
As shown in FIG. 1, the
計算機30-1~30-Nは、ネットワークNWを介して互いに通信可能であり、多数の演算リソースRを用い、計算システム20全体として、複数種類のサービスを行う。サービスには、画像処理などが含まれる。1つのサービスは、複数の処理を含み、複数の処理は、複数の演算リソースRにより分担して実行される。例えば、1つのサービスを行う複数の演算リソースRは、ネットワークNWなどに構成された仮想ネットワークを介して連結されており、処理対象データを直列及び又は並列に処理する。例えば、1つのサービスとして、計算機30-1の2つの演算リソースRによる並列処理により処理対象データとしての画像データが2値化され、その後、2値化後の画像データに対して計算機30-2の演算リソースRによる画像認識処理が行われ、処理結果が画像データの提供元(不図示)に返される。提供元は、サービスのユーザのクライアントコンピュータなどである。処理対象データ及び処理結果は、リソース管理装置10を介して提供元に送受信される。各サービスを構成する一連の処理は、例えば、リソース管理装置10の制御下で行われる。例えば、リソース管理装置10の記憶装置13には、サービスごとに複数の演算リソースRの各アドレスが格納されており、演算リソースRが出力する処理結果のデータの転送先は、リソース管理装置10により指定される。
The computers 30-1 to 30-N can communicate with each other via the network NW, and the
計算機30-1~30-Nのそれぞれは、実行可能な処理は異なるが、同様の構成を有する。以下、計算機30-1~30-Nを総称して計算機30ともいう。以下、各計算機30の構成を説明する。Each of the computers 30-1 to 30-N has a similar configuration, although the processes that it can execute are different. Hereinafter, the computers 30-1 to 30-N are collectively referred to as
計算機30は、パーソナルコンピュータ、スマートフォン、タブレットなどのコンピュータである。計算機30は、プロセッサ31と、プロセッサ31のメインメモリ32と、プログラム及び各種データを記憶する不揮発性の記憶装置33と、ネットワークNWに接続されたNIC(Network Interface Card)34と、を備える。計算機30は、さらに、計算機30の機能を向上させるアクセラレータ35を備える。The
プロセッサ31は、CPU(Central Processing Unit)などからなり、記憶装置33に記憶されているプログラム及び各種データを実行又は使用して計算機30全体を制御する。メインメモリ32は、RAM(Random Access Memory)などからなる。プログラム及び各種データは、メインメモリ32に適宜読み出される。記憶装置33は、SSD(Solid State Drive)などからなる。NIC34は、プロセッサ31の制御のもとでネットワークNWに対してデータを送受信する。The
アクセラレータ35は、FPGA(Field-Programmable Gate Array)、ASIC(Application Specific Integrated Circuit)、サブCPU、及び、GPU(Graphics Processing Unit)などのハードウェアにより構成されている。アクセラレータ35がFPGAの場合、プロセッサ31は、FPGAの再構成可能な領域の少なくとも一部に所定の演算回路を演算リソースRとして、計算機30の稼働中つまり動的に削除及び再構成可能である。ここでは、アクセラレータ35により、1又は複数の演算リソースRが構成される。例えば、アクセラレータ35がFPGAの場合、当該アクセラレータ35に演算リソースRとして動作する演算回路が構成されることにより、演算リソースRが構成される。FPGAの演算リソースRが構成された領域が、演算リソースを構成するハードウェアとなる。演算リソースRは、プロセッサ31により例えば仮想マシンとして構成されてもよい。演算リソースRは、GPUを論理的に複数に分割したハードウェアにより構成されてもよい。演算リソースRへのデータ入力、演算リソースRからの処理結果のデータの転送などは、例えばプロセッサ31により制御される。The
プロセッサ31は、上記プログラムを実行することにより、図2に示す、負荷監視部31A、性能見積部31B、及び、リソース管理部31Cとして動作する。By executing the above program, the
負荷監視部31Aは、計算機30に対する負荷を監視する。負荷としては、計算機30に入力される単位時間当たりのデータ量、計算機30が単位時間あたりに処理するデータ量、計算機30が単位時間あたりに出力するデータ量、計算機30の演算リソースRの使用率などが挙げられる。また、負荷としては、処理過程において中間データを記憶したり、演算パラメータを記憶したりするための、メインメモリ32又はアクセラレータ35に設けられた記憶部などのメモリリソースの使用率も挙げられる。負荷は、これに限らず、例えば、入力データレートや、出力データレート、動画像処理であればフレームレートなどであってもよい。負荷は、計算機30による処理時間の遅延の有無及び遅延の度合いに影響を与える情報により構成される。The
性能見積部31Bは、1つのサービスの一部の処理を実行する1又は複数の演算リソースRを動作させたときの計算機30の処理時間に関する性能を見積もる。性能は、処理時間そのものであってもよいし、処理速度などの処理時間を増減させる量であってもよい。処理時間は、例えば、計算機30にデータが入力されてから、当該データを上記1又は複数の演算リソースRにより処理し、処理結果を計算機30の外部に出力するまでの時間である。記憶装置33には、演算リソースRの回路規模及び計算機30に対する負荷と、その演算リソースRを使用したときの計算機30の性能との関係を示す関係式又はテーブルが記憶されている。性能見積部32Bは、演算リソースRの回路規模及び負荷監視部31Aが監視している負荷に基づいて、前記の関係式又はテーブルを用いて前記の性能を見積もる。性能見積部32Bは、見積時、テストデータを計算機30に使用させて前記の処理時間などを計測し、計測した処理時間などを上記の性能として見積もってもよい。The
リソース管理部32Cは、後述のリソース管理装置10からの後述の指示に基づいて、アクセラレータ35に対して任意の演算リソースRを追加又は削除する。アクセラレータ35がFPGAの場合、リソース管理部32Cは、このFPGAに対して演算リソースRとして動作する演算回路を書き込む又は削除する。The resource management unit 32C adds or deletes any computation resource R to the
図1に示すリソース管理装置10は、サーバコンピュータなどのコンピュータである。リソース管理装置10は、プロセッサ11と、プロセッサ11のメインメモリ12と、プログラム及び各種データを記憶する不揮発性の記憶装置13と、ネットワークNWに接続されたNIC14と、を備える。The
プロセッサ11は、CPUなどからなり、記憶装置13に記憶されているプログラム及び各種データを実行又は使用してリソース管理装置10全体を制御する。メインメモリ12は、RAMなどからなる。プログラム及び各種データは、メインメモリ12に適宜読み出される。記憶装置13は、SSDなどからなる。NIC14は、プロセッサ11の制御のもとでネットワークNWに対してデータを送受信する。The
プロセッサ11は、上記プログラムを実行することで、図3に示す、要求品質取得部11A、見積結果取得部11B、構成制御部11C、負荷情報取得部11D、及び、入力データ制限部11Eとして動作する。これら各部11A~11Eは、協働して図4に示すリソース管理処理を行う。リソース管理処理は、サービスごとに定期的に行われる。リソース管理処理は、例えば、1つのサービスについて数分おきに実行される。リソース管理処理は、計算システム20の動作中に動的に実行される。つまり、リソース管理処理は、上記サービスの提供中に実行される。リソース管理装置10は、リソース管理処理を行うとき、複数の計算機30-1~30-Nに対して処理対象のサービスの実行停止を指示してもよい。By executing the above programs, the
以下、図3~図4を参照しながら、各部11A~11Eの動作について説明する。以下では、処理対象のサービスをサービスXという。また、サービスXを提供する複数の演算リソースRのそれぞれを演算リソースRXともいう。複数の演算リソースRXが構成されている複数の計算機30のそれぞれを計算機30Xともいう。リソース管理装置10の記憶装置13には、サービスXを行う複数の演算リソースRXの各アドレスが格納されているものとする。前記のアドレスにより、複数の演算リソースRXがそれぞれ設けられている計算機30Xも特定可能となっている。
The operation of each of the
リソース管理処理では、まず、要求品質取得部11Aが、サービスXに要求される当該サービスXの処理時間に関する品質である要求品質を取得する(ステップS101)。要求品質は、予め設定されている閾値として機能するものであり、記憶装置13に各サービスに対応付けられて記録されているものとする。要求品質取得部11Aは、記憶装置13からサービスXに対応する要求品質を取得する。要求品質は、上記の性能の見積結果と比較されるものであり、性能と同じ次元を有する。性能が処理時間であれば、要求品質もそのサービスに要求される処理時間、例えば、処理時間として許容される上限時間となる。性能が処理速度であれば、要求品質も処理速度となる。In the resource management process, first, the requested
なお、性能及び品質は、処理時間を増減させる量として、入力データレートや、出力データレート、サービスXが動画像処理であれば処理時のフレームレートなどであってもよい。性能及び品質の内容は、各サービスの内容によって決定される。 Note that performance and quality may be amounts that increase or decrease processing time, such as input data rate, output data rate, or, if service X is video processing, frame rate during processing. The content of performance and quality is determined by the content of each service.
また、見積結果取得部11Bが、現在のハードウェア構成の複数の演算リソースRXにより行われるサービスXの品質を見積もった結果を品質見積結果として取得する(ステップS102)。見積結果取得部11Bは、複数の演算リソースRXが設けられた各計算機30XとNIC14、ネットワークNW、及びNIC34を介して通信し(以下、通信について同じ)、演算リソースRXを使用したときのその計算機30Xの性能の見積もりを指示する。計算機30Xの性能見積部31B(図2)は、前記の指示により見積もった見積結果を見積結果取得部11Bに送信する。見積結果取得部11Bは、計算機30Xそれぞれから送信されてきた見積結果に基づいてサービスXの品質を見積もり品質見積結果を取得する。見積結果となる性能が処理時間であれば、各計算機30Xからの見積結果を合算した処理時間が品質見積結果となる。見積結果となる性能が処理速度であれば、各計算機30Xからの見積結果の平均速度が品質見積結果となる。
The estimation result
要求品質及び品質見積結果が取得されたあと(ステップS101及びS102のあと)は、構成制御部11Cが、取得された要求品質と品質見積結果とを比較し、品質見積結果が要求品質を満たすかを判別する(ステップS103)。要求品質及び品質見積結果が処理時間である場合、品質見積結果である処理時間が要求品質である処理時間以下であれば、品質見積結果が要求品質を満たすと判別される。両者が処理速度である場合、品質見積結果である処理速度が要求品質である処理速度以上であれば、品質見積結果が要求品質を満たすと判別される。After the required quality and the quality estimation result are acquired (after steps S101 and S102), the
処理対象のサービスの品質が要求品質を満たす場合(ステップS103;Yes)、演算リソースRXのハードウェア構成を変更する必要が図4のリソース管理処理は終了する。 If the quality of the service to be processed meets the required quality (step S103; Yes), there is no need to change the hardware configuration of the computational resource RX, and the resource management process in Figure 4 is terminated.
処理対象のサービスの品質が要求品質を満たさない場合(ステップS103;No)、複数の演算リソースRXのハードウェア構成を変更する必要がある。このときは、負荷情報取得部11Dが、計算システム20の計算機30-1~30-Nのそれぞれに対する負荷を示す負荷情報を取得する(ステップS104)。負荷情報取得部11Dは、計算機30-1~30-Nと通信して、これらに対して現在の負荷を要求する。計算機30-1~30-Nでは、負荷監視部31Aが前記負荷の要求に応答して、監視している負荷を負荷情報取得部11Dに返信する。このようにして、負荷情報取得部11Dは、計算機30-1~30-Nのそれぞれに対する負荷を負荷情報として取得する。
If the quality of the service to be processed does not satisfy the required quality (step S103; No), it is necessary to change the hardware configuration of the multiple computing resources RX. In this case, the load
負荷情報の取得後、構成制御部11Cが、取得された負荷情報に基づいて、複数の演算リソースRXのハードウェア構成を見積結果取得時のハードウェア構成からこのハードウェア構成とは異なる第2のハードウェア構成に動的に変更する(ステップS105)。After acquiring the load information, the
構成制御部11Cは、ステップS105において、例えば、複数の演算リソースRXのうちの少なくとも1つを構成するハードウェアを計算機30-1~30-Nのうちの前記負荷の大きな計算機30Xのハードウェアから前記負荷の小さな1以上の計算機30のハードウェアに変更する。In step S105, the
一例として、前記ハードウェアがFPGAの場合、構成制御部11Cは、前記の負荷が第1基準よりも高い第1の計算機30Xのアクセラレータ35に書き込まれた演算リソースRXを削除する。他方、構成制御部11Cは、前記の負荷が第2基準よりも低い第2の計算機30のアクセラレータ35に前記で削除した演算リソースRXと同じ回路構成の演算リソースRを書き込む。なお、演算リソースRは、複数の第2の計算機30に分割して書き込まれてもよい。当該削除及び書込みは、構成制御部11Cが第1及び第2の各計算機30と通信して、リソース管理部32Cにより行わせる。書き込み及び削除後は、記憶装置33に記憶されている当該演算リソースRXのアドレスも変更する。また、負荷の低い計算機30に負荷の高い計算機30Xに設けれた演算リソースRXと同じ演算リソースRが構成されている場合、両演算リソースの入れ替え、例えば、記憶装置33に記憶されている当該演算リソースRXのアドレスの負荷の低い計算機30の演算リソースRへの書き換えによりハードウェア構成が変更されてもよい。ハードウェア構成の変更は、新たな演算リソースRXの追加を含んでもよい。このような追加は、構成制御部11Cが、処理性能を向上させるため、演算リソースRXの回路規模を大きくし、回路構成の並列度を上げることを含む。構成制御部11Cは、回路規模を大きくする場合、アクセラレータ35において必要な領域の確保を試みる。As an example, when the hardware is an FPGA, the
構成制御部11Cは、品質見積結果及び負荷情報を参照しながら、サービスXの品質要求を満足できるように、演算リソースRXのハードウェア構成を変更するとよい。構成制御部11Cは、演算リソースRXのハードウェア構成について最適化問題を解くアルゴリズムなど、任意のアルゴリズムでハードウェア構成を変更してもよい。The
構成制御部11Cが、負荷情報を用いずに、複数の演算リソースRXのハードウェア構成を動的に変更してもよい。例えば、リソース管理装置10の記憶装置13には、複数の演算リソースRXの各アドレスの複数の組み合わせが格納されているものとする。構成制御部11Cは、前記複数の組み合わせのいずれかをサービスXに使用しており、前記ハードウェア構成の変更時には、サービスXに使用する複数の演算リソースRXの各アドレスの組み合わせを変更してもよい。The
ステップS105のあとは、入力データ制限部11Eが、負荷情報を参照しながら、負荷が所定基準よりも大きい計算機30への処理対象データの入力量を制限する(ステップS106)。当該制御は、処理対象データの単位時間当たりの入力量を減らすほか、当該処理対象データの他の計算機30への振り替えも含む。この処理は、特に、計算システム20全体に対する負荷が大きいときや、上記ハードウェア構成の変更によってもサービスXの品質が改善されないときに有効である。入力データ制限部11Eは、品質見積結果をさらに参照して上記制御を行ってもよい。After step S105, the input
以上説明したように、この実施形態では、あるサービスについて、上記品質見積結果が上記要求品質を満たさない場合に、このサービスを分担して処理する複数の演算リソースRのハードウェア構成が上記品質見積結果の取得時の第1ハードウェア構成から前記第1ハードウェア構成とは異なる第2ハードウェア構成に計算システム20の動作中に変更する制御が行われる。上記品質見積結果は、演算リソースが設けられた計算機の負荷の影響を受けるので、本実施形態によれば、時々刻々と変化する計算機30に対する負荷に追従しながら、演算リソースRのハードウェア構成が変更される。従って、計算機30の負荷が高い場合においても提供中のサービスの品質低下を軽減でき、複数の演算リソースRのハードウェア構成が適切に管理される。前記制御を行わない場合、サービスの品質要求のため、演算リソースRを過剰に配置する必要があり、電力効率及び計算機30の利用効率が悪化する。本実施形態では、各サービスの品質を良好なものに保ったまま、電力効率及び計算機の使用率を最適な状態に保てる効果がある。また、本実施形態では、演算リソースを追加できるため、電力効率や計算機の使用率を最適な状態に保ちつつ、各サービスの品質要求を満足できる効果がある。As described above, in this embodiment, when the quality estimation result for a certain service does not satisfy the required quality, the hardware configuration of the multiple computing resources R that share and process this service is changed from the first hardware configuration at the time of obtaining the quality estimation result to a second hardware configuration different from the first hardware configuration during the operation of the
さらに本実施形態では、計算機30-1~30-2のそれぞれに対する負荷を示す負荷情報に基づいて、上記複数の演算リソースRのうちの少なくとも1つを構成するハードウェアが、計算機30-1~30-Nのうちの前記負荷の大きな計算機30のハードウェアから前記負荷の小さな計算機30のハードウェアに変更される。これにより、上記複数の演算リソースRのハードウェア構成を前記第1ハードウェア構成から前記第2ハードウェア構成に変更する。このようにすることで、計算機30に対する負荷によるサービスの品質低下を低減でき、複数の演算リソースRのハードウェア構成が適切に管理される。
Furthermore, in this embodiment, based on load information indicating the load on each of computers 30-1 to 30-2, the hardware constituting at least one of the multiple computational resources R is changed from the hardware of the
さらに、本実施形態では、負荷情報に基づいて、計算機30-1~30-Nのうち負荷が所定基準よりも大きい計算機への入力データのデータ量を制限する。これにより、計算機30に対する負荷によるサービスの品質低下を抑制できる。
Furthermore, in this embodiment, the amount of input data to a computer among computers 30-1 to 30-N whose load is greater than a predetermined standard is limited based on the load information. This makes it possible to suppress degradation of service quality due to the load on
なお、見積結果取得部11Bは、ステップS102において性能の見積りを計算機30に対して指示する際、性能見積りを行う条件を指定してもよい。例えば、見積結果取得部11Bは、上記ハードウェア構成により演算リソースRを増加または削減した場合の計算機30の性能を見積もるために、演算リソースRの増加量及び削減量を見積時のパラメータとして指定してもよい。同様に、入力データ量が増加または減少した場合の処理性能を見積もるために、入力データの増加量及び減少量を見積時のパラメータとして指定してもよい。これら見積結果に基づく品質見積結果は、ステップS106などで使用されてもよい。
When instructing the
[第2実施形態]
本実施形態に係るリソース管理装置110の構成を図5に示す。図5の見積結果取得部11Bは、計算機30―1~30-Nのうち、1つのサービス(例えば、サービスX)を分担して実行する複数の演算リソースR(例えば、複数の演算リソースRX)が構成された1以上の計算機30(1以上の計算機30X)それぞれの、複数の演算リソースRのうちのその計算機に構成された1以上の演算リソースRを使用したときの処理時間に関する性能を見積もった性能見積結果を取得する。この性能見積結果は、例えば、第1実施形態で見積結果取得部11Bにより取得される各計算機30の性能の見積結果であればよい。見積結果取得部11Bは、取得した性能見積結果に1以上の変動量を加味した値に基づいてサービスの計算システム20の動作中の前記品質を見積もる。1以上の変動量には、例えば、予め定められた第1変動量と、過去の前記負荷情報が示す前記負荷の傾向に応じた第2変動量とのうち、少なくとも前者が含まれればよい。
[Second embodiment]
The configuration of the
見積結果取得部11Bは、例えば、性能見積結果の値に対して、第1変動量として、当該値の5%を加算又は減算する。当該5%は、固定値として設定されている。なお、第1変動量は、5%以外の値であってもよい。また、見積結果取得部11Bは、負荷情報取得部11Dからの負荷情報が示す負荷を計算機30ごとに記憶装置33に順次記録する。見積結果取得部11Bは、性能見積結果の対象となっている計算機30についての過去の負荷を記憶装置33から読み出し、当該過去の負荷の傾向、例えば、現在から過去の所定のタイミングまでの期間における負荷の平均値又は現在と同じ時間帯の負荷に基づく第2変動量を導出する。例えば、前記平均値又は負荷が所定の閾値以上であれば、第2変動量として5%の加算を導出する。見積結果取得部11Bは、性能見積結果の値に対して、さらに第2変動量を加味した値(例えば、第1変動量が加味された値に、当該値の5%の値を加算した値)を上記品質見積結果として算出する。見積結果取得部11Bは、第2変動量を、ニューラルネットワークのモデルを利用して算出してもよいし、統計データをベースにした機械学習モデルによって算出してもよい。The estimation result
入力データ制限部11Eは、負荷情報に対して上記1以上の変動量を加味した値を新たな負荷情報とし、当該負荷情報が示す負荷が所定基準よりも大きい計算機30への処理対象データの入力量を制限してもよい。The input
その他の構成については、第1実施形態に準じるので、その説明を省略する。 The rest of the configuration is the same as in the first embodiment, so its description will be omitted.
本実施形態によれば、品質見積結果及び負荷情報について所定の変動量が加味されているので、時々刻々と変化する計算機30に対する負荷に対して予め想定し得る範囲で演算リソースRを確保しておくことが可能となる。これにより、計算機30に対する負荷が変動しても、サービスの品質低下を低減でき、複数の演算リソースRのハードウェア構成が適切に管理される。また、予め想定し得る範囲で演算リソースRを確保する際に、物理的に異なる演算リソースRを配置することで、演算リソースRの故障に対する冗長化も実現される。According to this embodiment, a predetermined amount of fluctuation is taken into account in the quality estimation result and the load information, so that it is possible to secure computing resources R within a range that can be predicted in advance for the load on the
[第3実施形態]
本実施形態に係るリソース管理装置210の構成を図6に示す。リソース管理装置210は、リソース管理装置10が備える各部11A~11Eに加え、優先制御部211Gを備える。優先制御部211Gは、プロセッサ11がまた、負荷情報取得部11Dは、計算機30-1~30-Nそれぞれに対する負荷の他、計算システム20全体に対する全体負荷を示す全体負荷情報も計算システム20から取得する。負荷情報取得部11Dは、全体負荷を、計算機30-1~30-Nそれぞれに対する負荷に基づいて算出してもよい。
[Third embodiment]
6 shows the configuration of a
リソース管理装置210の各部11A~11E及び211Gは、協働して図7に示すリソース管理処理を定期的に実行する。以下、当該リソース管理処理について図6及び図7を参照して説明する。なお、計算システム20は、複数のサービスを提供可能であるが、当該複数のサービスには、実行タイミングが競合した場合にどのサービスを優先して実行するかを特定する優先順位が設定されているものとする。Each
本実施形態に係るリソース管理処理では、まず、優先制御部211Gが負荷情報取得部11Dから全体負荷情報を取得する(ステップS301)。その後、優先制御部211Gは、全体負荷情報が示す計算システム20に対する全体負荷が所定の閾値より高いかを判定する(ステップS302)。全体負荷が所定の閾値より高くない場合(ステップS302;No)、リソース管理処理は終了する。全体負荷が所定の閾値より高い場合(ステップS302;Yes)、計算システム20のサービス提供に遅延が生じている可能性がある。この場合、優先制御部211Gは、ステップS303の処理を実行する。ステップS303は、複数回実行されることがある。優先制御部211Gは、Pを自然数としたときのP回目のステップS303において、優先順位がP番目のサービスを選択する。その後、P番目のサービスを処理対象のサービスとして、ステップS102~ステップS106が実行される。これら処理についての説明は、第1実施形態に準じる。但し、ステップS103の判別結果が肯定だった場合、再度ステップS303の処理が実行される。ステップS303の処理回数Pが計算システム20により提供可能なサービスの数に達した場合、再度ステップS301の処理が行われてもよい。また、ステップS106の処理のあともステップS301の処理が行われてもよい。In the resource management process according to this embodiment, first, the
本実施形態では、第1実施形態などと同様、計算システム20には、当該計算システム20が提供する複数のサービスそれぞれについて前記複数の演算リソースが構成されている。本実施形態のリソース管理装置210は、計算システム20全体に対する全体負荷を示す負荷情報を取得する負荷情報取得部11Dと、前記負荷情報が示す全体負荷が予め定められた閾値を超えた場合、前記複数のサービスのうちどのサービスを優先して、前記要求品質取得部と前記見積結果取得部と前記構成制御部とによる処理(ステップS101~S106)の対象とするかを決定する優先制御部211Gと、を備える。優先制御部211Gは、前記複数のサービスが競合したときの処理実行の優先順位に基づいて、前記どのサービスを優先して前記処理の対象とするかを決定する。In this embodiment, similar to the first embodiment, the
優先制御部211Gは、前記の優先順位に代えて又は加えて、各サービスにおける前記品質見積結果と前記要求品質との乖離度合いに基づいて、前記どのサービスを優先して前記処理の対象とするかを決定してもよい。例えば、優先制御部211Gは、ステップS101及びS102で取得された要求品質と品質見積結果との差をサービスごとに記憶装置33に蓄積しておき、当該差が大きいほど優先順位が上位のサービスとして前記処理の対象とする。優先制御部211Gは、例えば、ステップS303などで、各サービスについて、優先順位に前記差に応じた重みを加味し、加味後の値が小さいほどサービスの優先順位を高く設定してもよい。Instead of or in addition to the priority order, the
本実施形態によれば、計算システム20全体の負荷が所定の閾値を超えた場合に、優先順位の高いサービスについて優先的に、第1実施形態の演算リソースのハードウェア構成の制御を行う。従って、システム全体の負荷が高い場合においても、優先度の高いサービスに対して、演算リソースRのハードウェア構成を制御できるため、優先度の高いサービスについて品質の低下が低減される。According to this embodiment, when the load on the
[本発明の範囲]
本発明は、上記の実施の形態及び変形例に限定されるものではない。例えば、本発明には、本発明の技術思想の範囲内で当業者が理解し得る、上記の実施の形態及び変形例に対する様々な変更が含まれる。上記実施の形態及び変形例に挙げた各構成は、矛盾の無い範囲で適宜組み合わせることができる。また、上記の各構成のうちの任意の構成を削除することも可能である。上記各種のプログラムは、不揮発性の記憶装置33に限らず、非一時的なコンピュータ読み取り可能な記憶媒体に記憶されてもよい。
[Scope of the present invention]
The present invention is not limited to the above-mentioned embodiment and modified examples. For example, the present invention includes various modifications to the above-mentioned embodiment and modified examples that can be understood by a person skilled in the art within the scope of the technical idea of the present invention. The configurations listed in the above-mentioned embodiment and modified examples can be appropriately combined within a range without contradiction. In addition, it is also possible to delete any of the above-mentioned configurations. The above-mentioned various programs may be stored in a non-transient computer-readable storage medium, not limited to the
10…リソース管理装置、11…プロセッサ、11A…要求品質取得部、11B…見積結果取得部、11C…構成制御部、11D…負荷情報取得部、11E…入力データ制限部、12…メインメモリ、13…記憶装置、20…計算システム、30,30-1~30-N…計算機、31…プロセッサ、31A…負荷監視部、31B…性能見積部、31C…リソース管理部、32…メインメモリ、32B…性能見積部、32C…リソース管理部、33…記憶装置、35…アクセラレータ、110…リソース管理装置、210…リソース管理装置、211G…優先制御部、R…演算リソース。 10...resource management device, 11...processor, 11A...required quality acquisition unit, 11B...estimate result acquisition unit, 11C...configuration control unit, 11D...load information acquisition unit, 11E...input data restriction unit, 12...main memory, 13...storage device, 20...computing system, 30, 30-1 to 30-N...computers, 31...processor, 31A...load monitoring unit, 31B...performance estimation unit, 31C...resource management unit, 32...main memory, 32B...performance estimation unit, 32C...resource management unit, 33...storage device, 35...accelerator, 110...resource management device, 210...resource management device, 211G...priority control unit, R...computational resource.
Claims (7)
前記サービスに要求される当該サービスの処理時間に関する品質を要求品質として取得する要求品質取得部と、
第1ハードウェア構成の前記複数の演算リソースにより行われる前記サービスの前記計算システムの動作中の前記品質を見積もった結果を品質見積結果として取得する見積結果取得部と、
前記品質見積結果が前記要求品質を満たさない場合に、前記複数の演算リソースのハードウェア構成を前記第1ハードウェア構成から前記第1ハードウェア構成とは異なる第2ハードウェア構成に前記計算システムの動作中に変更する構成制御部と、を備え、
前記計算システムには、当該計算システムが提供する複数のサービスそれぞれについて前記複数の演算リソースが構成されており、
前記計算システム全体に対する負荷を示す第1負荷情報を取得する負荷情報取得部と、
前記第1負荷情報が示す前記負荷が予め定められた閾値を超えた場合、前記複数のサービスのうちどのサービスを優先して、前記要求品質取得部と前記見積結果取得部と前記構成制御部とによる処理の対象とするかを決定する優先制御部と、をさらに備える、
リソース管理装置。 A resource management device that is configured using a part of the hardware of a computing system consisting of a plurality of computers and manages the hardware configuration of a plurality of computing resources that share a service of processing data to be processed, comprising:
a required quality acquisition unit that acquires a quality related to a processing time of the service that is required for the service as a required quality;
an estimation result acquisition unit that acquires a result of estimating the quality of the service performed by the plurality of computing resources of a first hardware configuration during operation of the computing system as a quality estimation result;
a configuration control unit that changes a hardware configuration of the plurality of computing resources from the first hardware configuration to a second hardware configuration different from the first hardware configuration during operation of the computing system when the quality estimation result does not satisfy the required quality;
The computing system includes a plurality of computing resources for each of a plurality of services provided by the computing system,
a load information acquisition unit that acquires first load information indicating a load on the entire computing system;
and a priority control unit that determines, when the load indicated by the first load information exceeds a predetermined threshold, which of the plurality of services should be prioritized as a target for processing by the required quality acquisition unit, the estimate result acquisition unit, and the configuration control unit.
Resource management device.
前記構成制御部は、前記第2負荷情報に基づいて、前記複数の演算リソースのうちの少なくとも1つを構成するハードウェアを前記複数の計算機のうちの前記負荷の大きな第1計算機のハードウェアから前記負荷の小さな第2計算機のハードウェアに変更することで、前記複数の演算リソースのハードウェア構成を前記第1ハードウェア構成から前記第2ハードウェア構成に変更する、
請求項1に記載のリソース管理装置。 the load information acquisition unit acquires second load information indicating a load on each of the plurality of computers;
the configuration control unit changes hardware constituting at least one of the plurality of computing resources from hardware of a first computer having a large load to hardware of a second computer having a small load, based on the second load information, thereby changing the hardware configuration of the plurality of computing resources from the first hardware configuration to the second hardware configuration;
The resource management device according to claim 1 .
前記第2負荷情報に基づいて、前記複数の計算機のうち前記負荷が所定基準よりも大きい計算機への入力データのデータ量を制限する入力データ制限部と、
を備える請求項1又は2に記載のリソース管理装置。 the load information acquisition unit acquires second load information indicating a load on each of the plurality of computers;
an input data limiting unit that limits an amount of input data to a computer among the plurality of computers whose load is greater than a predetermined standard based on the second load information;
The resource management device according to claim 1 or 2, comprising:
請求項1から3のいずれか1項に記載のリソース管理装置。 the estimation result acquisition unit acquires a performance estimation result that estimates performance related to a processing time of each of the one or more computers configured with the plurality of computing resources among the plurality of computers when using one or more computing resources configured on the computer among the plurality of computing resources, and estimates the quality of the service during operation of the computing system based on a value obtained by adding one or more fluctuation amounts to the acquired performance estimation result;
The resource management device according to any one of claims 1 to 3.
前記見積結果取得部は、取得した前記性能見積結果に、予め定められた第1変動量と、過去の前記第2負荷情報が示す前記負荷の傾向に応じた第2変動量と、を加味した値に基づいて前記サービスの前記計算システムの動作中の前記品質を見積もる、
請求項4に記載のリソース管理装置。 the load information acquisition unit acquires second load information indicating a load on each of the plurality of computers;
the estimation result acquisition unit estimates the quality of the service during operation of the computing system based on a value obtained by adding a predetermined first fluctuation amount and a second fluctuation amount according to a trend of the load indicated by the past second load information to the acquired performance estimation result;
The resource management device according to claim 4.
請求項1に記載のリソース管理装置。 the priority control unit determines which of the services is to be given priority for the processing based on at least one of a priority order of processing execution when the plurality of services compete with each other and a degree of deviation between the quality estimation result and the required quality for each service.
The resource management device according to claim 1 .
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| PCT/JP2021/045073 WO2023105670A1 (en) | 2021-12-08 | 2021-12-08 | Resource management device and program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPWO2023105670A1 JPWO2023105670A1 (en) | 2023-06-15 |
| JP7670167B2 true JP7670167B2 (en) | 2025-04-30 |
Family
ID=86730020
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2023565768A Active JP7670167B2 (en) | 2021-12-08 | 2021-12-08 | Resource management device and program |
Country Status (2)
| Country | Link |
|---|---|
| JP (1) | JP7670167B2 (en) |
| WO (1) | WO2023105670A1 (en) |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007188226A (en) | 2006-01-12 | 2007-07-26 | Canon Inc | Digital multi-function peripheral and control method thereof |
| WO2011142031A1 (en) | 2010-05-14 | 2011-11-17 | 株式会社日立製作所 | Resource management method, resource management device and program |
| WO2017029826A1 (en) | 2015-08-18 | 2017-02-23 | 日本電信電話株式会社 | Resource configuration system, resource configuration method and resource configuration program |
| WO2018097058A1 (en) | 2016-11-22 | 2018-05-31 | 日本電気株式会社 | Analysis node, method for managing resources, and program recording medium |
-
2021
- 2021-12-08 WO PCT/JP2021/045073 patent/WO2023105670A1/en not_active Ceased
- 2021-12-08 JP JP2023565768A patent/JP7670167B2/en active Active
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007188226A (en) | 2006-01-12 | 2007-07-26 | Canon Inc | Digital multi-function peripheral and control method thereof |
| WO2011142031A1 (en) | 2010-05-14 | 2011-11-17 | 株式会社日立製作所 | Resource management method, resource management device and program |
| WO2017029826A1 (en) | 2015-08-18 | 2017-02-23 | 日本電信電話株式会社 | Resource configuration system, resource configuration method and resource configuration program |
| WO2018097058A1 (en) | 2016-11-22 | 2018-05-31 | 日本電気株式会社 | Analysis node, method for managing resources, and program recording medium |
Also Published As
| Publication number | Publication date |
|---|---|
| JPWO2023105670A1 (en) | 2023-06-15 |
| WO2023105670A1 (en) | 2023-06-15 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US9442763B2 (en) | Resource allocation method and resource management platform | |
| JP5332065B2 (en) | Cluster configuration management method, management apparatus, and program | |
| US12106147B2 (en) | Resource allocation in a cloud computing system based on predictions of workload probability parameters | |
| US11842215B2 (en) | Autoscaling and throttling in an elastic cloud service | |
| US20180300206A1 (en) | Method and system for data backup and restoration in cluster system | |
| Sampaio et al. | PIASA: A power and interference aware resource management strategy for heterogeneous workloads in cloud data centers | |
| US20120221730A1 (en) | Resource control system and resource control method | |
| Li | An adaptive overload threshold selection process using Markov decision processes of virtual machine in cloud data center | |
| JP2022112614A (en) | A device that determines resource movement schedules | |
| JP2012198724A (en) | Information processing program and method, and transfer processing device | |
| Babu et al. | Interference aware prediction mechanism for auto scaling in cloud | |
| US20250093932A1 (en) | Memory hierarchy power management | |
| US20240241770A1 (en) | Workload summarization for congestion avoidance in computer servers | |
| JP7670167B2 (en) | Resource management device and program | |
| US11669442B2 (en) | Co-operative memory management system | |
| JP2024037487A (en) | Information storage device, control system and control method | |
| JP2013200615A (en) | Virtual machine movement control system, virtual machine movement method, and program | |
| CN120086003A (en) | Method and device for supporting elastic scalability of computing resources in intelligent computing center | |
| US20180246735A1 (en) | Information processing apparatus, pld management program and pld management method | |
| JP7582457B2 (en) | Computational resource control device and control method | |
| JP7750304B2 (en) | Computers and programs | |
| CN118349362B (en) | Resource allocation method, device and equipment, storage medium and computer program product | |
| Alsaaidah et al. | Empowering cloud providers: optimised locust-inspired algorithm for SLA violation mitigation in green cloud computing | |
| Padhy et al. | CAMIRA: a consolidation-aware migration avoidance job scheduling strategy for virtualized parallel computing clusters | |
| Minhajuddin et al. | Towards Adaptive and Energy-Aware Task Offloading in Edge–Cloud Environments |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240524 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20250107 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250310 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250318 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250331 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7670167 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |