JP7484653B2 - Information processing device, information processing method, operation management device, and operation management method - Google Patents
Information processing device, information processing method, operation management device, and operation management method Download PDFInfo
- Publication number
- JP7484653B2 JP7484653B2 JP2020175752A JP2020175752A JP7484653B2 JP 7484653 B2 JP7484653 B2 JP 7484653B2 JP 2020175752 A JP2020175752 A JP 2020175752A JP 2020175752 A JP2020175752 A JP 2020175752A JP 7484653 B2 JP7484653 B2 JP 7484653B2
- Authority
- JP
- Japan
- Prior art keywords
- inference result
- noise
- result data
- data
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Feedback Control In General (AREA)
Description
本発明は、情報処理装置、情報処理方法、運転管理装置、および運転管理方法に関する。 The present invention relates to an information processing device, an information processing method, an operation management device, and an operation management method.
分類、回帰、または方策関数の出力などのニューラルネットワークによる推論は、ニューラルネットワークの自由度の高さから、一定程度の過学習に起因した推論結果の不安定さが存在する。そこで、過学習の低減のために種々の正則化方法が提案されている。ところが、過学習を低減させるための正則化は、パラメータの調整が難しく、設定によっては学習時間が膨大になったり、汎化性能が得られなかったりすることがある。さらに、ニューラルネットワークは一般的に、ノイズに対して脆弱であることが知られている。ニューラルネットワークは実用上、計測誤差などの影響によって誤った推論結果が出力される可能性があった。非特許文献1,2には、学習用データの水増しや汎化性能の向上のために、学習時において、学習用ノイズを付加する技術が開示されている。 Inferences using neural networks, such as classification, regression, or the output of a policy function, have a certain degree of instability in the inference results due to overlearning due to the high degree of freedom of the neural network. Therefore, various regularization methods have been proposed to reduce overlearning. However, regularization to reduce overlearning is difficult to adjust parameters, and depending on the settings, the learning time may become enormous or generalization performance may not be obtained. Furthermore, neural networks are generally known to be vulnerable to noise. In practice, neural networks may output erroneous inference results due to the influence of measurement errors, etc. Non-Patent Documents 1 and 2 disclose techniques for adding learning noise during learning in order to pad the learning data and improve generalization performance.
しかしながら、上述した従来技術においては、精度の向上には限界があった。そこで、入力データをニューラルネットワークに入力させて得られる推論結果の精度をさらに向上させる技術の開発が求められていた。 However, the above-mentioned conventional technology has limitations on how much accuracy can be improved. Therefore, there is a need to develop technology that can further improve the accuracy of inference results obtained by inputting input data into a neural network.
本発明は、上記に鑑みてなされたものであって、その目的は、入力データをニューラルネットワークに入力させて得られる推論結果の精度を向上させることができる情報処理装置、情報処理方法、運転管理装置、および運転管理方法を提供することにある。 The present invention has been made in view of the above, and its purpose is to provide an information processing device, an information processing method, an operation management device, and an operation management method that can improve the accuracy of inference results obtained by inputting input data into a neural network.
上述した課題を解決し、目的を達成するために、本発明の一態様に係る情報処理装置は、少なくとも1つの入力データを取得して、前記入力データに基づいてニューラルネットワークを用いて推論結果データを出力する制御部を備えた情報処理装置であって、前記制御部は、取得した前記入力データを記憶部に格納し、前記記憶部から読み出した1つの前記入力データに対して、互いに異なる複数のノイズを付加した、複数のノイズ付加データを生成し、前記複数のノイズ付加データを前記ニューラルネットワークに入力して、前記複数のノイズ付加データに対応した複数のノイズ付加推論結果データを出力し、前記複数のノイズ付加推論結果データに基づいて、前記推論結果データを出力する。 In order to solve the above-mentioned problems and achieve the object, an information processing device according to one aspect of the present invention is an information processing device including a control unit that acquires at least one input data and outputs inference result data based on the input data using a neural network, the control unit stores the acquired input data in a memory unit, generates multiple noise-added data by adding multiple noises different from each other to one input data read from the memory unit, inputs the multiple noise-added data to the neural network, outputs multiple noise-added inference result data corresponding to the multiple noise-added data, and outputs the inference result data based on the multiple noise-added inference result data.
本発明の一態様に係る情報処理装置は、上記の発明において、前記互いに異なる複数のノイズは、正規分布に基づいて選択されたノイズである。 In the information processing device according to one aspect of the present invention, the plurality of mutually different noises are noises selected based on a normal distribution.
本発明の一態様に係る情報処理装置は、上記の発明において、前記制御部は、前記複数のノイズ付加推論結果データのそれぞれに対してシミュレートを行って、前記複数のノイズ付加推論結果データのそれぞれに対応した複数の評価値を出力し、前記複数の評価値に基づいて、前記複数のノイズ付加推論結果データから選択した少なくとも1つのノイズ付加推論結果データを、前記推論結果データとして出力する。 In the information processing device according to one aspect of the present invention, in the above invention, the control unit performs a simulation for each of the plurality of noise-added inference result data, outputs a plurality of evaluation values corresponding to each of the plurality of noise-added inference result data, and outputs at least one noise-added inference result data selected from the plurality of noise-added inference result data based on the plurality of evaluation values as the inference result data.
本発明の一態様に係る情報処理装置は、上記の発明において、前記制御部は、前記複数のノイズ付加推論結果データに対してアンサンブル学習を行い、前記アンサンブル学習によって得られた出力を、前記推論結果データとして出力する。 In the information processing device according to one aspect of the present invention, in the above invention, the control unit performs ensemble learning on the multiple noise-added inference result data, and outputs the output obtained by the ensemble learning as the inference result data.
本発明の一態様に係る情報処理装置は、上記の発明において、前記入力データは、離散値を含むデータである。 In the information processing device according to one aspect of the present invention, the input data is data including discrete values.
本発明の一態様に係る運転管理装置は、液体を貯留する少なくとも1槽の貯留部と、前記貯留部に前記液体を供給可能な少なくとも1台の送液部と、を備える貯留設備に対して、前記送液部を制御して前記貯留部内の液位を管理する運転制御部を備えた運転管理装置であって、前記運転制御部は、前記貯留設備から前記貯留部内の液位を含む液位情報を取得し、取得した前記液位情報を含む情報を貯留入力データとして、上記の発明の情報処理装置に入力し、前記貯留入力データに対応して前記情報処理装置から出力された推論結果データを、貯留推論結果データとして取得し、前記貯留推論結果データに基づいて、前記送液部を制御する。 An operation management device according to one aspect of the present invention is an operation management device for a storage facility that includes at least one storage tank for storing liquid and at least one liquid delivery unit capable of supplying the liquid to the storage tank, and that includes an operation control unit that controls the liquid delivery unit to manage the liquid level in the storage facility, and the operation control unit acquires liquid level information including the liquid level in the storage facility from the storage facility, inputs the acquired information including the liquid level information as storage input data to the information processing device of the above invention, acquires inference result data output from the information processing device in response to the storage input data as storage inference result data, and controls the liquid delivery unit based on the storage inference result data.
本発明の一態様に係る運転管理装置は、上記の発明において、前記貯留推論結果データは、前記送液部の発停を切り替える液位の情報を含む。 In the operation management device according to one aspect of the present invention, in the above invention, the storage inference result data includes information on the liquid level that switches on and off the liquid delivery unit.
本発明の一態様に係る運転管理装置は、上記の発明において、前記貯留入力データは、所定時間において、前記貯留部から前記液体が排出される量の時刻に沿った予測値の情報を含む。 In the operation management device according to one aspect of the present invention, in the above invention, the storage input data includes information on a predicted value along with time of the amount of the liquid to be discharged from the storage section at a given time.
本発明の一態様に係る運転管理装置は、上記の発明において、前記送液部は、発停の切り換えが制御されるポンプから構成され、前記貯留入力データは、所定時刻における前記ポンプの発停の情報を含む。 In the operation management device according to one aspect of the present invention, in the above invention, the liquid delivery unit is composed of a pump whose on/off switching is controlled, and the storage input data includes information on the on/off of the pump at a specified time.
本発明の一態様に係る運転管理装置は、上記の発明において、前記送液部は、電力によって駆動するポンプから構成され、前記貯留入力データは、所定時間における前記電力の料金単価および消費電力の情報を含む。 In the operation management device according to one aspect of the present invention, in the above invention, the liquid delivery unit is composed of a pump driven by electricity, and the storage input data includes information on the unit price of the electricity and the amount of power consumed at a specified time.
本発明の一態様に係る情報処理方法は、少なくとも1つの入力データを取得して、前記入力データに基づいてニューラルネットワークを用いて推論結果データを出力する情報処理装置が実行する情報処理方法であって、取得した前記入力データを記憶部に格納し、前記記憶部から読み出した1つの前記入力データに対して、互いに異なる複数のノイズを付加した、複数のノイズ付加データを生成し、前記複数のノイズ付加データを前記ニューラルネットワークに入力して、前記複数のノイズ付加データに対応した複数のノイズ付加推論結果データを出力し、前記複数のノイズ付加推論結果データに基づいて、前記推論結果データを出力する。 An information processing method according to one aspect of the present invention is an information processing method executed by an information processing device that acquires at least one input data and outputs inference result data based on the input data using a neural network, storing the acquired input data in a storage unit, generating multiple noise-added data by adding multiple noises different from each other to one piece of input data read from the storage unit, inputting the multiple noise-added data to the neural network, outputting multiple noise-added inference result data corresponding to the multiple noise-added data, and outputting the inference result data based on the multiple noise-added inference result data.
本発明の一態様に係る運転管理方法は、液体を貯留する少なくとも1槽の貯留部と、前記貯留部に前記液体を供給可能な少なくとも1台の送液部と、を備える貯留設備に対して、前記送液部を制御して前記貯留部内の液位を管理する運転管理装置が実行する運転管理方法であって、前記貯留設備から前記貯留部内の液位を含む液位情報を取得し、取得した前記液位情報を含む情報を貯留入力データとして、上記の発明による情報処理方法に基づいて、前記貯留入力データに対応して得られた貯留推論結果データを取得し、前記貯留推論結果データに基づいて、前記送液部を制御する。 An operation management method according to one aspect of the present invention is an operation management method for a storage facility including at least one storage tank for storing liquid and at least one liquid delivery unit capable of supplying the liquid to the storage facility, the operation management device controls the liquid delivery unit to manage the liquid level in the storage facility, and obtains liquid level information including the liquid level in the storage facility from the storage facility, and uses the obtained information including the liquid level information as storage input data to obtain storage inference result data obtained in response to the storage input data based on the information processing method according to the above invention, and controls the liquid delivery unit based on the storage inference result data.
本発明に係る情報処理装置、情報処理方法、運転管理装置、および運転管理方法は、入力データをニューラルネットワークに入力させて得られる推論結果の精度を向上させることが可能となる。 The information processing device, information processing method, operation management device, and operation management method of the present invention make it possible to improve the accuracy of inference results obtained by inputting input data into a neural network.
以下、本発明の一実施形態について図面を参照しつつ説明する。なお、以下の一実施形態の全図においては、同一または対応する部分には同一の符号を付す。また、本発明は以下に説明する一実施形態によって限定されるものではない。 One embodiment of the present invention will be described below with reference to the drawings. Note that in all the drawings of the embodiment below, the same or corresponding parts are given the same reference numerals. Furthermore, the present invention is not limited to the embodiment described below.
図1は、本発明の一実施形態による情報処理装置を適用した運転管理システムの構成を示すブロック図である。図1に示すように、本発明の一実施形態による運転管理システム1は、ネットワーク2を介して互いに通信可能な、学習装置10と運転管理装置20とを有する。なお、運転管理装置20が学習装置10を備えても良い。運転管理装置20は、ネットワーク2を介して配水池系30から各種情報を収集可能に構成される。
Figure 1 is a block diagram showing the configuration of an operation management system to which an information processing device according to one embodiment of the present invention is applied. As shown in Figure 1, an operation management system 1 according to one embodiment of the present invention has a
ネットワーク2は、例えば、インターネットなどの公衆通信網であって、例えばLAN(Local Area Network)、WAN(Wide Area Network)、携帯電話などの電話通信網や公衆回線、VPN(Virtual Private Network)、および専用線などの一または複数の組み合わせからなる。ネットワーク2は、有線通信および無線通信が適宜組み合わされている。 Network 2 is, for example, a public communication network such as the Internet, and is composed of one or more combinations of, for example, a LAN (Local Area Network), a WAN (Wide Area Network), a telephone communication network such as a mobile phone, a public line, a VPN (Virtual Private Network), and a dedicated line. Network 2 appropriately combines wired communication and wireless communication.
(配水池系)
貯留設備としての配水池系30は、複数の配水池31,32、および複数の配水ポンプ33,34を備える。複数の配水ポンプ33,34は、それぞれの配水池31,32ごとに、1台または複数台設けられる。具体的に例えば、貯留部としての配水池31、32が30箇所程度の場合、送液部としての配水ポンプ33,34は40台程度備えられる。配水池31,32からは、水を必要とする需要家35,36に水が供給される。
(Water reservoir system)
The
本実施形態において、機械学習装置としての学習装置10は、配水池系30の推移などの環境条件、配水ポンプ33,34の発停状態や消費電力、所定時間における需要家35,36の単位時間当たりの電気料金(以下、電気料金単価)、時刻などの所定のデータを入力パラメータとし、配水池系30における複数の配水ポンプ33,34の発停を切り替える水位を出力パラメータとする強化学習を行う。
In this embodiment, the
(学習装置)
学習装置10は、通信部(図示せず)を有する複数の配水池系30から送信された種々の情報を、ネットワーク2を介して収集するデータ収集処理を実行する。学習装置10は、収集した種々の情報によって機械学習を実行可能である。学習装置10は、制御部11、記憶部12、通信部13、出力部14、および入力部15を備える。
(Learning device)
The
制御部11は、具体的に、CPU(Central Processing Unit)、DSP(Digital Signal Processor)、FPGA(Field-Programmable Gate Array)などのプロセッサ、およびRAM(Random Access Memory)やROM(Read Only Memory)などの主記憶部(いずれも図示せず)を備える。
Specifically, the
記憶部12は、物理的には、RAM等の揮発性メモリ、ROM等の不揮発性メモリ、EPROM(Erasable Programmable ROM)、ハードディスクドライブ(HDD、Hard Disk Drive)、ソリッドステートドライブ(SSD、Solid State Drive)、およびリムーバブルメディアなどから選ばれた記憶媒体から構成される。なお、リムーバブルメディアは、例えば、USB(Universal Serial Bus)メモリ、または、CD(Compact Disc)、DVD(Digital Versatile Disc)、またはBD(Blu-ray(登録商標) Disc)のようなディスク記録媒体である。また、外部から装着可能なメモリカードなどのコンピュータ読み取り可能な記録媒体を用いて記憶部12を構成してもよい。記憶部12には、学習装置10の動作を実行するための、オペレーティングシステム(Operating System :OS)、各種プログラム、各種テーブル、各種データベースなどが記憶可能である。各種プログラムには、本実施形態による学習モデルやニューラルネットワークも含まれる。これらの各種プログラムは、ハードディスク、フラッシュメモリ、CD-ROM、DVD-ROM、フレキシブルディスク等のコンピュータ読み取り可能な記録媒体に記録して広く流通させることも可能である。
The
本実施形態において、制御部11は、記憶部12に記憶されたプログラムを主記憶部の作業領域にロードして実行し、プログラムの実行を通じて各構成部などを制御することで、所定の目的に合致した機能を実現できる。具体的に、制御部11は、プログラムの実行によって、学習部111、判定部112、行動選択部113、状態入力部114、環境部115、演算部116、シミュレータ部117の機能を実現できる。
In this embodiment, the
制御部11によるプログラムの実行によって、学習部111の機能が実行される。学習部111は、学習装置10が受信した入出力データセットをもとに機械学習を行うことができる。学習部111は、学習した結果を学習モデル121として記憶部12に書き込んで記憶させる。学習部111は、学習を行っているニューラルネットワークとは別に、所定のタイミングで、当該タイミングにおける最新の学習モデルを、記憶部12に記憶させてもよい。記憶部12に記憶させる際には、古い学習モデル121を削除して最新の学習モデル121を記憶させる更新でもよいし、古い学習モデル121の一部または全部を保存したまま最新の学習モデル121を記憶させる蓄積でもよい。
The function of the
通信部13は、例えば、LAN(Local Area Network)インターフェースボードや、無線通信のための無線通信回路などである。LANインターフェースボードや無線通信回路は、ネットワーク2に接続される。通信部13は、ネットワーク2に接続して、運転管理装置20や配水池系30との間で通信を行う。
The communication unit 13 is, for example, a LAN (Local Area Network) interface board or a wireless communication circuit for wireless communication. The LAN interface board and the wireless communication circuit are connected to the network 2. The communication unit 13 is connected to the network 2 and communicates with the
出力手段としての出力部14は、制御部11による制御に従って、液晶ディスプレイやプラズマディスプレイなどのディスプレイの画面上に、文字や図形などを表示したり、スピーカから音声を出力したりして、所定の情報を外部に通知するように構成される。さらに、出力部14は、印刷用紙などに所定の情報を印刷することによって出力するプリンタを含む。記憶部12に格納された各種情報は、例えば所定の事務所などに設置された出力部14のモニタなどで確認することができる。
The output unit 14 as an output means is configured to notify the outside of predetermined information by displaying characters, figures, etc. on the screen of a display such as a liquid crystal display or plasma display, or by outputting sound from a speaker, according to the control of the
入力手段としての入力部15は、例えば、キーボードや出力部14の内部に組み込まれて表示パネルのタッチ操作を検出するタッチパネル式キーボード、または外部との間の通話を可能とする音声入力デバイスなどから構成される。なお、出力部14および入力部15を一体化させて、例えばタッチパネルディスプレイやスピーカマイクロホンなどの入出力部としても良い。
The
(運転管理装置)
運転管理装置20は、ネットワーク2を介して通信可能な構成を有する。運転管理装置20は、制御部21、記憶部22、通信部23、出力部24、および入力部25を備える。制御部21、記憶部22、通信部23、出力部24、および入力部25はそれぞれ、物理的および機能的には、上述した制御部11、記憶部12、通信部13、出力部14、および入力部25と同様の構成を有する。
(Operation management device)
The
本実施形態において制御部21は、記憶部22に記憶されたプログラムを主記憶部の作業領域にロードして実行することによって、具体的に、運転計画部211および運転制御部212の機能を実現できる。
In this embodiment, the
記憶部22には、運転計画部211により生成された運転計画情報が検索可能な運転計画データベース221、および運転制御部212が取得した配水池系30の運転情報が検索可能な運転情報データベース222が格納されている。運転計画データベース221に格納された運転計画情報は、例えば配水ポンプ33,34の発停に関するタイミングの計画情報を含む。運転制御部212は、運転計画情報に基づいて、配水池系30における配水ポンプ33,34の発停を制御する。運転情報データベース222における運転情報は、例えば、所定時点における配水ポンプ33,34のオンオフの情報(以下、発停情報)や、配水池31,32に貯留された水の水位の情報(以下、水位情報)を含む。なお、配水池系30に関する情報は、これらの情報に限定されない。
The
通信部23は、ネットワーク2に接続して、学習装置10および配水池系30との間で通信可能である。通信部23は、制御部21による制御に基づいて出力される指令信号によって、配水池31,32の液位情報としての水位情報や発停情報などの各種情報を収集する。なお、通信部23によって送受信される情報は、これらの情報に限定されない。本実施形態において運転管理装置20は、ネットワーク2を介して通信可能なクラウドサーバとして機能させることもできる。
The
ここで、本発明者は、情報処理装置としての学習装置10に関して、従来技術によるニューラルネットワークを用いた情報処理方法について検討を行った。図9は、従来技術によるニューラルネットワークの全体構成を模式的に示す図である。図9に示すニューラルネットワーク300は、例えば順伝播型ニューラルネットワークであり、入力層301、中間層302、および出力層303を有する。入力層301は複数のノードからなり、各ノードには互いに異なる入力パラメータが入力される。中間層302は入力層301からの出力が入力される。中間層302は、入力層301からの入力を受ける複数のノードからなる層を含む多層の構造を有する。出力層303は、中間層302からの出力が入力され、出力パラメータを出力する。中間層302が多層構造、例えば3~5層構造を有するニューラルネットワークを用いた機械学習は、深層学習(ディープラーニング)と呼ばれる。図9に示す例では、入力パラメータが所定の入力データ310であり、出力パラメータが、目的とする推論結果データ320である。
Here, the present inventor has studied an information processing method using a neural network according to the prior art for a
ニューラルネットワーク300において、教師あり学習や半教師あり学習によって所定の学習モデルを生成する際には、学習用入力パラメータおよび学習用出力パラメータの入出力データセットが用いられる。入力データ110に対して所定の推論結果データ120を出力する制御部11における学習部111は、学習用入力パラメータおよび学習用出力パラメータを教師データとして、図9に示すニューラルネットワークを用いたディープラーニングなどの機械学習によって、学習モデル121を生成できる。学習装置10の制御部11は、学習部111によって生成された学習モデルに基づいて、入力データ310から推論結果データ320を導出する。
When generating a predetermined learning model by supervised learning or semi-supervised learning in the
また、ニューラルネットワーク300を強化学習に用いた場合、状態sや行動aなどの入力データ310をニューラルネットワーク300に入力して、推論結果データ320を出力する。推論結果データ320としては、状態s、行動a、状態行動価値(Q値)などが出力される。
When the
本発明者は、従来のニューラルネットワーク300に対して、種々検討を行った結果、出力される推論結果の精度を向上させるためには、推論時、すなわちニューラルネットワーク300に入力する際に、入力データに互いに異なる複数のノイズを加える方法を案出した。すなわち、本発明者は、推論時の入力データにノイズを加えて、複数のパターンの入力データを生成し、生成された複数の入力データのそれぞれをニューラルネットワーク300に入力したことによって得られた複数の推論結果に基づいて、少なくとも1つの水路結果を選択または生成することによって、高精度で評価値の高い出力を得られることを想到した。以下に説明する本発明およびその一実施形態は、本発明者による以上の鋭意検討によって案出されたものである。
After various studies on the conventional
図2は、本発明の一実施形態による情報処理装置としての学習装置10が実行する情報処理方法を説明するための図である。図2に示すように、一実施形態による情報処理方法においては、演算部116が、1つの入力データ310に対して、第1ノイズを付加することにより、第1ノイズ付加データ311-1を生成する。同様に、演算部116が、1つの入力データ310に対して第1ノイズとは異なる第2ノイズを付加することにより、第2ノイズ付加データ311-2を生成する。さらに、演算部116は、入力データに対して第1ノイズとも第2ノイズとも異なる第3ノイズを付加することにより、第3ノイズ付加データ311-3を生成する。これらの互いに異なるノイズの付加は、1つの入力データ310に対してn個(nは2以上の自然数)のノイズを付加するまで実行される。入力データ310に対して付加される第1ノイズから第nノイズまでのn個のノイズは、互いに相関がない、互いに異なるノイズである。これらの互いに異なる第1ノイズ~第nノイズまでの複数のノイズは、例えば正規分布、いわゆるガウス雑音に基づいて選択されるが、他の分布に基づいたノイズを選択することも可能である。これにより、同じ入力データ310に基づいて、互いに異なる第1ノイズ付加データ311-1~第nノイズ付加データ311-nが、演算部116により生成される。生成された第1ノイズ付加データ311-1~第nノイズ付加データ311-nは、記憶部12に格納される。
2 is a diagram for explaining an information processing method executed by the
学習部111は、記憶部12からニューラルネットワーク122のプログラムを読み込んでニューラルネットワーク300の処理を実行する。すなわち、学習部111は、第1ノイズ付加データ311-1~第nノイズ付加データ311-nのそれぞれを、ニューラルネットワーク300に入力する。ニューラルネットワーク300は、それぞれの第1ノイズ付加データ311-1~第nノイズ付加データ311-nに対応して、それぞれの第1推論結果データ321-1、第2推論結果データ321-2、第3推論結果データ321-3、…、第n推論結果データ321-nを出力する。出力された複数のノイズ付加推論結果データとしての、第1推論結果データ321-1~第n推論結果データ321-nは、記憶部12に格納される。
The
続いて、制御部11のシミュレータ部117によって実行されるシミュレータ340は、ニューラルネットワーク300から出力された第1推論結果データ321-1~第n推論結果データ321-nのそれぞれに対して、個別にシミュレートを実行する。シミュレータ340は、第1推論結果データ321-1に基づいてシミュレートを実行した結果として、第1評価値330-1を出力する。同様にシミュレータ部117は、第2推論結果データ321-2、第3推論結果データ321-3、…、および第n推論結果データ321-nに基づいてシミュレートを実行した結果としてそれぞれ、第2評価値330-2、第3評価値330-3、…、および第n評価値330-nを出力する。出力された第1評価値330-1~第n評価値330-nは記憶部12に格納される。
Then, the
シミュレータ部117が出力した第1評価値330-1~第n評価値330-nは、評価値を選択するセレクタ350の機能を有する制御部11の判定部112に入力される。判定部112は、セレクタ350によって、最適な評価値を選択する。制御部11の判定部112は、第1評価値330-1~第n評価値330-nから選択した評価値に対応する推論結果データを選択して、出力する。以上により、入力データ310に対する、推論結果データ320が出力される。
The first evaluation value 330-1 through the nth evaluation value 330-n output by the
以上のように、強化学習などの、いわゆる制御方法や評価値を出力するニューラルネットワーク300であって、シミュレータ部117によって事前にシミュレート可能である場合には、複数の推論結果データ(第1~第n推論結果データ)から複数の評価値(第1~第n評価値)を取得して、最適な評価値となった推論結果データを選択することにより、推論結果データの精度を向上させることができる。また、入力データに複数の異なるノイズを付加することによって、ニューラルネットワーク300に入力するデータをノイズの付加数分だけ増加させることができるので、ノイズ付加による入力の水増しにより、方策を出力する強化学習などにおいては、シミュレータと組み合わせることによって、より評価値の高い制御の方策を得ることができる。
As described above, in the case of the
なお、評価値に対して所定の閾値を設定し、全ての第1評価値330-1~第n評価値330-nが所定の閾値未満であった場合に、第1評価値330-1~第n評価値330-nのうちの少なくとも1つ、または複数の評価値が所定の閾値以上になるまで、入力データ310に対してさらにノイズを付加するようにしても良い。以上説明した一実施形態による情報処理方法は、ニューラルネットワークを用いて情報処理を実行可能なあらゆる処理に適用可能である。 A predetermined threshold value may be set for the evaluation values, and if all of the first evaluation value 330-1 through the nth evaluation value 330-n are below the predetermined threshold value, further noise may be added to the input data 310 until at least one or more of the first evaluation value 330-1 through the nth evaluation value 330-n become equal to or greater than the predetermined threshold value. The information processing method according to the embodiment described above is applicable to any process in which information processing can be performed using a neural network.
(配水池系の運転管理方法)
次に、以上の一実施形態による情報処理方法に基づいた、配水池の運転管理方法について説明する。
(Operation and management method for water reservoir system)
Next, a method for managing operation of a water reservoir based on the information processing method according to the above embodiment will be described.
まず、一実施形態による運転管理方法の理解を容易にするために、配水池系の運転管理方法における従来技術の問題点について説明する。すなわち、従来、浄水場、配水池31,32と、需要家35,36との間で液体である水道水などを輸送するための配水ポンプ33,34は、オンオフ制御しかできない場合が多い。この場合、配水ポンプ33,34に使用する電力量や、配水ポンプ33,34の発停回数を低減するための運転計画を生成することが困難であった。これは、連続値の解を許容する線形計画問題であれば、最適値を現実的な時間で計算できるのに対し、離散値(整数)の解のみを許容する整数計画問題や、離散値と連続値とが混在する混合整数計画問題では、膨大なパターンを計算する必要があるため、現実的な処理時間で演算が終了しないためである。換言すると、連続値ではなく一部または全ての変数の解として離散値のみ許容する最適化問題は、膨大なパターンを試行することによって最適解を導出する必要があるため、一般的には最適解にたどり着くことが困難であり、代替として最適解に近い解を許容される時間内で導出している。
First, in order to facilitate understanding of the operation management method according to one embodiment, the problems of the conventional technology in the operation management method of a water reservoir system will be described. That is, conventionally, the water distribution pumps 33, 34 for transporting liquid tap water between the water purification plant, the
しかしながら、本発明者の知見によれば、離散値のみを許容する問題においては、膨大な場合分けが必要になり、対象ごとに特殊な事情が存在する場合には、対象ごとに場合分けをする枝刈り探索法を変更するのはかなり煩雑な作業となる。そのため、配水池系などにおいて、繁雑な処理を低減でき、最適な運転管理を行う技術が求められていた。 However, according to the inventor's knowledge, problems that allow only discrete values require a huge number of case distinctions, and when special circumstances exist for each target, changing the pruning search method that distinguishes between cases for each target becomes a very cumbersome task. For this reason, there has been a demand for technology that can reduce the amount of complicated processing and perform optimal operation management in water reservoir systems, etc.
そこで、本発明者は、運転計画の生成において、機械学習における例えばDQN(Deep Q-Network)などの強化学習を採用する方法について検討を行った。すなわち、操作そのものの評価ではなく、操作の結果の評価を用いた制御方法として、機械学習における強化学習を採用することを想到した。これにより、膨大な場合分けが不要になり、シミュレータを作成する際に、対象ごとの特殊事情を考慮すれば、制御に反映させることが可能になる。 The inventors therefore investigated a method of employing reinforcement learning in machine learning, such as DQN (Deep Q-Network), in generating operation plans. In other words, they came up with the idea of employing reinforcement learning in machine learning as a control method that uses evaluation of the results of operations, rather than evaluation of the operations themselves. This eliminates the need for a huge number of case distinctions, and when creating a simulator, if special circumstances for each target are taken into account, they can be reflected in the control.
さらに本発明者は、強化学習における報酬として、配水池31,32における制約条件である、水位の上限および下限、すなわち水位の許容範囲からの逸脱具合である、水位の許容範囲の上限または下限からの乖離の大きさに応じた報酬を想到した。具体的には、水位が、許容範囲から逸脱した乖離の大きさが大きくなるほど、報酬を小さくし、さらには報酬として負の絶対値が大きくなるようにした。これにより、配水池31,32の水位が、許容範囲内に収まれば報酬を大きくして、学習を進みやすくできる。これは、上述した制御方法において、制約条件から逸脱した時に一律の罰則を与えて、強化学習における学習の繰り返しの単位であるエピソードを停止した場合、逸脱した度合いが大きい場合も小さい場合も同じ罰則を与えることになる。そのため、制御方法を更新する際に制御方法をいずれの方向に更新すればよいかが明確にならない。そこで、制約条件からの逸脱の程度に応じて、例えば単調増加な関数を用いた罰則を与えることによって、制約条件から逸脱した場合に、逸脱した度合いが小さい方の報酬が逸脱した度合いが大きい方の報酬よりも大きくなるような勾配を生成できるため、勾配に従って強化学習を行うことによって、制約条件を満たす方策を学習できることになる。
Furthermore, the inventor has come up with the idea of a reward in reinforcement learning that corresponds to the magnitude of deviation from the upper or lower limit of the water level tolerance range, which is the constraint condition in the
また、配水ポンプ33,34の発停ではなく、配水ポンプ33,34をオンまたはオフにするための水位の閾値を最適化することによって、離散値の最適化の問題から、連続値の最適化の問題に変更することで、現実的な処理時間で演算を終了可能とした。すなわち、単純に、設定時刻において配水ポンプ33,34の発停を計画する場合、配水ポンプ33,34のオンとオフとの2通りに対して、時間の刻み数と、配水ポンプ33,34の数との累乗で算出される数の操作から、いずれの操作を選ぶかが選択される。しかしながら、所定の発停状態にある配水ポンプ33,34に対して、次に配水ポンプ33,34の発停操作を行う配水池31,32の水位(以下、発停水位)を決定するように制御する。これにより、オンオフの離散値の最適化問題を、配水池31,32の水位の連続値の最適化問題に変更できる。そのため、ニューラルネットワーク300による推論ごとに水位を決定すれば良いことになるので、従来に比して短時間で最適解に近い解を導出できる。さらに、配水池31,32のそれぞれにおける水位を所定の許容範囲内に設定していることにより、制約条件からの逸脱を低減できる。さらに、連続値から所定の制御を選択する場合、離散値から所定の制御を選択する場合に比して、推論ごとのばらつきが少なくなるため、安定した運転計画をたてることができる。
In addition, instead of starting and stopping the distribution pumps 33, 34, the water level threshold for turning the distribution pumps 33, 34 on or off is optimized, changing the problem of optimizing discrete values to a problem of optimizing continuous values, making it possible to complete the calculation in a realistic processing time. In other words, when simply planning the start and stop of the distribution pumps 33, 34 at a set time, one of the operations calculated as the power of the number of time increments and the number of distribution pumps 33, 34 is selected for the two ways of turning the distribution pumps 33, 34 on and off. However, for the distribution pumps 33, 34 in a specified start/stop state, the water level of the
以下に説明する本実施形態による配水池の運転管理方法は、本発明者による以上の鋭意検討によって案出されたものである。図3は、本実施形態による配水池の運転管理方法を説明するためのフローチャートである。なお、運転管理装置20は、ネットワーク2を通じて、常時または適時、配水池31,32から水位情報を取得しているとともに、配水ポンプ33,34から発停情報を取得し、取得した水位情報および発停情報を記憶部22に格納している。また、学習装置10と運転管理装置20と配水池系30との間における情報の送受信、供給、または取得は、ネットワーク2を介して行われるが、都度の説明は省略する。
The method for managing operation of a water reservoir according to this embodiment, which is described below, was devised by the inventor through the above-mentioned intensive study. FIG. 3 is a flowchart for explaining the method for managing operation of a water reservoir according to this embodiment. The
図3に示すように、ステップST1において学習装置10の制御部11における状態入力部114は、配水池系30に関する情報を貯留入力データとして取得する。入力データの一例としての貯留入力データは、例えば配水ポンプ33,34のオンオフなどの離散値を含む。具体的に、状態入力部114は、運転管理装置20から、水位情報および発停情報を取得する。状態入力部114は、運転管理装置20の制御部21における運転計画部211によって、運転計画データベース221から、所定時間、例えば48時間におけるそれぞれの需要家35,36が使用する水道水の量の予測値の情報(以下、需要予測情報)を取得する。需要予測情報は、換言すると、時刻に沿った、配水池31,32から排出される水道水の排出量の予測値である。状態入力部114は、適時、所定の電力供給事業者などの事業者サーバから、具体的に配水ポンプ33,34に電力を供給している電力供給事業者の事業者サーバ(図示せず)から、所定時刻における電力料金単価の情報(以下、料金情報)を取得する。状態入力部114は、常時または適時、所定の時刻サーバ(図示せず)から現在時刻の情報(以下、時刻)を取得する。なお、状態入力部114は、水位情報、発停情報、需要予測情報、料金情報、および時刻のうちの、全ての情報を取得しても、水位情報を含む一部の情報のみを取得しても良い。さらに、その他の情報を取得することも可能である。
As shown in FIG. 3, in step ST1, the
次に、ステップST2に移行して制御部11の演算部116は、取得したデータに対して、複数の互いに異なるノイズを付加する。具体的には、図2に示すように、演算部116は、例えば取得した複数の配水池31,32における複数の水位情報のうちの、少なくとも1つの水位情報に対して、互いに異なる複数のノイズを付加する。本実施形態においては、これらのノイズは、正規分布、いわゆるガウス雑音に基づいて選択されるが、例えば一様分布などの他の分布に基づいたノイズ、他の分布に基づいて選択することも可能である。水位情報に対して互いに異なる複数のノイズを付加することにより、1つの水位情報に対して複数のノイズ付加データが、ノイズ付加水位情報として生成される。同様に、取得した複数の配水ポンプ33,34における複数の発停情報のうちの、少なくとも1つの発停情報に対して、互いに異なる複数のノイズを付加する。これにより、1つの発停情報に対して複数のノイズ付加データが、ノイズ付加発停情報として生成される。さらに、需要予測情報に対しても同様に、少なくとも1つの需要予測情報に対して、複数のノイズ付加需要予測情報が生成される。なお、演算部116による情報に対するノイズの付加は、水位情報、発停情報、および需要予測情報の全ての情報に対して行っても良く、これらの情報から選択した情報に対してのみ行っても良い。また、演算部116は、必要に応じて、料金情報や時刻に対しても、複数の互いに異なるノイズを付加して、複数のノイズ付加料金情報や、複数のノイズ付加時刻を生成しても良い。すなわち、状態入力部114が取得した種々の情報のうちの、少なくとも1つの情報に対してノイズを付加すれば良い。
Next, the process proceeds to step ST2, and the
次に、図3のステップST3に移行して、学習装置10の制御部11における学習部111は、記憶部12からニューラルネットワーク122を読み出し、複数のノイズ付加データをニューラルネットワーク122に入力する。なお、学習部111は、強化学習による機械学習によって生成された学習モデル121を読み出して、複数のノイズ付加データを学習モデル121に入力しても良い。学習モデル121またはニューラルネットワーク122によって、制御部11の学習部111は、入力した複数のノイズ付加データにそれぞれ対応した、複数の推論結果データ321を出力する(図2参照)。
Next, moving to step ST3 in FIG. 3, the
その後、ステップST4に移行して、複数の推論結果データ321がシミュレータ部117によって実行されるシミュレータ340(図2参照)に入力される。シミュレータ340は、複数の推論結果データ321に対応した複数の評価値330を出力する。複数の評価値330は、制御部11の判定部112によって実行されるセレクタ350に入力される。セレクタ350は、複数の評価値330から、例えば、最も評価値が高い評価値330、または所定の評価値に最も近い評価値330などの所定条件に基づいて、少なくとも1つの評価値330を選択する。なお、複数の評価値330が所定条件を満たしていない場合には、ステップST2に復帰してノイズの付加を改めて行っても良い。続いて、制御部11の行動選択部113は、複数の推論結果データ321から、セレクタ350が選択した評価値に対応した少なくとも1つの推論結果データ321を最終の推論結果データ320として選択する。ここで、最終の推論結果データ320は、それぞれの配水ポンプ33,34の発停の切り換えを行うタイミングであったり、発停の切り換えを行う配水池31,32の水位であったり、それぞれの配水ポンプ33,34の発停のパターンであったりする。
Then, the process proceeds to step ST4, where the multiple inference result
続いて、ステップST5に移行して学習装置10の通信部13は、制御部11によって導出された最終の推論結果データ320を、貯留推論結果データとして運転管理装置20に送信する。運転管理装置20の運転制御部212は、取得した貯留推論結果データ(最終の推論結果データ320)に基づいて、配水池系30の配水ポンプ33,34の運転、すなわち発停を制御する。配水池系30における配水ポンプ33,34の発停によって得られるそれぞれの配水池31,32の水位は、水位情報として常時または適時、運転管理装置20に送信される。同様に、配水ポンプ33,34の動作のオンオフも、発停情報として常時または適時、運転管理装置20に送信される。運転管理装置20が取得したそれぞれの配水池31,32の水位情報や、それぞれの配水ポンプ33,34の発停情報は、運転管理装置20の記憶部22における運転情報データベース222に格納される。
Next, proceeding to step ST5, the communication unit 13 of the
次に、ステップST6に移行して、運転制御部212は、取得したそれぞれの配水池31,32における水位情報に基づいて、それぞれの配水池31,32の水位が許容範囲内であるか否かを判定する。なお、それぞれの配水池31,32の水位の許容範囲は、配水池31,32ごとにそれぞれ設定されている。運転制御部212は、配水ポンプ33,34の発停に応じたそれぞれの配水池31,32における水位が、許容範囲から逸脱したか否かを配水池31,32ごとに確認する。また、運転制御部212は、許容範囲から逸脱した場合には、許容範囲からどの程度逸脱したか、すなわち、それぞれの配水池31,32の水位が、許容範囲の上限よりどの程度高いか、許容範囲の下限よりどの程度低いかを、逸脱レベルとして導出する。同様に、運転制御部212は、配水ポンプ33,34の発停回数や使用電力料金が、許容範囲からどの程度逸脱したかに応じて、逸脱レベルを導出する。運転制御部212によって導出された逸脱レベルは、運転管理装置20から、学習装置10に送信される。
Next, proceeding to step ST6, the operation control unit 212 determines whether the water levels of the
学習装置10の環境部115は、取得した逸脱レベルに基づいて、強化学習の報酬に関する罰則を導出する。具体的に環境部115は、取得した逸脱レベルが大きいほど、線形的に減点が大きくなるように、換言すると報酬が少なくなるように、報酬を設定する。また、環境部115は、配水池31,32の制約条件である水位の許容範囲を維持しつつ、運転を所定時間、例えば1時間継続できた場合に、正の報酬を設定する。さらに、環境部115は、配水池系30の配水ポンプ33,34の発停回数や使用電力料金に応じて、逸脱レベルが大きくなるに従って罰則が大きくなるように、報酬を設定する。
The
次に、ステップST7に移行して、学習部111は、環境部115が設定した報酬を取得して、強化学習における報酬とする。これにより、学習部111の強化学習における機械学習が進み、配水池系30の運転制御に関して、より適切な推論結果、すなわち配水ポンプ33,34の発停のパターンを最適化させることができる。
Next, the process proceeds to step ST7, where the
図4は、上述した入力データにノイズを付加した一実施形態による配水池系の運転管理方法による、運転時間に沿った制御継続時間を示すグラフである。図5は、比較例としての入力データにノイズを付加することなく、強化学習を用いた従来技術による配水池系の運転管理方法による、運転時間に沿った制御継続時間を示すグラフである。なお、制御継続時間とは、配水池31,32の水位を、水位の許容範囲内に維持した状態で運転を継続できた時間であり、図4および図5に示す例では、運転継続時間の上限を24時間(1日)とした。
Figure 4 is a graph showing the control duration over operation time according to an embodiment of the operation management method for a water reservoir system in which noise is added to the input data described above. Figure 5 is a graph showing the control duration over operation time according to a conventional operation management method for a water reservoir system using reinforcement learning without adding noise to the input data as a comparative example. The control duration is the time during which operation can be continued while maintaining the water levels of the
図4から、一実施形態による運転管理方法においては、配水池31,32の水位を所定の水位の許容範囲内に維持した状態で、1900時間程度まで配水池系30の運転を継続することができたことが分かる。図4に示す例では、約1900時間の運転において、配水池31,32の制約条件、すなわち水位の許容範囲を維持した運転ができたことが確認された。これに対し、図5から、従来技術による運転管理方法においては、配水池31,32の水位が、所定の水位の許容範囲から逸脱していることが分かる。図5に示す例では、約1900時間の運転において、110時間程度、水位の許容範囲を逸脱して、配水池31,32の制約条件を逸脱した運転になったことが確認された。
From FIG. 4, it can be seen that in the operation management method according to one embodiment, the operation of the
すなわち、従来技術においては、安定して運転できたのは、((1900-110)/1900=)94.2%程度である。このように、強化学習によって生成された学習モデルや、教師あり学習または半教師あり学習などによって生成された学習モデルを、より精度良く構築したとしても、安定した運転を100%継続することは極めて困難であるのに対し、入力データにノイズを付加する本実施形態による運転管理方法によれば、配水池系30の運転を安定して行うことができる。なお、入力データにノイズを付加することによって、出力される推論結果の精度を向上させる対象としては、配水池系30などに限定されず、貯留ピットおよび焼却炉などを備えた廃棄物処理施設や、橋梁などの建築構造物など、種々の対象に適用可能である。
In other words, in the conventional technology, stable operation was achieved about 94.2% of the time ((1900-110)/1900=). Thus, even if a learning model generated by reinforcement learning or a learning model generated by supervised learning or semi-supervised learning is constructed with higher accuracy, it is extremely difficult to maintain stable operation 100% of the time. In contrast, the operation management method according to the present embodiment, which adds noise to the input data, allows stable operation of the
図6は、一実施形態による配水池系の運転管理方法による、運転時間に沿った制御スコアを示すグラフである。なお、一実施形態による運転管理方法においては、セレクタ350によって例えば20未満の評価値の推論結果を排除している。図7は、比較例としての従来技術による配水池系の運転管理方法による、運転時間に沿った制御スコアを示すグラフである。なお、図6および図7に示す制御スコアは、上述した制約条件である水位の許容範囲内での運転を継続できたか否かの運転継続性、使用電力料金、配水ポンプ33,34の発停回数に基づいて算出される。例えば、運転継続性は、水位の許容範囲内での運転を1時間継続した場合に1点とし、継続できなかった場合には水位の許容範囲から逸脱した大きさ応じた点数を減点した。また、発停回数が所定回数を超えたり、使用電力料金が所定の料金を超えたりした場合には、超えた回数や金額に応じた点数を減点した。なお、減点は、水位の許容範囲から逸脱した大きさに応じて、線形的な点数が好ましいが、指数的な点数や、対数的な点数や、多項式的な点数としても良い。また、制御スコアは、報酬または評価値とも言われる。 Figure 6 is a graph showing the control score along the operation time according to the operation management method of the water reservoir system according to one embodiment. In the operation management method according to one embodiment, the selector 350 eliminates inference results of evaluation values less than 20, for example. Figure 7 is a graph showing the control score along the operation time according to the operation management method of the water reservoir system according to the conventional technology as a comparative example. The control scores shown in Figures 6 and 7 are calculated based on the operation continuity, which is whether or not operation could be continued within the allowable range of the water level, which is the above-mentioned constraint condition, the power usage fee, and the number of starts and stops of the water distribution pumps 33 and 34. For example, the operation continuity is given 1 point when operation within the allowable range of the water level is continued for one hour, and if it cannot be continued, the points according to the amount of deviation from the allowable range of the water level are deducted. In addition, if the number of starts and stops exceeds a predetermined number of times or the power usage fee exceeds a predetermined fee, the points according to the number of times or amount of the exceedance are deducted. The deduction is preferably a linear score according to the deviation of the water level from the allowable range, but it may also be an exponential score, a logarithmic score, or a polynomial score. The control score is also called a reward or an evaluation value.
図6から、一実施形態による配水池系30の運転管理方法においては、制御スコアを20点以上23点以下の範囲に収めることが可能であることが分かる。これに対し、図7から、従来技術による配水池系30の管理方法においては、制御スコアが20未満、さらには-10程度まで低下することが分かる。すなわち、上述した一実施形態による運転管理方法によれば、従来に比して配水池系30の運転のさらなる最適化を実現可能であることが分かる。
From Figure 6, it can be seen that in the operation management method of the
(変形例)
次に、上述した一実施形態による情報処理方法の変形例について説明する。図8は、一実施形態の変形例による、入力データから推論結果を導出する方法を説明するための図である。図8に示すように、変形例による運転管理方法においては、上述した一実施形態と異なり、ニューラルネットワークが第1推論結果データ321-1~第n推論結果データ321-nを出力した後、これらの第1推論結果データ321-1~第n推論結果データ321-nは、アンサンブル360に入力される。アンサンブル360は、例えばバギング、ブースティング、またはスタッキングなどのアルゴリズムに基づいて学習部111により実行され、複数の推論結果データ321を組み合わせて多数決的に推論を行う。分類や回帰など推定問題においては、複数の出力を用いたアンサンブル学習によって精度を向上させることができる。一実施形態の変形例の場合、ノイズを付加した複数のノイズ付加入力データ311-1~311-nから、それらのデータに対応した複数の推論結果データ321-1~321-nを取得し、アンサンブル学習によってより精度の高い推論結果を得る最終の推論結果データ320として得ることができる。その他の情報処理方法については、一実施形態と同様である。なお、アンサンブル学習以外の学習型の対象物認識アルゴリズムを用いることも可能である。
(Modification)
Next, a modified example of the information processing method according to the embodiment described above will be described. FIG. 8 is a diagram for explaining a method of deriving an inference result from input data according to a modified example of the embodiment. As shown in FIG. 8, in the operation management method according to the modified example, unlike the embodiment described above, after the neural network outputs the first inference result data 321-1 to the n-th inference result data 321-n, these first inference result data 321-1 to the n-th inference result data 321-n are input to the ensemble 360. The ensemble 360 is executed by the
以上説明した一実施形態によれば、入力データに互いに異なる複数のノイズを付加して複数のノイズ付加データを生成し、複数のノイズ付加データをニューラルネットワークに入力して、複数のノイズ付加データのそれぞれに対応した複数の推論結果データを取得し、取得した複数の推論結果データに基づいて、最終の推論結果データを出力していることにより、入力データをニューラルネットワークに入力させて得られる推論結果データの精度をさらに向上させることが可能となる。 According to the embodiment described above, multiple noises different from each other are added to input data to generate multiple noise-added data, the multiple noise-added data are input to a neural network to obtain multiple inference result data corresponding to each of the multiple noise-added data, and final inference result data is output based on the obtained multiple inference result data. This makes it possible to further improve the accuracy of the inference result data obtained by inputting input data into a neural network.
(記録媒体)
上述の一実施形態において、学習装置10や運転管理装置20が実行する処理方法を実行させるプログラムを、コンピュータその他の機械やウェアラブルデバイスなどの装置(以下、コンピュータなど、という)が読み取り可能な記録媒体に記録することができる。コンピュータなどに、この記録媒体のプログラムを読み込ませて実行させることにより、当該コンピュータなどが移動体制御装置として機能する。ここで、コンピュータなどが読み取り可能な記録媒体とは、データやプログラムなどの情報を電気的、磁気的、光学的、機械的、または化学的作用によって蓄積し、コンピュータなどから読み取ることができる非一時的な記録媒体をいう。このような記録媒体のうちのコンピュータ等から取り外し可能なものとしては、例えばフレキシブルディスク、光磁気ディスク、CD-ROM、CD-R/W、DVD、BD、DAT、磁気テープ、フラッシュメモリなどのメモリカードなどがある。また、コンピュータなどに固定された記録媒体としてハードディスク、ROMなどがある。さらに、SSDは、コンピュータなどから取り外し可能な記録媒体としても、コンピュータなどに固定された記録媒体としても利用可能である。
(recoding media)
In the above-described embodiment, a program for executing the processing method executed by the
また、一実施形態による学習装置10、および運転管理装置20に実行させるプログラムは、インターネットなどのネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成しても良い。
In addition, the programs executed by the
(その他の実施形態)
一実施形態においては、上述した「部」を、「回路」などに読み替えることができる。例えば、制御部は、制御回路に読み替えることができる。
Other Embodiments
In one embodiment, the above-mentioned "unit" can be read as a "circuit" etc. For example, the control unit can be read as a control circuit.
なお、本明細書におけるフローチャートの説明では、「まず」、「次に」、「その後」、「続いて」などの表現を用いてステップ間の処理の前後関係を明示していたが、本実施の形態を実施するために必要な処理の順序は、それらの表現によって一意的に定められるわけではない。すなわち、本明細書で記載したフローチャートにおける処理の順序は、矛盾のない範囲で変更することができる。 Note that in the explanation of the flowcharts in this specification, the order of processing between steps is clearly indicated using expressions such as "first," "next," "then," and "continue." However, the order of processing required to implement this embodiment is not uniquely determined by these expressions. In other words, the order of processing in the flowcharts described in this specification can be changed as long as there are no contradictions.
さらなる効果や変形例は、当業者によって容易に導き出すことができる。本開示のより広範な態様は、以上のように表しかつ記述した特定の詳細および代表的な実施形態に限定されるものではない。したがって、添付のクレームおよびその均等物によって定義される総括的な発明の概念の精神または範囲から逸脱することなく、様々な変更が可能である。 Further advantages and modifications may be readily derived by those skilled in the art. The broader aspects of the present disclosure are not limited to the specific details and representative embodiments shown and described above. Thus, various modifications may be made without departing from the spirit or scope of the general inventive concept as defined by the appended claims and equivalents thereof.
1 運転管理システム
2 ネットワーク
10 学習装置
11,21 制御部
12,22 記憶部
13,23 通信部
14,24 出力部
15,25 入力部
20 運転管理装置
30 配水池系
31,32 配水池
33,34 配水ポンプ
35,36 需要家
111 学習部
112 判定部
113 行動選択部
114 状態入力部
115 環境部
116 演算部
117 シミュレータ部
121 学習モデル
122,300 ニューラルネットワーク
211 運転計画部
212 運転制御部
221 運転計画データベース
222 運転情報データベース
301 入力層
302 中間層
303 出力層
310 入力データ
311-1 第1ノイズ付加データ
311-2 第2ノイズ付加データ
311-3 第3ノイズ付加データ
311-n 第nノイズ付加データ
320,321 推論結果データ
321-1 第1推論結果データ
321-2 第2推論結果データ
321-3 第3推論結果データ
321-n 第n推論結果データ
330 評価値
330-1 第1評価値
330-2 第2評価値
330-3 第3評価値
330-n 第n評価値
340 シミュレータ
350 セレクタ
360 アンサンブル
1 Operation management system 2
Claims (12)
前記制御部は、
取得した前記入力データを記憶部に格納し、
前記記憶部から読み出した1つの前記入力データに対して、互いに異なる複数のノイズを付加した、複数のノイズ付加データを生成し、
前記複数のノイズ付加データを前記ニューラルネットワークに入力して、前記複数のノイズ付加データに対応した複数のノイズ付加推論結果データを出力し、
前記複数のノイズ付加推論結果データに基づいて、前記推論結果データを出力する
情報処理装置。 An information processing device including a control unit that acquires at least one input data and outputs inference result data using a neural network based on the input data,
The control unit is
The acquired input data is stored in a storage unit;
generating a plurality of noise-added data by adding a plurality of noises different from each other to the single input data read from the storage unit;
inputting the plurality of noise-added data into the neural network, and outputting a plurality of noise-added inference result data corresponding to the plurality of noise-added data;
and an information processing device that outputs the inference result data based on the plurality of noise-added inference result data.
請求項1に記載の情報処理装置。 The information processing apparatus according to claim 1 , wherein the plurality of noises different from each other are noises selected based on a normal distribution.
前記複数のノイズ付加推論結果データのそれぞれに対してシミュレートを行って、前記複数のノイズ付加推論結果データのそれぞれに対応した複数の評価値を出力し、
前記複数の評価値に基づいて、前記複数のノイズ付加推論結果データから選択した少なくとも1つのノイズ付加推論結果データを、前記推論結果データとして出力する
請求項1または2に記載の情報処理装置。 The control unit is
performing a simulation for each of the plurality of noise-added inference result data, and outputting a plurality of evaluation values corresponding to each of the plurality of noise-added inference result data;
The information processing apparatus according to claim 1 , further comprising: outputting, as the inference result data, at least one noise-added inference result data selected from the plurality of noise-added inference result data based on the plurality of evaluation values.
前記複数のノイズ付加推論結果データに対してアンサンブル学習を行い、
前記アンサンブル学習によって得られた出力を、前記推論結果データとして出力する
請求項1または2に記載の情報処理装置。 The control unit is
performing ensemble learning on the plurality of noise-added inference result data;
The information processing device according to claim 1 , wherein an output obtained by the ensemble learning is output as the inference result data.
請求項1~4のいずれか1項に記載の情報処理装置。 The information processing device according to any one of claims 1 to 4, wherein the input data is data including discrete values.
前記運転制御部は、
前記貯留設備から前記貯留部内の液位を含む液位情報を取得し、
取得した前記液位情報を含む情報を貯留入力データとして、請求項1~5のいずれか1項に記載の情報処理装置に入力し、前記貯留入力データに対応して前記情報処理装置から出力された推論結果データを、貯留推論結果データとして取得し、
前記貯留推論結果データに基づいて、前記送液部を制御する
運転管理装置。 An operation management device for a storage facility including at least one storage tank for storing a liquid and at least one liquid delivery unit capable of supplying the liquid to the storage tank, the operation management device including an operation control unit that controls the liquid delivery unit to manage a liquid level in the storage unit,
The operation control unit is
Acquiring liquid level information including a liquid level in the storage unit from the storage facility;
Inputting information including the acquired liquid level information as stored input data into an information processing device according to any one of claims 1 to 5, and acquiring inference result data output from the information processing device in response to the stored input data as stored inference result data;
An operation management device that controls the liquid delivery unit based on the storage inference result data.
請求項6に記載の運転管理装置。 The operation management device according to claim 6 , wherein the storage inference result data includes information on a liquid level that switches on/off the liquid delivery unit.
請求項6または7に記載の運転管理装置。 The operation management device according to claim 6 or 7, wherein the storage input data includes information on a predicted value along with time of an amount of the liquid to be discharged from the storage portion at a predetermined time.
前記貯留入力データは、所定時刻における前記ポンプの発停の情報を含む
請求項6~8のいずれか1項に記載の運転管理装置。 The liquid delivery unit is composed of a pump whose on/off switching is controlled,
The operation management device according to any one of claims 6 to 8, wherein the storage input data includes information on starting and stopping of the pump at a predetermined time.
前記貯留入力データは、所定時間における前記電力の料金単価および消費電力の情報を含む
請求項6~9のいずれか1項に記載の運転管理装置。 The liquid delivery unit is composed of a pump driven by electricity,
The operation management device according to any one of claims 6 to 9, wherein the stored input data includes information on the unit price of electricity and power consumption at a predetermined time.
取得した前記入力データを記憶部に格納し、
前記記憶部から読み出した1つの前記入力データに対して、互いに異なる複数のノイズを付加した、複数のノイズ付加データを生成し、
前記複数のノイズ付加データを前記ニューラルネットワークに入力して、前記複数のノイズ付加データに対応した複数のノイズ付加推論結果データを出力し、
前記複数のノイズ付加推論結果データに基づいて、前記推論結果データを出力する
情報処理方法。 1. An information processing method executed by an information processing device that acquires at least one input data and outputs inference result data using a neural network based on the input data, comprising:
The acquired input data is stored in a storage unit;
generating a plurality of noise-added data by adding a plurality of noises different from each other to the single input data read from the storage unit;
inputting the plurality of noise-added data into the neural network, and outputting a plurality of noise-added inference result data corresponding to the plurality of noise-added data;
and outputting the inference result data based on the plurality of noise-added inference result data.
前記貯留設備から前記貯留部内の液位を含む液位情報を取得し、
取得した前記液位情報を含む情報を貯留入力データとして、請求項11に記載の情報処理方法に基づいて、前記貯留入力データに対応して得られた貯留推論結果データを取得し、
前記貯留推論結果データに基づいて、前記送液部を制御する
運転管理方法。 An operation management method for a storage facility including at least one storage tank for storing a liquid and at least one liquid delivery unit capable of supplying the liquid to the storage tank, the operation management method being performed by an operation management device that controls the liquid delivery unit to manage a liquid level in the storage unit,
Acquiring liquid level information including a liquid level in the storage unit from the storage facility;
The information including the acquired liquid level information is used as storage input data, and storage inference result data obtained corresponding to the storage input data is acquired based on the information processing method according to claim 11 .
The operation management method further comprises controlling the liquid delivery unit based on the storage inference result data.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020175752A JP7484653B2 (en) | 2020-10-20 | 2020-10-20 | Information processing device, information processing method, operation management device, and operation management method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020175752A JP7484653B2 (en) | 2020-10-20 | 2020-10-20 | Information processing device, information processing method, operation management device, and operation management method |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2022067185A JP2022067185A (en) | 2022-05-06 |
| JP7484653B2 true JP7484653B2 (en) | 2024-05-16 |
Family
ID=81390579
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2020175752A Active JP7484653B2 (en) | 2020-10-20 | 2020-10-20 | Information processing device, information processing method, operation management device, and operation management method |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7484653B2 (en) |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20190156183A1 (en) | 2018-12-27 | 2019-05-23 | David M. Durham | Defending neural networks by randomizing model weights |
| JP2019113005A (en) | 2017-12-25 | 2019-07-11 | 株式会社クボタ | Manhole pump system |
| CN111242319A (en) | 2020-01-15 | 2020-06-05 | 支付宝(杭州)信息技术有限公司 | Model prediction result interpretation method and device |
| US20200285896A1 (en) | 2019-03-09 | 2020-09-10 | Tongji University | Method for person re-identification based on deep model with multi-loss fusion training strategy |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH04328669A (en) * | 1991-04-26 | 1992-11-17 | Toyo Electric Mfg Co Ltd | Unified neural network and its learning system |
| JP3252531B2 (en) * | 1993-05-28 | 2002-02-04 | 株式会社明電舎 | Sewage pump operation number control device |
-
2020
- 2020-10-20 JP JP2020175752A patent/JP7484653B2/en active Active
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2019113005A (en) | 2017-12-25 | 2019-07-11 | 株式会社クボタ | Manhole pump system |
| US20190156183A1 (en) | 2018-12-27 | 2019-05-23 | David M. Durham | Defending neural networks by randomizing model weights |
| US20200285896A1 (en) | 2019-03-09 | 2020-09-10 | Tongji University | Method for person re-identification based on deep model with multi-loss fusion training strategy |
| CN111242319A (en) | 2020-01-15 | 2020-06-05 | 支付宝(杭州)信息技术有限公司 | Model prediction result interpretation method and device |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2022067185A (en) | 2022-05-06 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN113099729B (en) | Deep Reinforcement Learning for Production Scheduling | |
| JP6902487B2 (en) | Machine learning system | |
| Chiang et al. | Combine evolutionary optimization with model predictive control in real-time flood control of a river system | |
| Zomorodian et al. | Development and application of coupled system dynamics and game theory: A dynamic water conflict resolution method | |
| CN113191880B (en) | Bank teller terminal banknote adding suggestion determining method and device | |
| CN114298429B (en) | A distribution network action plan auxiliary decision-making method, system, device and storage medium | |
| JP7484653B2 (en) | Information processing device, information processing method, operation management device, and operation management method | |
| CN118899917A (en) | Active power correction control method and device for power system | |
| CN101419610A (en) | Information processing device, information processing method, and program | |
| Mohammed et al. | Embracing advanced AI/ML to help investors achieve success: Vanguard Reinforcement Learning for Financial Goal Planning | |
| Bond et al. | Using numerical dynamic programming to compare passive and active learning in the adaptive management of nutrients in shallow lakes | |
| CN120631069A (en) | Double-capacity water tank control method, system, equipment and medium based on multi-objective reward Q learning | |
| Hernandez et al. | Learning from multivariate discrete sequential data using a restricted Boltzmann machine model | |
| CN117839220A (en) | Game engine optimization method and device based on reinforcement learning | |
| JP7347544B2 (en) | Strategy learning method, strategy learning device, program | |
| De Wet | Modelling the South African financial cycle | |
| Pascual et al. | Modelling the Dynamics of Financial Markets: Insights from Agent-Based Models | |
| KR102875519B1 (en) | Computer device for predicting public perception in competitive environment based on model-based reinforcement learning, and method of the same | |
| CN121302904B (en) | A reinforcement learning-based method for optimizing energy efficiency in cloud-based devices | |
| Ganguli | Differential profit rates and convergence to the natural state | |
| CN119109009B (en) | A method and apparatus for power distribution network planning based on mixed integer programming | |
| CN119416988B (en) | Drainage system real-time optimization control method, device, equipment and medium | |
| CN120069597B (en) | A Agent-Based Electricity Spot Market Strategy Processing Method and Computer Equipment | |
| Vermuyten et al. | Real-time flood control by means of an improved MPC-GA algorithm and a fast conceptual river model for the Demer basin in Belgium | |
| JP2024070638A (en) | PROGRAM, INFORMATION PROCESSING METHOD, AND INFORMATION PROCESSING APPARATUS |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230227 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240229 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240305 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240322 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240402 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240415 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7484653 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |