JP6917004B2 - Evaluation device, evaluation method and its program - Google Patents
Evaluation device, evaluation method and its program Download PDFInfo
- Publication number
- JP6917004B2 JP6917004B2 JP2017083501A JP2017083501A JP6917004B2 JP 6917004 B2 JP6917004 B2 JP 6917004B2 JP 2017083501 A JP2017083501 A JP 2017083501A JP 2017083501 A JP2017083501 A JP 2017083501A JP 6917004 B2 JP6917004 B2 JP 6917004B2
- Authority
- JP
- Japan
- Prior art keywords
- learning
- module
- evaluation
- learning module
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Testing And Monitoring For Control Systems (AREA)
- Air Conditioning Control Device (AREA)
Description
本発明は、評価装置、評価方法及びそのプログラムに関する。 The present invention relates to an evaluation device, an evaluation method, and a program thereof.
従来より、ニューラルネットワークの技術を用いてシステムの制御を行うことが知られている。例えば、特許文献1には、ニューラルネットワークを用いて、複数のかごの中から乗り場へ移動させるべき最適なかごを選択するエレベータシステムが開示されている。 Conventionally, it has been known to control a system by using a neural network technique. For example, Patent Document 1 discloses an elevator system that uses a neural network to select an optimum car to be moved from a plurality of cars to a landing.
また、引用文献2には、ニューラルネットワークを用いたパターン認識装置において誤認識を低減するために、ニューラルネットワークに対して追加学習を行う方法が開示されている。 Further, Cited Document 2 discloses a method of performing additional learning on a neural network in order to reduce erroneous recognition in a pattern recognition device using a neural network.
ニューラルネットワークの技術を用いた制御システムでは、制御性能を向上等させるためにニューラルネットワークの追加学習を行うことがある。例えば、最初の学習時には、図11の時刻1から時刻2の期間に得られたデータからランダムに選択した学習データAを用い、その後、図11の時刻2から時刻3の期間に得られたデータからランダムに選択した学習データBを用いて追加学習を行う場合が考えられる。 In a control system using neural network technology, additional learning of the neural network may be performed in order to improve control performance and the like. For example, at the time of the first learning, the learning data A randomly selected from the data obtained in the period from time 1 to time 2 in FIG. 11 is used, and then the data obtained in the period from time 2 to time 3 in FIG. 11 is used. It is conceivable that additional learning is performed using the learning data B randomly selected from.
このような場合に、学習データの選択をランダムに行っていることに起因して、学習データBが不適切な学習データを含む場合がある。このように不適切な学習データを含む追加学習データBを用いて追加学習を行った場合、追加学習後のニューラルネットワークの制御性能は、追加学習以前のニューラルネットワークと比較して性能が劣化することがある。 In such a case, the learning data B may include inappropriate learning data due to the random selection of the learning data. When additional learning is performed using the additional learning data B including inappropriate learning data in this way, the control performance of the neural network after the additional learning deteriorates as compared with the neural network before the additional learning. There is.
また、時刻2から時刻3の期間において特殊なイベントが発生していた場合は、追加学習後のニューラルネットワークが、特殊なイベントに特化したものとなる可能性がある。その結果、追加学習後のニューラルネットワークの制御性能は、追加学習以前のニューラルネットワークと比較して性能が劣化してしまう恐れがある。 Further, when a special event occurs in the period from time 2 to time 3, the neural network after the additional learning may be specialized for the special event. As a result, the control performance of the neural network after the additional learning may be deteriorated as compared with the neural network before the additional learning.
そこで、本発明は、追加学習後に学習モジュールの制御性能が劣化した場合に対処し得る評価装置、評価方法及びそのプログラムを提供することを目的とする。 Therefore, an object of the present invention is to provide an evaluation device, an evaluation method, and a program thereof that can deal with a case where the control performance of the learning module deteriorates after additional learning.
本発明の一態様に係る第1の学習モジュールを追加学習させた第2の学習モジュールを評価する評価装置は、第2の学習モジュールが達成すべき学習目標を受け付ける学習目標受付部と、少なくとも学習目標に含まれる評価項目について第2の学習モジュールの評価を行い、評価データを生成する評価部と、学習目標と評価データとを用いて、第2の学習モジュールが学習目標を達成したか否か判定する判定部と、学習目標を達成しないと判定される場合、少なくとも学習目標に基づいて、第2の学習モジュールと異なる第3の学習モジュールを取得する学習モジュール選択部とを備える。 The evaluation device for evaluating the second learning module obtained by additionally learning the first learning module according to one aspect of the present invention includes a learning goal receiving unit that receives a learning goal to be achieved by the second learning module, and at least learning. Whether or not the second learning module has achieved the learning goal by using the evaluation unit that evaluates the evaluation items included in the goal and generates the evaluation data and the learning goal and the evaluation data. It includes a determination unit for determining, and a learning module selection unit for acquiring a third learning module different from the second learning module, at least based on the learning objective, when it is determined that the learning target is not achieved.
この態様によれば、追加学習後に学習モジュールの制御性能が学習目標を達成しなかった場合に、学習目標を達成しなかった学習モジュールを使用し続けることを回避することができるので、学習モジュールを用いるシステムの信頼性を高めることができる。例えば、学習目標を達成しなかった学習モジュールの使用を回避することで、システム全体の処理精度の低下を防ぐことができる。また、学習目標を達成しない場合に、少なくとも学習目標に基づいて、学習目標を達成しなかった学習モジュールと異なる学習モジュールを取得する構成により、学習モジュールを用いて制御を行う制御装置、評価を行う評価装置のいずれも複数の学習モジュールを保持する必要がないので、学習モジュールを記録するためのハードウェア資源を最小限にすることができる。 According to this aspect, if the control performance of the learning module does not achieve the learning goal after the additional learning, it is possible to avoid continuing to use the learning module that did not achieve the learning goal. The reliability of the system used can be improved. For example, by avoiding the use of a learning module that does not achieve the learning goal, it is possible to prevent a decrease in the processing accuracy of the entire system. In addition, when the learning goal is not achieved, at least based on the learning goal, a control device that controls using the learning module and an evaluation are performed by a configuration in which a learning module different from the learning module that did not achieve the learning goal is acquired. Since it is not necessary to hold a plurality of learning modules in any of the evaluation devices, the hardware resource for recording the learning modules can be minimized.
上記評価装置において、第3の学習モジュールは、第1の学習モジュールとしてもよい。この態様によれば、性能劣化前の学習モジュールを用いてシステムの制御を続行することができるので、学習モジュールを用いるシステムの安定性の低下を防ぐことができる。 In the evaluation device, the third learning module may be the first learning module. According to this aspect, since the control of the system can be continued by using the learning module before the performance deterioration, it is possible to prevent the stability of the system using the learning module from being lowered.
上記評価装置において、学習モジュールが学習目標を達成することができなかった要因を推定して、学習モジュールの追加学習に用いる学習データに関する要因改善データを生成する要因推定部をさらに備えてもよい。この態様によれば、性能劣化した学習モジュールから有益な情報を得ることができる。このような情報を活用することにより、学習モジュールの精度向上に必要となる学習データや処理を低減することができ、CPUの負荷を低減することができる。 The evaluation device may further include a factor estimation unit that estimates the factors that the learning module could not achieve the learning target and generates factor improvement data related to the learning data used for the additional learning of the learning module. According to this aspect, useful information can be obtained from the learning module whose performance has deteriorated. By utilizing such information, it is possible to reduce the learning data and processing required for improving the accuracy of the learning module, and it is possible to reduce the load on the CPU.
上記評価装置において、学習モジュール選択部は、要因改善データに基づいて学習指示を生成してもよい。この態様によれば、性能劣化した学習モジュールが有する問題を克服し得る、効率的な追加学習を学習モジュールにさせることができる。この効率的な追加学習をさせた学習モジュールをシステムに用いることで、最短時間で、学習モジュールの更新による性能劣化を改善することができる。 In the evaluation device, the learning module selection unit may generate a learning instruction based on the factor improvement data. According to this aspect, it is possible to make the learning module perform efficient additional learning that can overcome the problems of the learning module whose performance has deteriorated. By using the learning module with this efficient additional learning in the system, it is possible to improve the performance deterioration due to the update of the learning module in the shortest time.
上記評価装置において、要因推定部は、推定した要因を出力し、推定した要因に関するユーザ入力を受信して、ユーザ入力に基づいて要因改善データを生成してもよい。この態様によれば、より信頼性の高い情報に基づいて、性能劣化要因に関する情報を生成することができる。 In the evaluation device, the factor estimation unit may output the estimated factor, receive the user input regarding the estimated factor, and generate the factor improvement data based on the user input. According to this aspect, it is possible to generate information on performance deterioration factors based on more reliable information.
本発明の他の態様に係る、第1の学習モジュールを追加学習させた第2の学習モジュールを評価する評価方法は、第2の学習モジュールが達成すべき学習目標を受け付ける工程と、少なくとも学習目標に含まれる評価項目について第2の学習モジュールの評価を行い、評価データを生成する工程と、学習目標と評価データとを用いて、第2の学習モジュールが学習目標を達成したか否か判定する工程と、学習目標を達成しないと判定される場合、少なくとも学習目標に基づいて、第2の学習モジュールと異なる第3の学習モジュールを取得する工程とを含む。 The evaluation method for evaluating the second learning module obtained by additionally learning the first learning module according to another aspect of the present invention includes a step of accepting a learning goal to be achieved by the second learning module and at least a learning goal. The evaluation item included in is evaluated by the second learning module, and the process of generating the evaluation data and the learning target and the evaluation data are used to determine whether or not the second learning module has achieved the learning target. It includes a step and a step of acquiring a third learning module different from the second learning module, at least based on the learning goal, when it is determined that the learning goal is not achieved.
本発明の他の態様に係るプログラムは、コンピュータに、第1の学習モジュールを追加学習させた第2の学習モジュールを評価させるためのプログラムであって、第2の学習モジュールが達成すべき学習目標を受け付ける処理と、少なくとも学習目標に含まれる評価項目について第2の学習モジュールの評価を行い、評価データを生成する処理と、学習目標と評価データとを用いて、第2の学習モジュールが学習目標を達成したか否か判定する処理と、学習目標を達成しないと判定される場合、第2の学習モジュールと異なる第3の学習モジュールを取得する処理とを実行させる。 The program according to another aspect of the present invention is a program for causing a computer to evaluate a second learning module obtained by additionally learning a first learning module, and is a learning goal to be achieved by the second learning module. The second learning module evaluates at least the evaluation items included in the learning goal and generates the evaluation data, and the second learning module uses the learning goal and the evaluation data. When it is determined that the learning target is not achieved, the process of determining whether or not the above is achieved and the process of acquiring a third learning module different from the second learning module are executed.
本発明によれば、追加学習後に学習モジュールの制御性能が性能劣化した場合に対処し得る評価装置、評価方法及びそのプログラムを提供することができる。 According to the present invention, it is possible to provide an evaluation device, an evaluation method, and a program thereof that can deal with a case where the control performance of a learning module deteriorates after additional learning.
添付図面を参照して、本発明の実施形態について説明する。なお、以下の実施形態は、本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。また、本発明は、その要旨を逸脱しない限り、さまざまな変形が可能である。さらに、当業者であれば、以下に述べる各要素を均等なものに置換した実施形態を採用することが可能であり、係る実施形態も本発明の範囲に含まれる。 Embodiments of the present invention will be described with reference to the accompanying drawings. It should be noted that the following embodiments are for facilitating the understanding of the present invention, and are not for limiting and interpreting the present invention. Further, the present invention can be modified in various ways as long as it does not deviate from the gist thereof. Further, those skilled in the art can adopt an embodiment in which each element described below is replaced with an equal one, and such an embodiment is also included in the scope of the present invention.
(ネットワーク構成)
図1を参照して、本発明の所定の実施形態に係る学習システム1のネットワーク構成について説明する。学習システム1は、学習装置10、追加学習制御装置20、1又は複数のセンサ30及び記憶装置40を備える。学習装置10は、通信ネットワークNを介して、追加学習制御装置20、1又は複数のセンサ30及び記憶装置40に接続される。通信ネットワークNは、有線又は無線回線により構成された有線通信網及び無線通信網のいずれであってもよく、インターネットやLocal Area Network(LAN)であってよい。
(Network configuration)
The network configuration of the learning system 1 according to the predetermined embodiment of the present invention will be described with reference to FIG. The learning system 1 includes a
学習装置10は、記憶装置40に記憶された学習データに基づいて、学習モジュールの学習を行い、学習済モジュールを記憶装置40に記憶する。本実施形態に係る学習装置10は、学習モジュールを備えるが、学習モジュールは、学習装置10と別体の装置に備えられてもよい。
The
なお、学習モジュールとは、学習能力を備えた専用若しくは汎用のハードウェア若しくはソフトウェアの一単位、又は、当該ハードウェア若しくはソフトウェアの一単位の組合せを含む。当該学習を行う学習モジュールには、学習データによりすでに何らかの学習を行っているものもあれば、学習前のものも含む。ここで、学習能力とは、あるタスクの処理能力を、学習データから得られる経験に基づいて向上させることのできる能力をいう。 The learning module includes a unit of dedicated or general-purpose hardware or software having learning ability, or a combination of one unit of the hardware or software. The learning module that performs the learning includes those that have already learned something from the learning data and those that have not been learned. Here, the learning ability means an ability that can improve the processing ability of a certain task based on the experience obtained from the learning data.
追加学習制御装置20は、学習済モジュールを用いて、入力データの特徴に応じた出力データを出力する。本実施形態に係る追加学習制御装置20は、学習済モジュール又は当該学習済モジュールの複製物を学習装置10から取得して、学習モジュールとして設定する。追加学習制御装置20は、設定された学習モジュールを用いて出力した出力データに対する評価を行い、評価データを出力することができる。追加学習制御装置20は、設定された学習モジュールが達成すべき学習目標と評価データとを用いて、現在設定されている学習モジュールが学習目標を達成したか否か判定することができる。学習目標を達成していないと判定される場合、追加学習制御装置20は、例えば以前設定されていた学習モジュールを学習装置10から取得して、学習モジュールとして設定してもよい。なお、追加学習制御装置20は、後述する評価装置60の機能構成を備えており、評価装置60を実質的に含むものである。
The additional
なお、学習済モジュールの複製物とは、学習済モジュールの機能を再現することができる専用若しくは汎用のハードウェア若しくはソフトウェアの一単位、又は、当該ハードウェア若しくはソフトウェアの一単位の組合せを含む。 The duplicate of the learned module includes one unit of dedicated or general-purpose hardware or software capable of reproducing the function of the learned module, or a combination of one unit of the hardware or software.
学習済モジュールの複製物は、必ずしも学習能力を備えていなくてもよい。また、学習済モジュールの構成と、学習済モジュールの複製物の構成は、必ずしも一致していなくてもよい。また、学習済モジュールの複製物は、いわゆる蒸留によって得られる学習モジュールを含む。すなわち、学習済モジュールの複製物は、学習済モジュールの機能を保つように、学習済モジュールと構造が異なる他の学習モジュールを学習させることで得られる、学習済みの当該他の学習モジュールを含む。 A copy of the trained module does not necessarily have the ability to learn. Further, the configuration of the trained module and the configuration of the duplicate of the trained module do not necessarily have to match. A replica of the trained module also includes a learning module obtained by so-called distillation. That is, the duplicate of the trained module includes the other trained learning module obtained by training another learning module having a structure different from that of the trained module so as to maintain the function of the trained module.
ここで、当該他の学習モジュールは、学習済モジュールよりも構造が単純であってよく、よりデプロイに適したものであってよいし、当該他の学習モジュールの学習には、学習済モジュールの出力データを用いてよい。なお、学習済モジュールの複製物は、学習モジュールの学習過程において、オーバーフィッティングを防ぐ正則化の方法を変えたり、バックプロパゲーションの学習率を変えたり、重み係数の更新アルゴリズムを変えたりして得られる学習済モジュールを含む。 Here, the other learning module may have a simpler structure than the learned module and may be more suitable for deployment, and for learning the other learning module, the output of the learned module may be obtained. Data may be used. In addition, the duplicate of the trained module can be obtained by changing the regularization method to prevent overfitting, changing the learning rate of backpropagation, and changing the weight coefficient update algorithm in the learning process of the learning module. Includes trained modules to be.
また、学習済モジュール又は当該学習済モジュールの複製物を取得するとは、学習済モジュールの機能を追加学習制御装置20において再現するために必要な情報を取得することをいう。例えば、学習モジュールがニューラルネットワークを含む場合、学習済モジュール又は当該学習済モジュールの複製物を取得するとは、少なくとも、ニューラルネットワークのレイヤ数、各レイヤに関するノード数、ノード間を繋ぐリンクの重みパラメータ、各ノードに関するバイアスパラメータ及び各ノードに関する活性化関数の関数形に関する情報を取得することをいう。
Further, acquiring a learned module or a duplicate of the learned module means acquiring information necessary for reproducing the function of the learned module in the additional
センサ30は、物理量を検出する物理量センサ、化学量を検出する化学量センサ、情報を検出する情報センサのいずれであってもよいが、これらに限られるものではなく、任意のセンサを含み得る。物理量センサは、例えば光を検出して画像データや動画データを出力するカメラや、人の心拍を検出して心拍データを出力する心拍センサ、人の血圧を検出して血圧データを出力する血圧センサ及び人の体温を検出して体温データを出力する体温センサ等のバイタルセンサを含み、その他任意の物理量を検出して電気的信号を出力するセンサを含む。化学量センサは、例えばガスセンサ、湿度センサ、イオンセンサを含み、その他任意の化学量を検出して電気信号を出力するセンサを含む。情報センサは、例えば統計データから特定のパターンを検出するセンサを含み、その他任意の情報を検出するセンサを含む。
The
記憶装置40は、センサ30によって出力されたセンシングデータを記憶する。また、記憶装置40は、学習装置10によって出力された学習済モジュールを記憶する。図1では、記憶装置40を単一の記憶部として示しているが、記憶装置40は、1又は複数のファイルサーバによって構成されてよい。
The
なお、図1において、学習装置10、追加学習制御装置20及び記憶装置40は、それぞれ別体として構成されているが、これらを一体として構成してもよい。すなわち、学習装置10、追加学習制御装置20及び記憶装置40の全てを一体として構成してもよく、学習装置10、追加学習制御装置20及び記憶装置40のうちの2つを選択的に一体として構成してもよい。このとき、一体として構成された、学習装置10、追加学習制御装置20及び記憶装置40の各要素間は、内部バスを介して接続される。
Although the
(物理的構成:学習装置)
図2を参照して、本発明の所定の実施形態に係る学習装置10の物理的構成について説明する。学習装置10は、制御部10aと、記憶部10bと、通信部10cと、入力部10dと、表示部10eを有する。これら各構成は、バスを介して相互にデータ送受信可能に接続される。
(Physical configuration: learning device)
The physical configuration of the
制御部10aは、ハードウェアプロセッサに相当するCentral Processing Unit(CPU)、及びメモリに相当するRandom Access Memory(RAM)を含む。CPUが記憶部10bに記憶されているプログラムをRAMに展開し、RAMに展開された当該プログラムを解釈及び実行することにより、制御部10aは、後述する図4の各部として機能する。
The
なお、ハードウェアプロセッサの種類はCPUに限定されない。例えば、ハードウェアプロセッサとして、CPU、Graphics Processing Unit(GPU)、Field−programmable Gate Array(FPGA)、Digital Signal Processor(DSP)、Application Specific Integrated Circuit(ASIC)を単独で、又は、組合せて使用することができる。RAMは、データの書き換えが可能な記憶部であり、例えば半導体記憶素子で構成される。RAMは、CPUが実行するアプリケーション等のプログラムやデータを一時的に記憶する。 The type of hardware processor is not limited to the CPU. For example, as a hardware processor, CPU, Graphics Processing Unit (GPU), Field-programmable Gate Array (FPGA), Digital Signal Processor (DSP), Application Specic Can be done. The RAM is a storage unit capable of rewriting data, and is composed of, for example, a semiconductor storage element. The RAM temporarily stores programs and data such as applications executed by the CPU.
記憶部10bは、例えばHard Disk Drive(HDD)やSolid State Drive(SDD)等の不揮発性の記憶媒体である。記憶部10bは、CPUが実行するプログラム及びデータを記憶する。
The
通信部10cは、学習装置10を通信ネットワークNに接続するハードウェアインタフェースである。
The
入力部10dは、ユーザからの入力を受け付けるものであり、例えば、キーボードやマウス、タッチパネルで構成される。
The
表示部10eは、CPUによる処理結果を視覚的に表示するものであり、例えば、Liquid Crystal Display(LCD)により構成される。
The
学習装置10は、例えば一般のパーソナルコンピュータのCPUによって本実施形態に係る学習プログラムを実行することで構成されてよい。学習プログラムは、RAMや記憶部10b等のコンピュータによって読み取り可能な記憶媒体に記憶されて提供されてもよいし、通信部10cにより接続される通信ネットワークNを介して提供されてもよい。これらの物理的な構成は例示であって、必ずしも独立した構成でなくてもよい。
The
(物理的構成:追加学習制御装置)
図3を参照して、本発明の所定の実施形態に係る追加学習制御装置20の物理的構成について説明する。追加学習制御装置20も、学習装置10と同様に、CPU及びRAMを含む制御部20a、データ等を記憶する記憶部20b、ネットワークNと接続するための通信部20c、ユーザからの入力を受け付ける入力部20d、表示部20e等を有する。これら各構成は、バスを介して相互にデータ送受信可能に接続される。CPUが記憶部20bに記憶されているプログラムをRAMに展開し、RAMに展開された当該プログラムを解釈及び実行することにより、制御部20aは、後述する図5の各部として機能する。
(Physical configuration: additional learning control device)
The physical configuration of the additional
追加学習制御装置20は、例えば一般のパーソナルコンピュータのCPUによって追加学習制御プログラムを実行することで構成されてよい。追加学習制御プログラムは、RAMや記憶部20b等のコンピュータによって読み取り可能な記憶媒体に記憶されて提供されてもよいし、通信部20cにより接続される通信ネットワークNを介して提供されてもよい。
The additional
(機能構成:学習装置)
図4を参照して、本発明の所定の実施形態に係る学習装置10の機能構成について説明する。学習装置10は、学習指示受付部101、学習データ取得部102、学習制御部103、学習モジュール104、学習済モジュール出力部105及び学習済モジュール抽出部106を備える。
(Functional configuration: learning device)
With reference to FIG. 4, the functional configuration of the
学習指示受付部101は、入力部10dを介したユーザからの学習指示、又は通信部10cを介した追加学習制御装置20からの学習指示を受け付けて、学習指示に含まれる情報を後述の学習データ取得部102に引き渡す。本実施形態では、学習指示には、学習データ取得条件、入力パラメータの指定等が含まれる。学習データ取得条件とは、学習モジュール104を学習させるための学習データとして使用できるデータのうちでも、ユーザからの学習指示を満たすために必要となる条件をいう。例えばセンサ30で取得されるデータのうち、取得日時を指定したものでもよい。入力パラメータとは、学習指示に含まれる情報のうち、学習済モジュールの制御の性能に影響を与える要因をいう。
The learning
学習データ取得部102は、学習データ取得条件を受信して、受信した学習データ取得条件に基づいて記憶装置40から学習データを取得する。
The learning
学習制御部103は、学習データ取得部102が取得した学習データを用いて、学習モジュール104を学習させる。学習制御部103は、学習指示受付部101で受け付けた学習指示に基づいて学習を完了させる。学習が完了したと判断する基準は、例えば所定個数の学習データによる学習をした場合でもよい。または学習済モジュールの制御の性能が後述の学習目標を満たした場合に、学習を完了してもよい。学習が完了すると、学習制御部103は、学習済モジュールを記憶装置40に記憶する。この際、本実施形態では、学習制御部103は、学習済モジュールを一意に識別可能な学習モジュール識別子及び学習データ取得条件と関連付けて学習済モジュールを記憶する。
The
ここで、記憶装置40に記憶される学習済モジュールは、その更新履歴がわかるようにバージョン管理されることが望ましい。バージョン管理は、学習モジュール識別子そのもので行ってもよいし、別途設けたバージョン情報で行ってもよい。
Here, it is desirable that the learned module stored in the
学習モジュール104は、機械学習を実現するためのモジュールである。ここでは、学習モジュール104の一例としてニューラルネットワークを適用した実施例について説明する。しかしながら、ニューラルネットワークは学習モジュール104の一例にすぎず、学習装置10は、学習モジュール104として他の構成を適用してもよい。
The
学習済モジュール出力部105は、学習済モジュールと学習モジュール識別子とを例えば追加学習制御装置20のような外部に出力する。
The learned
学習済モジュール抽出部106は、学習モジュール抽出条件を受信して、受信した学習モジュール抽出条件に基づいて記憶装置40から学習済モジュールを取得する。本実施形態では、学習モジュール抽出条件には、現在設定されている学習モジュールの学習モジュール識別子、及び抽出ポイントが含まれる。抽出ポイントは、性能が劣化する前の日付や現在設定されている学習モジュールから遡るバージョンの指定等、抽出対象となる学習モジュールを指定可能な情報を含む。例えば、抽出ポイントは、「2017年12月31日以前」、「現在設定されている学習モジュールの1つ前のバージョン」とすることができる。
The learned
(機能構成:追加学習制御装置)
図5を参照して、本発明の所定の実施形態に係る追加学習制御装置20の機能構成について説明する。追加学習制御装置20は、学習済モジュール受付部201、学習モジュール202、学習目標受付部203、評価部204、判定部205、学習モジュール選択部206、要因推定部207、制御部208及びデータベース(DB)209を備える。
(Functional configuration: Additional learning control device)
With reference to FIG. 5, the functional configuration of the additional
学習済モジュール受付部201は、学習済モジュールと学習モジュール識別子とを受け付けて、受け付けた学習済モジュールを学習モジュール202として設定する。本実施形態では、学習済モジュール受付部201は、学習装置10の学習済モジュール出力部105から学習済モジュールと学習モジュール識別子とを受け付けて、受け付けた学習済モジュールを学習モジュール202として設定する。なお、学習済モジュール受付部201は、学習済モジュールを記憶装置40から受け付けて、学習モジュール202として設定してもよい。ここでは、学習モジュール202の一例としてニューラルネットワークを適用した実施例について説明する。しかしながら、ニューラルネットワークは学習モジュール202の一例にすぎず、追加学習制御装置20は、学習モジュール202として他の構成を適用してもよい。
The learned
学習目標受付部203は、入力部20dを介して、学習モジュール202が達成すべき学習目標を受け付けて、受け付けた学習目標をDB209に記憶する。本実施形態では、学習目標には、評価項目及び条件が含まれる。評価項目は、学習モジュール202を評価するための項目であり、例えば、学習モジュールが出力する出力データの精度を判断するために用いられる項目である。
The learning
条件は、評価項目に対する条件として、例えば、評価項目「制御部208が制御する装置に対する外部操作回数/日」に対して、「当該評価項目が基準値x以下」、「当該評価項目が直前に設定されていた学習モジュールより小さい」、評価項目「制御部208が制御する装置の消費電力量/月」に対して、「当該評価項目が基準値y以下」、「当該評価項目が直前に設定されていた学習モジュールより小さい」、評価項目「所定の時間内に学習モジュール202が算出した値が許容変化率を超える回数/月」に対して、「当該評価項目が基準値z以下」、「当該評価項目が直前に設定されていた学習モジュールより小さい」等とすることができる。
The conditions are, for example, for the evaluation item "number of external operations / day for the device controlled by the
評価部204は、記憶装置40に記憶されたセンシングデータを用いて学習モジュール202の評価を行って評価データを生成し、学習済モジュール受付部201が受け付けた学習モジュール識別子と関連付けて、生成した評価データをDB209に記憶する。本実施形態では、評価部204は、少なくとも学習目標に含まれる評価項目について評価を行い、評価データを生成することができる。評価部204は、学習モジュール202が設定されてから一定の期間の経過後に自動で評価を行うこともできるし、別途、ユーザからの評価指示を受け付けて評価を行ってもよい。例えば、評価部204は、学習目標を受け付けることに応答して、評価を行ってもよい。なお、評価部204は学習目標に含まれる評価項目の他に、予め設定された評価項目について評価を行ってもよい。
The
判定部205は、学習目標受付部203が受け付けた学習目標とDB209に記憶された評価データとを用いて、現在設定されている学習モジュールが、学習目標を達成したか否か判定する。学習目標を達成したと判定される場合、判定部205は、処理を終了する。
The
学習モジュール選択部206は、学習目標を達成していないと判定される場合に、学習装置10の学習済モジュール抽出部106に後述するとおり学習モジュール抽出条件を送信し、その応答として得られた学習済モジュールを学習モジュール202として設定する。学習モジュール選択部206が学習済モジュール抽出部106に学習モジュール抽出条件を送信することにより得られた学習済モジュールは、学習モジュール202として設定される前に、再度学習目標を達成するか評価されてもよい。
When it is determined that the learning target has not been achieved, the learning
また、学習モジュール選択部206は、後述の要因推定部207に、学習目標を達成することができなかった要因の推定を指示して、要因改善データを得てもよい。その後、要因推定部207から得られた要因改善データを用いて、学習モジュール選択部206は、学習装置10に再追加学習を指示してもよい。
Further, the learning
要因推定部207は、現在設定されている学習モジュールが学習目標を達成していないと判定される場合に、学習目標を達成することができなかった要因を推定する。本実施形態では、要因推定部207は、学習モジュール選択部206からの指示に応答して、学習目標と記憶装置40のセンシングデータとを用いて、学習目標を達成することができなかった要因を推定する。学習目標を達成することができなかった要因を推定するために、記憶装置40のセンシングデータを統計処理する。
The
制御部208は、学習モジュール202が算出した値を用いて、制御を行う。本実施形態では学習モジュールを用いてシステムの制御を行う一例として制御を行う制御部を示すが、後述するように、本発明の実施形態は、学習モジュールを用いて処理を実行する様々なシステムに適用することができる。
The
DB209には、学習目標DB2091及び評価データDB2092が記憶される。本実施形態では、学習目標DB2091には、学習目標受付部203が受け付けた学習目標に含まれる、評価項目及び条件が記憶される。また、評価データDB2092には、評価部204が生成した評価データと評価対象である学習モジュールの学習モジュール識別子とが関連付けて記憶される。
The learning target DB2091 and the evaluation data DB2092 are stored in the
(追加学習処理)
[第1実施形態]
図6のフローチャートに沿って、追加学習制御装置20によって実行される追加学習処理の第1実施形態について説明する。本発明の実施形態は、学習モジュールを用いて処理を実行する様々なシステムに適用することができ、その分野は特に限定されないが、以下の説明においては空調制御システムを例として記載する。
(Additional learning process)
[First Embodiment]
A first embodiment of the additional learning process executed by the additional
第1実施形態では、制御部208は例えば、空調制御部である。学習モジュール202はセンサ30によって出力された現在室温、外気温、湿度等の値や既知の日時、部屋の体積等を入力パラメータとし、室温設定値を算出する。追加学習制御装置20の制御部208は、学習モジュール202によって算出された室温設定値を用いて空調制御を行う。ここでは、制御部208が学習モジュール202を用いて実際に空調制御を行い、評価部204は、制御部208による制御結果について評価を行う実施例について説明する。しかしながら、代替として、追加学習制御装置20はシミュレーション部(図示せず)を備えてもよい。代替の実施例では、シミュレーション部が学習モジュール202を用いて空調制御を行い、評価部204は、シミュレーション部によるシミュレーション結果について評価を行うことができる。
In the first embodiment, the
また、ここでは、追加学習制御装置20が学習モジュール202及び制御部208を備えた実施例について説明するが、代替として、追加学習制御装置20とは別体の制御装置が学習モジュール及び制御部を備えてもよい。
Further, although an embodiment in which the additional
学習装置10の学習制御部103によって事前に行われた学習の結果、記憶装置40には、2010年1月1日から2012年12月31日までの期間の学習データを用いて学習したニューラルネットワーク0と、2010年1月1日から2014年12月31日までの期間の学習データを用いて学習したニューラルネットワーク1と、2010年1月1日から2016年12月31日までの期間の学習データを用いて学習したニューラルネットワーク2とが記憶されているものとする。ニューラルネットワーク0は、学習モジュール識別子0と関連付けて記憶装置40に記憶されている。ニューラルネットワーク1は、学習モジュール識別子1と関連付けて記憶装置40に記憶されている。ニューラルネットワーク2は、学習モジュール識別子2と関連付けて記憶装置40に記憶されている。
As a result of learning performed in advance by the
追加学習制御装置20は、2017年1月31日まで、ニューラルネットワーク1を学習モジュール202として設定しているものとする。記憶装置40には、センサ30によって出力されたセンシングデータが随時記憶されている。すなわち、記憶装置40には、ニューラルネットワーク1を用いて空調制御を行っていた期間中の、現在室温や外気温等の入力パラメータに関するセンシングデータ、及び室温設定値に対する外部操作回数や消費電力量等の評価項目に関するセンシングデータが記憶されている。また、評価部204によって以前行われた評価の結果、追加学習制御装置20の評価データDB2092には、ニューラルネットワーク0の評価データ0、及びニューラルネットワーク1の評価データ1が記憶されている。
It is assumed that the additional
S601において、追加学習制御装置20の学習済モジュール受付部201は、ニューラルネットワークと学習モジュール識別子とを受け付けて、受け付けたニューラルネットワークを学習モジュール202として設定する。本実施形態では、2017年2月1日に、学習済モジュール受付部201は、学習装置10の学習済モジュール出力部105から、ニューラルネットワーク2と学習モジュール識別子2と受け付けて、受け付けたニューラルネットワーク2を学習モジュール202として設定する。2017年2月1日以降、制御部208は、設定されたニューラルネットワーク2によって算出された室温設定値を用いて空調制御を行っている。その間、前述したように、記憶装置40には、ニューラルネットワーク2を用いて空調制御を行っている期間中の、センサ30によって出力されたセンシングデータが随時記憶されている。
In S601, the learned
S602において、追加学習制御装置20の学習目標受付部203は、入力部20dを介して、学習モジュール202が達成すべき学習目標を受け付けて、受け付けた学習目標をDB209の学習目標DB2091に記憶する。本実施形態では、2017年4月1日に、入力部20dを介して追加学習制御装置20の管理者から学習目標を受け付けて、学習目標受付部203は、受け付けた学習目標を学習目標DB2091に記憶する。学習目標には、評価項目「室温設定値に対する外部操作回数/日」と、条件「直前に設定されていた学習モジュールより少ない」とが含まれるものとする。
In S602, the learning
S603において、追加学習制御装置20の評価部204は、学習モジュール202の評価を行って評価データを生成し、学習済モジュール受付部201が受け付けた学習モジュール識別子と関連付けて、生成した評価データをDB209の評価データDB2092に記憶する。本実施形態では、S602で学習目標を受け付けることに応答して、評価部204は、ニューラルネットワーク2を用いて空調制御が行われた期間中に記憶装置40に記憶されたセンシングデータを用いて、ニューラルネットワーク2の評価を行う。
In S603, the
ここで、評価部204は、S602で受け付けた学習目標に含まれる評価項目のみならず、予め設定された他の評価項目について評価を行ってもよい。このような構成とすることで、今後の学習目標において、異なる評価項目について、以前設定されていた学習モジュールとの比較条件が指定される場合に対応することができる。本実施形態では、評価部204は、学習目標に含まれる評価項目「室温設定値に対する外部操作回数/日」のみならず、予め設定された他の評価項目について評価を行って評価データ2を生成し、学習モジュール識別子2と関連付けて、評価データ2を評価データDB2092に記憶する。
Here, the
次に、S604において、追加学習制御装置20の判定部205は、S602で学習目標受付部203が受け付けた学習目標と評価データDB2092に記憶された評価データとを用いて、現在設定されている学習モジュールが、学習目標を達成したか否か判定する。学習目標を達成したと判定される場合(S604:Yes)、追加学習制御装置20は、処理を終了する。
Next, in S604, the
本実施形態では、判定部205は、評価項目「室温設定値に対する外部操作回数/日」、及び、条件「直前に設定されていた学習モジュールより少ない」を含む学習目標と、評価データ1及び評価データ2とを用いて、ニューラルネットワーク2が、学習目標を達成したか否か判定する。その結果、学習目標を達成していないと判定され(S604:No)、処理はS605に進む。
In the present embodiment, the
S605において、追加学習制御装置20の学習モジュール選択部206は、学習装置10の学習済モジュール抽出部106に学習モジュール抽出条件を送信し、その応答として得られた学習モジュールを学習モジュール202として設定し、処理を終了する。本実施形態では、学習モジュール選択部206は、学習済モジュール抽出部106に学習モジュール抽出条件「現在設定されている学習モジュールの学習モジュール識別子:学習モジュール識別子2、抽出ポイント:現在設定されている学習モジュールの1つ前のバージョン」を送信し、応答として得たニューラルネットワーク1を学習モジュール202として設定する。
In S605, the learning
[第2実施形態]
第1実施形態では、学習目標を達成していないと判定されたニューラルネットワーク2について、更新前のバージョンであるニューラルネットワーク1に戻す例について説明した。第2実施形態では、学習目標を達成していないと判定された場合に、ニューラルネットワークをさらに追加学習させる例について説明する。
[Second Embodiment]
In the first embodiment, an example of returning the neural network 2 determined not to achieve the learning goal to the version before the update, the neural network 1, has been described. In the second embodiment, an example in which the neural network is further trained when it is determined that the learning goal has not been achieved will be described.
図7は、追加学習制御装置20によって実行される追加学習処理の流れを示すフローチャートである。第2実施形態では第1実施形態と共通の事柄についての記述を省略し、異なる点についてのみ説明する。図7のS701からS705は、図6のS601からS605と同じ処理であるので、これらの処理の詳細な説明は省略する。
FIG. 7 is a flowchart showing the flow of the additional learning process executed by the additional
S706において、学習モジュール選択部206は、追加学習制御装置20の要因推定部207に、学習目標を達成することができなかった要因の推定を指示し、要因推定部207は、学習目標を達成することができなかった要因を推定する。本実施形態では、要因推定部207は、学習目標に含まれる評価項目「室温設定値に対する外部操作回数/日」について、記憶装置40のセンシングデータを用いて要因を推定する。例えば、要因推定部207は、ニューラルネットワーク2に用いた学習データの期間である2010年1月1から2016年12月31日までの期間のセンシングデータを用いて、要因を推定する。
In S706, the learning
本実施形態では、要因推定部207は、既知のアルゴリズムを使用して、例えば学習目標に含まれる評価項目「室温設定値に対する外部操作回数/日」が他の日の値から大きく外れて多かった日について、考えられるパターンを見出す。例えば、特定の期間「2016年7月1日から2016年7月31日まで」において「室温設定値に対する外部操作回数/日」が多いというパターンを見出したものとする。なお、パターンについては期間によるものだけでなく、入力パラメータに含まれる外気温、湿度等の値が所定の値と異なる値が続いたときに、「入力パラメータの値」が大きい又は少ないというパターンを見出してもよい。また、入力パラメータに含まれる部屋の体積が変わっていた場合に、「部屋の体積」が変化したというパターンを見出してもよい。
In the present embodiment, the
S707において、要因推定部207は、外れ値のパターンを見出したか否か判定する。外れ値のパターンを見出していない場合(S707:No)、追加学習制御装置20は処理を終了する。一方、外れ値のパターンを見出した場合(S707:Yes)、S708に進み、要因推定部207は、見出した外れ値のパターンを出力してもよい。本実施形態では、図8に示されるように、見出した外れ値のパターンを示すテキスト801「2016年7月1日から2016年7月31日において、室温設定値に対する外部操作回数/日が多い。」、パターンが性能劣化要因か否かを設定する性能劣化要因ラジオボタン802、詳細設定ボタン803、及び決定ボタン804を含む要因確定画面を出力する。詳細設定ボタンについては後述する。
In S707, the
S709において、要因推定部207は、ユーザ入力を受信したか否か判定する。ユーザ入力を受信した場合、S710に進み、要因推定部207は、ユーザ入力に基づいて要因改善データを生成し、生成した要因改善データを学習モジュール選択部206に戻す。要因改善データには、S708において要因推定部207が出力した外れ値のパターンのうち、性能劣化要因ラジオボタン802で性能劣化要因として選択されること等により、学習データに含めることが望ましくないことが指示されたパターンが含まれる。
In S709, the
本実施形態では、追加学習制御装置20の管理者は、2016年7月1日から2016年7月31日までの期間において室内工事が行われていたことを確認し、S708において出力された画面において、性能劣化要因ラジオボタン802で性能劣化要因として選択し、決定ボタン804を押下したものとする。その結果、要因推定部207は、受信したユーザ入力に基づいて要因改善データ「2016年7月1日から2016年7月31日までの期間を除く」を生成し、生成した要因改善データを学習モジュール選択部206に戻す。
In the present embodiment, the administrator of the additional
S711において、学習モジュール選択部206は、要因改善データに基づいて学習指示を生成し、生成した学習指示を学習装置10の学習指示受付部101に送信して、処理を終了する。本実施形態では、学習モジュール選択部206は、「学習データ取得条件:2010年1月1日から2016年12月31日まで、2016年7月1日から2016年7月31日までの期間を除く」を含む学習指示を学習指示受付部101に送信する。
In S711, the learning
なお、本実施形態では、S707で外れ値のパターンを見出したと判定される場合に、S710でユーザの入力に基づいて要因改善データを生成したが、S708からS710を省略してユーザの入力を受け付けることなく、要因推定部207が、見出した外れ値のパターンに基づいて要因改善データを生成してもよい。
In the present embodiment, when it is determined that the outlier pattern is found in S707, the factor improvement data is generated based on the user's input in S710, but the user's input is accepted by omitting S708 to S710. Instead, the
このようにすることで、学習装置10は、受信した学習指示に基づいて、ニューラルネットワークをさらに追加学習させることができる。本実施形態では、学習装置10は、2016年7月1日から2016年7月31日までの期間を除く学習データを用いて、ニューラルネットワーク1をさらに追加学習させることができる。
By doing so, the
[第3実施形態]
第2実施形態では、学習目標を達成していないと判定された場合に、学習データに含めることが望ましくないデータを除外して、ニューラルネットワークをさらに追加学習させる例について説明した。第3実施形態では、学習目標を達成していないと判定された場合に、ニューラルネットワークに対してさらに学習させるべきデータを追加して、ニューラルネットワークを追加学習させる例について説明する。
[Third Embodiment]
In the second embodiment, when it is determined that the learning goal has not been achieved, data that is not desirable to be included in the learning data is excluded, and an example in which the neural network is further trained has been described. In the third embodiment, when it is determined that the learning target has not been achieved, data to be further trained is added to the neural network, and an example in which the neural network is additionally trained will be described.
図7を参照して、第3実施形態について説明する。第3実施形態においても、第1実施形態及び第2実施形態と共通の事柄についての記述を省略し、異なる点についてのみ説明する。図7のS701からS705までは、第1実施形態と同じ処理であるので、これらの処理の詳細な説明は省略する。 A third embodiment will be described with reference to FIG. 7. Also in the third embodiment, the description of the matters common to those of the first embodiment and the second embodiment will be omitted, and only the differences will be described. Since S701 to S705 of FIG. 7 are the same processes as those in the first embodiment, detailed description of these processes will be omitted.
S706において、要因推定部207は、学習目標を達成することができなかった要因を推定する。本実施形態では、特定の時間帯「毎週土曜日の8時から9時」において「室温設定値に対する外部操作回数」が多いというパターンを見出したものとする。なお、パターンについては期間によるものだけでなく、入力パラメータに含まれる外気温、湿度等の値が所定の値と異なる値が続いたときに、「入力パラメータの値」が大きい又は少ないというパターンを見出してもよい。また、入力パラメータに含まれる部屋の体積が変わっていた場合に、「部屋の体積」が変化したというパターンを見出してもよい。
In S706, the
S707において、要因推定部207は、外れ値のパターンを見出したか否か判定する。本実施形態では、外れ値のパターンを見出したのでS708に進み、要因推定部207は、見出した外れ値のパターンを出力してもよい。本実施形態では、見出した外れ値のパターンを示すテキスト801「毎週土曜日の8時から9時において、室温設定値に対する外部操作が多い。」、性能劣化要因ラジオボタン802、詳細設定ボタン803、及び決定ボタン804を含む要因確定画面を出力する。
In S707, the
本実施形態では、追加学習制御装置20の管理者は、毎週土曜日は平日よりも少ない数のユーザが部屋を利用することから、室温設定値を平日と比較して高く設定することが望ましいことを確認し、S709において出力された画面において、性能劣化要因ラジオボタン802で非性能劣化要因として選択し、詳細設定ボタン803を押下したものとする。例えば詳細設定ボタン803を押下することにより、詳細設定画面が表示され、管理者は、この詳細設定画面において入力パラメータの調整を行ってもよい。代替として、追加学習制御装置20が、入力パラメータの調整を行ってもよい。
In the present embodiment, the administrator of the additional
S709において、要因推定部207は、ユーザ入力を受信したか否か判定する。本実施形態では、管理者が、詳細設定画面において入力パラメータの調整をし、その後、決定ボタン804を押下したものとする。その結果、処理はS710に進み、要因推定部207は、ユーザ入力に基づいて要因改善データを生成し、生成した要因改善データを学習モジュール選択部206に戻す。本実施形態では、要因改善データには、詳細設定画面で指定された入力パラメータに関する設定が含まれる。
In S709, the
S711において、学習モジュール選択部206は、要因改善データに基づいて学習指示を生成し、生成した学習指示を学習装置10の学習指示受付部101に送信して、処理を終了する。本実施形態では、学習モジュール選択部206は、詳細設定画面で指定された入力パラメータに関する設定を含む学習指示を学習指示受付部101に送信する。
In S711, the learning
なお、本実施形態では、S707で外れ値のパターンを見出したと判定される場合に、S710でユーザの入力に基づいて要因改善データを生成したが、S708からS710を省略してユーザの入力を受け付けることなく、要因推定部207が、見出した外れ値のパターンに基づいて要因改善データを生成してもよい。
In the present embodiment, when it is determined that the outlier pattern is found in S707, the factor improvement data is generated based on the user's input in S710, but the user's input is accepted by omitting S708 to S710. Instead, the
このようにすることで、学習装置10は、受信した学習指示に基づいて、ニューラルネットワークをさらに追加学習させることができる。本実施形態では、学習装置10は、追加学習制御装置20が見出したパターンが性能劣化要因ではなく、ニューラルネットワークにさらに学習させるべきパターンである場合に、追加の学習データを用いて、ニューラルネットワーク2をさらに追加学習させることができる。
By doing so, the
[別の実施形態]
上述したとおり、別の実施形態では、図9に示されるように、学習システム1は、学習済モジュール受付部201と、学習モジュール202と、制御部208とを備えた制御装置50を備えてもよい。学習システム1が制御装置50を備える本実施形態では、学習システム1は、学習目標受付部203、評価部204、判定部205、学習モジュール選択部206、要因推定部207及びDB209を備えた評価装置60を備える。前述したように、追加学習制御装置20は、評価装置60を含む。
[Another Embodiment]
As described above, in another embodiment, as shown in FIG. 9, the learning system 1 may include a
評価装置60は、図10に示されるように、CPU及びRAMを含む制御部60a、DB209のデータ等を記憶する記憶部60b、ネットワークNと接続するための通信部60c、ユーザからの入力を受け付ける入力部60d、表示部60e等を備えている。これら各構成は、バスを介して相互にデータ送受信可能に接続される。CPUが記憶部に記憶されているプログラムをRAMに展開し、RAMに展開された当該プログラムを解釈及び実行することにより、制御部60aは、図9の各部として機能する。
As shown in FIG. 10, the
評価装置60は、例えば一般のパーソナルコンピュータのCPUによって追加学習プログラムを実行することで構成されてよい。追加学習プログラムは、RAMや記憶部60b等のコンピュータによって読み取り可能な記憶媒体に記憶されて提供されてもよいし、通信部により接続される通信ネットワークNを介して提供されてもよい。
The
本明細書において説明した各処理を実施するプログラムは、記録媒体に記憶させてもよい。この記録媒体を用いれば、コンピュータに上記プログラムをインストールすることにより、当該コンピュータを評価装置60又は追加学習制御装置20として機能させることができる。ここで、上記プログラムを記憶した記録媒体は、非一過性の記録媒体であってもよい。非一過性の記録媒体は特に限定されないが、例えば、CD−ROM等の記録媒体であってもよい。
The program that performs each process described in the present specification may be stored in a recording medium. By using this recording medium, the computer can be made to function as the
上記の実施形態の一部又は全部は、以下の付記のようにも記載され得るが、以下には限られない。 Some or all of the above embodiments may also be described, but not limited to:
(付記1)
少なくとも1つのメモリと、前記メモリと接続された少なくとも1つのハードウェアプロセッサとを備えた、第1の学習モジュールを追加学習させた第2の学習モジュールを評価する評価装置であって、
前記ハードウェアプロセッサが、
前記第2の学習モジュールが達成すべき学習目標を受け付け、
少なくとも前記学習目標に含まれる評価項目について前記第2の学習モジュールの評価を行い、評価データを生成し、
前記学習目標と前記評価データとを用いて、前記第2の学習モジュールが前記学習目標を達成したか否か判定し、
前記学習目標を達成しないと判定される場合、少なくとも前記学習目標に基づいて、前記第2の学習モジュールと異なる第3の学習モジュールを取得する、
評価装置。
(Appendix 1)
An evaluation device for evaluating a second learning module in which a first learning module is additionally trained, which includes at least one memory and at least one hardware processor connected to the memory.
The hardware processor
Accepting the learning goals to be achieved by the second learning module,
At least the evaluation items included in the learning goal are evaluated by the second learning module, and evaluation data is generated.
Using the learning goal and the evaluation data, it is determined whether or not the second learning module has achieved the learning goal.
If it is determined that the learning goal is not achieved, a third learning module different from the second learning module is acquired, at least based on the learning goal.
Evaluation device.
(付記2)
第1の学習モジュールを追加学習させた第2の学習モジュールを評価する評価方法であって、
少なくとも1つ以上のハードウェアプロセッサによって、前記第2の学習モジュールが達成すべき学習目標を受け付け、
前記ハードウェアプロセッサによって、少なくとも前記学習目標に含まれる評価項目について前記第2の学習モジュールの評価を行い、評価データを生成し、
前記ハードウェアプロセッサによって、前記学習目標と前記評価データとを用いて、前記第2の学習モジュールが前記学習目標を達成したか否か判定し、
前記学習目標を達成しないと判定される場合、少なくとも前記学習目標に基づいて、前記第2の学習モジュールと異なる第3の学習モジュールを取得する、
評価方法。
(Appendix 2)
This is an evaluation method for evaluating the second learning module in which the first learning module is additionally learned.
At least one or more hardware processors accept the learning goals to be achieved by the second learning module.
The hardware processor evaluates the second learning module for at least the evaluation items included in the learning goal, generates evaluation data, and generates evaluation data.
Using the learning goal and the evaluation data, the hardware processor determines whether or not the second learning module has achieved the learning goal.
If it is determined that the learning goal is not achieved, a third learning module different from the second learning module is acquired, at least based on the learning goal.
Evaluation method.
1…学習システム、10…学習装置、10a…制御部、10b…記憶部、10c…通信部、10d…入力部、10e…表示部、101…学習指示受付部、102…学習データ取得部、103…学習制御部、104…学習モジュール、105…学習済モジュール出力部、106…学習済モジュール抽出部、20…追加学習制御装置、20a…制御部、20b…記憶部、20c…通信部、20d…入力部、20e…表示部、201…学習済モジュール受付部、202…学習モジュール、203…学習目標受付部、204…評価部、205…判定部、206…学習モジュール選択部、207…要因推定部、208…制御部、209…DB、2091…学習目標DB、2092…評価データDB、30…センサ、40…記憶装置、50…制御装置、60…評価装置、60a…制御部、60b…記憶部、60c…通信部、60d…入力部、60e…表示部、801…テキスト、802…性能劣化要因ラジオボタン、803…詳細設定ボタン、804…決定ボタン 1 ... Learning system, 10 ... Learning device, 10a ... Control unit, 10b ... Storage unit, 10c ... Communication unit, 10d ... Input unit, 10e ... Display unit, 101 ... Learning instruction reception unit, 102 ... Learning data acquisition unit, 103 ... learning control unit, 104 ... learning module, 105 ... learned module output unit, 106 ... learned module extraction unit, 20 ... additional learning control device, 20a ... control unit, 20b ... storage unit, 20c ... communication unit, 20d ... Input unit, 20e ... Display unit, 201 ... Learned module reception unit, 202 ... Learning module, 203 ... Learning target reception unit, 204 ... Evaluation unit, 205 ... Judgment unit, 206 ... Learning module selection unit, 207 ... Factor estimation unit , 208 ... Control unit, 209 ... DB, 2091 ... Learning target DB, 2092 ... Evaluation data DB, 30 ... Sensor, 40 ... Storage device, 50 ... Control device, 60 ... Evaluation device, 60a ... Control unit, 60b ... Storage unit , 60c ... communication unit, 60d ... input unit, 60e ... display unit, 801 ... text, 802 ... performance deterioration factor radio button, 803 ... detailed setting button, 804 ... enter button
Claims (7)
前記第2の学習モジュールが達成すべき学習目標を受け付ける学習目標受付部と、
少なくとも前記学習目標に含まれる評価項目について前記第2の学習モジュールの評価を行い、評価データを生成する評価部と、
前記学習目標と前記評価データとを用いて、前記第2の学習モジュールが前記学習目標を達成したか否か判定する判定部と、
前記学習目標を達成しないと判定される場合、前記第2の学習モジュールと異なる第3の学習モジュールを取得する学習モジュール選択部と
を備えた評価装置。 It is an evaluation device that evaluates the second learning module in which the first learning module is additionally learned.
A learning goal reception unit that receives learning goals to be achieved by the second learning module,
An evaluation unit that evaluates the second learning module and generates evaluation data for at least the evaluation items included in the learning goal.
Using the learning goal and the evaluation data, a determination unit for determining whether or not the second learning module has achieved the learning goal, and
Wherein when it is determined not to achieve learning objectives, evaluated and a learning module selection unit for acquiring third learning module different from the second learning module device.
前記第2の学習モジュールが達成すべき学習目標を受け付ける工程と、
少なくとも前記学習目標に含まれる評価項目について前記第2の学習モジュールの評価を行い、評価データを生成する工程と、
前記学習目標と前記評価データとを用いて、前記第2の学習モジュールが前記学習目標を達成したか否か判定する工程と、
前記学習目標を達成しないと判定される場合、前記第2の学習モジュールと異なる第3の学習モジュールを取得する工程と
を含む評価方法。 An evaluation method for evaluating a second learning module in which the first learning module is additionally learned, and a computer provided with a control unit is used.
The process of accepting the learning goals to be achieved by the second learning module, and
A process of evaluating the second learning module for at least the evaluation items included in the learning goal and generating evaluation data, and
A step of determining whether or not the second learning module has achieved the learning goal by using the learning goal and the evaluation data, and
Wherein when it is determined not to achieve learning objectives, evaluation method comprising a step of acquiring a third learning module different from the second learning modules.
前記第2の学習モジュールが達成すべき学習目標を受け付ける処理と、
少なくとも前記学習目標に含まれる評価項目について前記第2の学習モジュールの評価を行い、評価データを生成する処理と、
前記学習目標と前記評価データとを用いて、前記第2の学習モジュールが前記学習目標を達成したか否か判定する処理と、
前記学習目標を達成しないと判定される場合、前記第2の学習モジュールと異なる第3の学習モジュールを取得する処理と
を実行させるプログラム。 A program for causing a computer to evaluate a second learning module in which the first learning module is additionally learned.
The process of accepting the learning goal to be achieved by the second learning module,
At least the evaluation items included in the learning goal are evaluated by the second learning module, and evaluation data is generated.
A process of determining whether or not the second learning module has achieved the learning goal by using the learning goal and the evaluation data.
A program that executes a process of acquiring a third learning module different from the second learning module when it is determined that the learning goal is not achieved.
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017083501A JP6917004B2 (en) | 2017-04-20 | 2017-04-20 | Evaluation device, evaluation method and its program |
| PCT/JP2018/015244 WO2018193934A1 (en) | 2017-04-20 | 2018-04-11 | Evaluation apparatus, evaluation method, and program therefor |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017083501A JP6917004B2 (en) | 2017-04-20 | 2017-04-20 | Evaluation device, evaluation method and its program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2018181184A JP2018181184A (en) | 2018-11-15 |
| JP6917004B2 true JP6917004B2 (en) | 2021-08-11 |
Family
ID=62111150
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2017083501A Active JP6917004B2 (en) | 2017-04-20 | 2017-04-20 | Evaluation device, evaluation method and its program |
Country Status (2)
| Country | Link |
|---|---|
| JP (1) | JP6917004B2 (en) |
| WO (1) | WO2018193934A1 (en) |
Families Citing this family (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP7097006B2 (en) * | 2018-12-05 | 2022-07-07 | オムロン株式会社 | Sensor system |
| JP7279445B2 (en) * | 2019-03-20 | 2023-05-23 | 富士通株式会社 | Prediction method, prediction program and information processing device |
| US20200320428A1 (en) * | 2019-04-08 | 2020-10-08 | International Business Machines Corporation | Fairness improvement through reinforcement learning |
| JP7423484B2 (en) * | 2020-09-16 | 2024-01-29 | 株式会社東芝 | Learning devices, methods and programs |
| CN112511368A (en) * | 2020-10-16 | 2021-03-16 | 深圳市科漫达智能管理科技有限公司 | Service heartbeat monitoring method and related device |
| JP6984780B1 (en) * | 2021-06-30 | 2021-12-22 | 富士電機株式会社 | Information processing equipment, information processing system and information processing method |
| JP7713224B2 (en) * | 2021-07-20 | 2025-07-25 | 株式会社データグリッド | Model evaluation method and model evaluation system |
| KR102616968B1 (en) * | 2023-07-13 | 2023-12-27 | 주식회사 마키나락스 | Method for determining whether to additionally train anomaly detection model and determining adequacy of training data |
Family Cites Families (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0922402A (en) * | 1995-05-01 | 1997-01-21 | Fuji Electric Co Ltd | Daily power demand forecast method |
| JPH0962648A (en) | 1995-08-22 | 1997-03-07 | Mitsubishi Electric Corp | Pattern recognizer |
| US6269351B1 (en) * | 1999-03-31 | 2001-07-31 | Dryken Technologies, Inc. | Method and system for training an artificial neural network |
| JP4552464B2 (en) | 2004-03-09 | 2010-09-29 | フジテック株式会社 | Elevator system and group management control device thereof |
| US10460274B2 (en) * | 2013-11-18 | 2019-10-29 | Bidgely Inc. | Energy disaggregation techniques for whole-house energy consumption data |
| US10443577B2 (en) * | 2015-07-17 | 2019-10-15 | General Electric Company | Systems and methods for improved wind power generation |
-
2017
- 2017-04-20 JP JP2017083501A patent/JP6917004B2/en active Active
-
2018
- 2018-04-11 WO PCT/JP2018/015244 patent/WO2018193934A1/en not_active Ceased
Also Published As
| Publication number | Publication date |
|---|---|
| JP2018181184A (en) | 2018-11-15 |
| WO2018193934A1 (en) | 2018-10-25 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6917004B2 (en) | Evaluation device, evaluation method and its program | |
| USRE48574E1 (en) | Systems and methods for estimating a return time | |
| JP6632770B1 (en) | Learning device, learning inference device, method, and program | |
| JP7279445B2 (en) | Prediction method, prediction program and information processing device | |
| CN110674019A (en) | Method and device for predicting system fault and electronic equipment | |
| JP6718500B2 (en) | Optimization of output efficiency in production system | |
| US20220178572A1 (en) | Air conditioning control system and air conditioning control method | |
| KR102231511B1 (en) | Method and apparatus for controlling virtual keyboard | |
| JP7720143B2 (en) | Integrated Sensing System | |
| CN109839889A (en) | Equipment recommendation system and method | |
| CN114861172B (en) | Data processing method and system based on government affair service system | |
| US20220245447A1 (en) | Systems and methods for quantization aware training of a neural network for heterogeneous hardware platform | |
| CN112767074A (en) | Module machine model selection method and device, computer equipment and storage medium | |
| JP7258798B2 (en) | Information processing device, information processing system, information processing method and program | |
| JP2019214066A (en) | Plate crown calculation device, plate crown calculating method, computer program, and computer-readable storage medium | |
| KR102124425B1 (en) | Method and apparatus for estimating a predicted time series data | |
| JP2005164836A5 (en) | ||
| JP2019067214A (en) | Determination program, determination method, terminal device, learning data, and model | |
| KR101880273B1 (en) | Method and apparatus for monitoring posture of users | |
| KR20180020334A (en) | Apparatus for forecasting disruption of communication system and that of method | |
| CN103577517A (en) | Blood pressure measurement apparatus, gateway, system including same, and method thereof | |
| JP7252862B2 (en) | Control device, control system and control method | |
| US20250291432A1 (en) | Smart mouse device, smart system and operating method thereof | |
| US12542619B1 (en) | Machine learned models for detecting viewer presence using Wi-Fi Channel State Information | |
| JP7412267B2 (en) | Estimation model construction device |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200207 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210129 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210323 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210618 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210701 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6917004 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |