JP7437738B2 - Machine learning system, training dataset generation system, and machine learning program - Google Patents
Machine learning system, training dataset generation system, and machine learning program Download PDFInfo
- Publication number
- JP7437738B2 JP7437738B2 JP2020002255A JP2020002255A JP7437738B2 JP 7437738 B2 JP7437738 B2 JP 7437738B2 JP 2020002255 A JP2020002255 A JP 2020002255A JP 2020002255 A JP2020002255 A JP 2020002255A JP 7437738 B2 JP7437738 B2 JP 7437738B2
- Authority
- JP
- Japan
- Prior art keywords
- learning
- data set
- neural network
- unit
- inference
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Image Analysis (AREA)
Description
本発明は、機械学習システム、学習用データセット生成システム、及び機械学習プログラムに関する。 The present invention relates to a machine learning system, a learning dataset generation system, and a machine learning program.
従来から、店舗等の屋内に、監視カメラや、いわゆるAI(Artificial Intelligence)カメラ等のカメラを配して、これらのカメラで撮影したフレーム画像に映り込んだ人等の物体を、学習済物体検出用ニューラルネットワークモデルで検出し、検出した物体の認識を、学習済物体認識用ニューラルネットワークモデルを用いて行うようにした装置やシステムが知られている(例えば、特許文献1参照)。 Traditionally, cameras such as surveillance cameras and so-called AI (Artificial Intelligence) cameras have been placed indoors in stores, etc., and objects such as people reflected in frame images taken by these cameras are detected using learned object detection. There are known devices and systems in which a trained neural network model for object recognition is used to recognize the detected object using a neural network model for object recognition (for example, see Patent Document 1).
上記のような物体検出用ニューラルネットワークモデルや物体認識用ニューラルネットワークモデルを含む推論用のニューラルネットワークモデルの機械学習では、学習対象の確率分布(例えば、人の年齢の認識を行うニューラルネットワークモデルの場合は、人の年齢の確率分布)をニューラルネットワークモデルで再現するために、ディープラーニングを行う。 In machine learning of neural network models for inference, including neural network models for object detection and neural network models for object recognition, as described above, the probability distribution of the learning target (for example, in the case of a neural network model that recognizes a person's age) uses deep learning to reproduce the probability distribution of people's ages using a neural network model.
ところで、上記の画像中の物体に対する推論用のニューラルネットワークモデルを応用した技術において、異なるビデオカメラで撮影した同じ人について同一のIDを付与するPerson Re-Identificationを行うものがある。これは、複数のビデオカメラで撮影した各映像を構成する各フレーム画像における人の特徴量に基づいて、異なるビデオカメラで撮影した人の同定を行う人物同定用のニューラルネットワークモデルである。一般に、ビデオカメラが異なると、人物の映り方が大きく変化する、ビデオカメラ毎に明るさ・歪み等のパラメータが大きく異なる、人は動くため同一人物であっても見た目が大きく変化する等の理由から、Person Re-Identification(異なるビデオカメラで撮影した人の同定)は、非常に困難であり、今日も多くの研究者が適切な手法の開発を競っている。 By the way, among the techniques that apply the neural network model for inference with respect to objects in images, there is a technique that performs Person Re-Identification, which assigns the same ID to the same person photographed with different video cameras. This is a neural network model for person identification that identifies people photographed by different video cameras based on the human features in each frame image that constitutes each video photographed by a plurality of video cameras. In general, the way people are captured changes greatly when different video cameras are used, parameters such as brightness and distortion vary greatly between video cameras, and because people move, the appearance of the same person can vary greatly, etc. Therefore, Person Re-Identification (identification of people photographed with different video cameras) is extremely difficult, and many researchers today are still competing to develop appropriate methods.
Person Re-Identification用のニューラルネットワークモデルの機械学習用及びテスト用のデータセットとして、Market1501というデータセットが存在する(このデータセットをダウンロード可能なサイトは、https://github.com/vana77/Market-1501 Attrite)。このデータセットには、ショッピングセンターに設置されたカメラで撮影された751名分のデータ(画像データ(各人10枚弱の各角度から撮影されたフレーム画像データ)、及び属性データ)が格納されている。 There is a dataset called Market1501 as a dataset for machine learning and testing of neural network models for Person Re-Identification (the site where you can download this dataset is https://github.com/vana77/Market -1501 Attrite). This dataset stores data for 751 people (image data (less than 10 frame image data taken from each angle for each person) and attribute data) taken with cameras installed in shopping centers. ing.
また、Person Re-Identification用のニューラルネットワークモデルの機械学習用及びテスト用のデータセットを作成するために、Person Xという、3DCG(three-Dimensional Computer Graphics)によりデータセットを生成する技術がある。このPerson Xにより、1266名の様々な撮影角度からの人物の画像データを含む学習用データセットを得ることができる(このデータセットをダウンロード可能なサイトは、https://github.com/sxzrt/Dissecting-Person-Re-ID-from-the-Viewpoint-of-Viewpoint)。 Furthermore, in order to create a data set for machine learning and testing of a neural network model for Person Re-Identification, there is a technology called Person X that generates a data set using three-dimensional computer graphics (3DCG). With this Person Dissecting-Person-Re-ID-from-the-Viewpoint-of-Viewpoint).
ところが、そもそも、推論用の(ディープ)ニューラルネットワークモデルの機械学習には、図14に示すように、機械学習用のデータセット(以下、「学習用データセット」という)における、学習用データの偏りや、学習用データの数の少なさに起因して、学習対象の確率分布(例えば、人の年齢の認識を行うニューラルネットワークモデルの場合は、人の年齢の確率分布)を学習済ニューラルネットワークモデルで正確に再現することができないという問題がある。このため、当然、上記特許文献1に記載されたような従来のカメラで撮影した人等の物体に対する推論(検出や認識)を行う装置やシステムにおいても、学習対象の確率分布を学習済ニューラルネットワークモデルで正確に再現することができないという問題があった。なお、図14中の「DL」と「DNN」とは、それぞれ、「Deep Learning」と「Deep Neural Network」とを略して表記したものである。 However, in the first place, machine learning of (deep) neural network models for inference requires bias in the training data in the machine learning dataset (hereinafter referred to as the "learning dataset"), as shown in Figure 14. Or, due to the small amount of training data, the probability distribution of the learning target (for example, in the case of a neural network model that recognizes a person's age, the probability distribution of a person's age) cannot be used with a trained neural network model. The problem is that it cannot be accurately reproduced. For this reason, naturally, even in devices and systems that perform inference (detection and recognition) on objects such as people photographed with a conventional camera as described in Patent Document 1, the probability distribution of the learning target is calculated using a trained neural network. The problem was that it could not be accurately reproduced with a model. Note that "DL" and "DNN" in FIG. 14 are abbreviations for "Deep Learning" and "Deep Neural Network," respectively.
上記特許文献1に記載されたような従来の画像中の物体に対する推論用ニューラルネットワークモデルを例にして、上記の学習用データセットにおける学習用データの偏りについて詳述すると、一般に、画像中の物体に対する推論用ニューラルネットワークモデルの学習用データとして用いる画像は、店舗等の既存の(特定の)環境に設置したカメラを用いて収集する。しかし、このような実際の(特定の)環境において、一定期間に発生する事象には、偏りが生じてしまうので、既存の環境に設置したカメラを用いて収集した画像には、偏りが生じてしまう。例えば、店舗出入口に設置したカメラで一週間程度撮影した映像に含まれる人物を画像化した場合、これらの画像に含まれる人物の服装は、当該期間の季節に大きく依存するし、登場する人物の性・年齢についても、一週間程度のデータでは偏りが生じる可能性が高い。また、特定の動作(例えばショッピングカートを利用する)を行うかどうかについても、その時の顧客に依存するので、必要な数の特定動作を行う顧客の画像データが集まるかどうは分からない。なお、上記の特定動作を行う顧客の画像データのような特定種類の学習用データの不足も、一種の学習用データの偏りと捉えることができる。 Taking the conventional neural network model for inference regarding objects in images as described in Patent Document 1 as an example, to explain in detail the bias of the training data in the above training data set, in general, objects in images The images used as learning data for the inference neural network model for are collected using cameras installed in existing (specific) environments such as stores. However, in such an actual (specific) environment, events that occur over a certain period of time will be biased, so images collected using cameras installed in existing environments will be biased. Put it away. For example, if a camera installed at a store entrance is used to create images of people in videos taken over a week, the clothing of the people in these images will depend largely on the season of the period, and Regarding gender and age, there is a high possibility that bias will occur if data is collected over a period of about one week. Further, whether or not to perform a specific action (for example, using a shopping cart) also depends on the customer at the time, so it is unclear whether the required number of image data of customers performing a specific action will be collected. Note that the lack of specific types of learning data, such as image data of customers performing the above-mentioned specific actions, can also be considered as a type of bias in learning data.
上記の学習用データセットにおける学習用データの偏りは、画像中の物体に対する推論用ニューラルネットワークのモデルの表現力の限界と相俟って、上記の学習対象の確率分布を学習済推論用ニューラルネットワークモデルで正確に再現することができないという問題を深刻化する。 The bias in the training data in the above training data set is caused by the limited expressive power of the inference neural network model for objects in images, and the probability distribution of the above learning target is determined by the trained inference neural network. Exacerbating the problem that models cannot accurately reproduce.
上記の学習対象の確率分布を学習済推論用ニューラルネットワークモデルで正確に再現することができないという問題は、上記のPerson Re-Identification用の学習済ニューラルネットワークモデルにおいて、顕著である。そして、上記のMarket1501というデータセットを用いても、Market1501の学習用データセットに含まれる学習用データは、あるショッピングセンターに設置されたカメラで撮影された751名分のデータ(画像データ及び属性データ)であるため、Person Re-Identification用のニューラルネットワークモデルの機械学習を行うには、学習用データの数が少なく、また、ある特定の時期に撮影された画像データが元になっているので、学習用データの偏りが大きい。また、上記のPerson Xを用いて生成した学習用データセットについても、学習用データに含まれる画像データにおける人の種類や店内等のシチュエーションは、限定的であり、学習用データに偏りがある。このため、Market1501の学習用データセットや、Person Xで生成した学習用データセットを用いて機械学習しても、実用に耐えうるPerson Re-Identification用の学習済ニューラルネットワークモデルを得ることはできない。 The problem that the probability distribution of the learning target cannot be accurately reproduced by the trained neural network model for inference is remarkable in the trained neural network model for Person Re-Identification. Even if the Market 1501 data set mentioned above is used, the learning data included in the Market 1501 training data set is the data (image data and attribute data) of 751 people photographed by a camera installed in a certain shopping center. ) Therefore, in order to perform machine learning of a neural network model for Person Re-Identification, the amount of training data is small, and since it is based on image data taken at a certain time, The training data is highly biased. Further, regarding the learning data set generated using the above-mentioned Person Therefore, even if machine learning is performed using the Market 1501 training dataset or the training dataset generated by Person X, it is not possible to obtain a trained neural network model for Person Re-Identification that is suitable for practical use.
本発明は、上記課題を解決するものであり、学習対象の確率分布を正確に再現することが可能な、精度の高い学習済ニューラルネットワークモデルを生成することが可能な機械学習システム、学習用データセット生成システム、及び機械学習プログラムを提供することを目的とする。 The present invention solves the above problems, and provides a machine learning system and learning data that can generate a highly accurate trained neural network model that can accurately reproduce the probability distribution of a learning target. The purpose is to provide a set generation system and a machine learning program.
上記課題を解決するために、本発明の第1の態様による機械学習システムは、コンピュータグラフィックスで作成した学習用画像を含む学習用データセットを使用して、画像中の物体に対する推論用のニューラルネットワークモデルの機械学習を行う機械学習システムであって、ある特定環境における各構成要素の実体の確率分布に対応する学習用データセットを生成するデータセット生成部と、前記学習用データセットを用いてディープラーニングを行うことにより、学習済ニューラルネットワークモデルを生成するニューラルネットワーク生成部と、テスト用データセットに含まれるテスト用画像を前記学習済ニューラルネットワークモデルに入力して、前記テスト用画像中の物体に対する推論処理を行う推論部と、前記推論部による推論結果に基づいて、前記学習済ニューラルネットワークモデルの学習用データセットにおける学習用データの偏りを検証する検証部と、前記検証部による検証で判明した前記学習用データの偏りを減少させるように、前記特定環境における各構成要素の実体の確率分布を変更する特定環境変更部と、前記変更後の各構成要素の実体の確率分布に対応する学習用データセットを、前記データセット生成部により生成して、この学習用データセット内の学習用データに基づき、更新後の学習用データセットを生成するように制御する更新後学習用データセット生成制御部と、前記ニューラルネットワーク生成部により、前記更新後の学習用データセットを用いてディープラーニングを行うことによって、現在の学習済ニューラルネットワークモデルよりも精度の高い学習済ニューラルネットワークモデルを生成するように制御する学習繰返し制御部とを備え、前記データセット生成部により生成される学習用データセットを構成する各学習用画像は、前記特定環境における各構成要素の実体の確率分布から選択した前記各構成要素の実体に、ランダムノイズを加えて生成した複数パターンの前記各構成要素の実体に基づいて描画した画像である。 In order to solve the above problems, a machine learning system according to a first aspect of the present invention uses a training data set including training images created using computer graphics to create a neural network for inference with respect to objects in the images. A machine learning system that performs machine learning of a network model, comprising: a data set generation unit that generates a learning data set corresponding to the probability distribution of entities of each component in a specific environment; and a data set generation unit that uses the learning data set. A neural network generation unit that generates a trained neural network model by performing deep learning; and a neural network generation unit that generates a trained neural network model by inputting a test image included in a test data set to the trained neural network model and generating an object in the test image. an inference unit that performs inference processing for the inference; a verification unit that verifies bias in the training data in the training data set of the trained neural network model based on the inference result by the inference unit; a specific environment changing unit that changes the probability distribution of the entity of each component in the specific environment so as to reduce the bias of the learning data; and a learning that corresponds to the changed probability distribution of the entity of each component. post-updated training data set generation control that controls to generate a training data set by the data set generation unit and generate an updated training data set based on the training data in the training data set; and the neural network generation unit generates a trained neural network model with higher accuracy than the current trained neural network model by performing deep learning using the updated training data set. and a learning repetition control unit that controls each of the learning images constituting the learning data set generated by the data set generating unit, each of the configurations selected from the probability distribution of the entity of each component in the specific environment. This is an image drawn based on the entities of each of the constituent elements of a plurality of patterns generated by adding random noise to the entities of the elements .
本発明の第2の態様による機械学習システムは、コンピュータグラフィックスで作成した学習用画像を含む学習用データセットを使用して、画像中の物体に対する推論用のニューラルネットワークモデルの機械学習を行う機械学習システムであって、ある特定環境における各構成要素の実体の確率分布に対応する学習用データセットを生成するデータセット生成部と、前記学習用データセットを用いてディープラーニングを行うことにより、学習済ニューラルネットワークモデルを生成するニューラルネットワーク生成部と、テスト用データセットに含まれるテスト用画像を前記学習済ニューラルネットワークモデルに入力して、前記テスト用画像中の物体に対する推論処理を行う推論部と、前記推論部による推論結果に基づいて、前記学習済ニューラルネットワークモデルの学習用データセットにおける学習用データの偏りを検証する検証部と、前記検証部による検証で判明した前記学習用データの偏りを減少させるように、前記特定環境における各構成要素の実体の確率分布を変更する特定環境変更部と、前記変更後の各構成要素の実体の確率分布に対応する学習用データセットを、前記データセット生成部により生成して、この学習用データセット内の学習用データに基づき、更新後の学習用データセットを生成するように制御する更新後学習用データセット生成制御部と、前記ニューラルネットワーク生成部により、前記更新後の学習用データセットを用いてディープラーニングを行うことによって、現在の学習済ニューラルネットワークモデルよりも精度の高い学習済ニューラルネットワークモデルを生成するように制御する学習繰返し制御部と、前記特定環境における各構成要素の実体の確率分布に基づいて、前記各構成要素の実体に対応する前記特定環境の実体の時系列に沿ったシミュレーション結果のデータである特定環境実体情報を生成する特定環境生成部とを備え、前記データセット生成部は、前記学習用データセットに加えて、前記特定環境生成部により生成された前記特定環境実体情報に対応する、前記ニューラルネットワークモデルのテスト用データセットを生成し、前記推論部は、前記データセット生成部により生成されたテスト用データセットに含まれるテスト用画像を前記学習済ニューラルネットワークモデルに入力して、前記テスト用画像中の物体に対する推論処理を行う。 A machine learning system according to a second aspect of the present invention is a machine that performs machine learning of a neural network model for inference with respect to an object in an image using a learning data set that includes a learning image created using computer graphics. The learning system includes a dataset generation unit that generates a learning dataset corresponding to the probability distribution of entities of each component in a specific environment, and a learning system that performs deep learning using the training dataset. a neural network generation unit that generates a trained neural network model; and an inference unit that inputs a test image included in a test data set to the trained neural network model and performs inference processing on an object in the test image. , a verification unit that verifies the bias of the training data in the training data set of the trained neural network model based on the inference result by the inference unit; and a verification unit that verifies the bias of the training data found by the verification by the verification unit. a specific environment changing unit that changes the probability distribution of the entity of each component in the specific environment so as to decrease the probability distribution of the entity of each component; an updated learning data set generation control unit that is generated by the generation unit and controls to generate an updated learning data set based on the learning data in the learning data set, and the neural network generation unit a learning repetition control unit that performs deep learning using the updated learning data set to generate a trained neural network model that is more accurate than the current trained neural network model; Identification of generating specific environment entity information, which is data of simulation results along a time series of entities in the specific environment corresponding to the entities in the specific environment, based on probability distributions of entities in each component in the specific environment. an environment generation section, the dataset generation section generates a test dataset for the neural network model corresponding to the specific environment entity information generated by the specific environment generation section, in addition to the learning dataset. The inference unit inputs the test image included in the test data set generated by the data set generation unit into the trained neural network model, and performs inference processing on the object in the test image. I do.
この機械学習システムにおいて、前記学習繰返し制御部は、前記検証部による検証の結果、現在の学習用データセットにおける学習用データの偏りが、所定のレベル以下になるまで、前記特定環境変更部によって、前記学習用データの偏りを減少させるように、前記特定環境における各構成要素の確率分布を変更させる処理と、前記更新後学習用データセット生成制御部によって、前記変更後の各構成要素の実体の確率分布に対応する前記学習用データセットを、前記データセット生成部を用いて生成し、この学習用データセット内の学習用データに基づき、更新後の学習用データセットを生成する処理と、前記ニューラルネットワーク生成部によって、前記更新後の学習用データセットを用いて現在の学習済ニューラルネットワークモデルよりも精度の高い学習済ニューラルネットワークモデルを生成する処理と、前記生成した精度の高い学習済ニューラルネットワークモデルを用いて、前記推論部により前記テスト用画像中の物体に対する推論を行う処理と、前記推論部による推論結果に基づいて、前記検証部により現在の学習用データセットにおける学習用データの偏りを検証する処理とを繰り返すことが望ましい。 In this machine learning system, the learning repetition control unit causes the specific environment changing unit to: In order to reduce the bias of the learning data, the probability distribution of each component in the specific environment is changed, and the post-updated training data set generation control unit changes the actual state of each component after the change. a process of generating the learning data set corresponding to the probability distribution using the data set generation unit, and generating an updated learning data set based on the learning data in the learning data set; A process of generating a trained neural network model with higher accuracy than the current trained neural network model using the updated training data set by a neural network generation unit, and a process of generating the trained neural network model with higher accuracy than the current trained neural network model. Using a model, the inference unit performs inference on the object in the test image, and the verification unit determines the bias of the learning data in the current learning data set based on the inference result by the inference unit. It is desirable to repeat the verification process.
この機械学習システムにおいて、前記特定環境変更部は、調整パラメータの値に応じて、前記特定環境における各構成要素の実体の確率分布を変更し、前記変更後の各構成要素の実体の確率分布に従い、同じ調整パラメータにおいて、毎回異なる前記各構成要素の実体を生成することが望ましい。 In this machine learning system, the specific environment changing unit changes the probability distribution of each component entity in the specific environment according to the value of the adjustment parameter, and according to the changed probability distribution of each component entity. , it is desirable to generate a different entity of each component each time with the same adjustment parameters.
この機械学習システムにおいて、前記データセット生成部は、前記学習用データセットのアノテーションデータを生成することが望ましい。 In this machine learning system, it is preferable that the dataset generation unit generates annotation data of the learning dataset.
この機械学習システムにおいて、前記推論用のニューラルネットワークモデルには、複数のビデオカメラで撮影した各映像を構成する各フレーム画像における人の特徴量に基づいて、異なるビデオカメラで撮影した人の同定を行う人物同定用のニューラルネットワークモデルが含まれていてもよい。 In this machine learning system, the neural network model for inference has the ability to identify people photographed with different video cameras based on the features of the person in each frame image constituting each video photographed with multiple video cameras. A neural network model for person identification may be included.
本発明の第3の態様による学習用データセット生成システムは、画像中の物体に対する推論用のニューラルネットワークモデルの機械学習を行うための学習用データセットを生成する学習用データセット生成システムであって、前記学習用データセットは、コンピュータグラフィックスで作成した学習用画像を含み、テスト用データセットに含まれるテスト用画像を、現在の学習済ニューラルネットワークモデルに入力して、前記テスト用画像中の物体に対する推論処理を行う推論部と、前記推論部による推論結果に基づいて、前記現在の学習済ニューラルネットワークモデルの学習用データセットにおける学習用データの偏りを検証する検証部と、前記検証部による検証で判明した前記学習用データの偏りを減少させるように、前記学習用画像に映り込む特定環境における各構成要素の実体の確率分布を変更する特定環境変更部と、前記変更後の各構成要素の実体の確率分布に対応する学習用データセットを生成して、この学習用データセット内の学習用データに基づき、更新後の学習用データセットを生成するように制御する更新後学習用データセット生成制御部とを備え、前記更新後の学習用データセットを構成する各学習用画像は、前記特定環境における各構成要素の実体の確率分布から選択した前記各構成要素の実体に、ランダムノイズを加えて生成した複数パターンの前記各構成要素の実体に基づいて描画した画像である。 A learning dataset generation system according to a third aspect of the present invention is a learning dataset generation system that generates a learning dataset for performing machine learning of a neural network model for inference with respect to an object in an image. , the training data set includes training images created using computer graphics, and the test images included in the test data set are input to the current trained neural network model, and the test images in the test images are an inference unit that performs inference processing on an object; a verification unit that verifies bias of training data in a training data set of the currently trained neural network model based on the inference result by the inference unit; a specific environment changing unit that changes the probability distribution of the entity of each component in the specific environment reflected in the learning image so as to reduce the bias of the learning data found through verification; and each component after the change. An updated training dataset that controls the generation of a training dataset that corresponds to the probability distribution of the entity, and generates an updated training dataset based on the training data in this training dataset. Each of the learning images constituting the updated learning data set includes a generation control unit that applies random noise to the entity of each component selected from the probability distribution of the entity of each component in the specific environment. In addition, it is an image drawn based on the substance of each of the constituent elements of the generated plurality of patterns .
本発明の第4の態様による学習用データセット生成システムは、画像中の物体に対する推論用のニューラルネットワークモデルの機械学習を行うための学習用データセットを生成する学習用データセット生成システムであって、前記学習用データセットは、コンピュータグラフィックスで作成した学習用画像を含み、テスト用データセットに含まれるテスト用画像を、現在の学習済ニューラルネットワークモデルに入力して、前記テスト用画像中の物体に対する推論処理を行う推論部と、前記推論部による推論結果に基づいて、前記現在の学習済ニューラルネットワークモデルの学習用データセットにおける学習用データの偏りを検証する検証部と、前記検証部による検証で判明した前記学習用データの偏りを減少させるように、前記学習用画像に映り込む特定環境における各構成要素の実体の確率分布を変更する特定環境変更部と、前記変更後の各構成要素の実体の確率分布に対応する学習用データセットを生成して、この学習用データセット内の学習用データに基づき、更新後の学習用データセットを生成するように制御する更新後学習用データセット生成制御部と、前記特定環境における各構成要素の実体の確率分布に基づいて、前記各構成要素の実体に対応する前記特定環境の実体の時系列に沿ったシミュレーション結果のデータである特定環境実体情報を生成する特定環境生成部と、前記特定環境生成部により生成された前記特定環境実体情報に対応する、前記ニューラルネットワークモデルのテスト用データセットを生成するデータセット生成部とを備え、前記推論部は、前記データセット生成部により生成されたテスト用データセットに含まれるテスト用画像を、現在の学習済ニューラルネットワークモデルに入力して、前記テスト用画像中の物体に対する推論処理を行う。 A learning dataset generation system according to a fourth aspect of the present invention is a learning dataset generation system that generates a learning dataset for performing machine learning of a neural network model for inference with respect to an object in an image. , the training data set includes training images created using computer graphics, and the test images included in the test data set are input to the current trained neural network model, and the test images in the test images are an inference unit that performs inference processing on an object; a verification unit that verifies bias of training data in a training data set of the currently trained neural network model based on the inference result by the inference unit; a specific environment changing unit that changes the probability distribution of the entity of each component in the specific environment reflected in the learning image so as to reduce the bias of the learning data found through verification; and each component after the change. An updated training dataset that controls the generation of a training dataset that corresponds to the probability distribution of the entity, and generates an updated training dataset based on the training data in this training dataset. a generation control unit, and a specific environment entity that is simulation result data along a time series of entities of the specific environment corresponding to the entities of each component based on the probability distribution of the entities of each component in the specific environment. a specific environment generation unit that generates information; and a data set generation unit that generates a test dataset for the neural network model corresponding to the specific environment entity information generated by the specific environment generation unit, The unit inputs the test image included in the test data set generated by the data set generation unit into the current trained neural network model, and performs inference processing on the object in the test image.
この学習用データセット生成システムにおいて、前記特定環境変更部は、調整パラメータの値に応じて、前記特定環境における各構成要素の実体の確率分布を変更し、前記変更後の各構成要素の実体の確率分布に従い、同じ調整パラメータにおいて、毎回異なる前記各構成要素の実体を生成することが望ましい。 In this learning dataset generation system, the specific environment changing unit changes the probability distribution of each component entity in the specific environment according to the value of the adjustment parameter, and changes the probability distribution of each component entity after the change. It is desirable to generate a different entity of each component each time with the same adjustment parameters according to a probability distribution.
本発明の第5の態様による機械学習プログラムは、コンピュータグラフィックスで作成した学習用画像を含む学習用データセットを使用して、画像中の物体に対する推論用のニューラルネットワークモデルの機械学習を行うための機械学習プログラムであって、コンピュータを、ある特定環境における各構成要素の実体の確率分布に対応する学習用データセットを生成するデータセット生成部と、前記学習用データセットを用いてディープラーニングを行うことにより、学習済ニューラルネットワークモデルを生成するニューラルネットワーク生成部と、テスト用データセットに含まれるテスト用画像を前記学習済ニューラルネットワークモデルに入力して、前記テスト用画像中の物体に対する推論処理を行う推論部と、前記推論部による推論結果に基づいて、前記学習済ニューラルネットワークモデルの学習用データセットにおける学習用データの偏りを検証する検証部と、前記検証部による検証で判明した前記学習用データの偏りを減少させるように、前記特定環境における各構成要素の実体の確率分布を変更する特定環境変更部と、前記変更後の各構成要素の実体の確率分布に対応する学習用データセットを、前記データセット生成部により生成して、この学習用データセット内の学習用データに基づき、更新後の学習用データセットを生成するように制御する更新後学習用データセット生成制御部と、前記ニューラルネットワーク生成部により、前記更新後の学習用データセットを用いてディープラーニングを行うことによって、現在の学習済ニューラルネットワークモデルよりも精度の高い学習済ニューラルネットワークモデルを生成するように制御する学習繰返し制御部として機能させ、前記データセット生成部により生成される学習用データセットを構成する各学習用画像は、前記特定環境における各構成要素の実体の確率分布から選択した前記各構成要素の実体に、ランダムノイズを加えて生成した複数パターンの前記各構成要素の実体に基づいて描画した画像である。 A machine learning program according to a fifth aspect of the present invention is for performing machine learning of a neural network model for inference with respect to an object in an image using a learning data set including a learning image created using computer graphics. This machine learning program includes a data set generation unit that generates a learning data set corresponding to the probability distribution of entities of each component in a certain specific environment, and a deep learning using the learning data set. A neural network generation unit generates a trained neural network model by inputting a test image included in a test dataset to the trained neural network model, and performs inference processing on objects in the test image. an inference unit that performs the following: a verification unit that verifies the bias of the training data in the training data set of the trained neural network model based on the inference result by the inference unit; a specific environment changing unit that changes the probability distribution of the entity of each component in the specific environment so as to reduce the bias of the data; and a learning data set corresponding to the changed probability distribution of the entity of each component. an updated learning dataset generation control unit that controls the updated learning dataset to be generated by the dataset generation unit and to generate an updated learning dataset based on the learning data in the learning dataset; Learning controlled so that the neural network generation unit generates a trained neural network model with higher accuracy than the current trained neural network model by performing deep learning using the updated training data set. Each learning image constituting the learning data set generated by the data set generation unit, which functions as a repetition control unit, is an entity of each component selected from the probability distribution of the entity of each component in the specific environment. This is an image drawn based on the substance of each component of a plurality of patterns generated by adding random noise to the above.
本発明の第6の態様による機械学習プログラムは、コンピュータグラフィックスで作成した学習用画像を含む学習用データセットを使用して、画像中の物体に対する推論用のニューラルネットワークモデルの機械学習を行うための機械学習プログラムであって、コンピュータを、ある特定環境における各構成要素の実体の確率分布に対応する学習用データセットを生成するデータセット生成部と、前記学習用データセットを用いてディープラーニングを行うことにより、学習済ニューラルネットワークモデルを生成するニューラルネットワーク生成部と、テスト用データセットに含まれるテスト用画像を前記学習済ニューラルネットワークモデルに入力して、前記テスト用画像中の物体に対する推論処理を行う推論部と、前記推論部による推論結果に基づいて、前記学習済ニューラルネットワークモデルの学習用データセットにおける学習用データの偏りを検証する検証部と、前記検証部による検証で判明した前記学習用データの偏りを減少させるように、前記特定環境における各構成要素の実体の確率分布を変更する特定環境変更部と、前記変更後の各構成要素の実体の確率分布に対応する学習用データセットを、前記データセット生成部により生成して、この学習用データセット内の学習用データに基づき、更新後の学習用データセットを生成するように制御する更新後学習用データセット生成制御部と、前記ニューラルネットワーク生成部により、前記更新後の学習用データセットを用いてディープラーニングを行うことによって、現在の学習済ニューラルネットワークモデルよりも精度の高い学習済ニューラルネットワークモデルを生成するように制御する学習繰返し制御部と、前記特定環境における各構成要素の実体の確率分布に基づいて、前記各構成要素の実体に対応する前記特定環境の実体の時系列に沿ったシミュレーション結果のデータである特定環境実体情報を生成する特定環境生成部として機能させ、前記データセット生成部は、前記学習用データセットに加えて、前記特定環境生成部により生成された前記特定環境実体情報に対応する、前記ニューラルネットワークモデルのテスト用データセットを生成し、前記推論部は、前記データセット生成部により生成されたテスト用データセットに含まれるテスト用画像を前記学習済ニューラルネットワークモデルに入力して、前記テスト用画像中の物体に対する推論処理を行う。 A machine learning program according to a sixth aspect of the present invention is for performing machine learning of a neural network model for inference with respect to an object in an image using a learning data set including a learning image created using computer graphics. This machine learning program includes a data set generation unit that generates a learning data set corresponding to the probability distribution of entities of each component in a certain specific environment, and a deep learning using the learning data set. A neural network generation unit generates a trained neural network model by inputting a test image included in a test dataset to the trained neural network model, and performs inference processing on objects in the test image. an inference unit that performs the following: a verification unit that verifies the bias of the training data in the training data set of the trained neural network model based on the inference result by the inference unit; a specific environment changing unit that changes the probability distribution of the entity of each component in the specific environment so as to reduce the bias of the data; and a learning data set corresponding to the changed probability distribution of the entity of each component. an updated learning dataset generation control unit that controls the updated learning dataset to be generated by the dataset generation unit and to generate an updated learning dataset based on the learning data in the learning dataset; Learning controlled so that the neural network generation unit generates a trained neural network model with higher accuracy than the current trained neural network model by performing deep learning using the updated training data set. a repetition control unit, and a specific environment entity that is simulation result data along a time series of entities of the specific environment corresponding to the entities of each component based on the probability distribution of the entities of each component in the specific environment. The data set generation unit functions as a specific environment generation unit that generates information, and in addition to the learning dataset, the neural network model corresponds to the specific environment entity information generated by the specific environment generation unit. The inference unit inputs the test images included in the test data set generated by the data set generation unit into the trained neural network model, and the inference unit inputs the test images included in the test data set generated by the dataset generation unit to Perform inference processing on objects.
この機械学習プログラムにおいて、前記特定環境変更部は、調整パラメータの値に応じて、前記特定環境における各構成要素の実体の確率分布を変更し、前記変更後の各構成要素の実体の確率分布に従い、同じ調整パラメータにおいて、毎回異なる前記各構成要素の実体を生成することが望ましい。 In this machine learning program, the specific environment changing unit changes the probability distribution of each component entity in the specific environment according to the value of the adjustment parameter, and according to the changed probability distribution of each component entity. , it is desirable to generate a different entity of each component each time with the same adjustment parameters.
本発明の第1の態様による機械学習システム、第2の態様による機械学習システム、第3の態様による学習用データセット生成システム、第4の態様による学習用データセット生成システム、第5の態様による機械学習プログラム、及び第6の態様による機械学習プログラムによれば、学習用データの偏りを減少させるように、特定環境における各構成要素の実体の確率分布を変更させ、変更後の各構成要素の実体の確率分布に対応する学習用データセットを生成して、この学習用データセット内の学習用データに基づき、更新後の学習用データセットを生成することができる。つまり、この更新後の学習用データセットは、学習用データセットにおける学習用データの偏りを減少させるように生成し直した学習用データセット内の学習用データを反映した学習用データセットである。従って、この更新後の学習用データセット内の学習用データには、偏りが少ないので、この更新後の学習用データセットを用いてディープラーニングを行うことにより、現在の学習済ニューラルネットワークモデルよりも学習対象の確率分布を正確に再現することが可能な、精度の高い学習済ニューラルネットワークモデルを生成することができる。
The machine learning system according to the first aspect of the present invention, the machine learning system according to the second aspect, the learning dataset generation system according to the third aspect, the learning dataset generation system according to the fourth aspect, and the fifth aspect According to the machine learning program and the machine learning program according to the sixth aspect, the probability distribution of each component entity in a specific environment is changed so as to reduce bias in learning data, and the probability distribution of each component entity after the change is It is possible to generate a learning data set corresponding to the probability distribution of an entity, and to generate an updated learning data set based on the learning data in this learning data set. In other words, this updated learning data set is a learning data set that reflects the learning data in the learning data set that has been regenerated so as to reduce the bias of the learning data in the learning data set. Therefore, the training data in this updated training dataset has less bias, so by performing deep learning using this updated training dataset, it is better than the current trained neural network model. It is possible to generate a highly accurate trained neural network model that can accurately reproduce the probability distribution of the learning target.
以下、本発明を具体化した実施形態による機械学習システム、学習用データセット生成システム、及び機械学習プログラムについて、図面を参照して説明する。図1は、本実施形態による機械学習システム10(請求項における「機械学習システム」及び「学習用データセット生成システム」に相当)の概略のハードウェア構成を示すブロック構成図である。本実施形態では、機械学習システム10が、一つのコンピュータ(学習サーバ1)のみから構成されている場合の例を示しているが、クライアント・サーバ型のシステムであってもよい。なお、以下の説明において、「応用環境」とは、学習用画像やテスト用画像に映りこむ特定の(例えば、あるドラッグストア、あるコンビニ等の)環境を意味する。本実施形態では、上記の応用環境が、ドラッグストア等の店舗である場合の例について、説明する。また、本実施形態では、学習用画像やテスト用画像が、3次元コンピュータグラフィックス(3DCG:three-Dimensional Computer Graphics)で作成した画像である場合の例について、説明する。 EMBODIMENT OF THE INVENTION Hereinafter, a machine learning system, a learning dataset generation system, and a machine learning program according to embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a block configuration diagram showing a schematic hardware configuration of a machine learning system 10 (corresponding to a "machine learning system" and a "learning data set generation system" in the claims) according to the present embodiment. Although the present embodiment shows an example in which the machine learning system 10 is composed of only one computer (learning server 1), it may be a client-server type system. In the following description, the term "applied environment" refers to a specific environment (for example, a certain drug store, a certain convenience store, etc.) that appears in the learning images and test images. In this embodiment, an example in which the above-mentioned application environment is a store such as a drug store will be described. Further, in this embodiment, an example will be described in which the learning image and the test image are images created using three-dimensional computer graphics (3DCG).
図1に示すように、機械学習システム10を構成する学習サーバ1は、装置全体の制御及び各種演算を行うCPU2と、機械学習後の学習済ニューラルネットワークモデルの配布等行うための通信部3と、ディスプレイ4と、調整パラメータの入力等を行うための入力操作部5と、RAM(Random Access Memory)6と、各種のデータやプログラムを格納するハードディスク7とを備えている。 As shown in FIG. 1, a learning server 1 that constitutes a machine learning system 10 includes a CPU 2 that controls the entire device and performs various calculations, and a communication unit 3 that distributes trained neural network models after machine learning. , a display 4, an input operation unit 5 for inputting adjustment parameters, a RAM (Random Access Memory) 6, and a hard disk 7 for storing various data and programs.
上記のハードディスク7に格納されるプログラムには、3DCGで作成した学習用画像を含む学習用データセットを使用して、画像中の物体に対するReID(Person Re-Identification)等の推論用のニューラルネットワークモデルの機械学習を行うための機械学習プログラム15が含まれている。この機械学習プログラム15は、学習サーバ1に、機械学習システム10としての機能を実現させるためのプログラムである。 The program stored in the hard disk 7 includes a neural network model for inference, such as ReID (Person Re-Identification), for objects in images, using a learning data set that includes training images created with 3DCG. A machine learning program 15 for performing machine learning is included. This machine learning program 15 is a program for causing the learning server 1 to realize the functions of the machine learning system 10.
また、上記のハードディスク7に格納されるデータには、応用環境生成素材保存部11と、データセット保存部12と、DNNモデル保存部13と、推論結果保存部14とが含まれている。 Further, the data stored in the hard disk 7 includes an application environment generation material storage section 11, a data set storage section 12, a DNN model storage section 13, and an inference result storage section 14.
上記の応用環境生成素材保存部11には、この応用環境における人の3Dモデル(3DCGで作成した人の画像のモデル)、この応用環境における店舗の実体を再現するための様々なテクスチャ等の、3DCGで作成した画像の素材が格納されている。また、応用環境生成素材保存部11には、この応用環境における(例えば、あるドラッグストアのある地域における)人や店舗(の詳細情報)についての統計データが含まれている。この統計データには、例えば、この応用環境において生成され得る各性別、年代毎の人の実体の確率分布のデータが含まれている。 The applied environment generation material storage unit 11 contains a 3D model of a person in this applied environment (a model of an image of a person created with 3DCG), various textures for reproducing the actual store in this applied environment, etc. Contains image materials created with 3DCG. Further, the applied environment generation material storage unit 11 includes statistical data regarding (detailed information on) people and stores in this applied environment (for example, in an area where a certain drugstore is located). This statistical data includes, for example, data on the probability distribution of human entities for each gender and age that can be generated in this application environment.
上記のデータセット保存部12は、人検出、特徴検出(ベクトル化)、追跡、ReID等の推論用DNN(Deep Neural Network)のモデル(以下、「DNNモデル」という)のテスト用データセットと学習用データセットとを格納(保存)している。DNNモデル保存部13は、人検出、特徴検出、追跡、ReID(請求項における「人物同定用のニューラルネットワークモデル」)等の推論用の学習済DNNモデルを保存している。推論結果保存部14は、データセット保存部12に格納されているテスト用データセットに含まれる各テスト用画像中の物体に対する推論処理の結果と、応用環境の調整パラメータの変更用データ(以下、「調整パラメータ変更用データ」という)とを、格納(保存)している。 The above dataset storage unit 12 stores test datasets and learning data for inference DNN (Deep Neural Network) models (hereinafter referred to as "DNN models") for human detection, feature detection (vectorization), tracking, ReID, etc. It stores (saves) the data set for use. The DNN model storage unit 13 stores trained DNN models for inference such as person detection, feature detection, tracking, and ReID (“neural network model for person identification” in the claims). The inference result storage unit 14 stores the results of inference processing for objects in each test image included in the test data set stored in the data set storage unit 12 and data for changing adjustment parameters of the application environment (hereinafter referred to as (referred to as "adjustment parameter change data") is stored (saved).
次に、図2を参照して、学習サーバ1におけるCPU2の機能ブロックについて説明する。CPU2は、機能ブロックとして、制御部20(請求項における「更新後学習用データセット生成制御部」、及び「学習繰返し制御部」)と、応用環境生成部21(請求項における「特定環境生成部」)と、データセット生成部22と、学習部23(請求項における「ニューラルネットワーク生成部」)と、推論部24とを備えている。上記の応用環境生成部21は学習用生成部27を含んでおり、推論部24は、検証部25を含んでいる。なお、本実施形態では、推論部24が検証部25を含むようにしたが、推論部24と検証部25とを、別々の機能ブロックにしてもよい。 Next, with reference to FIG. 2, the functional blocks of the CPU 2 in the learning server 1 will be described. The CPU 2 includes, as functional blocks, a control unit 20 (“updated learning data set generation control unit” and “learning repetition control unit” in the claims) and an application environment generation unit 21 (“specific environment generation unit” in the claims). ''), a data set generation section 22, a learning section 23 ("neural network generation section" in the claims), and an inference section 24. The above application environment generation section 21 includes a learning generation section 27, and the inference section 24 includes a verification section 25. Note that in this embodiment, the inference section 24 includes the verification section 25, but the inference section 24 and the verification section 25 may be separate functional blocks.
上記の制御部20は、CPU2内の他の機能ブロックの制御を行う。応用環境生成部21は、(あるドラッグストア、あるコンビニ等の)応用環境における人及び店舗の各々の実体の確率分布に基づいて、人及び店舗の実体に対応する応用環境の実体(本実施形態の場合は、店舗状況の実体)の時系列に沿ったシミュレーション結果のデータ(以下、「応用環境実体情報」という)を生成する。「応用環境実体情報」は、請求項における「特定環境実体情報」に対応する。学習用生成部27は、上記の人検出、特徴検出、追跡、ReID等の各推論用DNNモデルの学習用データセットの生成時に、前回の推論結果に基づく調整パラメータの変更処理や、この変更後の調整パラメータに基づき、応用環境における各構成要素の実体の確率分布を変更する処理を行う。 The control unit 20 described above controls other functional blocks within the CPU 2. The application environment generation unit 21 generates application environment entities (in this embodiment In this case, simulation result data (hereinafter referred to as "applied environment entity information") is generated in chronological order (hereinafter referred to as "applied environment entity information"). "Application environment entity information" corresponds to "specific environment entity information" in the claims. When generating the training data set for each inference DNN model such as person detection, feature detection, tracking, ReID, etc., the learning generation unit 27 performs adjustment parameter change processing based on the previous inference result and after this change. Based on the adjustment parameters, processing is performed to change the probability distribution of each component entity in the application environment.
上記のデータセット生成部22は、上記の応用環境生成部21により生成された応用環境実体情報に対応する上記各推論用DNNモデルのテスト用データセットと、応用環境における各構成要素の実体の確率分布に対応する学習用データセットとを生成する。 The data set generation unit 22 generates a test data set for each of the inference DNN models corresponding to the application environment entity information generated by the application environment generation unit 21, and the probability of the entity of each component in the application environment. A training data set corresponding to the distribution is generated.
上記の学習部23は、上記のデータセット生成部22により生成された学習用データセットを用いて、上記人検出、特徴検出、追跡、ReID等の各推論用のDNNモデルのディープラーニングを行うことにより、これらの推論用の学習済DNNモデルを生成する。推論部24は、上記のデータセット生成部22により生成されたテスト用データセットに含まれる各テスト用画像を、上記の各推論用の学習済DNNモデルに入力して、上記の各テスト用画像中の物体に対する推論処理を行う。推論部24に含まれる検証部25は、上記の各テスト用画像中の物体に対する推論処理の結果(推論結果)に基づいて、上記の各推論用の学習済DNNモデルの学習用データセットにおける学習用データの偏りを検証する。また、詳細については後述するが、上記の検証部25と応用環境生成部21は、検証部25による検証で判明した上記の各推論用学習済DNNモデルの学習用データセットにおける学習用データの偏りを減少させるように、応用環境における各構成要素(人及び店舗)の実体の確率分布を変更させる。すなわち、検証部25と応用環境生成部21とが、請求項における特定環境変更部に相当する。 The learning unit 23 performs deep learning of the DNN model for each inference such as person detection, feature detection, tracking, and ReID using the learning dataset generated by the dataset generation unit 22. A trained DNN model for these inferences is generated. The inference unit 24 inputs each test image included in the test data set generated by the data set generation unit 22 to the trained DNN model for each inference, and generates each test image. Perform inference processing on the objects inside. The verification unit 25 included in the inference unit 24 performs learning on the training data set of the trained DNN model for each of the above inferences based on the results of inference processing (inference results) for the objects in each of the test images. Verify the bias in the data. Further, although the details will be described later, the verification unit 25 and the application environment generation unit 21 are configured to check the bias of the training data in the training data set of each trained DNN model for inference, which is found through the verification by the verification unit 25. The probability distribution of each component (person and store) entity in the application environment is changed so as to reduce the probability distribution. That is, the verification unit 25 and the application environment generation unit 21 correspond to the specific environment change unit in the claims.
制御部20は、上記の検証部25と応用環境生成部21による変更後の各構成要素(人及び店舗)の実体の確率分布に対応する学習用データセットを、データセット生成部22により生成して、この学習用データセット内の学習用データに基づき、更新後の学習用データセットを生成するように制御する。すなわち、制御部20は、請求項における更新後学習用データセット生成制御部として機能する。 The control unit 20 causes the data set generation unit 22 to generate a learning data set corresponding to the probability distribution of the entity of each component (person and store) after the modification by the verification unit 25 and application environment generation unit 21 described above. Then, control is performed to generate an updated learning data set based on the learning data in this learning data set. That is, the control unit 20 functions as an updated learning data set generation control unit in the claims.
また、制御部20は、上記の更新後の学習用データセットを用いて、学習部23により上記の各推論用DNNモデルのディープラーニングを行うことによって、現在の各推論用学習済DNNモデルよりも精度の高い各推論用学習済DNNモデルを生成するように制御する。すなわち、制御部20は、請求項における学習繰返し制御部としても機能する。 In addition, the control unit 20 performs deep learning on each of the above-mentioned inference DNN models using the above-mentioned updated training data set, so that the control unit 20 performs deep learning on each of the above-mentioned inference DNN models using the above-mentioned updated learning data set. Control is performed to generate highly accurate trained DNN models for each inference. That is, the control section 20 also functions as a learning repetition control section in the claims.
次に、図3を参照して、上記の機械学習システム10により行われる機械学習処理について説明する。まず、この機械学習処理に先立って、ユーザは、システム開発会社又は自分の会社のシステム開発部門により、3DCGを用いて、応用環境のベースを構築する必要がある(S1)。応用環境が店舗である場合には、図4に示すように、応用環境は、「店舗」、「人」、「人の行動」、「店舗状況」の要素から構成される。各要素は、様々なパラメータから構成されている。例えば、図4に示すように、「店舗」は、広さ、天井の高さ、壁・床のテクスチャ、棚の位置/向き等のパラメータ(一種の評価軸)から構成されており、「人」は、性別、年齢、人種、身長、体重、服装、行動特性等のパラメータから構成されている。「人の行動」は、上記の「人」のパラメータに含まれる行動特性の種類を表したものである。「店舗状況」は、混雑度、性別分布、年齢分布、平均顧客滞在時間分布、行動特性分布のパラメータから構成されている。上記の各パラメータの初期値(デフォルト値)の設定は、機械学習システム10のCPU2が、統計データに基づいて、自動的に行ってもよいし、ユーザの会社のシステム開発部門又はシステム開発会社の開発担当者が、入力操作部5から入力してもよい。「店舗」、「人」、「店舗状況」の各要素を構成する上記の各パラメータ(デフォルト値)のうち、いくつかのパラメータを、後述する調整パラメータで任意に調整することにより、様々なパターンの「店舗」、「人」、「店舗状況」の構成要素の実体の確率分布を表現できる。ここで、「実体」とは、これらの実体(例えば、店舗や人)を表すデータを意味する。 Next, with reference to FIG. 3, the machine learning process performed by the machine learning system 10 described above will be described. First, prior to this machine learning process, the user needs to construct the base of the application environment using 3DCG by a system development company or the system development department of his/her own company (S1). When the applied environment is a store, as shown in FIG. 4, the applied environment is composed of the elements of "store", "people", "people's behavior", and "store situation". Each element is made up of various parameters. For example, as shown in Figure 4, a "store" is composed of parameters (a kind of evaluation axis) such as size, ceiling height, wall/floor texture, shelf position/orientation, etc. ” is composed of parameters such as gender, age, race, height, weight, clothing, and behavioral characteristics. "Human behavior" represents the type of behavioral characteristics included in the above-mentioned "human" parameter. The "store situation" is composed of parameters such as crowding level, gender distribution, age distribution, average customer staying time distribution, and behavior characteristic distribution. The initial values (default values) of each of the above parameters may be set automatically by the CPU 2 of the machine learning system 10 based on statistical data, or by the system development department of the user's company or the system development company. A person in charge of development may input from the input operation section 5. By arbitrarily adjusting some of the above parameters (default values) that make up each element of "store", "person", and "store situation", various patterns can be created. It is possible to express the probability distribution of the constituent elements of "store", "person", and "store situation". Here, "entity" means data representing these entities (for example, stores and people).
本機械学習システム10では、例えば、「人」の構成要素については、「人」の実体の確率分布から(「人」の実体の確率分布に従って)、毎回異なる人物の実体(を表すデータ)を生成することができる。また、本機械学習システム10では、「店舗」の実体の確率分布から、毎回異なる店舗の実体(を表すデータ)を生成することができる。なお、「店舗状況」の実体の確率分布は、時間軸方向で店舗や人(主に人)を生成、制御するための確率分布であり、後述するスライドバー等によってユーザが手動で(若しくは自動的に)調整パラメータを変動させることで変動し、これにより、今以降の「店舗状況」の実体が変化する。図4に示される応用環境の3DCGフレーム画像31は、上記の「店舗」、「人」、「店舗状況」の各構成要素の実体に基づいて生成されたものである。 In this machine learning system 10, for example, for the component of "person", each time a different person's entity (data representing) is calculated from the probability distribution of the entity of "person" (according to the probability distribution of the entity of "person"). can be generated. Furthermore, in this machine learning system 10, it is possible to generate (data representing) different store entities each time from the probability distribution of the "store" entities. The probability distribution of the entity of "store status" is a probability distribution for generating and controlling stores and people (mainly people) in the time axis direction, and can be manually (or automatically) created by the user using the slide bar described later. ) by changing the adjustment parameters, and as a result, the substance of the "store situation" from now on will change. The 3DCG frame image 31 of the application environment shown in FIG. 4 is generated based on the entities of the above-mentioned "store", "person", and "store situation" components.
上記S1の応用環境のベースの構築には、人の3Dモデル、店舗の実体を再現するための様々なテクスチャ等の3DCGで作成した各種の画像の素材、及び各種の統計データ(例えば、あるドラッグストアのある地域における統計データ)等のデータの上記の応用環境生成素材保存部11への格納処理も含まれる。 To build the base of the application environment in S1 above, we used various image materials created with 3DCG, such as a 3D model of a person, various textures to reproduce the actual store, and various statistical data (for example, a drug This also includes processing for storing data such as statistical data for the area where the store is located in the applied environment generation material storage section 11 described above.
上記S1の応用環境のベースの構築処理が終了すると、第1回目の応用環境の実体の生成処理では、図5に示すように、ユーザUが、入力操作部5を用いて、応用環境を変動させる(調整する)ための調整パラメータを、所定の値(例えば、その店舗(応用環境)の売り上げ、顧客層、顧客動向等の分析結果と、その地域の店舗についての統計データに基づく調整パラメータの値)に設定して、応用環境の生成を指示すると、応用環境生成部21は、応用環境をデフォルト値から変更し、変更後の応用環境の実体(正確に言うと、変更後の応用環境の実体(店舗状況の実体)の時系列に沿ったコンピュータ・シミュレーション結果のデータ)を生成する(S2)。 When the application environment base construction process in S1 is completed, in the first application environment entity generation process, the user U uses the input operation unit 5 to change the application environment. (adjust) the adjustment parameters based on predetermined values (for example, the results of analysis of sales, customer demographics, customer trends, etc. of the store (application environment) and the statistical data about stores in the area). value) and instructs generation of an application environment, the application environment generation unit 21 changes the application environment from the default value and creates the entity of the changed application environment (to be more precise, the application environment after change). Data of computer simulation results along the time series of the entity (the entity of the store situation) is generated (S2).
より詳細に言うと、まず、ユーザUが、入力操作部5(マウス等)を用いて、後述するスライドバーにより調整パラメータを所定の値に設定することにより、図4で説明した「店舗」のパラメータのうち、いくつかのパラメータの設定をする(初期値(デフォルト値)から変更する)。すると、応用環境生成部21は、応用環境生成素材保存部11に格納された統計データに基づき、上記の設定済のパラメータの値を考慮して、他の未設定のパラメータの設定を行う(パラメータをデフォルト値から変更する)ことにより、上記の設定済のパラメータの値に応じた「店舗」、「人」、「店舗状況」の実体の確率分布を生成する。 More specifically, first, the user U uses the input operation unit 5 (mouse, etc.) to set adjustment parameters to predetermined values using a slide bar, which will be described later. Set some of the parameters (change from the initial value (default value)). Then, the application environment generation unit 21 sets other unset parameters based on the statistical data stored in the application environment generation material storage unit 11 and takes into account the values of the parameters that have already been set. is changed from the default value) to generate the probability distribution of the entities "store", "person", and "store status" according to the values of the above-mentioned already set parameters.
具体的には、ユーザUが、入力操作部5(マウス等)を用いて、後述するスライドバーにより調整パラメータを所定の値に設定することによって、店舗の広さ等のパラメータの調整(設定)をすると、応用環境生成部21は、設定済の店舗の広さ等のパラメータのレベルに応じて、例えば、天井の高さ、カメラ数等の未設定のパラメータを、応用環境生成素材保存部11に格納された統計データ(主に、確率分布で表されるデータ)に基づき設定して、図5に示す「店舗」の実体の確率分布32を生成する。 Specifically, the user U uses the input operation unit 5 (mouse, etc.) to adjust (set) parameters such as the size of the store by setting adjustment parameters to predetermined values using a slide bar described later. Then, the applied environment generation unit 21 saves unset parameters such as the height of the ceiling and the number of cameras to the applied environment generation material storage unit 11 according to the level of parameters such as the size of the store that have already been set. The probability distribution 32 of the "store" entity shown in FIG. 5 is generated based on the statistical data (mainly data expressed as a probability distribution) stored in the store.
また、ユーザUが、入力操作部5を用いて、スライドバーにより調整パラメータを所定の値に設定することによって、図4に示す混雑度、性別分布、年齢分布、行動特性分布等のパラメータの調整(設定)をすると、応用環境生成部21は、上記の設定済の混雑度、性別分布、年齢分布、行動特性分布等のパラメータのレベルに応じて、(未設定の)平均顧客滞在時間分布のパラメータを、応用環境生成素材保存部11に格納された統計データに基づき設定して、図5に示す「店舗状況」の実体の確率分布33を生成する。この「店舗状況」の実体の確率分布33に従って、応用環境生成部21は、人の生成(入店)・削除(退店)等のタイミング(時刻)の決定や、人を生成する場合における性別・年齢の決定を行う。より詳細に言うと、応用環境生成部21は、「店舗状況」の実体の確率分布に含まれる混雑度及び平均顧客滞在時間分布のパラメータに基づいて、図5に示されるように、人の生成(入店)・削除(退店)等の時刻を決定し、性別分布及び年齢分布に基づいて、図5に示されるように、生成する人の性別及び年齢を決定し、行動特性分布に基づいて、生成した人に適当な行動を割り当てる。 In addition, the user U uses the input operation unit 5 to set adjustment parameters to predetermined values using a slide bar, thereby adjusting parameters such as the degree of crowding, gender distribution, age distribution, behavioral characteristic distribution, etc. shown in FIG. When (setting) is performed, the applied environment generation unit 21 generates the (unset) average customer stay time distribution according to the levels of the parameters such as the congestion level, gender distribution, age distribution, behavioral characteristic distribution, etc. that have already been set. The parameters are set based on the statistical data stored in the applied environment generation material storage unit 11, and the probability distribution 33 of the "store situation" entity shown in FIG. 5 is generated. According to the probability distribution 33 of this "store situation" entity, the applied environment generation unit 21 determines the timing (time) of generating (entering) and deleting (exiting) a person, and determines the gender and gender of the person when generating the person.・Determine age. More specifically, the applied environment generation unit 21 generates people as shown in FIG. (entering the store), deletion (leaving the store), etc., determine the gender and age of the person to be generated, as shown in Figure 5, based on the gender distribution and age distribution, and assign appropriate actions to the generated person.
また、応用環境生成部21は、上記の「店舗状況」の実体の確率分布33に従って(設定済みの「店舗状況」の各パラメータに従って)、図4に示される「人」のパラメータのうち、未決定のパラメータ(性別、年齢、行動特性以外のパラメータ)を、応用環境生成素材保存部11に格納された統計データ等のデータに基づき設定して、「人」の実体の確率分布を生成する。なお、図5に示す「人」の実体の確率分布34は、応用環境生成部21が「店舗状況」の実体の確率分布33に従って生成した「年齢=30代、性別=女性」の人の実体の確率分布である。 Further, the applied environment generation unit 21 selects the unused parameters of the "person" shown in FIG. Determination parameters (parameters other than gender, age, and behavioral characteristics) are set based on data such as statistical data stored in the applied environment generation material storage unit 11, and a probability distribution of the "person" entity is generated. Note that the probability distribution 34 of the "person" entity shown in FIG. is the probability distribution of
次に、応用環境生成部21は、上記の「店舗」、「人」、「店舗状況」の構成要素の実体の確率分布32~34に基づいて、店舗状況の実体(応用環境の実体)の時系列に沿ったコンピュータ・シミュレーション結果のデータ(店舗で顧客(又は店員及び顧客)が行動する時系列の情報)(上記の応用環境実体情報)を生成する。このコンピュータ・シミュレーション結果のデータには、応用環境生成素材保存部11から読み込んだ、人の3Dモデル(3DCGで作成した人の画像のモデル)、この応用環境における店舗の実体を再現するための様々なテクスチャ等の3DCGで作成した画像データが含まれる。なお、上記の店舗状況の実体(の時系列に沿ったコンピュータ・シミュレーション結果のデータ)は、「店舗」、「人」、「店舗状況」の実体の確率分布32~34から生成したものであるため、ランダム要素が入り込む。要するに、応用環境生成部21は、調整パラメータの値が全く同じであって、「店舗」、「人」、「店舗状況」の実体の確率分布32~34が同じであっても、これらの確率分布32~34から、毎回異なる店舗や人の実体を生成する。 Next, the applied environment generation unit 21 generates the store situation entity (applied environment entity) based on the probability distributions 32 to 34 of the entities of the components of “store”, “person”, and “store situation”. Time-series computer simulation result data (time-series information on the actions of customers (or clerks and customers) in the store) (the above-mentioned applied environment entity information) is generated. This computer simulation result data includes a 3D model of a person (a model of a human image created with 3DCG) read from the applied environment generation material storage unit 11, and various models for reproducing the actual store in this applied environment. Contains image data created with 3DCG, such as textures. The above store situation entities (data of computer simulation results along the time series) are generated from the probability distributions 32 to 34 of the entities "store", "person", and "store situation". Therefore, random elements are introduced. In short, even if the values of the adjustment parameters are exactly the same and the probability distributions 32 to 34 of the entities ``store'', ``person'', and ``store situation'' are the same, the applied environment generation unit 21 calculates these probabilities. From the distributions 32 to 34, different stores and people are generated each time.
次に、図6(a)(b)(c)を参照して、上記の「店舗状況」の実体の確率分布を調整(変更)するためのスライドバーについて、説明する。ここでは、デフォルト(初期状態)の「店舗状況」の実体の確率分布が、その店舗の売り上げ、顧客層、顧客動向等の分析結果と、その地域の店舗についての統計データに基づくものであったと想定する。図6(a)は、そのデフォルトの「店舗状況」の実体の確率分布の例を示す。ただし、図6(a)及び(c)では、「店舗状況」の実体の確率分布を構成するパラメータ(評価軸)が、性別分布と年齢分布だけであると仮定した場合における、デフォルトの「店舗状況」の実体の確率分布の例を示している。図6(a)及び(c)におけるグラフ40a,40b,40c,40dは、各年代・性別の人物の出現確率分布を示す。 Next, with reference to FIGS. 6(a), 6(b), and 6(c), a slide bar for adjusting (changing) the probability distribution of the above-mentioned "store status" entity will be described. Here, the actual probability distribution of the default (initial state) "store status" is based on the analysis results of the store's sales, customer base, customer trends, etc., and statistical data about stores in the area. Suppose. FIG. 6(a) shows an example of the probability distribution of the default "store status" entity. However, in Figures 6(a) and (c), the default "store status" is assumed to be the only parameters (evaluation axes) that constitute the probability distribution of the "store status" entity: the gender distribution and the age distribution. It shows an example of the probability distribution of the entity ``Situation''. Graphs 40a, 40b, 40c, and 40d in FIGS. 6A and 6C show appearance probability distributions of people of each age and gender.
デフォルトの「店舗状況」の実体(本例では人物出現)の確率分布が、図6(a)に示す確率分布であった場合に、ユーザUが、入力操作部5(マウス等)を用いて、図6(b)に示す性別分布の調整用のスライドバー41と、年齢分布の調整用のスライドバー42とを、図6(b)中のそれぞれの矢印の方向にスライドさせることにより、ベクトル形式で表される調整パラメータを設定する。これにより、調整パラメータは、例えば、[0.9,0.0,・・・]のようなベクトルになる。このベクトルにおける最初の要素(0.9)は、スライドバー41により調整された女性度を表し、2番目の要素(0.0)は、スライドバー42により調整された老い度(老化度)を表す。 If the probability distribution of the default "store situation" entity (in this example, the appearance of a person) is the probability distribution shown in FIG. , by sliding the slide bar 41 for adjusting the gender distribution and the slide bar 42 for adjusting the age distribution shown in FIG. 6(b) in the direction of the respective arrows in FIG. 6(b), the vector Set the tunable parameters expressed in the format. Thereby, the adjustment parameter becomes a vector such as [0.9, 0.0, . . . ], for example. The first element (0.9) in this vector represents the femininity level adjusted by the slide bar 41, and the second element (0.0) represents the senility level adjusted by the slide bar 42. represent.
上記のスライドバー41とスライドバー42とを用いた調整パラメータの設定(調整)により、図6(a)に示す(デフォルトの)「店舗状況」の実体の確率分布が、図6(c)に示すように変化する。すなわち、図6(c)における破線で示すグラフ40a,40b,40c,40dが、それぞれ、実線で示すグラフ43a,43b,43c,43dに変化して、図6(c)中の黒い矢印で示すように、女性の割合が増大すると共に、図6(c)中の白い矢印で示すように、若者の割合が増大する。なお、4次元以上の軸は表示できないため、上記図6(a)及び(c)には記載できていないが、「店舗状況」の実体の確率分布の軸には、「平均顧客滞在時間分布」、「行動特性分布」(図4参照)等の軸もあり、これらの軸(評価軸)に基づく頻度分布によって、「店舗状況」の実体の確率分布が表現され、この確率分布に従って、店舗内の人がコントロールされる(人の生成(入店)・削除(退店)等のタイミング(時刻)の決定や、人の性別及び年齢の決定や、行動の割り当てが行われる)。上記のように、デフォルトの「店舗状況」の実体の確率分布を構成する各パラメータ(評価軸)の値に、スライドバーで設定した調整パラメータを構成する各要素の値(例えば、上記の[0.9,0.0,・・・]のベクトルを構成する0.9,0.0の値)を乗じることにより、応用環境の実体(「店舗状況」の実体)の確率分布を変更(変動)させることができる。 By setting (adjusting) the adjustment parameters using the slide bar 41 and the slide bar 42 described above, the probability distribution of the entity of the (default) "store situation" shown in FIG. 6(a) is changed to the one shown in FIG. 6(c). Change as shown. That is, graphs 40a, 40b, 40c, and 40d indicated by broken lines in FIG. 6(c) change to graphs 43a, 43b, 43c, and 43d indicated by solid lines, respectively, as indicated by black arrows in FIG. 6(c). As the proportion of women increases, the proportion of young people also increases, as shown by the white arrow in FIG. 6(c). Although it is not shown in Figures 6(a) and (c) above because it is not possible to display axes with four or more dimensions, the axis of the probability distribution of the entity "Store status" includes "Average customer stay time distribution". There are also axes such as "", "behavioral characteristic distribution" (see Figure 4), etc., and the frequency distribution based on these axes (evaluation axes) represents the probability distribution of the "store situation" entity, and according to this probability distribution, the store The people inside are controlled (the timing (time) of creating (entering) and deleting (exiting) people, etc., determining the gender and age of people, and assigning actions). As mentioned above, the value of each parameter (evaluation axis) that makes up the probability distribution of the entity of the default "store status" is changed to the value of each element that makes up the adjustment parameter set with the slide bar (for example, [0 .9, 0.0, ...]), the probability distribution of the entity of the application environment (the entity of "store situation") is changed (variation ) can be made.
図7は、上記図6(b)で説明したスライドバーの機能を組み込んだ調整パラメータ設定画面50の例を示す。この調整パラメータ設定画面50は、ディスプレイ4に表示される。調整パラメータ設定画面50は、右側に、調整パラメータ設定欄51が設けられており、左側に、各カメラの撮影画像64が表示されている。各カメラの撮影画像64は、ユーザUが、入力操作部5(マウス等)を用いて、調整パラメータ設定欄51に設けられた各スライドバーを調整することにより、変化する。図7の調整パラメータ設定欄51に設けられた各スライドバーは、あくまでも、例であるが、人(顧客)に関わる「店舗状況」のパラメータの調整用のスライドバー欄52と、「店舗」のパラメータの調整用のスライドバー欄53と、店舗タイプ変更欄54とから構成されている。 FIG. 7 shows an example of an adjustment parameter setting screen 50 incorporating the slide bar function described in FIG. 6(b) above. This adjustment parameter setting screen 50 is displayed on the display 4. The adjustment parameter setting screen 50 has an adjustment parameter setting column 51 on the right side, and images 64 taken by each camera are displayed on the left side. The captured image 64 of each camera changes when the user U adjusts each slide bar provided in the adjustment parameter setting field 51 using the input operation unit 5 (mouse or the like). The slide bars provided in the adjustment parameter setting column 51 in FIG. 7 are just examples; a slide bar column 52 for adjusting parameters of "store status" related to people (customers), and a slide bar column 52 for adjusting parameters of "store status" related to people (customers); It consists of a slide bar field 53 for parameter adjustment and a store type change field 54.
上記の人(顧客)に関わる「店舗状況」のパラメータの調整用のスライドバー欄52は、顧客数調整スライドバー55、若年層比率調整スライドバー56(0~29歳の人の比率調整用のスライドバー)、中壮年層比率調整スライドバー57(30~59歳の人の比率調整用のスライドバー)、女性比率調整スライドバー58、及び顧客行動バラエティ度調整スライドバー59から構成されている。上記の顧客数調整スライドバー55は、図4中の「混雑度」の調整用のスライドバーである。上記の若年層比率調整スライドバー56と中壮年層比率調整スライドバー57は、図4中の「年齢分布」の調整用のスライドバーである。 The slide bar column 52 for adjusting the parameters of "store status" related to the above people (customers) has a slide bar 55 for adjusting the number of customers, a slide bar 56 for adjusting the proportion of young people (for adjusting the proportion of people aged 0 to 29), (slide bar), middle-age group ratio adjustment slide bar 57 (slide bar for ratio adjustment of people aged 30 to 59), female ratio adjustment slide bar 58, and customer behavior variety adjustment slide bar 59. The customer number adjustment slide bar 55 described above is a slide bar for adjusting the "degree of congestion" in FIG. 4. The young age group ratio adjustment slide bar 56 and middle-aged age group ratio adjustment slide bar 57 described above are slide bars for adjusting the "age distribution" in FIG. 4.
上記の「店舗」のパラメータの調整用のスライドバー欄53は、カメラ数調整スライドバー60、広さ調整スライドバー61、照明強さ調整スライドバー62、及び商品在庫量調整スライドバー63から構成されている。上記のカメラ数調整スライドバー60、広さ調整スライドバー61、照明強さ調整スライドバー62は、それぞれ、図4中の「カメラ数」、「広さ」、「照明」の「強さ」の調整用のスライドバーである。 The slide bar column 53 for adjusting the parameters of the above-mentioned "store" is composed of a camera number adjustment slide bar 60, a width adjustment slide bar 61, a lighting intensity adjustment slide bar 62, and a product inventory amount adjustment slide bar 63. ing. The camera number adjustment slide bar 60, width adjustment slide bar 61, and illumination intensity adjustment slide bar 62 are used to adjust the “number of cameras,” “width,” and “intensity” of “illumination” in FIG. 4, respectively. This is a slide bar for adjustment.
上記の店舗タイプ変更欄54は、店舗タイプの選択用のウィンドウである。また、調整パラメータ設定画面50の右下には、店舗内全体を上方から見た画像65が表示される。 The above store type change field 54 is a window for selecting a store type. Further, at the lower right of the adjustment parameter setting screen 50, an image 65 of the entire store interior viewed from above is displayed.
次に、図3のフローチャートに戻って、上記S2で説明した応用環境実体情報の生成処理後の処理について、説明する。CPU2のデータセット生成部22は、上記S2で生成した現在の応用環境実体情報に対応するテスト用データセットを生成する(S3)。具体的には、データセット生成部22は、応用環境生成部21が生成した応用環境実体情報(応用環境の実体(店舗状況の実体)の時系列に沿ったコンピュータ・シミュレーション結果のデータ)に基づいて、図8に示すように、(応用環境である店舗に配された)各カメラの時系列に沿ったフレーム画像の生成処理と、これらのフレーム画像へのアノテーション処理とを行う。そして、データセット生成部22は、生成した各フレーム画像(例えば、第1カメラで撮影したフレーム画像71)と、このフレーム画像のアノテーション情報(に関するXMLファイル)73とを紐づけて、これらのデータをテスト用データとして、データセット保存部12におけるテスト用データセットに保存する。 Next, returning to the flowchart of FIG. 3, the processing after the application environment entity information generation processing described in S2 above will be described. The data set generation unit 22 of the CPU 2 generates a test data set corresponding to the current application environment entity information generated in S2 (S3). Specifically, the data set generation unit 22 generates data based on the application environment entity information (data of computer simulation results along the time series of the application environment entity (store situation entity)) generated by the application environment generation unit 21. Then, as shown in FIG. 8, processing is performed to generate frame images in chronological order from each camera (disposed in a store, which is an application environment), and annotation processing is performed on these frame images. Then, the dataset generation unit 22 associates each generated frame image (for example, the frame image 71 photographed with the first camera) with the annotation information (an XML file related to it) 73 of this frame image, and generates these data. is stored as test data in a test data set in the data set storage unit 12.
本実施形態の場合は、上記の各フレーム画像のアノテーション情報は、各フレーム画像中における人についてのアノテーション情報である。なお、図8のフレーム画像71についてのアノテーション情報の座標における100,110と200,300とは、それぞれ、フレーム画像71中の人のバウンディングボックス74における左上の端点のx座標、y座標と、右下の端点のx座標、y座標とを表す。また、アノテーション情報におけるIDは、カメラ間を通して、同一人物にふられるIDである。上記の各フレーム画像における人は、データセット生成部22自体が上記の応用環境実体情報から生成したものであるので、データセット生成部22は、応用環境実体情報に基づいて、各フレーム画像における人についての正確なアノテーション情報を生成することができる。 In the case of this embodiment, the annotation information of each frame image described above is annotation information about a person in each frame image. Note that 100, 110 and 200, 300 in the coordinates of the annotation information regarding the frame image 71 in FIG. Represents the x and y coordinates of the lower end point. Further, the ID in the annotation information is an ID assigned to the same person throughout the cameras. The person in each frame image described above is generated by the dataset generation unit 22 itself from the applied environment entity information, so the dataset generation unit 22 generates the person in each frame image based on the applied environment entity information. It is possible to generate accurate annotation information about
上記S3のテスト用データセットの生成処理が済むと、CPU2の制御部20は、応用環境生成部21とデータセット生成部22とを用いて、現在の応用環境における各構成要素の実体の確率分布に対応する学習用データセットの生成処理を行う(S4)。具体的には、第1回目の学習用データセットの生成処理では、応用環境生成部21の学習用生成部27が、上記S2で生成した店舗の実体の確率分布32a(図9参照)と人の実体の確率分布76a(図9参照)とから、店舗の実体を一つと人物の実体を一つ以上(図9では1名)選択する処理と、選択した店舗の実体及び人の実体にランダムノイズ(正規分布するノイズ)を加えて、複数パターンの店舗の実体及び人の実体を生成する処理とを繰り返す。そして、データセット生成部22は、上記のランダムノイズを加えて生成した複数パターンの店舗と人の実体から、種々のパターンの学習用画像とそのアノテーションデータとを含む学習用データセットを生成する。このように、店舗と人の実体の各々にランダムノイズを加えて複数パターンの店舗と人の実体を生成して、これらの実体に基づいて種々のパターンの学習用画像(フレーム画像)を描画する理由は、生成した学習用データセットにおける学習用データの充分な分布を保証するためである。 After the test data set generation process in S3 is completed, the control unit 20 of the CPU 2 uses the application environment generation unit 21 and the data set generation unit 22 to generate a probability distribution of the entity of each component in the current application environment. A process of generating a learning data set corresponding to (S4) is performed. Specifically, in the first training data set generation process, the learning generation unit 27 of the applied environment generation unit 21 uses the probability distribution 32a (see FIG. 9) of the store entity generated in S2 above and the human A process of selecting one store entity and one or more person entities (one person in FIG. 9) from the entity probability distribution 76a (see FIG. 9), and randomly selecting the selected store entity and person entity. The process of adding noise (normally distributed noise) and generating multiple patterns of store entities and human entities is repeated. Then, the dataset generation unit 22 generates a learning dataset including various patterns of learning images and their annotation data from the plurality of patterns of stores and human entities generated by adding the above random noise. In this way, random noise is added to each of the store and person entities to generate multiple patterns of store and person entities, and various patterns of learning images (frame images) are drawn based on these entities. The reason is to ensure sufficient distribution of training data in the generated training data set.
より詳細に言うと、学習用生成部27は、上記の選択した店舗の実体における、レンズパラメータ、カメラの位置・向き、店内テクスチャ(壁・床・棚等のテクスチャ)の色、棚の陳列物等の素材、照明の強さ・色・光線方向・陰影等にランダムノイズを加えたもの(店舗の実体)を複数パターン生成すると共に、上記の選択した人の実体における、人の向き、手足の状態、服や肌のテクスチャ、各種の素材等にランダムノイズを加えた人(の実体)を複数パターン生成する。データセット生成部22は、これらの複数パターンの人(の実体)の各々を上記の複数パターンの店舗の実体の各々に配置し、店舗の実体内に配置されたカメラから入力したフレーム画像として描画する(例えば図9の78,及び79)処理と、これらのフレーム画像へのアノテーションデータ生成処理とを行って、種々のパターンの学習用データを含む学習用データセットを生成する。これにより、データセット生成部22により生成される学習用データセットを構成する各学習用画像は、応用環境生成部21により生成された、ランダムノイズを加えた店舗と人の実体の各々に基づいて描画した画像となる。図9に示すように、データセット生成部22は、生成した学習用データセットを、データセット保存部12に格納する。 More specifically, the learning generation unit 27 generates the lens parameters, the position and orientation of the camera, the color of the store texture (texture of walls, floors, shelves, etc.), and the items displayed on the shelves in the selected store entity. In addition to generating multiple patterns (the actual store) by adding random noise to the material, lighting intensity, color, light direction, shadow, etc. Generate multiple patterns of people (substances) by adding random noise to the state, texture of clothes and skin, various materials, etc. The dataset generation unit 22 arranges each of these multiple patterns of people (entities) in each of the multiple patterns of store entities described above, and draws them as a frame image input from a camera placed inside the store entity. (for example, 78 and 79 in FIG. 9) and annotation data generation processing for these frame images are performed to generate a learning data set including learning data of various patterns. As a result, each learning image constituting the learning data set generated by the data set generation unit 22 is generated based on each of the stores and people generated by the applied environment generation unit 21, with random noise added. It becomes a drawn image. As shown in FIG. 9, the dataset generation unit 22 stores the generated learning dataset in the dataset storage unit 12.
このため、学習用データセットを構成する各学習用画像は、図8に示すテスト用データセット内の同じカメラが撮影した連続したフレーム画像(例えば、第1カメラが撮影した連続したフレーム画像68a,68b,68c、及び第2カメラが撮影した連続したフレーム画像69a,69b,69c)と異なり、(学習用データセットへの格納順が)一つ前の学習用画像における店舗と若干異なる(一つ前の学習用画像における店舗をアレンジした)店舗における、一つ前の学習用画像における人と若干異なる(一つ前の学習用画像における人をアレンジした)人の画像になる。すなわち、図9における(格納順が)連続した学習用画像78、79のように、相互に異なる店舗の画像78a、79aと、相互に異なる人の画像78b、79bとを組み合わせた画像になる。 Therefore, each of the learning images constituting the learning data set is a continuous frame image taken by the same camera in the test data set shown in FIG. 68b, 68c, and the consecutive frame images 69a, 69b, 69c taken by the second camera), the order of storage in the training data set is slightly different from that of the store in the previous training image (one This is an image of a person in a store (an arrangement of the store in the previous learning image) that is slightly different from the person in the previous learning image (an arrangement of the person in the previous learning image). That is, the image is a combination of images 78a and 79a of mutually different stores and images 78b and 79b of mutually different people, like the consecutive learning images 78 and 79 (in the order of storage) in FIG.
なお、第2回目以降の学習用データセットの生成処理においては、応用環境生成部21の学習用生成部27が、前回の推論結果を検証した結果判明した学習用データの偏りを減少させるように、応用環境における店舗の実体の確率分布32aや人の実体の確率分布76aを変更させて、変更後の店舗の実体の確率分布32bと人の実体の確率分布76bとから、店舗の実体と人の実体を選択して、店舗と人の実体を生成する点が異なる。ただし、この第2回目以降の学習用データセットの生成処理の詳細については、説明の都合上、後述する。 In addition, in the second and subsequent training data set generation processing, the learning generation unit 27 of the application environment generation unit 21 reduces the bias of the learning data found as a result of verifying the previous inference results. , the probability distribution 32a of the store entity and the probability distribution 76a of the human entity in the applied environment are changed, and the store entity and the person are determined from the changed probability distribution 32b of the store entity and the probability distribution 76b of the human entity. The difference is that the entities of stores and people are generated by selecting entities. However, details of the second and subsequent training data set generation processing will be described later for convenience of explanation.
上記S4の学習用データセットの生成処理が済むと、CPU2の制御部20は、各推論用のDNNモデルのディープラーニングを行うように、学習部23に指示する。これに応じて、学習部23は、上記S4で生成した学習用データセットを用いて、人検出、特徴検出(ベクトル化)、追跡、及びReIDの各推論用DNNモデルのディープラーニングを行うことによって、これらの推論用の学習済DNNモデルを生成する(S5)。より詳細に言うと、学習部23は、図10に示すように、学習対象の各推論用DNNモデルを、DNNモデル保存部13から読み出してメモリ上にロードし、上記S4で生成した学習用データセット(の各学習用データ中の学習用画像81とアノテーション情報82(請求項における「アノテーションデータ」))を用いて、これらの推論用のDNNモデルのディープラーニングを行った後、これらの推論用の学習済DNNモデルを、DNNモデル保存部13にセーブ(保存)する(図10のS11)。なお、図10における人検出、特徴検出(ベクトル化)、追跡、及びReIDの各DNNモデルは、ReIDに最低限必要なモデル群であり、上記のディープラーニングの対象になる推論用DNNモデルには、性別判定用や年齢判定用のDNNモデルが含まれていてもよい。 When the training data set generation process in S4 is completed, the control unit 20 of the CPU 2 instructs the learning unit 23 to perform deep learning of each inference DNN model. In response to this, the learning unit 23 performs deep learning on the DNN models for human detection, feature detection (vectorization), tracking, and ReID inference using the learning data set generated in S4 above. , a trained DNN model for these inferences is generated (S5). More specifically, as shown in FIG. 10, the learning unit 23 reads each inference DNN model to be learned from the DNN model storage unit 13, loads it onto the memory, and uses the learning data generated in S4 above. After performing deep learning of the DNN model for these inferences using the set (the learning image 81 and annotation information 82 ("annotation data" in the claims) in each training data of The learned DNN model is saved in the DNN model storage unit 13 (S11 in FIG. 10). The human detection, feature detection (vectorization), tracking, and ReID DNN models in Figure 10 are the minimum required model group for ReID, and the inference DNN models that are subject to the above deep learning are , a DNN model for gender determination and age determination may be included.
上記S5で説明した人検出、特徴検出(ベクトル化)、追跡、及びReIDの学習済DNNモデルの生成処理が終了すると、CPU2の制御部20は、図11の処理に移って、上記の各学習済DNNモデルによる推論処理を行うように、推論部24に指示する。これに応じて、推論部24は、まず、上記S5で生成された人検出、特徴検出(ベクトル化)、追跡、及びReIDの学習済DNNモデルを、DNNモデル保存部13から読み出してメモリ上にロードする(図11のS21)。そして、推論部24は、上記S3で生成されたテスト用データセットに含まれるテスト用画像(例えば、図11中のテスト用画像80)を、上記S5で生成された人検出、特徴検出(ベクトル化)、追跡、及びReIDの学習済DNNモデル群に入力して、テスト用画像中の人に対する、各学習済DNNモデルによる推論処理を実行し、この推論結果を推論結果保存部14に保存する(図3のS6)。 When the human detection, feature detection (vectorization), tracking, and ReID trained DNN model generation processing described in S5 above are completed, the control unit 20 of the CPU 2 moves to the processing shown in FIG. The inference unit 24 is instructed to perform inference processing using the established DNN model. In response to this, the inference unit 24 first reads out the trained DNN models for person detection, feature detection (vectorization), tracking, and ReID generated in S5 above from the DNN model storage unit 13 and stores them on the memory. Load (S21 in FIG. 11). Then, the inference unit 24 uses the test image (for example, the test image 80 in FIG. 11) included in the test data set generated in S3 above to perform the person detection and feature detection (vector detection) generated in S5 above. ), tracking, and ReID to the learned DNN model group, execute inference processing using each learned DNN model for the person in the test image, and save this inference result in the inference result storage unit 14. (S6 in Figure 3).
次に、図11中の各学習済DNNモデルについて説明する。これらの学習済DNNモデルのうち、人検出モデルは、入力されたフレーム画像(例えば、上記のテスト用画像80)中の人を検出する。特徴検出モデル(ベクトル化モデル)は、上記の人検出モデルによる人検出結果84(人物検出モデルで検出した人の切り抜き画像)に対してベクトル化処理を行って、そのベクトルを特徴検出結果85として、セーブ(記憶)する。追跡モデルは、同じカメラで撮影した各フレーム画像に映り込んだ人についての人検出結果84と、これらの人の画像についてのベクトル(特徴検出結果85)に基づいて、同じカメラで撮影した別のフレーム画像に映り込んだ人の画像間の類似度を求める。そして、この類似度に基づいて、これらの画像に映っていた人が、同じ人か否かを識別することにより、同じカメラによる撮影画像に映りこんだ人を追跡する(フレームを超えて同一人物に同一IDを付与することで、当該人物の移動を追跡する)。 Next, each trained DNN model in FIG. 11 will be explained. Among these trained DNN models, the person detection model detects people in the input frame image (for example, the test image 80 described above). The feature detection model (vectorization model) performs vectorization processing on the person detection result 84 (a cutout image of the person detected by the person detection model) by the above-mentioned person detection model, and uses the vector as the feature detection result 85. , save (memory). The tracking model is based on the person detection results 84 for people reflected in each frame image taken with the same camera and the vectors (feature detection results 85) for these people's images. The degree of similarity between images of people reflected in frame images is determined. Then, based on this degree of similarity, it is possible to identify whether or not the people in these images are the same person, thereby tracking the people in the images captured by the same camera (the same person can be traced across frames). (by assigning the same ID to the person, the movement of the person in question is tracked).
また、ReIDモデルは、各カメラで撮影した各フレーム画像に映り込んだ人についてのベクトル(特徴検出結果85)と、追跡モデルによる追跡結果86(同じカメラによる撮影画像に映りこんだ人についてのIDの付与結果)とに基づいて、カメラ間の人の同定処理を行って、異なるカメラで撮影したフレーム画像に映った人であっても、同じ人には、同じIDを付与する(IDをふり直す)。そして、ReIDモデルは、カメラ間を跨る各フレーム画像に映りこんだ人についての(ふり直した)IDの付与結果を、ReID結果87として出力する。推論部24は、上記の各学習済DNNモデルによる推論結果(人検出結果84、特徴検出結果85、追跡結果86、及びReID結果87)を、推論結果保存部14に格納する。 In addition, the ReID model uses vectors (feature detection results 85) for people captured in each frame image taken by each camera, and tracking results 86 by the tracking model (IDs for people captured in images taken by the same camera). The same ID is assigned to the same person even if the person appears in frame images taken with different cameras. fix). Then, the ReID model outputs, as a ReID result 87, the result of assigning an (re-assigned) ID to a person who appears in each frame image spanning between cameras. The inference unit 24 stores the inference results (person detection result 84, feature detection result 85, tracking result 86, and ReID result 87) by each of the trained DNN models described above in the inference result storage unit 14.
上記S6の各学習済DNNモデルによる推論処理が完了すると、CPU2の制御部20は、図12の処理に移って、上記の推論結果に基づいて、学習用データセットにおける学習用データの偏りの検証を行うように、検証部25に指示する。これに応じて、検証部25は、推論結果保存部14に格納された各学習済DNNモデルによる推論結果と、データセット保存部12に格納されたテスト用データセットに含まれるアノテーション情報73とから(テスト用画像中の人に対する各学習済DNNモデルの推論結果と各テスト用データのアノテーション情報73とを比較して)、現在の学習用データセットにおける学習用データの偏りを検証する(図3のS7)。より正確に言うと、検証部25は、上記の各学習済DNNモデルによる推論結果と、テスト用データセットに含まれるアノテーション情報73とから、現在の学習用データセットにおける学習用データの偏り、及び現在の各学習済DNNモデルによる推論精度が不十分なデータの種類を推定する。現在の各学習済DNNモデルによる推論精度が不十分なデータの種類があった場合には、図12に示すように、30代の人の誤検出が多いとか、向きが180°の人(後ろ姿の人)の誤検出が多いという結果になって表れる。ここで、上記の現在の各学習済DNNモデルによる推論精度が不十分なデータの種類については、この種類の学習用データが不足していると考えられる。このような特定の種類の学習用データの不足も、一種の学習用データの偏りと捉えることができる。従って、上記の検証部25による検証処理は、全体として、現在の学習用データセットにおける学習用データの偏りの検証処理と考えることができる。 When the inference process using each trained DNN model in S6 is completed, the control unit 20 of the CPU 2 moves to the process in FIG. 12 to verify the bias of the learning data in the learning data set based on the above inference result. The verification unit 25 is instructed to perform the following. In response to this, the verification unit 25 uses the inference results by each trained DNN model stored in the inference result storage unit 14 and the annotation information 73 included in the test dataset stored in the data set storage unit 12. (Compare the inference results of each trained DNN model for the person in the test image with the annotation information 73 of each test data) to verify the bias of the training data in the current training data set (Figure 3 S7). To be more precise, the verification unit 25 calculates the bias of the training data in the current training data set and Estimate the type of data for which the current inference accuracy of each trained DNN model is insufficient. If there are types of data for which the inference accuracy of the current trained DNN models is insufficient, as shown in Figure 12, there may be many false positives for people in their 30s, or people whose orientation is 180° (rear view This results in a high number of false positives for people (people). Here, regarding the types of data for which the inference accuracy of each of the current trained DNN models is insufficient, it is considered that this type of learning data is insufficient. This lack of specific types of learning data can also be considered as a type of bias in learning data. Therefore, the verification process by the verification unit 25 described above can be considered as a process for verifying the bias of the learning data in the current learning data set as a whole.
CPU2の制御部20は、上記S7の検証処理の結果、学習用データの偏りが所定のレベル以下の場合(各学習済DNNモデルが十分な精度を達成しており、調整パラメータの変更(調整)が不要の場合)は(S8でYES)、図3のフローチャートの処理を終了する。 The control unit 20 of the CPU 2 determines that, as a result of the verification process in S7, if the bias of the learning data is below a predetermined level (each trained DNN model has achieved sufficient accuracy, and the adjustment parameters are changed (adjusted)). is not necessary) (YES in S8), the process of the flowchart in FIG. 3 ends.
これに対して、上記S7の検証処理の結果、学習用データの偏りが所定のレベルを超える場合(偏りが十分に解消されていない場合)には(S8でNO)、CPU2の制御部20は、検証部25に、調整パラメータ変更用データの生成を指示する。これにより、検証部25は、図13に示すように、上記S7の検証で判明した学習用データの偏りを減少させるように、調整パラメータの値を変更させるためのデータ(調整パラメータ変更用データ)を生成して、推論結果保存部14に格納する。例えば、上記のように、30代の人の誤検出が多い場合には、30代の人の学習用データを増やすように、上記の調整パラメータ変更用データの設定を行う。また、向きが180°の人(後ろ姿の人)の誤検出が多い場合には、後ろ姿の人の(学習用画像を含む)学習用データを増やすように、上記の調整パラメータ変更用データの設定を行う。 On the other hand, as a result of the verification process in S7 above, if the bias in the learning data exceeds a predetermined level (the bias has not been sufficiently eliminated) (NO in S8), the control unit 20 of the CPU 2 , instructs the verification unit 25 to generate adjustment parameter change data. Thereby, as shown in FIG. 13, the verification unit 25 generates data (adjustment parameter change data) for changing the value of the adjustment parameter so as to reduce the bias of the learning data found in the verification of S7 above. is generated and stored in the inference result storage unit 14. For example, as described above, if there are many false detections for people in their 30s, the adjustment parameter change data described above is set so as to increase the learning data for people in their 30s. In addition, if there are many false detections of people whose orientation is 180° (people from behind), set the above adjustment parameter change data to increase the training data (including training images) of people from behind. I do.
CPU2の制御部20は、上記の調整パラメータ変更用データの生成処理の後、第2回目の学習用データセットの生成処理の準備に移る。第2回目以降の学習用データセットの生成処理においては、その準備処理として、応用環境生成部21の学習用生成部27が、上記の調整パラメータ変更用データを用いて、前回の推論結果を検証した結果判明した学習用データの偏りを減少させるように、調整パラメータを変更して、変更後の調整パラメータに基づき、応用環境における各構成要素(店舗及び人)の実体の確率分布を変更する(S9)。より具体的に言うと、図9に示すように、応用環境生成部21の学習用生成部27は、前回の応用環境生成時に生成した店舗の実体の確率分布32aと人の実体の確率分布76aに、上記の調整パラメータ変更用データを用いて変更した調整パラメータを乗じることにより、応用環境における店舗及び人の実体の確率分布を変更する。 After the adjustment parameter change data generation process described above, the control unit 20 of the CPU 2 moves to preparation for the second learning data set generation process. In the second and subsequent training dataset generation processes, as a preparatory process, the learning generation unit 27 of the application environment generation unit 21 verifies the previous inference results using the above adjustment parameter change data. In order to reduce the bias in the learning data found as a result of S9). More specifically, as shown in FIG. 9, the learning generation unit 27 of the applied environment generation unit 21 generates the probability distribution 32a of the store entity and the probability distribution 76a of the human entity generated during the previous application environment generation. is multiplied by the adjustment parameter changed using the adjustment parameter change data described above, thereby changing the probability distribution of stores and people in the application environment.
この後、CPU2の制御部20は、上記S4の処理に戻って、上記の変更後の店舗及び人の実体の確率分布に対応する学習用データセットを、データセット生成部22により生成して、この学習用データセット内の学習用データに基づき、更新後の学習用データセットを生成するように制御する(S4)。すなわち、第2回目の学習用データセットの生成処理を行う。 Thereafter, the control unit 20 of the CPU 2 returns to the process of S4, and causes the data set generation unit 22 to generate a learning dataset corresponding to the changed probability distribution of the stores and people. Control is performed to generate an updated learning data set based on the learning data in this learning data set (S4). That is, the second learning data set generation process is performed.
具体的には、制御部20は、まず、応用環境生成部21の学習用生成部27を用いて、上記の変更後の店舗の実体の確率分布32bと人の実体の確率分布76bとから、店舗の実体を一つと人の実体を一つ以上選択する処理と、選択した店舗と人の実体にランダムノイズを加えて複数パターンの店舗と人の実体を生成する処理とを繰り返す。そして、制御部20は、データセット生成部22を用いて、これらのランダムノイズを加えて生成した複数パターンの店舗の実体(図9中の店舗の画像78a、79aに相当)と人の実体(図9中の人の画像78b、79bに相当)に基づくフレーム画像の生成処理と、これらのフレーム画像へのアノテーション処理とを行って、変更後の店舗及び人の実体の確率分布に対応する学習用データセットを生成する。さらに、制御部20は、この新たに生成した学習用データセット内の学習用データを、前回生成した学習用データセットに追加して(又は、前回生成した学習用データセットにおける問題がある部分の学習用データを、新たに生成した学習用データセット内の学習用データに入れ替えて)、この新たに生成した学習用データセット内の学習用データを反映した学習用データセットを、更新後の学習用データセットとする。 Specifically, the control unit 20 first uses the learning generation unit 27 of the applied environment generation unit 21 to generate the probability distribution 32b of the store entity and the probability distribution 76b of the person entity after the above change. The process of selecting one or more store entities and one or more person entities, and the process of adding random noise to the selected store and person entities to generate multiple patterns of store and person entities are repeated. Then, the control unit 20 uses the data set generation unit 22 to generate multiple patterns of store entities (corresponding to store images 78a and 79a in FIG. 9) and human entities (corresponding to store images 78a and 79a in FIG. 9), which are generated by adding these random noises. By performing frame image generation processing based on the human images 78b and 79b in FIG. 9) and annotation processing on these frame images, learning corresponding to the probability distribution of the changed store and human entities is performed. Generate a dataset for Furthermore, the control unit 20 adds the learning data in the newly generated learning dataset to the previously generated learning dataset (or adds the learning data in the newly generated learning dataset to the problematic part of the previously generated learning dataset). (replace the training data with the training data in the newly generated training dataset), and then replace the training data set that reflects the training data in the newly generated training dataset with the updated training data. This is a data set for use.
上記の更新後の学習用データセットの生成処理が終了すると、CPU2の制御部20は、更新後の学習用データセットを用いて、学習部23により、上記の人検出、特徴検出(ベクトル化)、追跡、及びReIDの各推論用のDNNモデルのディープラーニングを行うことによって、現在の各推論用の学習済DNNモデルよりも精度の高い各推論用の学習済DNNモデルを生成するように制御する。そして、制御部20は、推論部24を用いて、上記の生成し直した各推論用の学習済DNNモデルに、上記S3で生成されたテスト用データセットに含まれるテスト用画像を入力して、テスト用画像中の人に対する、各推論用学習済DNNモデルによる推論処理を実行し、この推論結果を推論結果保存部14に保存する(S6)。この後、制御部20は、検証部25を用いて、上記S7の検証処理を行う。そして、制御部20は、上記S7の検証処理の結果、学習用データの偏りが所定のレベル以下(S8でYES)になるまで(各学習済DNNモデルが十分な精度を達成しており、調整パラメータの変更(調整)が不要になるまで)、上記S9、及びS4~S7の処理を繰り返す。 When the above-mentioned generation process of the updated learning data set is completed, the control unit 20 of the CPU 2 causes the learning unit 23 to perform the above-mentioned person detection and feature detection (vectorization) using the updated learning data set. By performing deep learning on the DNN model for each inference of , tracking, and ReID, control is performed to generate a trained DNN model for each inference that is more accurate than the current trained DNN model for each inference. . Then, the control unit 20 uses the inference unit 24 to input the test image included in the test data set generated in S3 above to the trained DNN model for each inference regenerated above. , performs inference processing using each inference trained DNN model for the person in the test image, and stores the inference results in the inference result storage unit 14 (S6). Thereafter, the control unit 20 uses the verification unit 25 to perform the verification process in S7 above. Then, as a result of the verification process in S7, the control unit 20 performs adjustment until the bias of the learning data becomes equal to or less than a predetermined level (YES in S8) (each trained DNN model has achieved sufficient accuracy, (until changing (adjusting) the parameters is no longer necessary), repeat the above steps S9 and S4 to S7.
上記のように、本実施形態の機械学習システム10によれば、学習用データの偏りを減少させるように、応用環境における各構成要素の実体の確率分布を変更させ、変更後の各構成要素の実体の確率分布(変更後の店舗の実体の確率分布32bや人の実体の確率分布76b)に対応する学習用データセットを生成して、この学習用データセット内の学習用データに基づき、更新後の学習用データセットを生成することができる。つまり、この更新後の学習用データセットは、学習用データセットにおける学習用データの偏りを減少させるように生成し直した学習用データセット内の学習用データを反映した学習用データセットである。従って、この更新後の学習用データセット内の学習用データには、偏りが少ないので、この更新後の学習用データセットを用いて上記各推論用のDNNモデルのディープラーニングを行うことにより、現在の各推論用の学習済DNNモデルよりも学習対象の確率分布を正確に再現することが可能な、精度の高い各推論用の学習済DNNモデルを生成することができる。 As described above, according to the machine learning system 10 of the present embodiment, the probability distribution of each component entity in the application environment is changed so as to reduce bias in learning data, and the probability distribution of each component entity after the change is A learning dataset corresponding to the probability distribution of the entity (probability distribution 32b of the store entity after change and probability distribution 76b of the human entity) is generated and updated based on the learning data in this learning dataset. A subsequent training dataset can be generated. In other words, this updated learning data set is a learning data set that reflects the learning data in the learning data set that has been regenerated so as to reduce the bias of the learning data in the learning data set. Therefore, the training data in this updated training dataset has little bias, so by performing deep learning on the DNN models for each of the above inferences using this updated training dataset, the current It is possible to generate a highly accurate trained DNN model for each inference that can more accurately reproduce the probability distribution of the learning target than the trained DNN model for each inference.
また、本実施形態の機械学習システム10によれば、応用環境生成部21(の学習用生成部27)が、上記の調整パラメータ変更用データに基づいて変更した調整パラメータの値に応じて、応用環境における各構成要素(店舗及び人)の実体の確率分布を変更し、この変更後の各構成要素の実体の確率分布に従い、同じ調整パラメータにおいて、毎回異なる各構成要素(店舗及び人)の実体を生成するようにした。これにより、これらの各構成要素(店舗及び人)の実体(の画像)から学習用データセットを生成することで、種々のパターンの学習用データを含む学習用データセットを生成することができる。 Further, according to the machine learning system 10 of the present embodiment, the application environment generation unit 21 (the learning generation unit 27 of the application environment generation unit 21) generates application Change the probability distribution of the entities of each component (stores and people) in the environment, and according to the probability distribution of the entities of each component after this change, the entities of each component (stores and people) that are different each time with the same adjustment parameters is now generated. Thereby, by generating a learning dataset from (images of) the entities of each of these components (stores and people), it is possible to generate a learning dataset including various patterns of learning data.
また、本実施形態の機械学習システム10によれば、学習用データセットを構成する各学習用画像を、応用環境における店舗と人の実体の確率分布から選択した店舗と人の実体に、ランダムノイズを加えて生成した複数パターンの店舗と人の実体に基づいて描画した画像とした。これにより、一組の店舗の実体(の画像)と人の実体(の画像)から、種々のパターンの学習用画像を得ることができるので、学習用データセットにおける学習用データの充分な分布を実現することができる。 Further, according to the machine learning system 10 of the present embodiment, each learning image constituting the learning data set is applied with random noise to store and human entities selected from the probability distribution of stores and human entities in the application environment. The image was drawn based on multiple patterns of stores and people generated by adding . As a result, it is possible to obtain various patterns of training images from a set of store entities (images) and human entities (images), so it is possible to obtain a sufficient distribution of learning data in the training dataset. It can be realized.
また、本実施形態の機械学習システム10によれば、ディープラーニングの対象になる推論用のDNNモデルには、複数のビデオカメラで撮影した各映像を構成する各フレーム画像における人の特徴量(ベクトル)に基づいて、異なるビデオカメラで撮影した人の同定を行う人物同定用のDNNモデル(ReIDのDNNモデル)が含まれるようにした。「発明が解決しようとする課題」の欄に記載したように、学習用データセットにおける学習用データの偏りに起因して、学習対象の確率分布を学習済DNNモデルで正確に再現することができないという問題は、ReID用の学習済DNNモデルにおいて特に顕著である。本実施形態の機械学習システム10によれば、学習用データセット内の学習用データの偏りを少なくすることができるので、この学習用データセットを用いてReID用のDNNモデルのディープラーニングを行うことにより、精度の高いReID用の学習済DNNモデルを生成することができる。 In addition, according to the machine learning system 10 of this embodiment, the DNN model for inference that is the target of deep learning includes human feature values (vector ), a DNN model for person identification (ReID DNN model) that identifies people photographed with different video cameras is included. As stated in the "Problem to be Solved by the Invention" column, due to bias in the training data in the training dataset, the probability distribution of the learning target cannot be accurately reproduced by the trained DNN model. This problem is particularly noticeable in the trained DNN model for ReID. According to the machine learning system 10 of this embodiment, it is possible to reduce the bias of the learning data in the learning dataset, so this learning dataset can be used to perform deep learning of the DNN model for ReID. As a result, a trained DNN model for ReID with high accuracy can be generated.
変形例:
なお、本発明は、上記の各実施形態の構成に限られず、発明の趣旨を変更しない範囲で種々の変形が可能である。次に、本発明の変形例について説明する。
Variant:
Note that the present invention is not limited to the configurations of the above-described embodiments, and various modifications can be made without changing the spirit of the invention. Next, a modification of the present invention will be described.
変形例1:
上記の実施形態では、学習用データセットにおける学習用データの偏りを検証する処理と、学習用データの偏りを減少させるように調整パラメータの値を変更する処理とを、CPU2が自動的に行う場合の例を示したが、これらの処理をユーザが手動で行ってもよい。すなわち、ユーザが、テスト用画像中の人に対する各学習済DNNモデルの推論結果と、各テスト用データのアノテーション情報とを、ディスプレイに表示させて、上記の推論結果とアノテーション情報とを目で見て比較することにより、現在の学習用データセットにおける学習用データの偏りを検証し、この検証結果に基づいて、入力操作部5のマウス等により、上記の各種スライドバーを用いて、調整パラメータを変更するようにしてもよい。
Variation 1:
In the above embodiment, the CPU 2 automatically performs the process of verifying the bias of the learning data in the learning data set and the process of changing the value of the adjustment parameter so as to reduce the bias of the learning data. Although an example has been shown, the user may perform these processes manually. That is, the user displays the inference results of each trained DNN model for the person in the test image and the annotation information of each test data on a display, and visually views the above inference results and annotation information. By comparing the data, the bias of the training data in the current training data set is verified, and based on the verification results, the adjustment parameters can be adjusted using the mouse or the like on the input operation section 5 using the various slide bars mentioned above. It may be changed.
変形例2:
上記の実施形態では、第1回目の推論処理に用いる各推論用の学習済DNNモデルを、現在の応用環境における店舗の実体の確率分布と人の実体の確率分布に対応する学習用データセットを用いてディープラーニングを行うことにより生成したが、これに限られず、第1回目の推論処理に用いる各推論用の学習済DNNモデルとして、既存の(現在の応用環境における店舗の実体の確率分布と人の実体の確率分布に対応する学習用データセット以外の別の)学習用データセットを用いてディープラーニングを行うことにより生成した各推論用の学習済DNNモデルを用いてもよい。
Variation 2:
In the above embodiment, the trained DNN model for each inference used in the first inference process is created using a training dataset corresponding to the probability distribution of the store entity and the probability distribution of the human entity in the current application environment. Although the model is not limited to this, the trained DNN model for each inference used in the first inference process is based on the existing probability distribution of the store entity in the current application environment. A trained DNN model for each inference generated by performing deep learning using a learning data set other than the learning data set corresponding to the probability distribution of human entities may be used.
変形例3:
上記の実施形態では、テスト用データセットとして、現在の応用環境実体情報に対応するテスト用データセット(各カメラの時系列に沿ったフレーム画像と、このフレーム画像のアノテーション情報から構成されるテスト用データを格納したテスト用データセット)用いた。けれども、本発明の機械学習システム、及び学習用データセット生成システムに用いられるテスト用データセットは、これに限られず、既存のテスト用データセットや、他の応用環境(例えば、他の店舗)における状況(統計情報等)に基づいて生成したテスト用データセットであってもよい。
Variation 3:
In the above embodiment, the test data set is a test data set corresponding to the current application environment entity information (a test data set consisting of a chronological frame image of each camera and annotation information of this frame image). A test dataset containing data was used. However, the test data set used in the machine learning system and the learning data set generation system of the present invention is not limited to this, and may be an existing test data set or a data set in another application environment (for example, another store). It may be a test data set generated based on the situation (statistical information, etc.).
変形例4:
上記の実施形態では、店舗の実体は店舗の確率分布により3DCG(のデータ)として生成されるようにしたが、実店舗に設置されているセキュリティカメラより入力した実際の店舗背景画像を利用してもよい。なお、この場合におけるランダムノイズとは、当該実写の店舗背景画像の一部をクロップし、クロップ部分をランダムな拡大率で拡大及びランダムな角度で回転させ、さらにレンズパラメータによる歪みや明度・彩度をランダムに変化させ、最後に所定のフレームサイズとなるように調整させた店舗画像を生成することに相当する。なお、当該実写した店舗背景画像に3DCGの人物を配置させるためには、当該セキュリティカメラに対応する店舗カメラの設置位置や設置角度、及び遮蔽物に関する情報が必要となるため、これを事前に準備し、応用環境生成素材保存部に格納しておく必要がある。なお、セキュリティカメラにデプスカメラ(撮影したRGB画像にピクセル単位で奥行き情報を与えることが可能なカメラ)を利用することで、上記の店舗カメラの設置位置や設置角度を自動計算するようにしてもよい。
Modification example 4:
In the above embodiment, the actual store is generated as a 3DCG (data) based on the probability distribution of the store. Good too. In this case, random noise means cropping a part of the live-action store background image, enlarging the cropped part at a random enlargement rate and rotating it at a random angle, and further adding distortion due to lens parameters, brightness, and saturation. This corresponds to generating a store image that is randomly changed and finally adjusted to a predetermined frame size. In addition, in order to place a 3DCG person in the actual store background image, information regarding the installation position and angle of the store camera that corresponds to the security camera, as well as information regarding obstructions, is required, so please prepare this in advance. It is necessary to store it in the applied environment generation material storage section. In addition, by using a depth camera (a camera that can give depth information in pixel units to the captured RGB image) as a security camera, the installation position and installation angle of the above store camera can be automatically calculated. good.
1 学習サーバ(コンピュータ)
10 機械学習システム(機械学習システム、学習用データセット生成システム)
15 機械学習プログラム
20 制御部(更新後学習用データセット生成制御部、学習繰返し制御部)
21 応用環境生成部(特定環境生成部、特定環境変更部)
22 データセット生成部
23 学習部(ニューラルネットワーク生成部)
24 推論部
25 検証部(検証部、特定環境変更部)
78,79,81 学習用画像
82 アノテーション情報(アノテーションデータ)
1 Learning server (computer)
10 Machine learning system (machine learning system, learning dataset generation system)
15 Machine learning program 20 Control unit (post-update learning data set generation control unit, learning repetition control unit)
21 Application environment generation unit (specific environment generation unit, specific environment change unit)
22 Data set generation unit 23 Learning unit (neural network generation unit)
24 Inference section 25 Verification section (verification section, specific environment change section)
78, 79, 81 Learning image 82 Annotation information (annotation data)
Claims (12)
ある特定環境における各構成要素の実体の確率分布に対応する学習用データセットを生成するデータセット生成部と、
前記学習用データセットを用いてディープラーニングを行うことにより、学習済ニューラルネットワークモデルを生成するニューラルネットワーク生成部と、
テスト用データセットに含まれるテスト用画像を前記学習済ニューラルネットワークモデルに入力して、前記テスト用画像中の物体に対する推論処理を行う推論部と、
前記推論部による推論結果に基づいて、前記学習済ニューラルネットワークモデルの学習用データセットにおける学習用データの偏りを検証する検証部と、
前記検証部による検証で判明した前記学習用データの偏りを減少させるように、前記特定環境における各構成要素の実体の確率分布を変更する特定環境変更部と、
前記変更後の各構成要素の実体の確率分布に対応する学習用データセットを、前記データセット生成部により生成して、この学習用データセット内の学習用データに基づき、更新後の学習用データセットを生成するように制御する更新後学習用データセット生成制御部と、
前記ニューラルネットワーク生成部により、前記更新後の学習用データセットを用いてディープラーニングを行うことによって、現在の学習済ニューラルネットワークモデルよりも精度の高い学習済ニューラルネットワークモデルを生成するように制御する学習繰返し制御部とを備え、
前記データセット生成部により生成される学習用データセットを構成する各学習用画像は、前記特定環境における各構成要素の実体の確率分布から選択した前記各構成要素の実体に、ランダムノイズを加えて生成した複数パターンの前記各構成要素の実体に基づいて描画した画像である機械学習システム。 A machine learning system that performs machine learning of a neural network model for inference with respect to objects in images using a training dataset including training images created using computer graphics,
a dataset generation unit that generates a learning dataset corresponding to the probability distribution of the entity of each component in a certain specific environment;
a neural network generation unit that generates a trained neural network model by performing deep learning using the training data set;
an inference unit that inputs a test image included in a test data set into the trained neural network model and performs inference processing on an object in the test image;
a verification unit that verifies bias in the training data in the training data set of the trained neural network model based on the inference result by the inference unit;
a specific environment changing unit that changes the probability distribution of the entity of each component in the specific environment so as to reduce the bias of the learning data found by the verification unit;
A learning data set corresponding to the probability distribution of the substance of each component after the change is generated by the data set generation unit, and the updated learning data is generated based on the learning data in this learning data set. a post-update learning dataset generation control unit that controls to generate a set;
Learning controlled so that the neural network generation unit generates a trained neural network model with higher accuracy than the current trained neural network model by performing deep learning using the updated training data set. It is equipped with a repetition control section ,
Each training image constituting the training dataset generated by the dataset generation unit is created by adding random noise to the entity of each component selected from the probability distribution of the entity of each component in the specific environment. A machine learning system that is an image drawn based on the substance of each of the constituent elements of a plurality of generated patterns .
ある特定環境における各構成要素の実体の確率分布に対応する学習用データセットを生成するデータセット生成部と、
前記学習用データセットを用いてディープラーニングを行うことにより、学習済ニューラルネットワークモデルを生成するニューラルネットワーク生成部と、
テスト用データセットに含まれるテスト用画像を前記学習済ニューラルネットワークモデルに入力して、前記テスト用画像中の物体に対する推論処理を行う推論部と、
前記推論部による推論結果に基づいて、前記学習済ニューラルネットワークモデルの学習用データセットにおける学習用データの偏りを検証する検証部と、
前記検証部による検証で判明した前記学習用データの偏りを減少させるように、前記特定環境における各構成要素の実体の確率分布を変更する特定環境変更部と、
前記変更後の各構成要素の実体の確率分布に対応する学習用データセットを、前記データセット生成部により生成して、この学習用データセット内の学習用データに基づき、更新後の学習用データセットを生成するように制御する更新後学習用データセット生成制御部と、
前記ニューラルネットワーク生成部により、前記更新後の学習用データセットを用いてディープラーニングを行うことによって、現在の学習済ニューラルネットワークモデルよりも精度の高い学習済ニューラルネットワークモデルを生成するように制御する学習繰返し制御部と、
前記特定環境における各構成要素の実体の確率分布に基づいて、前記各構成要素の実体に対応する前記特定環境の実体の時系列に沿ったシミュレーション結果のデータである特定環境実体情報を生成する特定環境生成部とを備え、
前記データセット生成部は、前記学習用データセットに加えて、前記特定環境生成部により生成された前記特定環境実体情報に対応する、前記ニューラルネットワークモデルのテスト用データセットを生成し、
前記推論部は、前記データセット生成部により生成されたテスト用データセットに含まれるテスト用画像を前記学習済ニューラルネットワークモデルに入力して、前記テスト用画像中の物体に対する推論処理を行う機械学習システム。 A machine learning system that performs machine learning of a neural network model for inference with respect to objects in images using a training dataset including training images created using computer graphics,
a dataset generation unit that generates a learning dataset corresponding to the probability distribution of the entity of each component in a certain specific environment;
a neural network generation unit that generates a trained neural network model by performing deep learning using the training data set;
an inference unit that inputs a test image included in a test data set into the trained neural network model and performs inference processing on an object in the test image;
a verification unit that verifies bias in the training data in the training data set of the trained neural network model based on the inference result by the inference unit;
a specific environment changing unit that changes the probability distribution of the entity of each component in the specific environment so as to reduce the bias of the learning data found by the verification unit;
A learning data set corresponding to the probability distribution of the substance of each component after the change is generated by the data set generation unit, and the updated learning data is generated based on the learning data in this learning data set. a post-update learning dataset generation control unit that controls to generate a set;
Learning controlled so that the neural network generation unit generates a trained neural network model with higher accuracy than the current trained neural network model by performing deep learning using the updated training data set. a repetition control section;
Identification of generating specific environment entity information, which is data of simulation results along a time series of entities in the specific environment corresponding to the entities in the specific environment, based on probability distributions of entities in each component in the specific environment. Equipped with an environment generation section,
In addition to the learning data set, the data set generation unit generates a test data set for the neural network model that corresponds to the specific environment entity information generated by the specific environment generation unit,
The inference unit inputs a test image included in the test data set generated by the data set generation unit to the trained neural network model, and performs inference processing on the object in the test image. Machine learning system.
前記特定環境変更部によって、前記学習用データの偏りを減少させるように、前記特定環境における各構成要素の確率分布を変更させる処理と、
前記更新後学習用データセット生成制御部によって、前記変更後の各構成要素の実体の確率分布に対応する前記学習用データセットを、前記データセット生成部を用いて生成し、この学習用データセット内の学習用データに基づき、更新後の学習用データセットを生成する処理と、
前記ニューラルネットワーク生成部によって、前記更新後の学習用データセットを用いて現在の学習済ニューラルネットワークモデルよりも精度の高い学習済ニューラルネットワークモデルを生成する処理と、
前記生成した精度の高い学習済ニューラルネットワークモデルを用いて、前記推論部により前記テスト用画像中の物体に対する推論を行う処理と、
前記推論部による推論結果に基づいて、前記検証部により現在の学習用データセットにおける学習用データの偏りを検証する処理と
を繰り返すことを特徴とする請求項1又は請求項2に記載の機械学習システム。 The learning repetition control unit is configured to perform the following steps until the bias of the learning data in the current learning data set becomes equal to or less than a predetermined level as a result of the verification by the verification unit.
A process of changing the probability distribution of each component in the specific environment by the specific environment changing unit so as to reduce bias in the learning data;
The updated learning dataset generation control section generates the learning dataset corresponding to the probability distribution of the entity of each component after the change using the dataset generation section, and generates the learning dataset using the dataset generation section. A process of generating an updated training dataset based on the training data in the
A process of generating, by the neural network generation unit, a trained neural network model with higher accuracy than the current trained neural network model using the updated learning data set;
A process of inferring an object in the test image by the inference unit using the generated highly accurate trained neural network model;
Machine learning according to claim 1 or 2, characterized in that the verification unit repeats the process of verifying the bias of the learning data in the current learning data set based on the inference result by the inference unit. system.
前記学習用データセットは、コンピュータグラフィックスで作成した学習用画像を含み、
テスト用データセットに含まれるテスト用画像を、現在の学習済ニューラルネットワークモデルに入力して、前記テスト用画像中の物体に対する推論処理を行う推論部と、
前記推論部による推論結果に基づいて、前記現在の学習済ニューラルネットワークモデルの学習用データセットにおける学習用データの偏りを検証する検証部と、
前記検証部による検証で判明した前記学習用データの偏りを減少させるように、前記学習用画像に映り込む特定環境における各構成要素の実体の確率分布を変更する特定環境変更部と、
前記変更後の各構成要素の実体の確率分布に対応する学習用データセットを生成して、この学習用データセット内の学習用データに基づき、更新後の学習用データセットを生成するように制御する更新後学習用データセット生成制御部とを備え、
前記更新後の学習用データセットを構成する各学習用画像は、前記特定環境における各構成要素の実体の確率分布から選択した前記各構成要素の実体に、ランダムノイズを加えて生成した複数パターンの前記各構成要素の実体に基づいて描画した画像である学習用データセット生成システム。 A learning dataset generation system for generating a learning dataset for performing machine learning of a neural network model for inference with respect to objects in images, the system comprising:
The training data set includes training images created using computer graphics,
an inference unit that inputs a test image included in a test data set into a currently trained neural network model and performs inference processing on an object in the test image;
a verification unit that verifies the bias of the training data in the training data set of the current trained neural network model based on the inference result by the inference unit;
a specific environment changing unit that changes the probability distribution of the entity of each component in the specific environment reflected in the learning image so as to reduce the bias of the learning data found by the verification unit;
Control is performed to generate a learning data set corresponding to the probability distribution of the substance of each component after the change, and to generate an updated learning data set based on the learning data in this learning data set. and a post-update training data set generation control unit ,
Each training image constituting the updated training data set is a plurality of patterns generated by adding random noise to the entity of each component selected from the probability distribution of the entity of each component in the specific environment. A learning dataset generation system that is an image drawn based on the substance of each component .
前記学習用データセットは、コンピュータグラフィックスで作成した学習用画像を含み、
テスト用データセットに含まれるテスト用画像を、現在の学習済ニューラルネットワークモデルに入力して、前記テスト用画像中の物体に対する推論処理を行う推論部と、
前記推論部による推論結果に基づいて、前記現在の学習済ニューラルネットワークモデルの学習用データセットにおける学習用データの偏りを検証する検証部と、
前記検証部による検証で判明した前記学習用データの偏りを減少させるように、前記学習用画像に映り込む特定環境における各構成要素の実体の確率分布を変更する特定環境変更部と、
前記変更後の各構成要素の実体の確率分布に対応する学習用データセットを生成して、この学習用データセット内の学習用データに基づき、更新後の学習用データセットを生成するように制御する更新後学習用データセット生成制御部と、
前記特定環境における各構成要素の実体の確率分布に基づいて、前記各構成要素の実体に対応する前記特定環境の実体の時系列に沿ったシミュレーション結果のデータである特定環境実体情報を生成する特定環境生成部と、
前記特定環境生成部により生成された前記特定環境実体情報に対応する、前記ニューラルネットワークモデルのテスト用データセットを生成するデータセット生成部とを備え、
前記推論部は、前記データセット生成部により生成されたテスト用データセットに含まれるテスト用画像を、現在の学習済ニューラルネットワークモデルに入力して、前記テスト用画像中の物体に対する推論処理を行う学習用データセット生成システム。 A learning dataset generation system for generating a learning dataset for performing machine learning of a neural network model for inference with respect to objects in images, the system comprising:
The training data set includes training images created using computer graphics,
an inference unit that inputs a test image included in a test data set into a currently trained neural network model and performs inference processing on an object in the test image;
a verification unit that verifies the bias of the training data in the training data set of the current trained neural network model based on the inference result by the inference unit;
a specific environment changing unit that changes the probability distribution of the entity of each component in the specific environment reflected in the learning image so as to reduce the bias of the learning data found by the verification unit;
Control is performed to generate a learning data set corresponding to the probability distribution of the substance of each component after the change, and to generate an updated learning data set based on the learning data in this learning data set. a post-update training data set generation control unit,
Identification of generating specific environment entity information, which is data of simulation results along a time series of entities in the specific environment corresponding to the entities in the specific environment, based on probability distributions of entities in each component in the specific environment. environment generation section;
a data set generation unit that generates a test data set for the neural network model corresponding to the specific environment entity information generated by the specific environment generation unit;
The inference unit inputs the test image included in the test data set generated by the data set generation unit into the currently trained neural network model, and performs inference processing on the object in the test image. A learning dataset generation system.
コンピュータを、
ある特定環境における各構成要素の実体の確率分布に対応する学習用データセットを生成するデータセット生成部と、
前記学習用データセットを用いてディープラーニングを行うことにより、学習済ニューラルネットワークモデルを生成するニューラルネットワーク生成部と、
テスト用データセットに含まれるテスト用画像を前記学習済ニューラルネットワークモデルに入力して、前記テスト用画像中の物体に対する推論処理を行う推論部と、
前記推論部による推論結果に基づいて、前記学習済ニューラルネットワークモデルの学習用データセットにおける学習用データの偏りを検証する検証部と、
前記検証部による検証で判明した前記学習用データの偏りを減少させるように、前記特定環境における各構成要素の実体の確率分布を変更する特定環境変更部と、
前記変更後の各構成要素の実体の確率分布に対応する学習用データセットを、前記データセット生成部により生成して、この学習用データセット内の学習用データに基づき、更新後の学習用データセットを生成するように制御する更新後学習用データセット生成制御部と、
前記ニューラルネットワーク生成部により、前記更新後の学習用データセットを用いてディープラーニングを行うことによって、現在の学習済ニューラルネットワークモデルよりも精度の高い学習済ニューラルネットワークモデルを生成するように制御する学習繰返し制御部として機能させ、
前記データセット生成部により生成される学習用データセットを構成する各学習用画像は、前記特定環境における各構成要素の実体の確率分布から選択した前記各構成要素の実体に、ランダムノイズを加えて生成した複数パターンの前記各構成要素の実体に基づいて描画した画像である機械学習プログラム。 A machine learning program for performing machine learning of a neural network model for inference with respect to objects in images using a learning dataset including training images created with computer graphics,
computer,
a dataset generation unit that generates a learning dataset corresponding to the probability distribution of the entity of each component in a certain specific environment;
a neural network generation unit that generates a trained neural network model by performing deep learning using the training data set;
an inference unit that inputs a test image included in a test data set into the trained neural network model and performs inference processing on an object in the test image;
a verification unit that verifies bias in the training data in the training data set of the trained neural network model based on the inference result by the inference unit;
a specific environment changing unit that changes the probability distribution of the entity of each component in the specific environment so as to reduce the bias of the learning data found by the verification unit;
A learning data set corresponding to the probability distribution of the substance of each component after the change is generated by the data set generation unit, and the updated learning data is generated based on the learning data in this learning data set. a post-update learning dataset generation control unit that controls to generate a set;
Learning controlled so that the neural network generation unit generates a trained neural network model with higher accuracy than the current trained neural network model by performing deep learning using the updated training data set. Function as a repeat control section ,
Each training image constituting the training dataset generated by the dataset generation unit is created by adding random noise to the entity of each component selected from the probability distribution of the entity of each component in the specific environment. A machine learning program that is an image drawn based on the entities of each of the constituent elements of the generated plurality of patterns .
コンピュータを、
ある特定環境における各構成要素の実体の確率分布に対応する学習用データセットを生成するデータセット生成部と、
前記学習用データセットを用いてディープラーニングを行うことにより、学習済ニューラルネットワークモデルを生成するニューラルネットワーク生成部と、
テスト用データセットに含まれるテスト用画像を前記学習済ニューラルネットワークモデルに入力して、前記テスト用画像中の物体に対する推論処理を行う推論部と、
前記推論部による推論結果に基づいて、前記学習済ニューラルネットワークモデルの学習用データセットにおける学習用データの偏りを検証する検証部と、
前記検証部による検証で判明した前記学習用データの偏りを減少させるように、前記特定環境における各構成要素の実体の確率分布を変更する特定環境変更部と、
前記変更後の各構成要素の実体の確率分布に対応する学習用データセットを、前記データセット生成部により生成して、この学習用データセット内の学習用データに基づき、更新後の学習用データセットを生成するように制御する更新後学習用データセット生成制御部と、
前記ニューラルネットワーク生成部により、前記更新後の学習用データセットを用いてディープラーニングを行うことによって、現在の学習済ニューラルネットワークモデルよりも精度の高い学習済ニューラルネットワークモデルを生成するように制御する学習繰返し制御部と、
前記特定環境における各構成要素の実体の確率分布に基づいて、前記各構成要素の実体に対応する前記特定環境の実体の時系列に沿ったシミュレーション結果のデータである特定環境実体情報を生成する特定環境生成部として機能させ、
前記データセット生成部は、前記学習用データセットに加えて、前記特定環境生成部により生成された前記特定環境実体情報に対応する、前記ニューラルネットワークモデルのテスト用データセットを生成し、
前記推論部は、前記データセット生成部により生成されたテスト用データセットに含まれるテスト用画像を前記学習済ニューラルネットワークモデルに入力して、前記テスト用画像中の物体に対する推論処理を行う機械学習プログラム。 A machine learning program for performing machine learning of a neural network model for inference with respect to objects in images using a learning dataset including training images created with computer graphics,
computer,
a dataset generation unit that generates a learning dataset corresponding to the probability distribution of the entity of each component in a certain specific environment;
a neural network generation unit that generates a trained neural network model by performing deep learning using the training data set;
an inference unit that inputs a test image included in a test data set into the trained neural network model and performs inference processing on an object in the test image;
a verification unit that verifies bias in the training data in the training data set of the trained neural network model based on the inference result by the inference unit;
a specific environment changing unit that changes the probability distribution of the entity of each component in the specific environment so as to reduce the bias of the learning data found by the verification unit;
A learning data set corresponding to the probability distribution of the substance of each component after the change is generated by the data set generation unit, and the updated learning data is generated based on the learning data in this learning data set. a post-update learning dataset generation control unit that controls to generate a set;
Learning controlled so that the neural network generation unit generates a trained neural network model with higher accuracy than the current trained neural network model by performing deep learning using the updated training data set. a repetition control section;
Identification of generating specific environment entity information, which is data of simulation results along a time series of entities in the specific environment corresponding to the entities in the specific environment, based on probability distributions of entities in each component in the specific environment. Function as an environment generation section,
In addition to the learning data set, the data set generation unit generates a test data set for the neural network model that corresponds to the specific environment entity information generated by the specific environment generation unit,
The inference unit inputs a test image included in the test data set generated by the data set generation unit to the trained neural network model, and performs inference processing on the object in the test image. Machine learning program.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020002255A JP7437738B2 (en) | 2020-01-09 | 2020-01-09 | Machine learning system, training dataset generation system, and machine learning program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020002255A JP7437738B2 (en) | 2020-01-09 | 2020-01-09 | Machine learning system, training dataset generation system, and machine learning program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2021111101A JP2021111101A (en) | 2021-08-02 |
| JP7437738B2 true JP7437738B2 (en) | 2024-02-26 |
Family
ID=77059902
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2020002255A Active JP7437738B2 (en) | 2020-01-09 | 2020-01-09 | Machine learning system, training dataset generation system, and machine learning program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7437738B2 (en) |
Families Citing this family (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2018140033A (en) * | 2017-02-28 | 2018-09-13 | 株式会社大一商会 | Game machine |
| US12002202B2 (en) * | 2021-08-09 | 2024-06-04 | Merck Sharp & Dohme Llc | Meta-learning for cardiac MRI segmentation |
| US20250078375A1 (en) * | 2022-01-28 | 2025-03-06 | Sony Semiconductor Solutions Corporation | Data processing device, data processing method, and program |
| JP7410209B2 (en) * | 2022-04-20 | 2024-01-09 | Lineヤフー株式会社 | Information processing device, information processing method, and information processing program |
| JP7844006B2 (en) * | 2022-08-26 | 2026-04-13 | Awl株式会社 | Dataset generation system, server, and dataset generation program |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2011065579A (en) | 2009-09-18 | 2011-03-31 | Nec Corp | Standard pattern learning device, labeling criterion calculating device, standard pattern learning method and program |
| JP2019106119A (en) | 2017-12-14 | 2019-06-27 | オムロン株式会社 | Detection system, information processing apparatus, evaluation method, and program |
| JP2019152964A (en) | 2018-03-01 | 2019-09-12 | コニカミノルタ株式会社 | Learning method and learning device |
| JP2019219928A (en) | 2018-06-20 | 2019-12-26 | 国立大学法人 筑波大学 | Image processing device, image processing method, and image processing program |
-
2020
- 2020-01-09 JP JP2020002255A patent/JP7437738B2/en active Active
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2011065579A (en) | 2009-09-18 | 2011-03-31 | Nec Corp | Standard pattern learning device, labeling criterion calculating device, standard pattern learning method and program |
| JP2019106119A (en) | 2017-12-14 | 2019-06-27 | オムロン株式会社 | Detection system, information processing apparatus, evaluation method, and program |
| JP2019152964A (en) | 2018-03-01 | 2019-09-12 | コニカミノルタ株式会社 | Learning method and learning device |
| JP2019219928A (en) | 2018-06-20 | 2019-12-26 | 国立大学法人 筑波大学 | Image processing device, image processing method, and image processing program |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2021111101A (en) | 2021-08-02 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7437738B2 (en) | Machine learning system, training dataset generation system, and machine learning program | |
| Choy et al. | 4d spatio-temporal convnets: Minkowski convolutional neural networks | |
| US20230342592A1 (en) | Controlling a neural network through intermediate latent spaces | |
| AU2009298416B2 (en) | Systems and methods for evaluating robustness | |
| CN107155360B (en) | Multilayer Aggregation for Object Detection | |
| US11455074B2 (en) | System and user interface for viewing and interacting with three-dimensional scenes | |
| US8577156B2 (en) | Systems and methods for multi-perspective scene analysis | |
| CA2739023C (en) | Systems and methods for optimizing a scene | |
| US20130177235A1 (en) | Evaluation of Three-Dimensional Scenes Using Two-Dimensional Representations | |
| KR20210088600A (en) | Exhibition area state recognition method, apparatus, electronic device and recording medium | |
| EP2347387A1 (en) | Systems and methods for multi-perspective scene analysis | |
| JP2014211719A (en) | Apparatus and method for information processing | |
| JP7682985B2 (en) | A platform for enabling multiple users to create and use neural luminance field models | |
| Peng | Machines' perception of space | |
| DE112021004843T5 (en) | CREATING A SMART HOME BUBBLE | |
| Hinojosa et al. | Thermal image segmentation using evolutionary computation techniques | |
| Johnson et al. | Representation and synthesis of behaviour using gaussian mixtures | |
| Chalás et al. | Generating various composite human faces from real 3D facial images | |
| García-Rodríguez et al. | Surveillance and human–computer interaction applications of self-growing models | |
| Copeland et al. | Texture synthesis using gray-level co-occurrence models: algorithms, experimental analysis, and psychophysical support | |
| CN114332556A (en) | Training sample screening method, device, computer equipment and storage medium | |
| Carballal et al. | Minimal neural network topology optimization for aesthetic classification | |
| Leizea et al. | Real time non-rigid 3D surface tracking using particle filter | |
| JP5071900B2 (en) | Image generating apparatus and method | |
| US20150317566A1 (en) | Systems and methods for content generation and optimization using probability factors |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221130 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231017 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20231205 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231228 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240123 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240205 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7437738 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |