JP7609726B2 - Computer system, method for controlling input of data to a model, and control device - Google Patents
Computer system, method for controlling input of data to a model, and control device Download PDFInfo
- Publication number
- JP7609726B2 JP7609726B2 JP2021115708A JP2021115708A JP7609726B2 JP 7609726 B2 JP7609726 B2 JP 7609726B2 JP 2021115708 A JP2021115708 A JP 2021115708A JP 2021115708 A JP2021115708 A JP 2021115708A JP 7609726 B2 JP7609726 B2 JP 7609726B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- data
- target
- label
- computer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Image Analysis (AREA)
Description
本発明は、行動を決定するモデルへのデータの入力制御に関する。 The present invention relates to controlling the input of data into a model that determines behavior.
機械学習を利用して、車両、ロボット、及びドローン等の制御対象の自動制御を実現するアルゴリズムの開発が行われている。例えば、End to End深層強化学習を利用して、画像から車両の制御信号を出力するアルゴリズムの開発が行われる。 Machine learning is being used to develop algorithms that realize automatic control of controlled objects such as vehicles, robots, and drones. For example, end-to-end deep reinforcement learning is being used to develop algorithms that output vehicle control signals from images.
End to End深層強化学習は、大量の学習データが必要かつ学習時間が膨大であり、また、学習が困難な場合が多いという問題がある。そこで、オブジェクトベース強化学習を利用したアルゴリズム開発が注目されている。 End-to-end deep reinforcement learning has problems in that it requires a large amount of training data, takes a huge amount of time to train, and is often difficult to train. Therefore, the development of algorithms that use object-based reinforcement learning has attracted attention.
オブジェクトベース強化学習では、画像からオブジェクト(物体)を抽出し、抽出したオブジェクトの情報に基づいて、制御対象の行動を決定する方策を学習する。 In object-based reinforcement learning, objects are extracted from images, and a strategy for determining the behavior of the target is learned based on the information about the extracted objects.
一般的に、方策は、ニューラルネットワーク等のモデルとして与えられる。モデルがニューラルネットワークの場合、ニューラルネットワークは複数の入力スロットを有する。通常、オブジェクト情報を入力する入力スロットが変わると出力値も変化する。すなわち、方策の精度に影響を与える。そのため、入力スロットに対するオブジェクト情報の入力の制御は重要である。 Generally, a policy is given as a model such as a neural network. When the model is a neural network, the neural network has multiple input slots. Usually, when the input slot for inputting object information changes, the output value also changes. In other words, this affects the accuracy of the policy. Therefore, it is important to control the input of object information to the input slots.
入力スロットへのオブジェクト情報の入力を制御する方法として、例えば、非特許文献1に記載の技術が知られている。 As a method for controlling the input of object information to an input slot, for example, the technology described in Non-Patent Document 1 is known.
非特許文献1には、物体の見え情報に基づいて物体のスコアを決定し、スコアに基づいて物体を選択して、選択したオブジェクト情報をニューラルネットワークに入力する手法が記載されている。 Non-Patent Document 1 describes a method of determining an object's score based on the object's appearance information, selecting an object based on the score, and inputting the selected object information into a neural network.
物体の見え方は多様性が高いため、人が物体の見え方及びスコアの算出方法を設定するか、又は、優先度の算出方法を別途学習する必要がある。したがって、処理コストが高いという課題がある。また、非特許文献1に記載の手法は、方策の精度の改善効果が小さいという課題がある。 Because there is a high degree of diversity in how objects appear, it is necessary for a person to set the object appearance and the method of calculating the score, or to separately learn the method of calculating the priority. Therefore, there is an issue that the processing cost is high. In addition, the method described in Non-Patent Document 1 has an issue that the effect of improving the accuracy of the policy is small.
本発明は、高い精度の出力を得るための、モデルへのオブジェクト情報の入力制御を実現する計算機システム及び方法を提供する。 The present invention provides a computer system and method that realizes control of the input of object information into a model in order to obtain a highly accurate output.
本願において開示される発明の代表的な一例を示せば以下の通りである。すなわち、計算機システムであって、演算装置、前記演算装置に接続される記憶装置、前記演算装置に接続されるインタフェースを有する、少なくとも一つの計算機を備え、制御対象の周囲の画像に含まれる物体の特徴を表す物体データを用いて、前記制御対象の行動を決定するモデルを管理するモデル情報と、前記物体の動きに基づいて付与されるラベルに基づく前記モデルに対する前記物体データの入力規則を管理する入力制御情報と、を保持し、前記画像の時系列データを受け付け、複数の前記画像の各々から前記物体を検出し、複数の前記画像の中からターゲット画像を選択し、前記ターゲット画像を含む二つ以上の前記画像を用いて、前記ターゲット画像から検出された前記物体の動きを表す動きデータを算出し、前記ターゲット画像及び前記動きデータを対応付けて記憶し、複数の前記画像の各々について、前記動きデータに基づいて、前記画像から検出された前記物体に前記ラベルを付与し、複数の前記画像の各々について、前記入力制御情報及び前記ラベルに基づいて、前記モデルに対する、前記画像から検出された前記物体の前記物体データの入力を制御する。 A representative example of the invention disclosed in the present application is as follows. That is, a computer system includes at least one computer having an arithmetic unit, a storage device connected to the arithmetic unit, and an interface connected to the arithmetic unit, and holds model information that manages a model that determines the behavior of the control target using object data that represents the characteristics of objects included in an image surrounding the control target, and input control information that manages input rules for the object data to the model based on labels assigned based on the movement of the object, receives time-series data of the images, detects the object from each of the multiple images, selects a target image from the multiple images, calculates motion data representing the motion of the object detected from the target image using two or more images including the target image, stores the target image and the motion data in association with each other, assigns the label to the object detected from the image based on the motion data for each of the multiple images, and controls input of the object data of the object detected from the image to the model based on the input control information and the label for each of the multiple images.
本発明によれば、モデルの出力の精度を向上させる物体データ(オブジェクト情報)の入力制御を実現できる。上記した以外の課題、構成及び効果は、以下の実施例の説明により明らかにされる。 According to the present invention, it is possible to realize input control of object data (object information) that improves the accuracy of model output. Problems, configurations, and advantages other than those described above will become clear from the explanation of the following embodiment.
以下、本発明の実施例を、図面を用いて説明する。ただし、本発明は以下に示す実施例の記載内容に限定して解釈されるものではない。本発明の思想ないし趣旨から逸脱しない範囲で、その具体的構成を変更し得ることは当業者であれば容易に理解される。 The following describes an embodiment of the present invention with reference to the drawings. However, the present invention should not be interpreted as being limited to the description of the embodiment shown below. It will be easily understood by those skilled in the art that the specific configuration can be changed without departing from the concept or spirit of the present invention.
以下に説明する発明の構成において、同一又は類似する構成又は機能には同一の符号を付し、重複する説明は省略する。 In the configuration of the invention described below, the same or similar configurations or functions are given the same reference symbols, and duplicate explanations are omitted.
本明細書等における「第1」、「第2」、「第3」等の表記は、構成要素を識別するために付するものであり、必ずしも、数又は順序を限定するものではない。 The terms "first," "second," "third," and the like used in this specification are used to identify components and do not necessarily limit the number or order.
図面等において示す各構成の位置、大きさ、形状、及び範囲等は、発明の理解を容易にするため、実際の位置、大きさ、形状、及び範囲等を表していない場合がある。したがって、本発明では、図面等に開示された位置、大きさ、形状、及び範囲等に限定されない。 The position, size, shape, range, etc. of each component shown in the drawings, etc. may not represent the actual position, size, shape, range, etc., in order to facilitate understanding of the invention. Therefore, the present invention is not limited to the position, size, shape, range, etc. disclosed in the drawings, etc.
計算機システムは、少なくとも一つの計算機100から構成される。図1は、実施例1の計算機システムに含まれる計算機100のハードウェア構成の一例を説明する図である。
The computer system is composed of at least one
計算機100は、プロセッサ101、メモリ102、補助記憶装置103、ネットワークインタフェース104、及び入出力インタフェース105を有する。各ハードウェア要素はバスを介して互いに接続される。
The
プロセッサ101は、計算機100全体の制御を行う演算装置であり、メモリ102に格納されるプログラムを実行する。プロセッサ101がプログラムにしたがって処理を実行することによって、特定の機能を実現する機能部(モジュール)として動作する。以下の説明では、機能部を主語に処理を説明する場合、プロセッサ101が当該機能部を実現するプログラムを実行していることを示す。
The
メモリ102は、プロセッサ101が実行するプログラム及びプログラムが実行する情報を格納する記憶装置である。メモリ102はワークエリアとしても用いられる。
補助記憶装置103は、データを永続的に格納する記憶装置であり、例えば、HDD(Hard Disk Drive)及びSSD(Solid State Drive)等である。メモリ102に格納されるプログラム及び情報は、補助記憶装置103に格納されてもよい。この場合、プロセッサ101が補助記憶装置103からプログラム及び情報を読み出し、メモリ102にロードする。
The
ネットワークインタフェース104は、ネットワークを介して外部装置と接続するためのインタフェースである。
The
入出力インタフェース105は、入力装置111及び出力装置112と接続するためのインタフェースである。ここで、入力装置111は、キーボード、マウス、及びタッチパネル等である。また、出力装置112は、ディスプレイ等である。
The input/
なお、計算機100は、入出力インタフェース105を有していなくてもよい。
Note that the
計算機システムは、行動を決定するための方策を学習する計算機100と、学習された方策を用いて行動を決定する計算機100とを含む。なお、一つの計算機100が、学習及び行動の決定を行ってもよい。
The computer system includes a
図2A及び図2Bは、実施例1の計算機100の機能構成の一例を示す図である。
Figures 2A and 2B are diagrams showing an example of the functional configuration of the
図2Aは、方策を学習する計算機100-1の機能構成を示す。計算機100-1は、物体検出部200、境界ボックス予測部201、物体分類部202、ラベル付与部203、入力制御部204、及び学習部210を有する。また、計算機100-1は、分類定義情報230、遮蔽検出定義情報231、ラベル定義情報232、物体データ定義情報233、入力制御情報234、モデル情報235、及び学習情報236を保持する。また、計算機100-1には、外部から自己情報237及び報酬情報238が入力される。自己情報237及び報酬情報238は画像250の入力にあわせて入力される。
Figure 2A shows the functional configuration of computer 100-1 that learns a policy. Computer 100-1 has an
分類定義情報230は、物体を分類するための情報である。例えば、分類定義情報230は、分類器の定義情報である。遮蔽検出定義情報231は、ある物体が他の物体によって遮蔽された状態を検出するための方法に関する情報である。ラベル定義情報232は、物体の動きに基づいてラベルを付与するための方法に関する情報である。例えば、ラベル定義情報232は、物体種別、及び評価する物体の動きに基づくラベル付与規則を対応付けたエントリを格納する情報である。物体データ定義情報233は、方策を決定する場合に入力する物体データ(特徴量)のデータ構造に関する情報である。入力制御情報234は、方策を実現するモデルに対する物体データの入力規則に関する情報である。モデル情報235は、モデルの定義情報である。学習情報236は、方策の学習処理を制御するための情報である。例えば、学習情報236には、学習率等が含まれる。自己情報237は、制御対象の内部状態及び周囲の環境に関する情報である。報酬情報238は、行動に対する報酬の情報である。
The
物体検出部200は、制御対象の周囲の画像250から物体(オブジェクト)を検出する。物体検出部200は、当該物体を包含する矩形領域(境界ボックス)を生成する。物体検出部200は、境界ボックス予測部201及び物体分類部202に画像250及び物体の境界ボックスを出力し、ラベル付与部203に画像250を出力する。
The
境界ボックス予測部201は、複数の画像250を用いて、物体の境界ボックスを予測し、物体検出部200によって生成された境界ボックスと予測された境界ボックスとを比較し、比較結果に基づいて境界ボックスを補正する。境界ボックス予測部201は、補正された境界ボックスをラベル付与部203に出力する。
The boundary
物体分類部202は、画像250に含まれる物体の種別を分類する。本実施例では、物体分類部202は、境界ボックスごとに物体の種別を分類する。物体分類部202は、分類結果をラベル付与部203に出力する。
The
ラベル付与部203は、複数の画像250を用いて、画像250に含まれる物体の動きを解析し、物体の動きに基づいて画像250に含まれる物体にラベルを付与する。ラベル付与部203は、物体のラベル及び画像250を入力制御部204に出力する。
The
入力制御部204は、画像250に含まれる物体の物体データ800(図8参照)を生成し、当該物体のラベルに基づいて、モデルに対する物体データ800の入力を制御する。
The
学習部210は、入力制御部204によって入力された物体データ800を用いて方策を学習する。学習部210は、方策に基づいて行動を決定する行動決定部220を含む。行動決定部220は、モデル情報235によって定義された方策、自己情報237、及び物体データ800に基づいて行動を決定し、行動データ260として出力する。行動データ260は、例えば、車両のトルク及びステアリングを制御するための制御信号である。
The
学習部210は、学習情報236、報酬情報238、及び行動データ260に基づいて、方策を学習し、学習結果をモデル情報235に反映する。
The
実施例1では、強化学習を例に説明するが、強化学習以外の学習手法でもよい。 In Example 1, reinforcement learning is used as an example, but learning methods other than reinforcement learning may also be used.
図2Bは、方策を用いて行動を決定する計算機100-2の機能構成を示す。計算機100-2は、物体検出部200、境界ボックス予測部201、物体分類部202、ラベル付与部203、入力制御部204、及び行動決定部220を有する。また、計算機100-2は、分類定義情報230、遮蔽検出定義情報231、ラベル定義情報232、物体データ定義情報233、入力制御情報234、及びモデル情報235を保持し、また、自己情報237が入力される。
Figure 2B shows the functional configuration of computer 100-2, which determines an action using a strategy. Computer 100-2 has an
計算機100-2が有する機能及び情報は、計算機100-1が有する機能及び情報と同一であるため説明を省略する。 The functions and information possessed by computer 100-2 are the same as those possessed by computer 100-1, and therefore will not be described.
なお、計算機100-1、100-2が有する各機能部については、複数の機能部を一つの機能部にまとめてもよいし、一つの機能部を機能毎に複数の機能部に分けてもよい。例えば、物体検出部200が境界ボックス予測部201を含んでもよい。
Note that with regard to each functional unit of the computers 100-1 and 100-2, multiple functional units may be combined into one functional unit, or one functional unit may be divided into multiple functional units for each function. For example, the
なお、計算機システムは、モデルを学習し、車両、ロボット、及びドローン等の制御対象に学習されたモデルを設定する形態でもよい。この場合、制御対象は、画像を取得するカメラと、駆動装置と、図2Bに示すような機能を有するマイクロコンピュータ等の制御装置とを備える。制御対象は、制御装置から出力された行動データ260に基づいて駆動装置を制御する。
The computer system may learn a model and set the learned model to a control object such as a vehicle, a robot, or a drone. In this case, the control object includes a camera that acquires images, a drive unit, and a control device such as a microcomputer having the functions shown in FIG. 2B. The control object controls the drive unit based on the
次に、実施例1の計算機システムが扱う画像250の一例について説明する。
Next, an example of an
図3A、図3B、及び図3Cは、実施例1の計算機システムが扱う画像250の一例を説明する図である。
Figures 3A, 3B, and 3C are diagrams illustrating an example of an
図3Aに示すように、実施例1の計算機システムは、車両300に取り付けられたカメラによって取得された画像を扱う。カメラは、範囲310の画像を取得するものとする。範囲310には、物体(車両)320-1、320-2、320-3、320-4が含まれる。なお、説明のために3次元空間の座標系を示している。
As shown in FIG. 3A, the computer system of the first embodiment handles images captured by a camera attached to a
カメラは、例えば、図3B及び図3Cに示すような画像250を出力する。図3Bは、画像の左上を原点とする座標系の画像250を示す。図3Cは、画像の上中心を原点とする座標系の画像250を示す。
The camera outputs an
物体検出部200は、検出した物体を包含する境界ボックス330を生成する。図3B及び図3Cの画像250からは、物体320-1、320-2、320-3、320-4を包含する境界ボックス330-1、330-2、330-3、330-4が生成される。
The
図3B及び図3Cの画像250には、物体320として車両のみが存在しているが、人、道路標識、及び信号機等、車両とは物体種別が異なる物体が含まれてもよい。
In the
図4は、実施例1の計算機100-1が実行する処理の一例を説明するフローチャートである。図5は、実施例1の計算機100-1が生成する境界ボックス情報のデータ構造の一例を示す図である。図6は、実施例1の計算機100-1が生成する動き情報のデータ構造の一例を示す図である。図7は、実施例1の計算機100-1が生成する物体ラベル情報のデータ構造の一例を示す図である。 FIG. 4 is a flowchart illustrating an example of processing executed by the computer 100-1 of the first embodiment. FIG. 5 is a diagram illustrating an example of the data structure of bounding box information generated by the computer 100-1 of the first embodiment. FIG. 6 is a diagram illustrating an example of the data structure of motion information generated by the computer 100-1 of the first embodiment. FIG. 7 is a diagram illustrating an example of the data structure of object label information generated by the computer 100-1 of the first embodiment.
計算機100-1は、時系列順に並べられた、複数の画像250(画像250の時系列データ)を取得する(ステップS101)。取得した画像250はワークエリアに格納される。
The computer 100-1 acquires a number of images 250 (time-series data of the images 250) arranged in chronological order (step S101). The acquired
計算機100-1の物体検出部200は、各画像250に対して物体検出処理を実行する(ステップS102)。
The
物体検出処理では、物体検出部200は、一つの画像250から一つ以上の物体を検出し、検出された物体の境界ボックス330を生成する。なお、画像から物体を検出する方法は公知の技術であるため詳細な説明は省略する。
In the object detection process, the
物体検出部200は、一つの画像250に対する物体検出処理の結果として境界ボックス情報500を生成する。境界ボックス情報500は、ID501、位置502、及びサイズ503を含むエントリを格納する。一つのエントリが一つの物体の境界ボックス330に対応する。なお、エントリに含まれるフィールドは前述したものに限定されない。前述したフィールドのいずれかを含まなくてもよいし、また、他のフィールドを含んでもよい。
The
ID501は、境界ボックス330(物体)の識別情報を格納するフィールドである。位置502は、境界ボックス330の中心の座標値を格納するフィールドである。なお、中心の座標値の代わりに、境界ボックス330の左上の座標値等が格納されてもよい。サイズ503は、境界ボックス330の幅(width)及び高さ(hight)を格納するフィールドである。
また、物体検出部200は、各画像250の境界ボックス情報500を参照し、境界ボックス330を追跡することによって、画像250間の境界ボックス330の対応付けを行う。物体検出部200は、当該対応付けに基づいて、同じ物体の境界ボックス330に同じIDを付与する。
The
計算機100-1の境界ボックス予測部201は、各画像250に対して境界ボックス補正処理を実行する(ステップS103)。境界ボックス補正処理は図10及び図11を用いて説明する。
The bounding
計算機100-1の物体分類部202は、各画像250に対して物体分類処理を実行する(ステップS104)。
The
画像に含まれる物体の分類は公知の技術を用いればよいため詳細な説明は省略する。例えば、CNN(Convolutional Neural Network)を用いて分類する方法が考えられる。 Classification of objects contained in an image can be done using known techniques, so a detailed description will be omitted. For example, a classification method using a CNN (Convolutional Neural Network) can be considered.
計算機100-1のラベル付与部203は、画像250のループ処理を開始する(ステップS105)。具体的には、ラベル付与部203は、ターゲットとなる画像250(ターゲット画像250)を一つ選択する。ここでは、最新の画像250から過去の方向に画像250が選択されるものとする。なお、時間の経過方向に画像250を選択してもよい。
The
計算機100-1のラベル付与部203は、物体種別のループ処理を開始する(ステップS106)。具体的には、ラベル付与部203は、ターゲットとなる物体種別(ターゲット物体種別)を一つ選択する。
The
計算機100-1のラベル付与部203は、ターゲット画像250を用いて、ターゲット物体種別の物体の動きデータを算出する(ステップS107)。具体的には、以下のような処理が実行される。
The
(S107-1)ラベル付与部203は、ターゲット画像250より時系列が一つ前の画像250を読み出す。
(S107-1) The
(S107-2)ラベル付与部203は、ターゲット画像250及び読み出された画像250の各々の境界ボックス情報500から、ターゲット物体種別の物体の境界ボックス330のデータを読み出す。
(S107-2) The
(S107-3)ラベル付与部203は、境界ボックス330のデータを用いて、ターゲット物体種別の物体の境界ボックス330の動きを表す指標を算出する。例えば、ラベル付与部203は、境界ボックス330の中心、境界ボックス330のサイズ(高さ及び幅)の変化量を算出する。
(S107-3) The
このとき、ラベル付与部203は、物体データ800に含める衝突猶予時間等の特徴量を算出してもよい。衝突猶予時間は式(1)、式(2)、式(3)のいずれかで算出される。
At this time, the
ここで、w(t)は、ターゲット画像250における境界ボックス330の幅を表す。デルタwは境界ボックス330の幅の変化量を表す。h(t)は、ターゲット画像250における境界ボックス330の高さを表す。デルタtは境界ボックス330の高さの変化量を表す。s(t)は、ターゲット画像250における境界ボックス330の面積を表す。面積は、幅及び高さの乗算値として与えられる。デルタsは境界ボックス330の面積の変化量を表す。
Here, w(t) represents the width of the
(S107-4)ラベル付与部203は、指標から構成される動きデータを生成し、動き情報600に登録する。
(S107-4) The
図6に示すように、動き情報600は、ID601、位置変化量602、サイズ変化量603、及び衝突猶予時間604を含むエントリを格納する。一つのエントリが一つの物体の動きデータに対応する。なお、エントリに含まれるフィールドは前述したものに限定されない。前述したフィールドのいずれかを含まなくてもよいし、また、他のフィールドを含んでもよい。
As shown in FIG. 6, the
ID601は、ID501と同一のフィールドである。位置変化量602は、境界ボックス330の中心の変化量を格納するフィールドである。サイズ変化量603は、境界ボックス330のサイズの変化量を格納するフィールドである。衝突猶予時間604は、衝突猶予時間を格納するフィールドである。図6に示すように動きデータは、指標を成分とするベクトルとして扱うことができる。
ID601 is the same field as ID501.
なお、動き情報600は物体種別ごとに生成されるものとする。なお、ターゲット画像250が最も過去の場合、当該画像250より前の画像250は存在しないため、ラベル付与部203は指標を0とする。なお、時系列が連続する三つ以上の画像250を用いて動きデータを算出してもよい。
The
以上がステップS107の処理の説明である。 This concludes the explanation of the processing in step S107.
計算機100-1のラベル付与部203は、動き情報600及びラベル定義情報232に基づいてターゲット物体種別の物体にラベルを付与し、物体ラベル情報700を生成する(ステップS108)。
The
ラベル定義情報232には、例えば、以下のような付与規則が定義される。
(付与規則1)中心のy軸の変化量の大きい順に「L1」から「Ln」までのラベルを付与する。
(付与規則2)中心のx軸の変化量順に動きデータをソートし、両端の動きデータのx軸の変化量の差分の大きい順に「L1」から「Ln」までのラベルを付与する。
nは物体の数を表す。
In the
(Assignment rule 1) Labels are assigned from "L1" to "Ln" in descending order of the amount of change in the y-axis from the center.
(Assignment rule 2) The motion data is sorted in order of the amount of change on the x-axis from the center, and labels from "L1" to "Ln" are assigned in order of the largest difference in the amount of change on the x-axis of the motion data at both ends.
n represents the number of objects.
付与規則1は、動きデータに含まれる物理量そのものを指標としてラベルを付与する方法である。付与規則2は、動きデータに含まれる物理量から算出される、周囲の物体の動きとの違いを示す指標に基づいてラベルを付与する方法である。 Assignment rule 1 is a method of assigning a label using the physical quantity contained in the motion data itself as an index. Assignment rule 2 is a method of assigning a label based on an index that indicates the difference from the motion of surrounding objects, calculated from the physical quantity contained in the motion data.
なお、ターゲット画像250が最も過去の場合、ラベル付与部203は、時系列が一つ先の画像250に対するラベルの付与結果をそのまま流用する。
When the
図7に示すように、物体ラベル情報700は、ID701及びラベル702を含むエントリを格納する。一つのエントリが一つの物体に対応する。なお、エントリに含まれるフィールドは前述したものに限定されない。前述したフィールドのいずれかを含まなくてもよいし、また、他のフィールドを含んでもよい。
As shown in FIG. 7,
ID701は、ID501と同一のフィールドである。ラベル702は、決定されたラベルを格納するフィールドである。図7では、中心のy軸の変化量の大きい順に「L1」から「Ln」までのラベルが付与された結果を示す。nは物体の数を表す。
ID701 is the same field as ID501.
計算機100-1のラベル付与部203は、すべての物体種別について処理が完了したか否かを判定する(ステップS109)。
The
すべての物体種別について処理が完了していないと判定された場合、計算機100-1のラベル付与部203は、ステップS106に戻り、同様の処理を実行する。
If it is determined that processing has not been completed for all object types, the
すべての物体種別について処理が完了したと判定された場合、計算機100-1のラベル付与部203は、すべての画像250について処理が完了したか否かを判定する(ステップS110)。
If it is determined that processing has been completed for all object types, the
すべての画像250について処理が完了していないと判定された場合、計算機100-1のラベル付与部203は、ステップS105に戻り、同様の処理を実行する。
If it is determined that processing has not been completed for all
すべての画像250について処理が完了したと判定された場合、計算機100-1の入力制御部204は、物体データ定義情報233に基づいて、各画像250に含まれる物体の物体データ800を生成する(ステップS111)。
If it is determined that processing has been completed for all
計算機100-1の入力制御部204は、物体ラベル情報700及び入力制御情報234に基づいて、各画像250について、行動決定部220に対する物体データ800の入力を制御する(ステップS112)。
The
ここで、行動決定部220に対する物体データの入力の制御方法について説明する。図8A、図8B、図9A、及び図9Bは、実施例1の入力制御部204による物体データ800の入力制御の一例を説明する図である。
Here, a method for controlling the input of object data to the
行動決定部220が図8A及び図8Bに示すように、入力層810、隠れ層811、及び出力層812から構成されるニューラルネットワークである場合、入力制御情報234には、ラベルと入力スロットとの対応付けを示す情報が格納される。この場合、入力制御部204は、物体のラベルに対応する入力スロットに物体データ800を入力する。
When the
なお、図8Aは、物体種別が一つの場合の物体データ800の入力制御を示し、図8Bは、物体種別が二つの場合の物体データ800の入力制御を示す。
Note that FIG. 8A shows input control of
行動決定部220が図9A及び図9Bに示すように、リカレントニューラルネットワーク(RNN)820及びニューラルネットワーク(NN)830から構成される場合、入力制御情報234には、ラベルとRNN820への物体データ800の入力順とを対応付けた情報が格納される。この場合、入力制御部204は、物体のラベルに対応する順番に従って、RNN820に物体データ800を入力する。
When the
なお、図9Aは、物体種別が一つの場合の物体データ800の入力制御を示し、図9Bは、物体種別が二つの場合の物体データ800の入力制御を示す。
Note that FIG. 9A shows input control of
計算機100-1の学習部210は、入力が制御された物体データ800を用いて学習処理を実行する(ステップS113)。その後、計算機100-1は、一連の処理を終了する。
The
学習処理は公知の技術であるため詳細な説明を省略する。なお、学習部210は、画像250が入力されるたびに、学習処理を実行するのではなく、所定の周期で実行してもよい。周期が経過していない場合には、ステップS112及びステップS113の処理は省略できる。学習処理が実行されない場合、物体データ800は蓄積される。
Since the learning process is a known technique, a detailed description will be omitted. Note that the
計算機100-2が実行する処理は、計算機100-1のステップS113の処理を、行動データ260の出力処理に置き換えたものである。
The process executed by computer 100-2 is the same as that executed by computer 100-1 in step S113, but with the output process of
ラベル付与部203は、物体(境界ボックス330)の動きに基づいてラベルを付与する。物体の動きは、物体の見えより多様性が低いため、入力の意味付けを明確に行うことができる。例えば、水平方向の動きが大きい、自車両に近い、移動速度が速い等、物体データ800の入力規則を与えることができる。入力規則に基づいて物体データ800の入力を制御することによって、学習効率の向上及び出力の精度向上が期待できる。
The
図10は、実施例1の境界ボックス予測部201が実行する境界ボックス補正処理の一例を説明するフローチャートである。図11は、実施例1の境界ボックス予測部201による予測境界ボックスの算出方法の一例を示す図である。
FIG. 10 is a flowchart illustrating an example of a boundary box correction process executed by the boundary
境界ボックス予測部201は、ターゲット画像250を選択し、ターゲット画像250に対して、以下で説明する境界ボックス補正処理を実行する。なお、最新の画像250から過去の方向に画像250が選択されるものとする。
The boundary
境界ボックス予測部201は、ターゲット画像250に含まれる物体のループ処理を開始する(ステップS201)。具体的には、境界ボックス予測部201は、ターゲット画像250の境界ボックス情報500から一つの境界ボックス330を選択する。
The bounding
境界ボックス予測部201は、ターゲット画像250と、ターゲット画像250より時系列が一つ前の画像250とを用いて、選択された物体の予測境界ボックス330を算出する(ステップS202)。
The bounding
例えば、境界ボックス予測部201は、ターゲット画像250(t2)より時系列が一つ前の画像250(t1)の物体320-2の境界ボックス330、並びに、物体320-2に重なっている物体320-1の大きさ及び移動速度等に基づいて、選択された画像250における物体320-2の予測境界ボックス330を算出する。
For example, the boundary
なお、予測境界ボックス330の算出方法は公知の技術を用いればよいため、詳細な説明は省略する。
The method for calculating the predicted
境界ボックス予測部201は、選択された物体の境界ボックス330と、予測境界ボックス330との誤差を算出する(ステップS203)。
The bounding
例えば、境界ボックス予測部201は、中心のx軸の誤差又は境界ボックス330の高さの誤差等を算出する。
For example, the bounding
境界ボックス予測部201は、算出された誤差及び遮蔽検出定義情報231に基づいて、選択された物体が他の物体によって遮蔽されているか否かを判定する(ステップS204)。
The bounding
遮蔽検出定義情報231には誤差の閾値が格納されており、境界ボックス予測部201は、誤差及び閾値の比較結果に基づいて、選択された物体が他の物体によって遮蔽されているか否かを判定する。例えば、誤差が閾値より大きい場合、境界ボックス予測部201は、選択された物体が他の物体によって遮蔽されていると判定する。
The occlusion
選択された物体が他の物体によって遮蔽されていないと判定された場合、境界ボックス予測部201はステップS206に進む。
If it is determined that the selected object is not occluded by another object, the bounding
選択された物体が他の物体によって遮蔽されていると判定された場合、境界ボックス予測部201は、選択された物体の境界ボックス330を予測境界ボックス330に置換し(ステップS205)、その後、ステップS206に進む。
If it is determined that the selected object is occluded by another object, the bounding
具体的には、境界ボックス予測部201は、境界ボックス情報500から選択されたエントリの位置502及びサイズ503に、予測境界ボックス330の値を設定する。
Specifically, the bounding
遮蔽状態を考慮して補正された境界ボックス330を用いることによって、物体の動きを正確に評価することができる。
By using a
ステップS206では、ターゲット画像250に含まれるすべての物体について処理が完了したか否かを判定する(ステップS206)。 In step S206, it is determined whether processing has been completed for all objects contained in the target image 250 (step S206).
ターゲット画像250に含まれるすべての物体について処理が完了していないと判定された場合、境界ボックス予測部201は、ステップS201に戻り、同様の処理を実行する。
If it is determined that processing has not been completed for all objects contained in the
ターゲット画像250に含まれるすべての物体について処理が完了したと判定された場合、境界ボックス予測部201は境界ボックス補正処理を終了する。
When it is determined that processing has been completed for all objects contained in the
実施例2では、過去の物体の動きデータから構成されるクラスタを利用してラベルを付与する点が異なる。以下、実施例1との差異を中心に実施例2について説明する。 The difference in the second embodiment is that labels are assigned using clusters constructed from past object movement data. Below, the second embodiment will be explained, focusing on the differences from the first embodiment.
実施例2の計算機システムを構成する計算機100のハードウェア構成は実施例1と同一である。
The hardware configuration of the
図12A及び図12Bは、実施例2の計算機100の機能構成の一例を示す図である。
Figures 12A and 12B are diagrams showing an example of the functional configuration of a
図12Aは、方策を学習する計算機100-1の機能構成を示す。実施例2の計算機100-1は、クラスタ情報239及び履歴情報240を保持する点が実施例1と異なる。
FIG. 12A shows the functional configuration of a computer 100-1 that learns a policy. The computer 100-1 of the second embodiment differs from the computer of the first embodiment in that it holds
図12Bは、方策を用いて行動を決定する計算機100-2の機能構成を示す。実施例2の計算機100-1は、クラスタ情報239及び履歴情報240を保持する点が実施例1と異なる。
FIG. 12B shows the functional configuration of a computer 100-2 that uses a policy to determine an action. The computer 100-1 of the second embodiment differs from the computer of the first embodiment in that it stores
図13は、実施例2のクラスタ情報239のデータ構造の一例を示す図である。
Figure 13 is a diagram showing an example of the data structure of
クラスタID1301、重心1302、及び範囲1303を含むエントリを格納する。一つのエントリが一つのクラスタに対応する。なお、エントリに含まれるフィールドは前述したものに限定されない。前述したフィールドのいずれかを含まなくてもよいし、また、他のフィールドを含んでもよい。
Entries including a
クラスタID1301は、クラスタの識別情報を格納するフィールドである。重心1302は、クラスタの重心を格納するフィールドである。範囲1303は、クラスタの大きさを格納するフィールドである。
実施例2では、動きデータに含まれるx座標、y座標、幅、高さの各々の変化量を軸とする特徴量空間のクラスタを想定している。なお、特徴量空間はこれに限定されない。 In the second embodiment, a cluster in a feature space is assumed, with the axes representing the amount of change in each of the x-coordinate, y-coordinate, width, and height contained in the motion data. Note that the feature space is not limited to this.
なお、物体種別ごとにクラスタを構成してもよい。この場合、物体種別ごとにクラスタ情報239が存在する。
In addition, a cluster may be configured for each object type. In this case,
図14は、実施例2の履歴情報240のデータ構造の一例を示す図である。
Figure 14 is a diagram showing an example of the data structure of
履歴情報240は、位置変化量1401及びサイズ変化量1402を含むエントリを格納する。一つのエントリが動きデータに対応する。なお、エントリに含まれるフィールドは前述したものに限定されない。前述したフィールドのいずれかを含まなくてもよいし、また、他のフィールドを含んでもよい。
The
位置変化量1401及びサイズ変化量1402は、位置変化量602及びサイズ変化量603と同一のフィールドである。
なお、物体種別ごとにクラスタを構成する場合、エントリには物体種別を格納するフィールドが含まれる。 When configuring clusters for each object type, the entry includes a field that stores the object type.
実施例2のラベル定義情報232は、例えば、以下のような付与規則が定義される。
(付与規則3)クラスタnにラベル「Ln」を付与する。
nはクラスタの数を表す。
In the
(Assignment rule 3) Assign a label "Ln" to cluster n.
n represents the number of clusters.
実施例2の計算機100-1が実行する処理の流れは実施例1と同様であるが、一部処理が異なる。 The process flow executed by the computer 100-1 in the second embodiment is the same as that in the first embodiment, but some processing is different.
ステップS108では、ラベル付与部203は、動き情報600、ラベル定義情報232、及びクラスタ情報239に基づいて、ターゲット物体種別の物体にラベルを付与し、物体ラベル情報700を生成する。
In step S108, the
具体的には、ラベル付与部203は、物体の動きデータ及びクラスタ情報239に基づいて、物体が所属するクラスタを決定する。ラベル付与部203は、動きデータを履歴情報240に格納する。ラベル付与部203は、クラスタ及びラベル定義情報232に基づいて、ターゲット物体種別の物体にラベルを付与する。
Specifically, the
実施例2の物体データ800の入力の制御方法は実施例1と同一の制御方法を採用できる。また、図15に示すような制御方法も採用できる。
The control method for inputting the
図15は、実施例2の入力制御部204による物体データ800の入力制御の一例を説明する図である。
Figure 15 is a diagram illustrating an example of input control of
行動決定部220は、RNN820及びNN830から構成される。この場合、ラベル定義情報232には、クラスタごとのラベルの付与規則が定義されている。また、入力制御情報234には、各クラスタのラベルとRNN820への物体データ800の入力順とを対応付けた情報が格納される。この場合、入力制御部204は、物体のラベルに対応する順番に従って、各クラスタの物体データ800をRNN820に入力する。
The
図16は、実施例2の計算機100-1が実行する再クラスタリング処理を説明するフローチャートである。 Figure 16 is a flowchart explaining the re-clustering process executed by computer 100-1 in Example 2.
計算機100-1は、所定数の動きデータが蓄積された場合、所定時間経過した場合、又は、実行要求を受け付けた場合、再クラスタリング処理を実行する。ここでは、ラベル付与部203が実行するものとする。なお、他の機能部が実行してもよい。
The computer 100-1 executes the reclustering process when a predetermined number of pieces of motion data have been accumulated, when a predetermined time has elapsed, or when an execution request has been received. Here, it is assumed that the
ラベル付与部203は、履歴情報240を用いて、クラスタリングを実行する(ステップS301)。クラスタリングは公知の手法を用いればよいため詳細な説明を省略する。
The
ラベル付与部203は、クラスタ情報239を参照し、前回のクラスタと、新たなクラスタとを対応付けできるか否かを判定する(ステップS302)。
The
例えば、すべてのクラスタについて、前回のクラスタと、新たなクラスタとの重心の誤差が閾値より小さく、かつ、範囲の誤差が閾値より小さい場合、ラベル付与部203は、前回のクラスタと、新たなクラスタとを対応付けできると判定する。
For example, if the error in the center of gravity between the previous cluster and the new cluster is smaller than a threshold value for all clusters, and the error in the range is smaller than a threshold value, the
前回のクラスタと、新たなクラスタとを対応付けできると判定された場合、ラベル付与部203は、クラスタ情報239を更新し(ステップS303)、再クラスタリング処理を終了する。
If it is determined that the previous cluster can be associated with the new cluster, the
具体的には、ラベル付与部203は、各クラスタの重心1302及び範囲1303を更新する。再クラスタリングの前後でクラスタは実質的に変化していないため、ラベル定義情報232及び入力制御情報234は変化する必要がない。
Specifically, the
前回のクラスタと、新たなクラスタとを対応付けができないと判定された場合、ラベル付与部203は、クラスタ情報239を更新する(ステップS304)。
If it is determined that the previous cluster cannot be associated with the new cluster, the
具体的には、ラベル付与部203は、クラスタ情報239を初期化し、クラスタリングの結果に基づいて、新たなクラスタのエントリをクラスタ情報239に設定する。
Specifically, the
ラベル付与部203は、ラベル定義情報232及び入力制御情報234の再設定をユーザに要求する(ステップS305)。
The
実施例2では、所属するクラスタに応じてラベルが設定されるため、クラスタが変化した場合、ラベル定義情報232及び入力制御情報234を再設定する必要がある。したがって、クラスタが変化した場合、ラベル付与部203は、ユーザに対して、ラベル定義情報232及び入力制御情報234の再設定を促す。
In the second embodiment, since a label is set according to the cluster to which the label belongs, if the cluster changes, the
ラベル付与部203は、ユーザからラベル定義情報232及び入力制御情報234の入力を受け付ける(ステップS306)。その後、ラベル付与部203は再クラスタリング処理を終了する。
The
なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。また、例えば、上記した実施例は本発明を分かりやすく説明するために構成を詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、各実施例の構成の一部について、他の構成に追加、削除、置換することが可能である。 The present invention is not limited to the above-described embodiments, but includes various modified examples. For example, the above-described embodiments are provided to explain the present invention in detail, and are not necessarily limited to those including all of the described configurations. In addition, it is possible to add, delete, or replace part of the configuration of each embodiment with another configuration.
また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、本発明は、実施例の機能を実現するソフトウェアのプログラムコードによっても実現できる。この場合、プログラムコードを記録した記憶媒体をコンピュータに提供し、そのコンピュータが備えるプロセッサが記憶媒体に格納されたプログラムコードを読み出す。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施例の機能を実現することになり、そのプログラムコード自体、及びそれを記憶した記憶媒体は本発明を構成することになる。このようなプログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、CD-ROM、DVD-ROM、ハードディスク、SSD(Solid State Drive)、光ディスク、光磁気ディスク、CD-R、磁気テープ、不揮発性のメモリカード、ROMなどが用いられる。 The above-mentioned configurations, functions, processing units, processing means, etc. may be realized in part or in whole by hardware, for example by designing them as integrated circuits. The present invention can also be realized by software program code that realizes the functions of the embodiments. In this case, a storage medium on which the program code is recorded is provided to a computer, and a processor included in the computer reads the program code stored in the storage medium. In this case, the program code itself read from the storage medium realizes the functions of the above-mentioned embodiments, and the program code itself and the storage medium on which it is stored constitute the present invention. Examples of storage media for supplying such program code include flexible disks, CD-ROMs, DVD-ROMs, hard disks, SSDs (Solid State Drives), optical disks, magneto-optical disks, CD-Rs, magnetic tapes, non-volatile memory cards, and ROMs.
また、本実施例に記載の機能を実現するプログラムコードは、例えば、アセンブラ、C/C++、perl、Shell、PHP、Python、Java(登録商標)等の広範囲のプログラム又はスクリプト言語で実装できる。 In addition, the program code that realizes the functions described in this embodiment can be implemented in a wide range of program or script languages, such as assembler, C/C++, perl, Shell, PHP, Python, Java (registered trademark), etc.
さらに、実施例の機能を実現するソフトウェアのプログラムコードを、ネットワークを介して配信することによって、それをコンピュータのハードディスクやメモリ等の記憶手段又はCD-RW、CD-R等の記憶媒体に格納し、コンピュータが備えるプロセッサが当該記憶手段や当該記憶媒体に格納されたプログラムコードを読み出して実行するようにしてもよい。 Furthermore, the program code of the software that realizes the functions of the embodiment may be distributed over a network and stored in a storage means such as a computer's hard disk or memory, or in a storage medium such as a CD-RW or CD-R, and the processor of the computer may read and execute the program code stored in the storage means or storage medium.
上述の実施例において、制御線や情報線は、説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。全ての構成が相互に接続されていてもよい。 In the above examples, the control lines and information lines are those that are considered necessary for the explanation, and not all control lines and information lines in the product are necessarily shown. All components may be interconnected.
100 計算機
101 プロセッサ
102 メモリ
103 補助記憶装置
104 ネットワークインタフェース
105 入出力インタフェース
111 入力装置
112 出力装置
200 物体検出部
201 境界ボックス予測部
202 物体分類部
203 ラベル付与部
204 入力制御部
210 学習部
220 行動決定部
230 分類定義情報
231 遮蔽検出定義情報
232 ラベル定義情報
233 物体データ定義情報
234 入力制御情報
235 モデル情報
236 学習情報
237 自己情報
238 報酬情報
239 クラスタ情報
240 履歴情報
250 画像
260 行動データ
300 車両
310 範囲
320 物体
330 境界ボックス
500 境界ボックス情報
600 動き情報
700 物体ラベル情報
800 物体データ
810 入力層
811 隠れ層
812 出力層
820 リカレントニューラルネットワーク
830 ニューラルネットワーク
100
Claims (14)
演算装置、前記演算装置に接続される記憶装置、前記演算装置に接続されるインタフェースを有する、少なくとも一つの計算機を備え、
制御対象の周囲の画像に含まれる物体の特徴を表す物体データを用いて、前記制御対象の行動を決定するモデルを管理するモデル情報と、前記物体の動きに基づいて付与されるラベルに基づく前記モデルに対する前記物体データの入力規則を管理する入力制御情報と、を保持し、
前記画像の時系列データを受け付け、
複数の前記画像の各々から前記物体を検出し、
複数の前記画像の中からターゲット画像を選択し、前記ターゲット画像を含む二つ以上の前記画像を用いて、前記ターゲット画像から検出された前記物体の動きを表す動きデータを算出し、前記ターゲット画像及び前記動きデータを対応付けて記憶し、
複数の前記画像の各々について、前記動きデータに基づいて、前記画像から検出された前記物体に前記ラベルを付与し、
複数の前記画像の各々について、前記入力制御情報及び前記ラベルに基づいて、前記モデルに対する、前記画像から検出された前記物体の前記物体データの入力を制御することを特徴とする計算機システム。 1. A computer system comprising:
At least one computer having a computing device, a storage device connected to the computing device, and an interface connected to the computing device;
The system holds model information for managing a model that determines a behavior of a control target using object data that represents features of objects included in an image of the control target, and input control information for managing input rules for the object data to the model based on labels that are assigned based on the movement of the object,
receiving time series data of the image;
Detecting the object in each of a plurality of the images;
selecting a target image from the plurality of images, calculating motion data representing a motion of the object detected from the target image using two or more of the images including the target image, and storing the target image and the motion data in association with each other;
for each of a plurality of said images, applying said label to said object detected in said image based on said motion data;
A computer system comprising: a computer that controls, for each of a plurality of said images, input of said object data of said object detected from said image to said model based on said input control information and said label.
前記動きデータは、前記物体の動きを表す物理量を成分とするベクトルであって、
前記計算機システムは、
前記動きデータを用いて算出される指標に基づく前記ラベルの付与規則を管理するラベル定義情報を保持し、
前記画像から検出された前記物体の前記動きデータを用いて前記指標を算出し、
前記指標及び前記ラベル定義情報に基づいて、前記画像から検出された前記物体に前記ラベルを付与することを特徴とする計算機システム。 2. The computer system of claim 1,
The motion data is a vector having physical quantities representing the motion of the object as components,
The computer system comprises:
holding label definition information for managing a rule for assigning the label based on an index calculated using the motion data;
Calculating the indicator using the motion data of the object detected from the image;
A computer system comprising: a computer that assigns the label to the object detected from the image based on the index and the label definition information.
前記動きデータは、前記物体の動きを表す物理量を成分とするベクトルであって、
前記計算機システムは、
前記動きデータに含まれる前記物理量を軸とする特徴量空間における複数の前記動きデータから構成されるクラスタを管理するクラスタ情報と、所属する前記クラスタに基づく前記ラベルの付与規則を管理するラベル定義情報と、を保持し、
前記動きデータ及び前記クラスタ情報に基づいて、前記画像から検出された前記物体が所属する前記クラスタを特定し、
特定された前記クラスタ及び前記ラベル定義情報に基づいて、前記画像から検出された前記物体に前記ラベルを付与することを特徴とする計算機システム。 2. The computer system of claim 1,
The motion data is a vector having physical quantities representing the motion of the object as components,
The computer system comprises:
holding cluster information for managing clusters configured from a plurality of pieces of motion data in a feature space having an axis of the physical quantity included in the motion data, and label definition information for managing a rule for assigning the label based on the cluster to which the cluster belongs;
Identifying the cluster to which the object detected from the image belongs based on the motion data and the cluster information;
A computer system comprising: a computer that assigns the label to the object detected from the image based on the identified cluster and the label definition information.
前記画像に含まれる前記物体を包含する領域である境界ボックスを算出し、
前記ターゲット画像を含む二つ以上の前記画像を用いて、前記ターゲット画像に含まれる前記物体の中からターゲット物体を選択し、前記ターゲット物体が他の前記物体によって遮蔽されているか否かを判定し、
前記ターゲット物体が他の前記物体によって遮蔽されている場合、前記ターゲット物体の前記境界ボックスを補正し、
前記ターゲット画像を含む二つ以上の前記画像における前記物体の前記境界ボックスの変化量に基づいて、前記ターゲット画像から検出された前記物体の前記動きデータを算出することを特徴とする計算機システム。 2. The computer system of claim 1,
A bounding box is calculated as an area including the object included in the image;
using two or more of the images including the target image, selecting a target object from among the objects included in the target image, and determining whether the target object is occluded by another of the objects;
correcting the bounding box of the target object if the target object is occluded by another of the objects;
A computer system comprising: a computer that calculates the motion data of the object detected from the target image based on an amount of change in the bounding box of the object in two or more images including the target image.
前記モデルを学習するための学習用画像の時系列データを受け付け、
複数の前記学習用画像の各々から前記物体を検出し、
複数の前記学習用画像の中からターゲット学習用画像を選択し、前記ターゲット学習用画像を含む二つ以上の前記学習用画像を用いて、前記ターゲット学習用画像から検出された前記物体の前記動きデータを算出し、前記ターゲット学習用画像及び前記動きデータを対応付けて記憶し、
複数の前記学習用画像の各々について、前記動きデータに基づいて、前記学習用画像から検出された前記物体に前記ラベルを付与し、
複数の前記学習用画像の各々について、前記入力制御情報及び前記ラベルに基づいて、前記モデルに対する、前記学習用画像から検出された前記物体の前記物体データの入力を制御し、
入力が制御された前記物体データを用いた学習処理を実行することによって、前記モデルを更新し、前記更新の結果を前記モデル情報に反映することを特徴とする計算機システム。 2. The computer system of claim 1,
Accepting time series data of learning images for learning the model;
Detecting the object from each of the plurality of learning images;
selecting a target learning image from the plurality of learning images, calculating the motion data of the object detected from the target learning image using two or more learning images including the target learning image, and storing the target learning image and the motion data in association with each other;
for each of the plurality of training images, assigning the label to the object detected from the training image based on the motion data;
for each of the plurality of learning images, controlling input of the object data of the object detected from the learning image to the model based on the input control information and the label;
A computer system comprising: a learning process that uses the object data whose input is controlled, thereby updating the model; and a result of the update that is reflected in the model information.
前記計算機システムは、
演算装置、前記演算装置に接続される記憶装置、前記演算装置に接続されるインタフェースを有する、少なくとも一つの計算機を含み、
制御対象の周囲の画像に含まれる物体の特徴を表す物体データを用いて、前記制御対象の行動を決定するモデルを管理するモデル情報と、前記物体の動きに基づいて付与されるラベルに基づく前記モデルに対する前記物体データの入力規則を管理する入力制御情報と、を保持し、
前記データの入力制御方法は、
前記少なくとも一つの計算機が、前記画像の時系列データを受け付ける第1のステップと、
前記少なくとも一つの計算機が、複数の前記画像の各々から前記物体を検出する第2のステップと、
前記少なくとも一つの計算機が、複数の前記画像の中からターゲット画像を選択し、前記ターゲット画像を含む二つ以上の前記画像を用いて、前記ターゲット画像から検出された前記物体の動きを表す動きデータを算出し、前記ターゲット画像及び前記動きデータを対応付けて記憶する第3のステップと、
前記少なくとも一つの計算機が、複数の前記画像の各々について、前記動きデータに基づいて、前記画像から検出された前記物体に前記ラベルを付与する第4のステップと、
前記少なくとも一つの計算機が、複数の前記画像の各々について、前記入力制御情報及び前記ラベルに基づいて、前記モデルに対する、前記画像から検出された前記物体の前記物体データの入力を制御する第5のステップと、
を含むことを特徴とするモデルに対するデータの入力制御方法。 A method for controlling input of data to a model, the method being executed by a computer system, comprising:
The computer system comprises:
At least one computer having a computing device, a storage device connected to the computing device, and an interface connected to the computing device;
The system holds model information for managing a model that determines a behavior of a control target using object data that represents features of objects included in an image of the control target, and input control information for managing input rules for the object data to the model based on labels that are assigned based on the movement of the object,
The data input control method includes:
a first step of receiving, by the at least one computer, time series data of the image;
a second step of the at least one computer detecting the object in each of a plurality of the images;
a third step in which the at least one computer selects a target image from the plurality of images, calculates motion data representing a motion of the object detected from the target image using two or more of the images including the target image, and stores the target image and the motion data in association with each other;
a fourth step of the at least one computer assigning, for each of a plurality of the images, the labels to the objects detected in the images based on the motion data;
a fifth step of controlling, for each of a plurality of the images, input of the object data of the object detected from the image to the model based on the input control information and the label by the at least one computer;
13. A method for controlling input of data to a model, comprising:
前記動きデータは、前記物体の動きを表す物理量を成分とするベクトルであって、
前記計算機システムは、前記動きデータを用いて算出される指標に基づく前記ラベルの付与規則を管理するラベル定義情報を保持し、
前記第4のステップは、
前記少なくとも一つの計算機が、前記画像から検出された前記物体の前記動きデータを用いて前記指標を算出するステップと、
前記少なくとも一つの計算機が、前記指標及び前記ラベル定義情報に基づいて、前記画像から検出された前記物体に前記ラベルを付与するステップと、を含むことを特徴とするモデルに対するデータの入力制御方法。 A method for controlling input of data to a model according to claim 6, comprising the steps of:
The motion data is a vector having physical quantities representing the motion of the object as components,
the computer system holds label definition information that manages a rule for assigning the label based on an index calculated using the motion data;
The fourth step includes:
said at least one computer calculating said indicia using said motion data of said object detected from said image;
and a step in which the at least one computer assigns the label to the object detected from the image based on the index and the label definition information.
前記動きデータは、前記物体の動きを表す物理量を成分とするベクトルであって、
前記計算機システムは、前記動きデータに含まれる前記物理量を軸とする特徴量空間における複数の前記動きデータから構成されるクラスタを管理するクラスタ情報と、所属する前記クラスタに基づく前記ラベルの付与規則を管理するラベル定義情報と、を保持し、
前記第4のステップは、
前記少なくとも一つの計算機が、前記動きデータ及び前記クラスタ情報に基づいて、前記画像から検出された前記物体が所属する前記クラスタを特定するステップと、
前記少なくとも一つの計算機が、特定された前記クラスタ及び前記ラベル定義情報に基づいて、前記画像から検出された前記物体に前記ラベルを付与するステップと、
を含むことを特徴とするモデルに対するデータの入力制御方法。 A method for controlling input of data to a model according to claim 6, comprising the steps of:
The motion data is a vector having physical quantities representing the motion of the object as components,
the computer system holds cluster information for managing clusters configured of a plurality of pieces of motion data in a feature space having an axis of the physical quantity included in the motion data, and label definition information for managing a rule for assigning the label based on the cluster to which the cluster belongs;
The fourth step includes:
identifying, by the at least one computer, the cluster to which the object detected from the image belongs based on the motion data and the cluster information;
assigning the labels to the objects detected in the image based on the identified clusters and the label definition information, by the at least one computer;
13. A method for controlling input of data to a model, comprising:
前記第2のステップは、
前記少なくとも一つの計算機が、前記画像に含まれる前記物体を包含する領域である境界ボックスを算出するステップと、
前記少なくとも一つの計算機が、前記ターゲット画像を含む二つ以上の前記画像を用いて、前記ターゲット画像に含まれる前記物体の中からターゲット物体を選択し、前記ターゲット物体が他の前記物体によって遮蔽されているか否かを判定するステップと、
前記少なくとも一つの計算機が、前記ターゲット物体が他の前記物体によって遮蔽されている場合、前記ターゲット物体の前記境界ボックスを補正するステップと、を含み、
前記第3のステップは、前記少なくとも一つの計算機が、前記ターゲット画像を含む二つ以上の前記画像における前記物体の前記境界ボックスの変化量に基づいて、前記ターゲット画像から検出された前記物体の前記動きデータを算出するステップを含むことを特徴とするモデルに対するデータの入力制御方法。 A method for controlling input of data to a model according to claim 6, comprising the steps of:
The second step includes:
said at least one computer calculating a bounding box that is an area that contains said object in said image;
the at least one computer using two or more of the images including the target image to select a target object from among the objects included in the target image and determine whether the target object is occluded by another of the objects;
and correcting the bounding box of the target object if the target object is occluded by another of the objects,
A method for controlling input of data to a model, characterized in that the third step includes a step in which the at least one computer calculates the motion data of the object detected from the target image based on the amount of change in the bounding box of the object in two or more images including the target image.
前記少なくとも一つの計算機が、前記モデルを学習するための学習用画像の時系列データを受け付け、
前記少なくとも一つの計算機が、複数の前記学習用画像の各々から前記物体を検出するステップと、
前記少なくとも一つの計算機が、複数の前記学習用画像の中からターゲット学習用画像を選択し、前記ターゲット学習用画像を含む二つ以上の前記学習用画像を用いて、前記ターゲット学習用画像から検出された前記物体の前記動きデータを算出し、前記ターゲット学習用画像及び前記動きデータを対応付けて記憶するステップと、
前記少なくとも一つの計算機が、複数の前記学習用画像の各々について、前記動きデータに基づいて、前記学習用画像から検出された前記物体に前記ラベルを付与するステップと、
前記少なくとも一つの計算機が、複数の前記学習用画像の各々について、前記入力制御情報及び前記ラベルに基づいて、前記モデルに対する、前記学習用画像から検出された前記物体の前記物体データの入力を制御するステップと、
前記少なくとも一つの計算機が、入力が制御された前記物体データを用いた学習処理を実行することによって、前記モデルを更新し、前記更新の結果を前記モデル情報に反映するステップと、
を含むことを特徴とするモデルに対するデータの入力制御方法。 A method for controlling input of data to a model according to claim 6, comprising the steps of:
The at least one computer receives time-series data of training images for training the model;
detecting the object from each of a plurality of training images by the at least one computer;
the at least one computer selecting a target learning image from the plurality of learning images, calculating the motion data of the object detected from the target learning image using two or more learning images including the target learning image, and storing the target learning image and the motion data in association with each other;
the at least one computer assigning the label to the object detected from the training image based on the motion data for each of the training images;
a step of controlling, for each of the plurality of learning images, an input of the object data of the object detected from the learning image to the model based on the input control information and the label, by the at least one computer;
updating the model by executing a learning process using the object data whose input is controlled by the at least one computer, and reflecting a result of the update in the model information;
13. A method for controlling input of data to a model, comprising:
演算装置、前記演算装置に接続される記憶装置、前記演算装置に接続されるインタフェースを備え、
前記制御対象の周囲の画像に含まれる物体の特徴を表す物体データを用いて、前記制御対象の行動を決定するモデルを管理するモデル情報と、前記物体の動きに基づいて付与されるラベルに基づく前記モデルに対する前記物体データの入力規則を管理する入力制御情報と、を保持し、
前記画像の時系列データを受け付け、
複数の前記画像の各々から前記物体を検出し、
複数の前記画像の中からターゲット画像を選択し、前記ターゲット画像を含む二つ以上の前記画像を用いて、前記ターゲット画像から検出された前記物体の動きを表す動きデータを算出し、前記ターゲット画像及び前記動きデータを対応付けて記憶し、
複数の前記画像の各々について、前記動きデータに基づいて、前記画像から検出された前記物体に前記ラベルを付与し、
複数の前記画像の各々について、前記入力制御情報及び前記ラベルに基づいて、前記モデルに対する、前記画像から検出された前記物体の前記物体データの入力を制御することを特徴とする制御装置。 A control device that determines an action of a control target,
A computing device, a storage device connected to the computing device, and an interface connected to the computing device,
The method includes: storing model information for managing a model that determines a behavior of the control target using object data that represents features of objects included in an image of the control target; and storing input control information for managing input rules for the object data to the model based on labels that are assigned based on the movement of the object;
receiving time series data of the image;
Detecting the object in each of a plurality of the images;
selecting a target image from the plurality of images, calculating motion data representing a motion of the object detected from the target image using two or more of the images including the target image, and storing the target image and the motion data in association with each other;
for each of a plurality of said images, applying said label to said object detected in said image based on said motion data;
A control device characterized by controlling, for each of a plurality of images, input of the object data of the object detected from the image to the model based on the input control information and the label.
前記動きデータは、前記物体の動きを表す物理量を成分とするベクトルであって、
前記制御装置は、
前記動きデータを用いて算出される指標に基づく前記ラベルの付与規則を管理するラベル定義情報を保持し、
前記画像から検出された前記物体の前記動きデータを用いて前記指標を算出し、
前記指標及び前記ラベル定義情報に基づいて、前記画像から検出された前記物体に前記ラベルを付与することを特徴とする制御装置。 The control device according to claim 11,
The motion data is a vector having physical quantities representing the motion of the object as components,
The control device includes:
holding label definition information for managing a rule for assigning the label based on an index calculated using the motion data;
Calculating the indicator using the motion data of the object detected from the image;
A control device which assigns the label to the object detected from the image based on the index and the label definition information.
前記動きデータは、前記物体の動きを表す物理量を成分とするベクトルであって、
前記制御装置は、
前記動きデータに含まれる前記物理量を軸とする特徴量空間における複数の前記動きデータから構成されるクラスタを管理するクラスタ情報と、所属する前記クラスタに基づく前記ラベルの付与規則を管理するラベル定義情報と、を保持し、
前記動きデータ及び前記クラスタ情報に基づいて、前記画像から検出された前記物体が所属する前記クラスタを特定し、
特定された前記クラスタ及び前記ラベル定義情報に基づいて、前記画像から検出された前記物体に前記ラベルを付与することを特徴とする制御装置。 The control device according to claim 11,
The motion data is a vector having physical quantities representing the motion of the object as components,
The control device includes:
holding cluster information for managing clusters configured from a plurality of pieces of motion data in a feature space having an axis of the physical quantity included in the motion data, and label definition information for managing a rule for assigning the label based on the cluster to which the cluster belongs;
Identifying the cluster to which the object detected from the image belongs based on the motion data and the cluster information;
A control device which assigns the label to the object detected from the image based on the identified cluster and the label definition information.
前記画像に含まれる前記物体を包含する領域である境界ボックスを算出し、
前記ターゲット画像を含む二つ以上の前記画像を用いて、前記ターゲット画像に含まれる前記物体の中からターゲット物体を選択し、前記ターゲット物体が他の前記物体によって遮蔽されているか否かを判定し、
前記ターゲット物体が他の前記物体によって遮蔽されている場合、前記ターゲット物体の前記境界ボックスを補正し、
前記ターゲット画像を含む二つ以上の前記画像における前記物体の前記境界ボックスの変化量に基づいて、前記ターゲット画像から検出された前記物体の前記動きデータを算出することを特徴とする制御装置。 The control device according to claim 11,
A bounding box is calculated as an area including the object included in the image;
using two or more of the images including the target image, selecting a target object from among the objects included in the target image, and determining whether the target object is occluded by another of the objects;
correcting the bounding box of the target object if the target object is occluded by another of the objects;
A control device comprising: a control unit that calculates the motion data of the object detected from the target image based on an amount of change in the bounding box of the object in two or more images including the target image.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021115708A JP7609726B2 (en) | 2021-07-13 | 2021-07-13 | Computer system, method for controlling input of data to a model, and control device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021115708A JP7609726B2 (en) | 2021-07-13 | 2021-07-13 | Computer system, method for controlling input of data to a model, and control device |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2023012202A JP2023012202A (en) | 2023-01-25 |
| JP7609726B2 true JP7609726B2 (en) | 2025-01-07 |
Family
ID=85381620
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2021115708A Active JP7609726B2 (en) | 2021-07-13 | 2021-07-13 | Computer system, method for controlling input of data to a model, and control device |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7609726B2 (en) |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2021513484A (en) | 2018-02-14 | 2021-05-27 | ズークス インコーポレイテッド | Detection of blocking stationary vehicles |
-
2021
- 2021-07-13 JP JP2021115708A patent/JP7609726B2/en active Active
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2021513484A (en) | 2018-02-14 | 2021-05-27 | ズークス インコーポレイテッド | Detection of blocking stationary vehicles |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2023012202A (en) | 2023-01-25 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US12430702B2 (en) | Learning robotic tasks using one or more neural networks | |
| US20230419113A1 (en) | Attention-based deep reinforcement learning for autonomous agents | |
| US11055583B1 (en) | Machine learning for computing enabled systems and/or devices | |
| US11960292B2 (en) | Method and system for developing autonomous vehicle training simulations | |
| US10282623B1 (en) | Depth perception sensor data processing | |
| KR102532749B1 (en) | Method and apparatus for hierarchical learning of neural networks based on weak supervised learning | |
| US10679099B2 (en) | Method and apparatus for a manifold view of space | |
| CN112214606B (en) | Detecting and predicting object events from images | |
| CN112200131B (en) | A vehicle collision detection method based on vision, intelligent terminal and storage medium | |
| CN113892112A (en) | Action classification using deep-nested clustering | |
| CN113591573A (en) | Training and target detection method and device for multi-task learning deep network model | |
| US10762440B1 (en) | Sensor fusion and deep learning | |
| JP7200610B2 (en) | POSITION DETECTION PROGRAM, POSITION DETECTION METHOD, AND POSITION DETECTION DEVICE | |
| JP7031685B2 (en) | Model learning device, model learning method and computer program | |
| CN113454640B (en) | Method and system for object tracking using online learning | |
| US20230030474A1 (en) | Method and system for developing autonomous vehicle training simulations | |
| JP7609726B2 (en) | Computer system, method for controlling input of data to a model, and control device | |
| US20250206343A1 (en) | Method For Determining Control Parameters For Driving A Vehicle | |
| US12358142B2 (en) | Generating robotic assembly instructions from three-dimensional computer-aided design models | |
| CN113848699A (en) | Techniques to handle ambiguity in an automatic control system | |
| US11620479B2 (en) | System for determining diverting availability of object recognition model | |
| KR101508842B1 (en) | Systme and method for providign evolutionary adaptive eye tracking for low-cost human computer interaction application | |
| WO2023009926A1 (en) | Method and system for developing autonomous vehicle training simulations | |
| KR102831955B1 (en) | Method and System for Deep Learning-based Auto Labeling using Semiconductor FDC Sensor Data | |
| KR102944943B1 (en) | Method for generating 3d motion information |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240208 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20241128 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20241210 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20241219 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7609726 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |