Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP7848769B2 - Control device and control method - Google Patents
[go: Go Back, main page]

JP7848769B2 - Control device and control method - Google Patents

Control device and control method

Info

Publication number
JP7848769B2
JP7848769B2 JP2023122148A JP2023122148A JP7848769B2 JP 7848769 B2 JP7848769 B2 JP 7848769B2 JP 2023122148 A JP2023122148 A JP 2023122148A JP 2023122148 A JP2023122148 A JP 2023122148A JP 7848769 B2 JP7848769 B2 JP 7848769B2
Authority
JP
Japan
Prior art keywords
workpiece
robot arm
picked
information
learned
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2023122148A
Other languages
Japanese (ja)
Other versions
JP2025018448A (en
Inventor
聖公 赤池
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP2023122148A priority Critical patent/JP7848769B2/en
Publication of JP2025018448A publication Critical patent/JP2025018448A/en
Application granted granted Critical
Publication of JP7848769B2 publication Critical patent/JP7848769B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Manipulator (AREA)

Description

本開示は、制御装置及び制御方法に関し、例えば、ワークを拾い上げて移動させるロボットアームの制御装置及び制御方法に関する。 This disclosure relates to a control device and control method, and more particularly to a control device and control method for a robot arm that picks up and moves a workpiece.

例えば、特許文献1の制御装置は、ロボットアームでワークを拾い上げた際の当該ワークの重心点をロボットアームに設けられた力覚センサの検出情報に基づいて算出し、算出した重心点を参照してワークの種類を判定している。 For example, the control device described in Patent Document 1 calculates the center of gravity of a workpiece when it is picked up by a robot arm, based on detection information from a force sensor installed on the robot arm, and determines the type of workpiece by referring to the calculated center of gravity.

特開2022-67995号公報Japanese Patent Publication No. 2022-67995

本出願人は、以下の課題を見出した。特許文献1の制御装置は、ワークの種類を判別することはできるが、ワーク毎に当該ワークを良好に拾い上げることができる把持点を導き出せない課題を有する。 The applicant has identified the following problem: While the control device described in Patent Document 1 can identify the type of workpiece, it has the problem of not being able to determine a gripping point that allows for a good pickup of each workpiece.

本開示は、このような問題点に鑑みてなされたものであり、ワーク毎に当該ワークを良好に拾い上げることができる把持点を導き出せる制御装置及び制御方法を実現する。 This disclosure was made in view of these problems, and aims to realize a control device and control method that can determine a gripping point that allows for good pickup of each workpiece.

本開示の一態様に係る制御装置は、ワークを拾い上げて移動させるロボットアームの制御装置であって、
前記ロボットアームで前記ワークを拾い上げた際の前記ワークの重心点を前記ロボットアームに設けられた力覚センサの検出情報に基づいて導き出し、前記ロボットアームで前記ワークを拾い上げた際の前記ワークの重心点と前記ワークの把持点とのズレ量と、前記ロボットアームで前記ワークを拾い上げた際の前記ロボットアームの関節情報と、を入力とし、前記ワークの把持点を出力とする深層強化学習モデルによって、前記ワークの重心点に対してズレ量が最小となる前記ワークの把持点を学習する強化学習部と、
前記深層強化学習モデルによって学習した前記ワークの把持点で前記ワークを拾い上げるように、前記ロボットアームの関節情報を導き出す経路生成部と、
前記導き出したロボットアームの関節情報に基づいて前記ロボットアームを制御する制御部と、
を備え、
前記強化学習部は、前記深層強化学習モデルによって、前記導き出したロボットアームの関節情報に基づいて前記ロボットアームを制御して前記ロボットアームで前記ワークを拾い上げた際の前記ワークの重心点と前記ワークの把持点とのズレ量と、前記導き出したロボットアームの関節情報と、を用いて、前記ワークの把持点を再学習する。
A control device according to one aspect of this disclosure is a control device for a robot arm that picks up and moves a workpiece,
A reinforcement learning unit learns the gripping point of the workpiece that minimizes the amount of deviation from the center of gravity of the workpiece when the robot arm picks up the workpiece, using a deep reinforcement learning model that takes the amount of deviation between the center of gravity of the workpiece and the gripping point of the workpiece when the robot arm picks up the workpiece and the joint information of the robot arm when the robot arm picks up the workpiece as inputs and the gripping point of the workpiece as output.
A path generation unit that derives joint information of the robot arm so as to pick up the workpiece at the gripping point of the workpiece learned by the deep reinforcement learning model,
A control unit that controls the robot arm based on the derived joint information of the robot arm,
Equipped with,
The reinforcement learning unit uses the deep reinforcement learning model to control the robot arm based on the derived joint information of the robot arm, and uses the amount of deviation between the center of gravity of the workpiece and the gripping point of the workpiece when the robot arm picks up the workpiece, along with the derived joint information of the robot arm, to relearn the gripping point of the workpiece.

上述の制御装置は、前記ロボットアームで拾い上げるワークの種類並びに拾い上げるワークの順番に関する情報、及び学習済みワークの種類に関する情報を取得し、前記ロボットアームで拾い上げるワークの種類並びに拾い上げるワークの順番に関する情報、及び学習済みワークの種類に関する情報に基づいて、今回、拾い上げるワークが学習済みか否かを判定する判定部を備え、
前記今回、拾い上げるワークが学習済みの場合、前記深層強化学習モデルによる学習を省略し、前記今回、拾い上げるワークが学習済みでない場合、前記深層強化学習モデルによる学習を行うことが好ましい。
The control device described above acquires information regarding the type of workpiece to be picked up by the robot arm, the order in which the workpieces are picked up, and information regarding the types of workpieces that have been learned. Based on the information regarding the type of workpiece to be picked up by the robot arm, the order in which the workpieces are picked up, and the types of workpieces that have been learned, the control device includes a determination unit that determines whether or not the workpiece to be picked up this time has been learned.
In the present case, if the workpiece to be picked up has already been learned, it is preferable to omit the learning process using the deep reinforcement learning model, and if the workpiece to be picked up has not already been learned, it is preferable to perform the learning process using the deep reinforcement learning model.

上述の制御装置において、前記ロボットアームの関節情報として前記ロボットアームの各関節部の角度情報の他に、前記ロボットアームの関節部を駆動するモータの角速度情報、角加速度情報又はトルク情報の少なくとも何れか1つを含むことが好ましい。 In the control device described above, it is preferable that the joint information of the robot arm includes, in addition to the angle information of each joint of the robot arm, at least one of the angular velocity information, angular acceleration information, or torque information of the motor that drives the joint of the robot arm.

本開示の一態様に係る制御方法は、ワークを拾い上げて移動させるロボットアームの制御方法であって、
前記ロボットアームで前記ワークを拾い上げた際の前記ワークの重心点を前記ロボットアームに設けられた力覚センサの検出情報に基づいて導き出す工程と、
前記ロボットアームで前記ワークを拾い上げた際の前記ワークの重心点と前記ワークの把持点とのズレ量と、前記ロボットアームで前記ワークを拾い上げた際の前記ロボットアームの関節情報と、を入力とし、前記ワークの把持点を出力とする深層強化学習モデルによって、前記ワークの重心点に対してズレ量が最小となる前記ワークの把持点を学習する工程と、
前記深層強化学習モデルによって学習した前記ワークの把持点で前記ワークを拾い上げるように、前記ロボットアームの関節情報を導き出す工程と、
前記導き出したロボットアームの関節情報に基づいて前記ロボットアームを制御する工程と、
前記深層強化学習モデルによって、前記導き出したロボットアームの関節情報に基づいて前記ロボットアームを制御して前記ロボットアームで前記ワークを拾い上げた際の前記ワークの重心点と前記ワークの把持点とのズレ量と、前記導き出したロボットアームの関節情報と、を用いて、前記ワークの把持点を再学習する工程と、
を備える。
A control method relating to one aspect of this disclosure is a control method for a robot arm that picks up and moves a workpiece,
A step of determining the center of gravity of the workpiece when the robot arm picks up the workpiece based on detection information from a force sensor provided on the robot arm,
A deep reinforcement learning model takes the amount of deviation between the center of gravity of the workpiece and the gripping point of the workpiece when the robot arm picks up the workpiece as input, and the joint information of the robot arm when the robot arm picks up the workpiece as output, to learn the gripping point of the workpiece that minimizes the amount of deviation from the center of gravity of the workpiece.
The process of deriving joint information of the robot arm so that the workpiece is picked up at the gripping point of the workpiece learned by the deep reinforcement learning model,
A step of controlling the robot arm based on the joint information of the robot arm derived above,
The process involves using the deep reinforcement learning model to control the robot arm based on the joint information of the robot arm derived above, to relearn the gripping point of the workpiece, using the amount of deviation between the center of gravity of the workpiece and the gripping point of the workpiece when the robot arm picks up the workpiece, and the derived joint information of the robot arm.
It is equipped with.

上述の制御方法は、前記ロボットアームで拾い上げるワークの種類並びに拾い上げるワークの順番に関する情報、及び学習済みワークの種類に関する情報を取得し、前記ロボットアームで拾い上げるワークの種類並びに拾い上げるワークの順番に関する情報、及び学習済みワークの種類に関する情報に基づいて、今回、拾い上げるワークが学習済みか否かを判定する工程を備え、
前記今回、拾い上げるワークが学習済みの場合、前記深層強化学習モデルによる学習を省略し、前記今回、拾い上げるワークが学習済みでない場合、前記深層強化学習モデルによる学習を行うことが好ましい。
The control method described above includes a step of acquiring information regarding the type of workpiece to be picked up by the robot arm, the order in which the workpieces are picked up, and information regarding the types of workpieces that have been learned, and determining whether the workpiece to be picked up this time has been learned based on the information regarding the type of workpiece to be picked up by the robot arm, the order in which the workpieces are picked up, and the types of workpieces that have been learned.
In the present case, if the workpiece to be picked up has already been learned, it is preferable to omit the learning process using the deep reinforcement learning model, and if the workpiece to be picked up has not already been learned, it is preferable to perform the learning process using the deep reinforcement learning model.

本開示によれば、ワーク毎に当該ワークを良好に把持することができる把持点を導き出せる制御装置及び制御方法を実現できる。 According to this disclosure, a control device and control method can be realized that can determine a gripping point that allows for a good grip on each workpiece.

実施の形態1のロボットアームシステムの構成を示すブロック図である。This is a block diagram showing the configuration of the robot arm system according to Embodiment 1. 実施の形態1のロボットアームシステムのロボットアームでワークを把持する様子を示す図である。This diagram shows how the robot arm of the robot arm system of Embodiment 1 grips a workpiece. 実施の形態1のロボットアームシステムのロボットアームを制御する流れを説明するためのフローチャート図である。This is a flowchart illustrating the flow of controlling the robot arm of the robot arm system of Embodiment 1. ロボットアームで拾い上げられるワークが収納箱に収納された状態を示す図である。This diagram shows the workpiece, picked up by the robot arm, stored in a storage box. 実施の形態2のロボットアームシステムの構成を示すブロック図である。This is a block diagram showing the configuration of the robot arm system of Embodiment 2. 実施の形態2のロボットアームシステムのロボットアームを制御する流れを説明するためのフローチャート図である。This is a flowchart illustrating the control flow of the robot arm of the robot arm system of Embodiment 2.

以下、本開示を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。但し、本開示が以下の実施の形態に限定される訳ではない。また、以下の記載及び図面は、適宜、簡略化されている。 The following describes specific embodiments applying this disclosure, with reference to the drawings. However, this disclosure is not limited to the following embodiments. Furthermore, the following description and drawings have been simplified as appropriate.

<実施の形態1>
先ず、本実施の形態のロボットアームシステムの構成を説明する。図1は、本実施の形態のロボットアームシステムの構成を示すブロック図である。図2は、本実施の形態のロボットアームシステムのロボットアームでワークを把持する様子を示す図である。
<Embodiment 1>
First, the configuration of the robot arm system of this embodiment will be described. Figure 1 is a block diagram showing the configuration of the robot arm system of this embodiment. Figure 2 is a diagram showing how the robot arm of the robot arm system of this embodiment grips a workpiece.

本実施の形態のロボットアームシステム1は、図1に示すように、ロボットアーム2、力覚センサ3、カメラ4、制御装置5及びデータベース(DB)6を備えている。これらのロボットアーム2、力覚センサ3、カメラ4及びDB6は、有線又は無線によって制御装置5に通信可能に接続されている。 As shown in Figure 1, the robot arm system 1 of this embodiment comprises a robot arm 2, a force sensor 3, a camera 4, a control device 5, and a database (DB) 6. These robot arm 2, force sensor 3, camera 4, and DB 6 are communicated to the control device 5 via wired or wireless means.

ロボットアーム2は、一般的なロボットアームと同様に多関節ロボットアームであり、図2に示すように、ハンド部2a及びアーム部2bを備えている。ハンド部2aは、例えば、2指ハンドで構成することができる。アーム部2bは、例えば、6軸ロボットで構成することができる。これらのハンド部2a及びアーム部2bの各々の関節部は、モータ2cの駆動力に基づいて動作する。 The robot arm 2 is a multi-joint robot arm, similar to a typical robot arm, and comprises a hand section 2a and an arm section 2b, as shown in Figure 2. The hand section 2a can be configured as, for example, a two-fingered hand. The arm section 2b can be configured as, for example, a six-axis robot. Each joint of these hand section 2a and arm section 2b operates based on the driving force of the motor 2c.

力覚センサ3は、図2に示すように、ロボットアーム2のハンド部2aとアーム部2bとの間に配置されている。つまり、ハンド部2aは、力覚センサ3を介してアーム部2bに連結されている。カメラ4は、例えば、RGBDカメラで構成することができる。 As shown in Figure 2, the force sensor 3 is positioned between the hand portion 2a and the arm portion 2b of the robot arm 2. In other words, the hand portion 2a is connected to the arm portion 2b via the force sensor 3. The camera 4 can be configured as, for example, an RGBD camera.

カメラ4は、例えば、ロボットアーム2で把持される前のワークWを撮影する。カメラ4は、ロボットアーム2に設けられているとよいが、ロボットアーム2で把持される前のワークWを撮影することができる箇所に配置されていればよい。 Camera 4, for example, photographs the workpiece W before it is grasped by the robot arm 2. While it is preferable for camera 4 to be mounted on the robot arm 2, it is sufficient if it is positioned in a location that allows it to photograph the workpiece W before it is grasped by the robot arm 2.

制御装置5は、図1に示すように、形状認識部5a、強化学習部5b、経路生成部5c及び制御部5dを備えている。形状認識部5aは、カメラ4で撮影した画像情報に基づいて、ワークWの形状を認識する。ワークWの形状を認識する手法は、一般的な手法を用いることができる。 As shown in Figure 1, the control device 5 comprises a shape recognition unit 5a, a reinforcement learning unit 5b, a path generation unit 5c, and a control unit 5d. The shape recognition unit 5a recognizes the shape of the workpiece W based on image information captured by the camera 4. A general method can be used to recognize the shape of the workpiece W.

強化学習部5bは、詳細は後述するが、ロボットアーム2でワークWを拾い上げた際の当該ワークWの重心点Gを力覚センサ3の検出情報に基づいて導き出し、深層強化学習モデルによってワークWの重心点Gに対するズレ量が最小となるワークWの把持点Pを学習する。 The reinforcement learning unit 5b, as will be described in detail later, derives the center of gravity G of the workpiece W when the robot arm 2 picks it up, based on the detection information from the force sensor 3, and learns the gripping point P of the workpiece W that minimizes the amount of deviation from the center of gravity G of the workpiece W using a deep reinforcement learning model.

深層強化学習モデルは、ロボットアーム2でワークWを拾い上げた際の当該ワークWの重心点GとワークWの把持点Pとのズレ量と、ロボットアーム2でワークWを拾い上げた際のロボットアーム2の関節情報と、を入力とし、ワークWの把持点Pを出力とするモデルである。なお、重心点G、把持点P及びズレ量は、例えば、所定の位置を原点とする三次元の座標情報で示されるとよい。 The deep reinforcement learning model takes the following as inputs: the amount of displacement between the center of gravity G of the workpiece W and the gripping point P of the workpiece W when the robot arm 2 picks up the workpiece W; and the joint information of the robot arm 2 when the robot arm 2 picks up the workpiece W. The model outputs the gripping point P of the workpiece W. The center of gravity G, gripping point P, and displacement amount can preferably be represented by three-dimensional coordinate information with a predetermined origin.

経路生成部5cは、詳細は後述するが、認識したワークWの形状に基づいて導き出した当該ワークWの把持点P又は深層強化学習モデルによって学習したワークWの把持点Pにロボットアーム2がアプローチしてワークWを拾い上げるための経路を生成し、生成した経路を実現するためのロボットアーム2の関節情報として各々の関節部の角度などを導き出す。 The path generation unit 5c, as will be described in detail later, generates a path for the robot arm 2 to approach the gripping point P of the workpiece W, derived based on the shape of the recognized workpiece W, or the gripping point P of the workpiece W learned by the deep reinforcement learning model, and pick up the workpiece W. It also derives joint information for the robot arm 2, such as the angles of each joint, to realize the generated path.

また、経路生成部5cは、深層強化学習モデルによって学習したワークWの把持点Pから所定の場所にワークWを移動させるための経路を生成し、生成した経路を実現するためのロボットアーム2の関節情報として各々の関節部の角度などを導き出す。 Furthermore, the path generation unit 5c generates a path for moving the workpiece W from its gripping point P, which was learned by a deep reinforcement learning model, to a predetermined location. It then derives joint information for the robot arm 2, such as the angles of each joint, to realize the generated path.

制御部5dは、導き出したロボットアーム2の各々の関節部の角度情報などに基づいて、ロボットアーム2の各々のモータ2cを制御する。このとき、制御部5dは、モータ2cに設けられたエンコーダ2dの検出情報に基づいて当該モータ2cを制御するとよい。DB6は、深層強化学習モデルやワークWの把持点P毎の当該ワークWの把持が成功したか否かの結果情報などを格納する。 The control unit 5d controls each motor 2c of the robot arm 2 based on the angle information of each joint of the robot arm 2 that it has derived. At this time, the control unit 5d may control the motor 2c based on the detection information of the encoder 2d provided on the motor 2c. The DB 6 stores the deep reinforcement learning model and result information such as whether the gripping of the workpiece W was successful or not for each gripping point P of the workpiece W.

次に、本実施の形態のロボットアームシステム1のロボットアーム2を制御する流れを説明する。図3は、本実施の形態のロボットアームシステムのロボットアームを制御する流れを説明するためのフローチャート図である。 Next, the control flow of the robot arm 2 of the robot arm system 1 of this embodiment will be explained. Figure 3 is a flowchart illustrating the control flow of the robot arm of the robot arm system of this embodiment.

ここで、図4は、ロボットアーム2で拾い上げられるワークWが収納箱11に収納された状態を示しており、以下の説明では、当該ワークWを拾い上げるものとする。図4の例では、図2に示すような側面視が偏心形状である板状のワークWが収納箱11の内部に収納された状態で当該収納箱11に設けられた仕切り11aに立て掛けられている。 Here, Figure 4 shows the state in which the workpiece W to be picked up by the robot arm 2 is stored in the storage box 11. In the following description, we will assume that the workpiece W is being picked up. In the example of Figure 4, a plate-shaped workpiece W, which has an eccentric shape in side view as shown in Figure 2, is stored inside the storage box 11 and propped up against a partition 11a provided in the storage box 11.

このような状態で、先ず、カメラ4がワークWを上側から撮影する。そして、制御装置5の形状認識部5aは、カメラ4で撮影したワークWの画像情報に基づいて、ワークWの形状を認識する(S1)。このとき、形状認識部5aは、ワークWの上面視の形状を認識するとよい。図4の例では、形状認識部5aは、ワークWの上面視が薄い板状であると認識する。 In this state, first, camera 4 photographs the workpiece W from above. Then, the shape recognition unit 5a of the control device 5 recognizes the shape of the workpiece W based on the image information of the workpiece W captured by camera 4 (S1). At this time, the shape recognition unit 5a should recognize the shape of the workpiece W as viewed from above. In the example in Figure 4, the shape recognition unit 5a recognizes that the top view of the workpiece W is a thin plate shape.

次に、制御装置5の経路生成部5cは、認識したワークWの形状に基づいて、ワークWの把持点Pを導き出す(S2)。例えば、ワークWの上面視が薄い板状である場合、経路生成部5cは、図2に示すように、ワークWの幅寸法(図2の左右方向)の中央を把持点Pとする。但し、経路生成部5cは、例えば、認識したワークWの形状に基づいて、ワークWの上面視の略中央を把持点Pとすればよい。 Next, the path generation unit 5c of the control device 5 derives the gripping point P of the workpiece W based on the recognized shape of the workpiece W (S2). For example, if the top view of the workpiece W is a thin plate shape, the path generation unit 5c sets the gripping point P to the center of the width dimension of the workpiece W (left-right direction in Figure 2), as shown in Figure 2. However, the path generation unit 5c may, for example, set the gripping point P to approximately the center of the top view of the workpiece W based on the recognized shape of the workpiece W.

次に、制御装置5の経路生成部5cは、導き出したワークWの把持点Pにロボットアーム2がアプローチしてワークWを拾い上げるための経路を生成し、生成した経路を実現するためのロボットアーム2の関節情報として各々の関節部の角度などを導き出す。 Next, the path generation unit 5c of the control device 5 generates a path for the robot arm 2 to approach the gripping point P of the workpiece W and pick up the workpiece W. It then derives joint information for the robot arm 2, such as the angles of each joint, to realize the generated path.

そして、制御装置5の制御部5dは、導き出したロボットアーム2の各々の関節部の角度情報などに基づいて、ロボットアーム2の各々のモータ2cを制御してワークWを拾い上げる(S3)。ここで、ワークWの拾い上げは、例えば、ワークWを所定の高さ鉛直方向に引き上げるとよい。 Then, the control unit 5d of the control device 5 controls each motor 2c of the robot arm 2 based on the angle information of each joint of the robot arm 2 that it has derived, to pick up the workpiece W (S3). Here, the workpiece W can be picked up by, for example, pulling the workpiece W up vertically to a predetermined height.

次に、制御装置5の強化学習部5bは、ロボットアーム2でワークWを拾い上げた際の当該ワークWの重心点Gを力覚センサ3の検出情報に基づいて導き出し、ロボットアーム2でワークWを拾い上げた際のワークWの重心点GとワークWの把持点Pとのズレ量と、ロボットアーム2でワークWを拾い上げた際のロボットアーム2の関節情報と、を取得する(S4)。 Next, the reinforcement learning unit 5b of the control device 5 derives the center of gravity G of the workpiece W when the robot arm 2 picks up the workpiece W, based on the detection information from the force sensor 3. It then acquires the amount of deviation between the center of gravity G of the workpiece W and the gripping point P of the workpiece W, as well as the joint information of the robot arm 2 when the robot arm 2 picks up the workpiece W (S4).

ここで、力覚センサ3を用いてワークWの重心点Gを導き出す手法は、一般的な手法を用いることができる。そして、ワークWの重心点GとワークWの把持点Pとのズレ量は、水平方向でのズレ量であるとよい。 Here, a general method can be used to determine the center of gravity G of the workpiece W using the force sensor 3. Furthermore, the amount of displacement between the center of gravity G of the workpiece W and the gripping point P of the workpiece W should ideally be the amount of displacement in the horizontal direction.

また、ロボットアーム2の関節情報は、ロボットアーム2でワークWを拾い上げるために当該ワークWを把持した際の各々の関節部の角度情報の他に、モータ2cの角速度情報、角加速度情報及びトルク情報の少なくとも1つを含んでいるとよい。 Furthermore, the joint information of the robot arm 2 may include, in addition to the angle information of each joint when the robot arm 2 grasps the workpiece W in order to pick it up, at least one of the angular velocity information, angular acceleration information, and torque information of the motor 2c.

次に、制御装置5の強化学習部5bは、深層強化学習モデルにS4の工程で取得したワークWの重心点GとワークWの把持点Pとのズレ量と、ロボットアーム2でワークWを拾い上げた際のロボットアーム2の関節情報と、を入力し、ワークWの重心点Gに対してズレ量が最小となるワークWの把持点Pを学習する(S5)。 Next, the reinforcement learning unit 5b of the control device 5 receives the amount of displacement between the center of gravity G of the workpiece W and the gripping point P of the workpiece W, obtained in step S4, and the joint information of the robot arm 2 when the robot arm 2 picked up the workpiece W, and learns the gripping point P of the workpiece W that minimizes the displacement relative to the center of gravity G of the workpiece W (S5).

このとき、ワークWの把持点Pが局所範囲である場合、例えば、ワークWの形状や収納箱11との干渉などの要因で、ロボットアーム2でワークWの把持点Pを把持できない場合が想定される。そのため、制御装置5の強化学習部5bは、ワークWの重心点Gに対して所定の範囲(図2の例では、ワークWの重心点Gに対して当該ワークWの幅方向に所定の範囲)でワークWの把持点Pを分布させるとよい。 In this case, if the gripping point P of the workpiece W is within a localized area, it is conceivable that the robot arm 2 may not be able to grip the workpiece W at its gripping point P due to factors such as the shape of the workpiece W or interference with the storage box 11. Therefore, the reinforcement learning unit 5b of the control device 5 should distribute the gripping points P of the workpiece W within a predetermined range relative to the center of gravity G of the workpiece W (in the example in Figure 2, a predetermined range in the width direction of the workpiece W relative to the center of gravity G of the workpiece W).

次に、制御装置5の経路生成部5cは、学習したワークWの把持点Pにロボットアーム2がアプローチしてワークWを拾い上げるための経路を生成し、生成した経路を実現するためのロボットアーム2の関節情報として各々の関節部の角度などを導き出す。 Next, the path generation unit 5c of the control device 5 generates a path for the robot arm 2 to approach the learned gripping point P of the workpiece W and pick up the workpiece W. It then derives joint information for the robot arm 2, such as the angles of each joint, to realize the generated path.

そして、制御装置5の制御部5dは、導き出したロボットアーム2の各々の関節部の角度情報などに基づいて、ロボットアーム2の各々のモータ2cを制御してワークWを拾い上げる(S6)。 Then, the control unit 5d of the control device 5 controls each motor 2c of the robot arm 2 based on the angle information of each joint of the robot arm 2 that it has derived, in order to pick up the workpiece W (S6).

次に、制御装置5の強化学習部5bは、ロボットアーム2で学習したワークWの把持点Pを把持してワークWを拾い上げた際の当該ワークWの重心点Gを力覚センサ3の検出情報に基づいて取得し、ロボットアーム2でワークWを拾い上げた際のワークWの重心点GとワークWの把持点Pとのズレ量と、ロボットアーム2でワークWを拾い上げた際のロボットアーム2の関節情報と、を取得する(S7)。 Next, the reinforcement learning unit 5b of the control device 5 acquires the center of gravity G of the workpiece W when the robot arm 2 grasps the gripping point P of the workpiece W and picks up the workpiece W, based on the detection information of the force sensor 3. It also acquires the amount of deviation between the center of gravity G of the workpiece W and the gripping point P of the workpiece W when the robot arm 2 picks up the workpiece W, and the joint information of the robot arm 2 when the robot arm 2 picks up the workpiece W (S7).

次に、制御装置5の強化学習部5bは、深層強化学習モデルにS7の工程で取得したワークWの重心点GとワークWの把持点Pとのズレ量と、ロボットアーム2でワークWを拾い上げた際のロボットアーム2の関節情報と、を入力し、ワークWの重心点Gに対してズレ量が最小となるワークWの把持点Pを再学習する(S8)。 Next, the reinforcement learning unit 5b of the control device 5 receives the amount of displacement between the center of gravity G of the workpiece W and the gripping point P of the workpiece W, obtained in step S7, and the joint information of the robot arm 2 when the robot arm 2 picked up the workpiece W, and relearns the gripping point P of the workpiece W that minimizes the displacement relative to the center of gravity G of the workpiece W (S8).

このとき、S5の工程において、強化学習部5bがワークWの重心点Gに対して所定の範囲でワークWの把持点Pを分布させている場合、深層強化学習モデルにワークWの把持が成功したか否かの結果情報も入力して、ワークWの重心点Gに対してズレ量が最小となるワークWの把持点Pを再学習するとよい。 At this point, if, in step S5, the reinforcement learning unit 5b distributes the gripping points P of the workpiece W within a predetermined range relative to the centroid G of the workpiece W, it is advisable to input the result information of whether or not the gripping of the workpiece W was successful into the deep reinforcement learning model and retrain the gripping points P of the workpiece W that minimize the amount of displacement relative to the centroid G of the workpiece W.

これにより、ワークWの重心点Gに対してズレ量が最小となるワークWの把持点PでワークWを確実に把持することができる。そのため、例えば、ワークWが大型の場合であっても、ワークWを把持した際に発生するワークWのモーメントを減少させることができ、ワークWを良好に拾い上げることができる。 This allows for secure gripping of the workpiece W at the gripping point P, where the amount of displacement relative to the workpiece W's center of gravity G is minimized. Therefore, even with large workpieces W, for example, the moment generated when gripping the workpiece W can be reduced, allowing for efficient pick-up of the workpiece W.

次に、制御装置5の経路生成部5cは、再学習したワークWの把持点Pにロボットアーム2がアプローチしてワークWを拾い上げ、所定の場所に移動させるための経路を生成し、生成した経路を実現するためのロボットアーム2の関節情報として各々の関節部の角度などを導き出す。 Next, the path generation unit 5c of the control device 5 generates a path for the robot arm 2 to approach the gripping point P of the relearned workpiece W, pick up the workpiece W, and move it to a predetermined location. It then derives joint information for the robot arm 2, such as the angles of each joint, to realize the generated path.

そして、制御装置5の制御部5dは、導き出したロボットアーム2の各々の関節部の角度情報などに基づいて、ロボットアーム2の各々のモータ2cを制御してワークWを拾い上げて所定の場所に移動させる(S9)。 Then, the control unit 5d of the control device 5 controls each motor 2c of the robot arm 2 based on the angle information of each joint of the robot arm 2 that it has derived, to pick up the workpiece W and move it to the predetermined location (S9).

このように本実施の形態の制御装置5及び制御方法は、深層強化学習モデルを用いてワークWの重心点Gに対してズレ量が最小となるワークWの把持点Pを学習する。そのため、本実施の形態の制御装置5及び制御方法は、ワークW毎に当該ワークWを良好に把持することができる把持点Pを簡単に導き出せる。 Thus, the control device 5 and control method of this embodiment learn the gripping point P of the workpiece W that minimizes the amount of displacement relative to the center of gravity G of the workpiece W, using a deep reinforcement learning model. Therefore, the control device 5 and control method of this embodiment can easily derive the gripping point P that allows for good gripping of each workpiece W.

しかも、ワークW毎に当該ワークWの把持点Pを作業員が入力するティーチング処理を行う必要がなく、特許文献1の制御装置に比べて、把持可能なワークWを簡単に増やすことができ、また、ワークWの形状や荷姿によらずに、ワークWを拾い上げることができる。 Furthermore, it eliminates the need for operators to manually input the gripping point P for each workpiece W. Compared to the control device described in Patent Document 1, it allows for easy expansion of the number of grippable workpieces W, and enables the picking up of workpieces W regardless of their shape or packaging.

<実施の形態2>
図5は、本実施の形態のロボットアームシステムの構成を示すブロック図である。本実施の形態のロボットアームシステム21は、図5に示すように、実施の形態1のロボットアームシステム1と略等しい。
<Embodiment 2>
Figure 5 is a block diagram showing the configuration of the robot arm system of this embodiment. As shown in Figure 5, the robot arm system 21 of this embodiment is substantially the same as the robot arm system 1 of Embodiment 1.

そのため、重複する説明は省略するが、図5に示すように、制御装置22が判定部22aを備えており、当該判定部22aが、今回、拾い上げるワークWが学習済みか否かを判定し、判定結果に基づいて当該ワークWの把持点Pを学習するか否かを判定する。 Therefore, although redundant explanations will be omitted, as shown in Figure 5, the control device 22 is equipped with a determination unit 22a. This determination unit 22a determines whether the workpiece W to be picked up has already been learned, and based on the determination result, it decides whether or not to learn the gripping point P of the workpiece W.

そして、DB23には、ロボットアーム2で拾い上げるワークWの種類や拾い上げるワークWの順番などに関する情報、学習済みワークWの種類に関する情報、学習済みワークWの把持点Pに関する情報、及び学習済みワークWの関節情報などが格納されている。 Furthermore, DB23 stores information such as the type of workpiece W to be picked up by the robot arm 2, the order in which the workpieces W are picked up, information about learned workpiece W types, information about the gripping points P of learned workpiece W, and information about the joints of learned workpiece W.

図6は、本実施の形態のロボットアームシステムのロボットアームを制御する流れを説明するためのフローチャート図である。本実施の形態のロボットアームシステム21のロボットアーム2を制御する流れは、図6に示すように、実施の形態1のロボットアームシステム1のロボットアーム2を制御する流れと略等しい。 Figure 6 is a flowchart illustrating the control flow of the robot arm in this embodiment of the robot arm system. The control flow of the robot arm 2 in the robot arm system 21 of this embodiment is substantially the same as the control flow of the robot arm 2 in the robot arm system 1 of Embodiment 1, as shown in Figure 6.

そのため、重複する説明は省略するが、S1の工程の前に、制御装置22の判定部22aがDB23からロボットアーム2で拾い上げるワークWの種類や拾い上げるワークWの順番などに関する情報、及び学習済みワークWの種類に関する情報を読み出し、ロボットアーム2で拾い上げるワークWの種類や拾い上げるワークWの順番などに関する情報、及び学習済みワークWの種類に関する情報に基づいて、今回、拾い上げるワークWが学習済みか否かを判定する(S11)。 Therefore, although redundant explanations will be omitted, before step S1, the determination unit 22a of the control device 22 reads information from DB 23 regarding the type of workpiece W to be picked up by the robot arm 2, the order in which the workpieces W will be picked up, and information regarding the types of workpieces W that have already been learned. Based on this information, the determination unit 22a determines whether the workpiece W to be picked up this time has already been learned (S11).

今回、拾い上げるワークWが学習済みでない場合(S11のNO)、S1~S9の工程を実行し、ロボットアーム2を制御して当該ワークWを拾い上げて移動させる。つまり、制御装置22は、今回、拾い上げるワークWの把持点を学習する。 If the workpiece W to be picked up is not already learned (NO in S11), steps S1 to S9 are executed, and the robot arm 2 is controlled to pick up and move the workpiece W. In other words, the control device 22 learns the gripping point of the workpiece W to be picked up this time.

一方、今回、拾い上げるワークWが学習済みである場合(S11のYES)、制御装置22の制御部5dは、DB23から当該ワークWの関節情報を読み出し、読み出したワークWの関節情報に基づいて、ロボットアーム2の各々のモータ2cを制御してワークWの把持を試み、ワークWの把持が成功したか否かを判定する(S12)。 On the other hand, if the workpiece W to be picked up is already learned (YES in S11), the control unit 5d of the control device 22 reads the joint information of the workpiece W from DB 23, and based on the read joint information of the workpiece W, controls each of the motors 2c of the robot arm 2 to attempt to grasp the workpiece W, and determines whether or not the grasp of the workpiece W was successful (S12).

ワークWの把持が失敗した場合(S12のNO)、S1~S9の工程を実行し、ロボットアーム2を制御して当該ワークWを拾い上げて移動させる。このとき、例えば、ワークWは学習済みであっても、ワークWの荷姿が変わって当該ワークWの把持に失敗したことなどが要因にある。 If the gripping of workpiece W fails (NO in S12), steps S1 to S9 are executed, and the robot arm 2 is controlled to pick up and move the workpiece W. In this case, even if workpiece W has been learned, the failure to grip it may be due to a change in the packaging of workpiece W.

一方、ワークWの把持が成功した場合(S12のYES)、読み出したワークWの関節情報に基づいて、ロボットアーム2の各々のモータ2cを制御してワークWの移動を継続させる(S13)。つまり、制御装置22は、今回、拾い上げるワークWの把持点の学習を省略する。 On the other hand, if the gripping of the workpiece W is successful (YES in S12), the robot arm 2 controls each of its motors 2c based on the read joint information of the workpiece W to continue moving the workpiece W (S13). In other words, the control device 22 omits learning the gripping point of the workpiece W to be picked up this time.

このように本実施の形態の制御装置22及び制御方法も、深層強化学習モデルを用いてワークWの重心点Gに対してズレ量が最小となるワークWの把持点Pを学習する。そのため、本実施の形態の制御装置22及び制御方法は、ワークW毎に当該ワークWを良好に把持することができる把持点Pを簡単に導き出せる。 Thus, the control device 22 and control method of this embodiment also learn the gripping point P of the workpiece W that minimizes the amount of displacement relative to the centroid G of the workpiece W using a deep reinforcement learning model. Therefore, the control device 22 and control method of this embodiment can easily derive the gripping point P that allows for good gripping of each workpiece W.

特に、本実施の形態の制御装置22及び制御方法は、今回、拾い上げるワークWが学習済みか否かを判定し、判定結果に基づいて、深層強化学習モデルによる学習を省略している。そのため、ワークWを拾い上げる毎に当該ワークWの把持点Pを学習する必要がなく、制御装置22の計算負担を低減することができる。 In particular, the control device 22 and control method of this embodiment determine whether the workpiece W to be picked up has already been learned, and based on the determination result, the learning process using the deep reinforcement learning model is omitted. Therefore, it is not necessary to learn the gripping point P of the workpiece W each time it is picked up, thereby reducing the computational burden on the control device 22.

なお、本実施の形態では、制御装置22の判定部22aがDB23からロボットアーム2で拾い上げるワークWの種類や拾い上げるワークWの順番などに関する情報、及び学習済みワークWの種類に関する情報を読み出し、ロボットアーム2で拾い上げるワークWの種類や拾い上げるワークWの順番などに関する情報、及び学習済みワークWの種類に関する情報に基づいて、今回、拾い上げるワークWが学習済みか否かを判定しているが、今回、拾い上げるワークWを撮影した画像情報に基づいて認識した当該ワークWの形状に基づいて、今回、拾い上げるワークWが学習済みか否かの判定をしてもよい。 In this embodiment, the determination unit 22a of the control device 22 reads information from DB 23 regarding the type of workpiece W to be picked up by the robot arm 2, the order in which the workpieces W are picked up, and information regarding the types of workpieces W that have already been learned. Based on this information, the determination unit 22a determines whether the workpiece W to be picked up this time has already been learned. However, the determination may also be made based on the shape of the workpiece W recognized from image information of the workpiece W to be picked up this time.

また、本実施の形態では、S12の工程を実行しているが、S12の工程を省略してもよい。 Furthermore, although step S12 is performed in this embodiment, step S12 may be omitted.

<他の実施の形態>
上記実施の形態では、本開示をハードウェアの構成として説明したが、本開示はこれに限定されるものではない。本開示は、各処理を、CPU(Central Processing Unit)にプログラムを実行させることにより実現することも可能である。
<Other Embodiments>
In the embodiments described above, the disclosure was explained as a hardware configuration, but the disclosure is not limited thereto. The disclosure can also be implemented by having a CPU (Central Processing Unit) execute a program for each process.

ここで、プログラムは、コンピュータに読み込まれた場合に、1又はそれ以上の機能をコンピュータに行わせるための命令群(又はソフトウェアコード)を含む。プログラムは、非一時的なコンピュータ可読媒体又は実体のある記憶媒体に格納されてもよい。限定ではなく例として、コンピュータ可読媒体又は実体のある記憶媒体は、random-access memory(RAM)、read-only memory(ROM)、フラッシュメモリ、solid-state drive(SSD)又はその他のメモリ技術、CD-ROM、digital versatile disc(DVD)、Blu-ray(登録商標)ディスク又はその他の光ディスクストレージ、磁気カセット、磁気テープ、磁気ディスクストレージ又はその他の磁気ストレージデバイスを含む。プログラムは、一時的なコンピュータ可読媒体又は通信媒体上で送信されてもよい。限定ではなく例として、一時的なコンピュータ可読媒体又は通信媒体は、電気的、光学的、音響的、またはその他の形式の伝搬信号を含む。 Here, a program includes a set of instructions (or software code) that, when loaded into a computer, cause the computer to perform one or more functions. A program may be stored on a non-temporary computer-readable medium or a physical storage medium. Examples, but not limited to, include random-access memory (RAM), read-only memory (ROM), flash memory, solid-state drives (SSDs), or other memory technologies, CD-ROMs, digital versatile discs (DVDs), Blu-ray® discs, or other optical disc storage, magnetic cassettes, magnetic tapes, magnetic disk storage, or other magnetic storage devices. A program may be transmitted over a temporary computer-readable medium or a communication medium. Examples, but not limited to, include temporary computer-readable mediums or communication media that include electrically, optically, acoustically, or otherwise propagating signals.

本開示は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。 This disclosure is not limited to the embodiments described above, and may be modified as appropriate without departing from the spirit of the invention.

1 ロボットアームシステム
2 ロボットアーム、2a ハンド部、2b アーム部、2c モータ、2d エンコーダ
3 力覚センサ
4 カメラ
5 制御装置、5a 形状認識部、5b 強化学習部、5c 経路生成部、5d 制御部
6 データベース
11 収納箱
21 ロボットアームシステム
22 制御装置、22a 判定部
23 データベース
G ワークの重心点
P ワークの把持点
W ワーク
1 Robot arm system 2 Robot arm, 2a Hand section, 2b Arm section, 2c Motor, 2d Encoder 3 Force sensor 4 Camera 5 Control device, 5a Shape recognition section, 5b Reinforcement learning section, 5c Path generation section, 5d Control unit 6 Database 11 Storage box 21 Robot arm system 22 Control device, 22a Judgment section 23 Database G Center of gravity of workpiece P Gripping point of workpiece W Workpiece

Claims (5)

ワークを拾い上げて移動させるロボットアームの制御装置であって、
前記ロボットアームで前記ワークを拾い上げた際の前記ワークの重心点を前記ロボットアームに設けられた力覚センサの検出情報に基づいて導き出し、前記ロボットアームで前記ワークを拾い上げた際の前記ワークの重心点と前記ワークの把持点とのズレ量と、前記ロボットアームで前記ワークを拾い上げた際の前記ロボットアームの関節情報と、を入力とし、前記ワークの把持点を出力とする深層強化学習モデルによって、前記ワークの重心点に対してズレ量が最小となる前記ワークの把持点を学習する強化学習部と、
前記深層強化学習モデルによって学習した前記ワークの把持点で前記ワークを拾い上げるように、前記ロボットアームの関節情報を導き出す経路生成部と、
前記導き出したロボットアームの関節情報に基づいて前記ロボットアームを制御する制御部と、
を備え、
前記強化学習部は、前記深層強化学習モデルによって、前記導き出したロボットアームの関節情報に基づいて前記ロボットアームを制御して前記ロボットアームで前記ワークを拾い上げた際の前記ワークの重心点と前記ワークの把持点とのズレ量と、前記導き出したロボットアームの関節情報と、を用いて、前記ワークの把持点を再学習する、制御装置。
A control device for a robot arm that picks up and moves a workpiece,
A reinforcement learning unit learns the gripping point of the workpiece that minimizes the amount of deviation from the center of gravity of the workpiece when the robot arm picks up the workpiece, using a deep reinforcement learning model that takes the amount of deviation between the center of gravity of the workpiece and the gripping point of the workpiece when the robot arm picks up the workpiece and the joint information of the robot arm when the robot arm picks up the workpiece as inputs and the gripping point of the workpiece as output.
A path generation unit that derives joint information of the robot arm so as to pick up the workpiece at the gripping point of the workpiece learned by the deep reinforcement learning model,
A control unit that controls the robot arm based on the derived joint information of the robot arm,
Equipped with,
The reinforcement learning unit is a control device that, using the deep reinforcement learning model, controls the robot arm based on the joint information of the robot arm derived to pick up the workpiece, and uses the amount of deviation between the center of gravity of the workpiece and the gripping point of the workpiece, along with the derived joint information of the robot arm, to relearn the gripping point of the workpiece.
前記ロボットアームで拾い上げるワークの種類並びに拾い上げるワークの順番に関する情報、及び学習済みワークの種類に関する情報を取得し、前記ロボットアームで拾い上げるワークの種類並びに拾い上げるワークの順番に関する情報、及び学習済みワークの種類に関する情報に基づいて、今回、拾い上げるワークが学習済みか否かを判定する判定部を備え、
前記今回、拾い上げるワークが学習済みの場合、前記深層強化学習モデルによる学習を省略し、前記今回、拾い上げるワークが学習済みでない場合、前記深層強化学習モデルによる学習を行う、請求項1に記載の制御装置。
The system includes a determination unit that acquires information regarding the type of workpiece to be picked up by the robot arm, the order in which the workpieces are picked up, and the types of workpieces that have been learned, and determines whether the workpiece to be picked up this time has been learned or not based on the information regarding the type of workpiece to be picked up by the robot arm, the order in which the workpieces are picked up, and the types of workpieces that have been learned.
The control device according to claim 1, wherein if the workpiece to be picked up this time has already been learned, the learning by the deep reinforcement learning model is omitted, and if the workpiece to be picked up this time has not been learned, the learning by the deep reinforcement learning model is performed.
前記ロボットアームの関節情報として前記ロボットアームの各関節部の角度情報の他に、前記ロボットアームの関節部を駆動するモータの角速度情報、角加速度情報又はトルク情報の少なくとも何れか1つを含む、請求項1又は2に記載の制御装置。 The control device according to claim 1 or 2, wherein, in addition to the angle information of each joint of the robot arm, the joint information of the robot arm includes at least one of the angular velocity information, angular acceleration information, or torque information of the motor that drives the joint of the robot arm. ワークを拾い上げて移動させるロボットアームの制御方法であって、
前記ロボットアームで前記ワークを拾い上げた際の前記ワークの重心点を前記ロボットアームに設けられた力覚センサの検出情報に基づいて導き出す工程と、
前記ロボットアームで前記ワークを拾い上げた際の前記ワークの重心点と前記ワークの把持点とのズレ量と、前記ロボットアームで前記ワークを拾い上げた際の前記ロボットアームの関節情報と、を入力とし、前記ワークの把持点を出力とする深層強化学習モデルによって、前記ワークの重心点に対してズレ量が最小となる前記ワークの把持点を学習する工程と、
前記深層強化学習モデルによって学習した前記ワークの把持点で前記ワークを拾い上げるように、前記ロボットアームの関節情報を導き出す工程と、
前記導き出したロボットアームの関節情報に基づいて前記ロボットアームを制御する工程と、
前記深層強化学習モデルによって、前記導き出したロボットアームの関節情報に基づいて前記ロボットアームを制御して前記ロボットアームで前記ワークを拾い上げた際の前記ワークの重心点と前記ワークの把持点とのズレ量と、前記導き出したロボットアームの関節情報と、を用いて、前記ワークの把持点を再学習する工程と、
を備える、制御方法。
A method for controlling a robot arm that picks up and moves a workpiece,
A step of determining the center of gravity of the workpiece when the robot arm picks up the workpiece based on detection information from a force sensor provided on the robot arm,
A deep reinforcement learning model takes the amount of deviation between the center of gravity of the workpiece and the gripping point of the workpiece when the robot arm picks up the workpiece as input, and the joint information of the robot arm when the robot arm picks up the workpiece as output, to learn the gripping point of the workpiece that minimizes the amount of deviation from the center of gravity of the workpiece.
The process of deriving joint information of the robot arm so that the workpiece is picked up at the gripping point of the workpiece learned by the deep reinforcement learning model,
A step of controlling the robot arm based on the joint information of the robot arm derived above,
The process involves using the deep reinforcement learning model to control the robot arm based on the joint information of the robot arm derived above, to relearn the gripping point of the workpiece, using the amount of deviation between the center of gravity of the workpiece and the gripping point of the workpiece when the robot arm picks up the workpiece, and the derived joint information of the robot arm.
A control method comprising:
前記ロボットアームで拾い上げるワークの種類並びに拾い上げるワークの順番に関する情報、及び学習済みワークの種類に関する情報を取得し、前記ロボットアームで拾い上げるワークの種類並びに拾い上げるワークの順番に関する情報、及び学習済みワークの種類に関する情報に基づいて、今回、拾い上げるワークが学習済みか否かを判定する工程を備え、
前記今回、拾い上げるワークが学習済みの場合、前記深層強化学習モデルによる学習を省略し、前記今回、拾い上げるワークが学習済みでない場合、前記深層強化学習モデルによる学習を行う、請求項4に記載の制御方法。
The system includes a step of acquiring information regarding the type of workpiece to be picked up by the robot arm, the order in which the workpieces are picked up, and the types of workpieces that have been learned, and determining whether the workpiece to be picked up this time has been learned based on the information regarding the type of workpiece to be picked up by the robot arm, the order in which the workpieces are picked up, and the types of workpieces that have been learned,
The control method according to claim 4, wherein if the workpiece to be picked up this time has already been learned, the learning by the deep reinforcement learning model is omitted, and if the workpiece to be picked up this time has not been learned, the learning by the deep reinforcement learning model is performed.
JP2023122148A 2023-07-27 2023-07-27 Control device and control method Active JP7848769B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023122148A JP7848769B2 (en) 2023-07-27 2023-07-27 Control device and control method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2023122148A JP7848769B2 (en) 2023-07-27 2023-07-27 Control device and control method

Publications (2)

Publication Number Publication Date
JP2025018448A JP2025018448A (en) 2025-02-06
JP7848769B2 true JP7848769B2 (en) 2026-04-21

Family

ID=94433121

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023122148A Active JP7848769B2 (en) 2023-07-27 2023-07-27 Control device and control method

Country Status (1)

Country Link
JP (1) JP7848769B2 (en)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014210311A (en) 2013-04-18 2014-11-13 ファナック株式会社 Control device of robot carrying work
JP2017064910A (en) 2015-07-31 2017-04-06 ファナック株式会社 Machine learning device for learning taking-out operation of workpiece, robot system, and machine learning method
JP2018118343A (en) 2017-01-25 2018-08-02 株式会社安川電機 Handling system and controller
JP2019034836A (en) 2017-08-18 2019-03-07 ファナック株式会社 Control device and machine learning device
WO2019225746A1 (en) 2018-05-25 2019-11-28 川崎重工業株式会社 Robot system and supplemental learning method
WO2020262058A1 (en) 2019-06-26 2020-12-30 ソニー株式会社 Control device, control method, and program
US20210060797A1 (en) 2019-08-30 2021-03-04 Lg Electronics Inc. Robot and operating method thereof
JP2021171885A (en) 2020-04-27 2021-11-01 パナソニックIpマネジメント株式会社 Retention device, control method, control program, control system, and end effector
JP2022067995A (en) 2020-10-21 2022-05-09 新東工業株式会社 Control apparatus, robot control system, program, and control method

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014210311A (en) 2013-04-18 2014-11-13 ファナック株式会社 Control device of robot carrying work
JP2017064910A (en) 2015-07-31 2017-04-06 ファナック株式会社 Machine learning device for learning taking-out operation of workpiece, robot system, and machine learning method
JP2018118343A (en) 2017-01-25 2018-08-02 株式会社安川電機 Handling system and controller
JP2019034836A (en) 2017-08-18 2019-03-07 ファナック株式会社 Control device and machine learning device
WO2019225746A1 (en) 2018-05-25 2019-11-28 川崎重工業株式会社 Robot system and supplemental learning method
WO2020262058A1 (en) 2019-06-26 2020-12-30 ソニー株式会社 Control device, control method, and program
US20210060797A1 (en) 2019-08-30 2021-03-04 Lg Electronics Inc. Robot and operating method thereof
JP2021171885A (en) 2020-04-27 2021-11-01 パナソニックIpマネジメント株式会社 Retention device, control method, control program, control system, and end effector
JP2022067995A (en) 2020-10-21 2022-05-09 新東工業株式会社 Control apparatus, robot control system, program, and control method

Also Published As

Publication number Publication date
JP2025018448A (en) 2025-02-06

Similar Documents

Publication Publication Date Title
CN102189550B (en) Robot having learning control function
CN108568814B (en) Robot and robot control method
KR100377973B1 (en) Time optimal track for cluster tool robots
JP5895346B2 (en) Robot, robot control apparatus, robot control method, and robot control program
JP2017094438A (en) Robot system with simplified teaching and learning performance improvement function by learning
JP2024539839A (en) Robot system for controlling multiple robots to perform a task cooperatively - Patents.com
CN103107767A (en) Motor control device, robot hand, robot, and motor control method
TW202042990A (en) Robot hand, robot, and robot system
JP2016120561A (en) Transfer robot and control method thereof
JP2017056525A (en) Robot apparatus, robot control method, program, recording medium, and assembly part manufacturing method
JP2011093055A (en) Information processing method, apparatus, and program
JP5253293B2 (en) Friction coefficient identification method, grip control method, robot hand and program for performing this grip control method
JP7848769B2 (en) Control device and control method
CN116741685B (en) Wafer safe transmission control method and system
JP3328414B2 (en) Robot hand attitude control device
CN114746223B (en) Generate control programs for robotic manipulators
US20200298410A1 (en) Robot hand controller
JP2016209936A (en) Robot apparatus, robot control method, program, and recording medium
JP2022128152A (en) Robot hand and article take-out system
CN117283596A (en) Grip position setting method and robot system
JPH09204216A (en) Acceleration / deceleration control method for articulated robot
JP5157545B2 (en) Whole body coordination device, robot, and robot control method
JP6671226B2 (en) Robot arm system and teaching method of robot arm
JP2019104091A (en) Robot apparatus and control method for robot apparatus
KR20240170811A (en) Product moving device and its control method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20250423

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20260218

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20260310

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20260323

R150 Certificate of patent or registration of utility model

Ref document number: 7848769

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150