JP7809033B2 - Remote operation assistance system, remote operation assistance method, and program - Google Patents
Remote operation assistance system, remote operation assistance method, and programInfo
- Publication number
- JP7809033B2 JP7809033B2 JP2022136628A JP2022136628A JP7809033B2 JP 7809033 B2 JP7809033 B2 JP 7809033B2 JP 2022136628 A JP2022136628 A JP 2022136628A JP 2022136628 A JP2022136628 A JP 2022136628A JP 7809033 B2 JP7809033 B2 JP 7809033B2
- Authority
- JP
- Japan
- Prior art keywords
- target object
- unit
- end effector
- information
- motion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Manipulator (AREA)
- Image Analysis (AREA)
Description
本発明は、遠隔操作補助システム、遠隔操作補助方法、およびプログラムに関する。 The present invention relates to a remote operation assistance system, a remote operation assistance method, and a program.
ロボットに物体を把持させる制御装置が提案されている。このような制御装置として、物理的に接触可能な把持点を仮決定したうえで、力のつり合いを考慮して把持力を決定し、その把持力の質を把持力の包絡体の体積として評価したうえで、より質の高い把持点を探索する手法が提案されている(例えば特許文献1参照)。 A control device has been proposed that allows a robot to grasp an object. One such control device involves tentatively determining a physically contactable grasp point, determining a grasp force taking into account the balance of forces, evaluating the quality of the grasp force as the volume of the envelope of the grasp force, and then searching for a grasp point of higher quality (see, for example, Patent Document 1).
特許文献1に記載の技術等では、物体毎に形状や把持点を事前に登録しておき、物体形状を用いて物体の位置姿勢を推定したのちに、ロボットの現在姿勢と把持点との関係から把持するための軌道を生成する。このため、特許文献1に記載等の技術では、事前にシステムに登録された物体(形状や重量)しか扱えないという課題があった。 Technologies such as those described in Patent Document 1 register the shape and gripping point of each object in advance, estimate the object's position and orientation using the object's shape, and then generate a gripping trajectory based on the relationship between the robot's current orientation and the gripping point. For this reason, technologies such as those described in Patent Document 1 have the problem of only being able to handle objects (shapes and weights) that have been registered in the system in advance.
本発明は、上記の問題点に鑑みてなされたものであって、事前にシステムに登録されていない物体であっても作業可能な遠隔操作補助システム、遠隔操作補助方法、およびプログラムを提供することを目的とする。 The present invention was made in consideration of the above-mentioned problems, and aims to provide a remote operation assistance system, remote operation assistance method, and program that can perform work on objects that have not been registered in the system in advance.
(1)上記目的を達成するため、本発明の一態様に係る遠隔操作補助システムは、少なくともエンドエフェクタを遠隔操作する遠隔操作補助システムであって、少なくとも前記エンドエフェクタを操作する操作者の動作に関する情報を取得する動作取得部と、前記動作取得部で得た情報を用いて、前記エンドエフェクタによって操作する対象である対象物体と、前記対象物体の操作方法であるタスクを推定する意図理解部と、前記エンドエフェクタが操作される環境の環境情報を取得する環境状況判断部と、前記意図理解部の情報と前記環境状況判断部の情報を取得し、取得した情報から前記エンドエフェクタの操作量を決定する操作量決定部と、を備え、前記操作量決定部は、前記対象物体の物体形状を幾何基本要素に近似し、前記近似した結果を、前記エンドエフェクタに対する事前登録された操作戦略の登録情報と比較して反映する近似結果反映部を備える、遠隔操作補助システムである。 (1) In order to achieve the above object, one aspect of the present invention provides a remote operation assistance system for remotely operating at least an end effector, comprising: a motion acquisition unit that acquires information regarding the motion of an operator operating the end effector; an intention understanding unit that uses the information acquired by the motion acquisition unit to estimate a target object to be operated by the end effector and a task that is a method of operating the target object; an environmental situation determination unit that acquires environmental information about the environment in which the end effector is operated; and a manipulation amount determination unit that acquires information from the intention understanding unit and the environmental situation determination unit and determines a manipulation amount for the end effector from the acquired information, wherein the manipulation amount determination unit comprises an approximation result reflection unit that approximates the object shape of the target object to geometric primitives and compares the approximation result with registered information of a pre-registered manipulation strategy for the end effector and reflects the approximated result.
(2)また、本発明の一態様に係る(1)に記載の遠隔操作補助システムにおいて、前記近似結果反映部は、前記環境情報は、インスタンスIDを含む前記対象物体に関する形状情報であり、前記インスタンスID(識別子)毎に前記幾何基本要素の形状フィッティング処理を行う。なお、本実施形態において、対象物体に関する形状とは、ボクセル情報または点群情報である。 (2) In the remote operation assistance system according to (1) of one aspect of the present invention, the approximation result reflecting unit performs shape fitting of the geometric primitives for each instance ID (identifier) of the target object, where the environment information is shape information related to the target object including an instance ID. Note that in this embodiment, the shape related to the target object is voxel information or point cloud information.
(3)また、本発明の一態様に係る(1)または(2)に記載の遠隔操作補助システムにおいて、前記幾何基本要素は、1つ、または複数、あるいは注目領域のうちのいずれか1つである。 (3) In the remote operation assistance system according to (1) or (2) of one aspect of the present invention, the geometric basic element is one, multiple, or one of a region of interest.
(4)また、本発明の一態様に係る(3)に記載の遠隔操作補助システムにおいて、前記近似結果反映部は、前記幾何基本要素が前記注目領域の場合に、前記対象物体の平均形状を前記幾何基本要素に変形して領域間のマッピング関数を算出し、前記意図理解部によって推定された動作とタクソノミーと、前記環境状況判断部によって分離されたクラスIDに基づいて、把持確率マップを取得し、算出された領域間の対応のマッピング関数に基づいて、前記把持確率マップを前記幾何基本要素の領域にマッピングし、現在の手首姿勢から、幾何学的制約を満たしつつ、経路の短さと最短経路が最も確率が高くなる把持点を、最適化問題を解いて求める。 (4) Furthermore, in the remote operation assistance system described in (3) according to one aspect of the present invention, when the geometric primitive is the region of interest, the approximation result reflecting unit transforms the average shape of the target object into the geometric primitive and calculates a mapping function between regions, obtains a grasping probability map based on the motion and taxonomy estimated by the intention understanding unit and the class ID separated by the environmental situation determining unit, maps the grasping probability map to the region of the geometric primitive based on the calculated mapping function of correspondence between regions, and solves an optimization problem to find a grasping point that maximizes the probability of the shortest path and the shortest route while satisfying geometric constraints from the current wrist posture.
(5)また、本発明の一態様に係る(1)から(4)のうちのいずれか1つに記載の遠隔操作補助システムにおいて、前記環境状況判断部は、RGBデータを取得するRGBセンサと、深度画像を取得する深度センサと、インスタンスセグメンテーション(Instance Segmentation)の手法を用いて、前記RGBセンサが出力するカラー画像を用いて、画像中の物体のインスタンス(Instance)IDに基づくマスク画像を生成するマスク生成部と、前記深度画像と前記マスク画像を用いて各インスタンスIDにおける深度画像を生成する加算部と、前記RGBセンサが出力するカラー画像に対して画像処理を行って、前記環境状況判断部の位置を検出する自己位置推定部と、前記自己位置推定部が出力する前記環境状況判断部の姿勢情報と、前記加算部が出力するクラス毎の各インスタンスIDにおける深度画像を用いて、クラス毎の各インスタンスIDのポイントクラウドを三次元再構成によって求める三次元再構成部と、キーフレーム毎に各インスタンスIDのポイントクラウドを取得し、時刻tの現在のデータ、過去のt-1、t-2、・・・のフレームの時系列データを取得管理し、これらのデータを統合するデータ統合部と、を備える。 (5) In addition, in the remote operation assistance system according to any one of (1) to (4) according to one aspect of the present invention, the environmental situation determination unit includes an RGB sensor that acquires RGB data, a depth sensor that acquires a depth image, and an instance segmentation (Instance the mask generation unit uses the color image output by the RGB sensor to generate a mask image based on the instance ID of an object in the image using a method of image segmentation; an adder unit uses the depth image and the mask image to generate a depth image for each instance ID; a self-position estimation unit performs image processing on the color image output by the RGB sensor to detect the position of the environmental situation assessment unit; a three-dimensional reconstruction unit uses the posture information of the environmental situation assessment unit output by the self-position estimation unit and the depth image for each instance ID for each class output by the adder unit to perform three-dimensional reconstruction to obtain a point cloud for each instance ID for each class; and a data integration unit acquires a point cloud for each instance ID for each key frame, acquires and manages the current data at time t and time series data for past frames t-1, t-2, ..., and integrates this data.
(6)上記目的を達成するため、本発明の一態様に係る遠隔操作補助方法は、少なくともエンドエフェクタを遠隔操作する遠隔操作補助システムにおける遠隔操作補助方法であって、動作取得部が、少なくとも前記エンドエフェクタを操作する操作者の動作に関する情報を取得する動作取得ステップと、意図理解部が、前記動作取得ステップで得た情報を用いて、前記エンドエフェクタによって操作する対象である対象物体と、前記対象物体の操作方法であるタスクを推定する意図理解ステップと、環境状況判断部が、前記エンドエフェクタが操作される環境の環境情報を取得する環境状況判断ステップと、操作量決定部が、前記意図理解ステップで得られた情報と前記環境状況判断ステップで得られた情報を取得し、取得した情報から前記エンドエフェクタの操作量を決定する操作量決定ステップと、を有し、前記操作量決定ステップにおいて、前記操作量決定部が、前記対象物体の物体形状を幾何基本要素に近似し、前記近似した結果を、前記エンドエフェクタに対する事前登録された操作戦略の登録情報と比較して反映する、遠隔操作補助方法である。 (6) To achieve the above object, one aspect of the present invention provides a remote operation assistance method in a remote operation assistance system that remotely operates at least an end effector, the remote operation assistance method including: a motion acquisition step in which a motion acquisition unit acquires information about at least the motion of an operator operating the end effector; an intention understanding step in which an intention understanding unit uses the information acquired in the motion acquisition step to infer a target object to be operated by the end effector and a task that is a method of operating the target object; an environmental situation determination step in which an environmental situation determination unit acquires environmental information about the environment in which the end effector is operated; and a manipulation amount determination step in which a manipulation amount determination unit acquires the information acquired in the intention understanding step and the information acquired in the environmental situation determination step and determines a manipulation amount for the end effector from the acquired information; and in the manipulation amount determination step, the manipulation amount determination unit approximates the object shape of the target object to geometric primitives and compares the approximation result with registered information of a pre-registered manipulation strategy for the end effector to reflect the approximated result.
(7)上記目的を達成するため、本発明の一態様に係るプログラムは、少なくともエンドエフェクタを遠隔操作する遠隔操作補助システムにおけるコンピュータであって、少なくとも前記エンドエフェクタを操作する操作者の動作に関する動作情報を取得させ、前記動作情報を用いて、前記エンドエフェクタによって操作する対象である対象物体と、前記対象物体の操作方法であるタスクを推定させ、前記エンドエフェクタが操作される環境の環境情報を取得させ、推定された前記対象物体と前記タスクの情報と、前記環境情報を取得させ、取得された情報から前記エンドエフェクタの操作量を決定させ、前記エンドエフェクタの操作量の決定において、前記対象物体の物体形状を幾何基本要素に近似させ、前記近似された結果を、前記エンドエフェクタに対する事前登録された操作戦略の登録情報と比較して反映させる、を実行させるプログラムである。 (7) In order to achieve the above object, one aspect of the present invention provides a program for a computer in a remote operation assistance system that remotely operates at least an end effector, the program executing the following: acquiring motion information related to the motion of an operator operating the end effector; using the motion information, estimating a target object to be operated by the end effector and a task that is a method of operating the target object; acquiring environmental information about the environment in which the end effector is operated; acquiring information about the estimated target object and task and the environmental information; determining an operation amount for the end effector from the acquired information; approximating the object shape of the target object to geometric primitives in determining the operation amount for the end effector; and comparing the approximation result with registered information of a pre-registered operation strategy for the end effector and reflecting the result in the calculation.
(1)~(7)によれば、事前にシステムに登録されていない物体であっても作業可能にできる。 By using (1) to (7), it is possible to work with objects that have not been registered in the system in advance.
以下、本発明の実施の形態について図面を参照しながら説明する。なお、以下の説明に用いる図面では、各部材を認識可能な大きさとするため、各部材の縮尺を適宜変更している。
なお、実施形態を説明するための全図において、同一の機能を有するものは同一符号を用い、繰り返しの説明は省略する。
また、本願でいう「XXに基づいて」とは、「少なくともXXに基づく」ことを意味し、XXに加えて別の要素に基づく場合も含む。また、「XXに基づいて」とは、XXを直接に用いる場合に限定されず、XXに対して演算や加工が行われたものに基づく場合も含む。「XX」は、任意の要素(例えば、任意の情報)である。
Hereinafter, embodiments of the present invention will be described with reference to the drawings. In the drawings used in the following description, the scale of each component is appropriately changed so that each component can be recognized.
In all the drawings for explaining the embodiments, the same reference numerals are used for components having the same functions, and repeated explanations will be omitted.
Furthermore, in this application, "based on XX" means "based on at least XX," and includes cases where it is based on other elements in addition to XX. Furthermore, "based on XX" is not limited to cases where XX is used directly, but also includes cases where it is based on XX that has been calculated or processed. "XX" is any element (for example, any information).
[遠隔操作補助システムの構成例]
図1は、本実施形態に係る遠隔操作補助システムの構成例を示す図である。図1のように、遠隔操作補助システム1は、環境状況判断部2(2-1,2-2,2-3,…)と、HMD3と、指示検出部4と、動作取得部5と、意図理解部6と、操作量決定部7と、ロボット15と、制御部16を備える。
HMD3は、例えば視線検出部31を備える。
操作量決定部7は、例えば、モデル8と、データ統合部9と、近似結果反映部17と、動作推定部11と、把持DB12と、データベース14を備える。
近似結果反映部17は、形状近似部10と、把持計画部13を備える。
ロボット15は、例えば、エンドエフェクタ151と、アーム152と、センサ153を備える。
[Configuration example of remote operation assistance system]
1 is a diagram showing an example of the configuration of a remote operation assistance system according to this embodiment. As shown in FIG. 1, the remote operation assistance system 1 includes an environmental situation determination unit 2 (2-1, 2-2, 2-3, ...), an HMD 3, an instruction detection unit 4, an action acquisition unit 5, an intention understanding unit 6, an operation amount determination unit 7, a robot 15, and a control unit 16.
The HMD 3 includes, for example, a gaze detection unit 31 .
The operation amount determination unit 7 includes, for example, a model 8, a data integration unit 9, an approximation result reflection unit 17, a motion estimation unit 11, a grip DB 12, and a database 14.
The approximation result reflecting unit 17 includes a shape approximation unit 10 and a grasp planning unit 13 .
The robot 15 includes, for example, an end effector 151 , an arm 152 , and a sensor 153 .
環境状況判断部2は、後述するようにRGBセンサ深度センサを備える。環境状況判断部2は、エンドエフェクタ151が操作される環境の環境情報を取得する。環境状況判断部2は、対象物体に関する形状情報を出力する。なお、本実施形態において、対象物体に関する形状とは、例えばボクセル情報または点群情報である。また、環境状況判断部2は、例えば操作環境に複数設置されている。なお、環境状況判断部2の構成例等は後述する。 The environmental situation determination unit 2 is equipped with an RGB sensor and a depth sensor, as described below. The environmental situation determination unit 2 acquires environmental information about the environment in which the end effector 151 is operated. The environmental situation determination unit 2 outputs shape information about the target object. Note that in this embodiment, the shape about the target object is, for example, voxel information or point cloud information. Furthermore, multiple environmental situation determination units 2 are installed in the operating environment, for example. Note that an example configuration of the environmental situation determination unit 2 will be described later.
HMD3は、例えばヘッドマウントディスプレイ装置である。HMD3は、例えば眼鏡型であってもよく、片目用であってもよく、両目用であってもよい。なお、HMD3は、表示装置も備え、環境状況判断部2のRGBセンサ211(図2)が撮影した画像を取得して表示してもよく、または取得した画像データを用いて生成した仮想画像を表示してもよい。 The HMD 3 is, for example, a head-mounted display device. The HMD 3 may be, for example, a glasses-type device, and may be for one eye or both eyes. The HMD 3 also includes a display device, and may acquire and display images captured by the RGB sensor 211 (Figure 2) of the environmental condition assessment unit 2, or may display virtual images generated using the acquired image data.
視線検出部31は、例えば、操作者の眼の画像を撮影し、撮影した画像を画像処理して視線を検出する。 The gaze detection unit 31, for example, captures an image of the operator's eyes and performs image processing on the captured image to detect the gaze.
指示検出部4は、操作者の指の関節角度と手首の姿勢を検出する。指示検出部4は、例えば、データグローブ、関節角度検出センサ等である。 The instruction detection unit 4 detects the operator's finger joint angles and wrist posture. The instruction detection unit 4 is, for example, a data glove, a joint angle detection sensor, etc.
動作取得部5は、少なくともエンドエフェクタ151を操作する操作者の動作に関する情報を取得する。動作取得部5は、例えば、視線検出部31が検出した検出結果と、指示検出部4が検出した検出結果を取得する。 The motion acquisition unit 5 acquires information about at least the motion of the operator operating the end effector 151. The motion acquisition unit 5 acquires, for example, the detection results detected by the gaze detection unit 31 and the detection results detected by the instruction detection unit 4.
意図理解部6は、動作取得部5が取得した情報を用いて、エンドエフェクタ151によって操作される対象である対象物体と、対象物体の操作方法であるタスク(操作意図)を推定する。 The intention understanding unit 6 uses the information acquired by the action acquisition unit 5 to estimate the target object to be operated by the end effector 151 and the task (operation intention), which is the method of operating the target object.
操作量決定部7は、意図理解部6が出力する情報と環境状況判断部2が出力する情報を取得し、取得した情報からエンドエフェクタ151の操作量を決定する。 The operation amount determination unit 7 acquires information output by the intention understanding unit 6 and information output by the environmental situation determination unit 2, and determines the operation amount of the end effector 151 from the acquired information.
モデル8は、動作推定部11が動作推定の際に用いる学習済みのモデルである。 Model 8 is a trained model used by the motion estimation unit 11 when estimating motion.
データ統合部9は、複数の環境状況判断部2が出力する対象物体に関する形状情報に含まれるボクセル情報を用いて三次元形状の統合情報を生成する。なお、データ統合部9は、複数の環境状況判断部2が出力する対象物体に関する形状情報に含まれる点群情報を統合して三次元情報を生成するようにしてもよい。なお、統合情報はインスタンスIDを有しているので、データ統合部9は、インスタンスID毎に統合した三次元形状の統合情報を出力する。 The data integration unit 9 generates integrated information of the three-dimensional shape using voxel information contained in the shape information about the target object output by multiple environmental situation assessment units 2. The data integration unit 9 may also generate three-dimensional information by integrating point cloud information contained in the shape information about the target object output by multiple environmental situation assessment units 2. Since the integrated information includes an instance ID, the data integration unit 9 outputs integrated information of the three-dimensional shape integrated for each instance ID.
近似結果反映部17は、近似結果をエンドエフェクタ151の事前登録された操作戦略の登録情報と比較して反映する。 The approximation result reflection unit 17 compares the approximation result with the registration information of the pre-registered operation strategy of the end effector 151 and reflects it.
形状近似部10は、データ統合部9が出力する統合された三次元形状の統合情報を取得する。形状近似部10は、インスタンスID毎に幾何プリミティブの形状フィッティング処理を行うことで幾何プリミティブ情報を生成する。なお、形状近似部10は、後述するように単一プリミティブで形状近似を行うようにしてもよく、複数プリミティブで形状近似を行うようにしてもよく、注目領域で形状近似を行うようにしてもよい。なお、複数プリミティブにおいて、形状を分類するための情報は幾何情報を用いる。形状近似部10は、複数プリミティブで形状近似する場合、それぞれのプリミティブをフィッティングした後に、各領域のアホーダンスを、データベース14を参照して取得する。形状近似部10は、例えば、物体のクラス(例えば、ペットボトル、スパナ、箱等)に分類する。 The shape approximation unit 10 acquires the integrated information of the integrated three-dimensional shape output by the data integration unit 9. The shape approximation unit 10 generates geometric primitive information by performing shape fitting processing on geometric primitives for each instance ID. As described below, the shape approximation unit 10 may perform shape approximation using a single primitive, multiple primitives, or a region of interest. For multiple primitives, geometric information is used as information for classifying shapes. When performing shape approximation using multiple primitives, the shape approximation unit 10 acquires the affordance of each region by referencing the database 14 after fitting each primitive. The shape approximation unit 10 classifies the objects, for example, into object classes (e.g., plastic bottle, wrench, box, etc.).
動作推定部11は、意図理解部6から操作意図情報と、ロボット15から関節角測定値と、形状近似部10からインスタンスID(識別情報)と見えている(環境状況判断部2が検出できている)物体の幾何プリミティブを取得する。動作推定部11は、モデル8を参照して、操作意図、ロボット状態、対象物体に紐づく可能な操作から、操作意図の集合である動作を推定する。例えば、両手でスパナを持ち替える動作は、右手把持と、両手支持と、左手把持との操作意図で構成される。例えば、動作推定部11は、ロボット15に次にどのような動作をさせるかを推定する。動作推定部11は、推定したロボット15のハンドの動作情報を出力する。なお、動作情報には、作業に関するタクソノミー情報(例えば参考文献1参照)も含まれる。モデル8は、データ量を削減するため、例えば多様なペットボトルのモデルを記憶せず、例えば代表的なペットボトルのモデルを記憶する。このため、動作推定部11は、対象物体のクラスと、モデル8に記憶されている情報を用いることで、動作を推定することができる。 The motion estimation unit 11 acquires operation intention information from the intention understanding unit 6, joint angle measurements from the robot 15, and instance IDs (identification information) and geometric primitives of visible objects (detected by the environmental situation assessment unit 2) from the shape approximation unit 10. The motion estimation unit 11 references the model 8 to estimate a motion, which is a set of operation intentions, from the operation intention, robot state, and possible operations associated with the target object. For example, the motion of switching hands to hold a wrench is composed of operation intentions for right-hand grip, two-hand support, and left-hand grip. For example, the motion estimation unit 11 estimates the next motion the robot 15 should perform. The motion estimation unit 11 outputs estimated motion information for the robot 15's hands. The motion information also includes taxonomy information related to the task (see, for example, Reference 1). To reduce the amount of data, the model 8 does not store a wide variety of plastic bottle models, but instead stores a representative model of a plastic bottle. Therefore, the movement estimation unit 11 can estimate movement by using the class of the target object and the information stored in the model 8.
参考文献1;Thomas Feix, Javier Romero,他,“The GRASP Taxonomy of Human GraspTypes” IEEE Transactions on Human-Machine Systems ( Volume: 46, Issue: 1, Feb.2016),IEEE,p66-77 Reference 1: Thomas Feix, Javier Romero, et al., “The GRASP Taxonomy of Human GraspTypes” IEEE Transactions on Human-Machine Systems (Volume: 46, Issue: 1, Feb.2016), IEEE, p66-77
把持DB12は、確率付き形状モデルを格納するデータベースであり、クラスID(識別子)毎に保持している。形状は、クラスの平均形状を意味する。確率は、操作意図毎の把持確率を意味しており、例えばポリゴン毎に保持している。この形状を、幾何プリミティブ形状に合わせて変形することで、得られたインスタンス形状での把持確率を得るが、ニューラルネットワークを用いて近似してもよい。把持DB12は、物体のクラスの一般的な(単位体積当たりの)重量を格納する。把持DB12は、タクソノミー毎、クラス毎に平均的な形状の場合の把持計画を格納する。 The grasping DB12 is a database that stores shape models with probabilities, and holds them for each class ID (identifier). Shape refers to the average shape of the class. Probability refers to the grasping probability for each operation intention, and is held for each polygon, for example. This shape is transformed to match the geometric primitive shape to obtain the grasping probability for the obtained instance shape, but this may also be approximated using a neural network. The grasping DB12 stores the general weight (per unit volume) of the object class. The grasping DB12 stores the grasping plan for the average shape for each taxonomy and class.
把持計画部13は、形状近似部10からインスタンスID毎の幾何プリミティブ形状情報と、動作推定部11から推定された動作情報を取得する。把持計画部13は、取得した情報に含まれるインタンスID毎の幾何プリミティブと、動作によって得られる未来での操作意図やタクソノミーと、操作意図毎の把持確率により把持点(把持する位置)を決定する。把持計画は、例えば、把持点決定後、接触するまで指を閉じ続けさせる。把持計画部13は、把持点に基づく手先軌道列情報、指軌道列情報を出力する。なお、把持計画部13が行う処理については、後述する。 The grasp planning unit 13 acquires geometric primitive shape information for each instance ID from the shape approximation unit 10 and motion information estimated from the motion estimation unit 11. The grasp planning unit 13 determines a grasp point (grasp position) based on the geometric primitive for each instance ID included in the acquired information, the future operation intention and taxonomy obtained from the motion, and the grasp probability for each operation intention. For example, the grasp plan keeps the fingers closed until contact occurs after the grasp point is determined. The grasp planning unit 13 outputs hand trajectory sequence information and finger trajectory sequence information based on the grasp point. The processing performed by the grasp planning unit 13 will be described later.
データベース14は、例えば、プリミティブが備えるアホーダンスを格納する。データベース14は、複数プリミティブの場合、それぞれのプリミティブが備えるアホーダンスを格納する。データベース14は、インスタンスIDが所属するクラスIDを関連付けて格納する。データベース14は、クラス毎の平均形状モデルを格納する。データベース14は、注目領域のプリミティブについては、平均形状に関連付けて領域内の把持しやすい位置情報を格納する。 Database 14 stores, for example, the ahordances possessed by primitives. In the case of multiple primitives, database 14 stores the ahordances possessed by each primitive. Database 14 associates and stores instance IDs with the class IDs to which they belong. Database 14 stores average shape models for each class. For primitives in the region of interest, database 14 stores positional information within the region that is easy to grasp, associated with the average shape.
ロボット15は、例えば、片腕アームロボット、双腕アームロボット、および多腕アームロボットのうちのいずれかである。
エンドエフェクタ151は、少なくとも3つの指部を備える。なお、エンドエフェクタ151が備える指の数は、タクソノミーを実現できる数であればよい。
アーム152は、先端にエンドエフェクタ151が接続されている。
The robot 15 is, for example, one of a single-arm robot, a double-arm robot, and a multi-arm robot.
The end effector 151 has at least three fingers. The number of fingers included in the end effector 151 may be any number that allows the taxonomy to be realized.
The arm 152 has an end effector 151 connected to its tip.
制御部16は、把持計画部13が出力する手先軌道列情報、指軌道列情報と、ロボット15のセンサ153が出力する関節角測定値に基づいて、エンドエフェクタ151、アーム152の関節角指令値を生成して、ロボット15の動作を制御する。 The control unit 16 generates joint angle command values for the end effector 151 and arm 152 based on the hand trajectory information and finger trajectory information output by the grasp planning unit 13 and the joint angle measurement values output by the sensor 153 of the robot 15, and controls the operation of the robot 15.
[環境状況判断部の構成例]
次に、環境状況判断部2の構成例を説明する。
図2は、本実施形態に係る環境状況判断部の構成例を示す図である。図2のように、環境状況判断部2は、例えば、環境センサ21と、自己位置推定部22と、マスク生成部23と、加算部24と、三次元再構成部25と、データ統合部26を備える。
環境センサ21は、例えば、RGBセンサ211と、深度センサ212を備える。
[Configuration example of environmental situation determination unit]
Next, an example of the configuration of the environmental situation determination unit 2 will be described.
2 is a diagram showing an example of the configuration of the environmental situation determination unit according to this embodiment. As shown in FIG. 2, the environmental situation determination unit 2 includes, for example, an environmental sensor 21, a self-position estimation unit 22, a mask generation unit 23, an addition unit 24, a 3D reconstruction unit 25, and a data integration unit 26.
The environmental sensor 21 includes, for example, an RGB sensor 211 and a depth sensor 212 .
RGBセンサ211は、例えばCCD(Charge Coupled Device)撮像装置またはCMOS(Complementary Metal Oxide Semiconductor)撮像装置等の撮影装置であり、RGB(赤緑青)のカラー画像を出力する。また、RGBセンサ211は、例えば魚眼レンズを備える。 The RGB sensor 211 is an imaging device such as a CCD (Charge Coupled Device) imaging device or a CMOS (Complementary Metal Oxide Semiconductor) imaging device, and outputs an RGB (red, green, blue) color image. The RGB sensor 211 also includes, for example, a fisheye lens.
深度センサ212は、深度情報を含む深度画像を取得し、取得した深度画像を出力する。なお、深度画像には、深度センサ212から見た輝度情報が含まれている。 The depth sensor 212 acquires a depth image including depth information and outputs the acquired depth image. Note that the depth image also includes brightness information as seen by the depth sensor 212.
加算部24は、深度画像とマスク画像を用いて各インスタンスIDにおける深度画像を生成し、生成した各インスタンスIDにおける深度画像を出力する。出力される画像は、インスタンスID毎の深度が含まれている。このため、同じインスタンスIDの領域がどこであるかを抽出できるので、インタンスID毎の距離を抽出できる。 The adder 24 generates a depth image for each instance ID using the depth image and mask image, and outputs the generated depth image for each instance ID. The output image contains the depth for each instance ID. This makes it possible to extract the locations of areas with the same instance ID, and therefore the distance for each instance ID.
マスク生成部23は、例えばインスタンスセグメンテーション(Instance Segmentation)の手法を用いて、RGBセンサ211が出力するカラー画像を用いて、画像中の物体のインスタンス(Instance)ID(識別情報)に基づくマスク画像を生成して出力する。なお、インスタンスセグメンテーションとは、例えば、画像上やRGB-D画像に写っている物体インスタンスの前景領域マスクを、各物体インスタンスを互いに別の物と区別しながら推定する問題である。前景領域マスクとは、例えば[1or0]の2値により「前景物体または背景」を表現する。 The mask generation unit 23 uses the color image output by the RGB sensor 211, for example, using a technique called instance segmentation, to generate and output a mask image based on the instance ID (identification information) of an object in the image. Instance segmentation is the problem of estimating the foreground region mask of an object instance appearing in an image or RGB-D image, while distinguishing each object instance from other objects. The foreground region mask represents "foreground object or background" using, for example, two values, [1 or 0].
自己位置推定部22は、RGBセンサ211が出力するカラー画像に対して画像処理を行って、環境状況判断部2の位置を検出して、撮影装置の姿勢情報を出力する。 The self-position estimation unit 22 performs image processing on the color image output by the RGB sensor 211 to detect the position of the environmental situation assessment unit 2 and output attitude information of the image capture device.
三次元再構成部25は、自己位置推定部22が出力する撮影装置の姿勢情報と、加算部24が出力するクラス毎の各インスタンスIDにおける深度画像を用いて、クラス毎の各インスタンスIDのポイントクラウド(point cloud)を三次元再構成によって求める。換言すると、三次元再構成部25は、クラス毎にインスタンスIDに分けて対象物体に関する形状を例えばボクセルまたは点群で構成する。なお、ポイントクラウドとは、点群データであり、X、Y、Zの基本的位置情報や色などの情報を持つ3次元データである。 The three-dimensional reconstruction unit 25 uses the orientation information of the image capture device output by the self-position estimation unit 22 and the depth image for each instance ID for each class output by the addition unit 24 to perform three-dimensional reconstruction to obtain a point cloud for each instance ID for each class. In other words, the three-dimensional reconstruction unit 25 divides the instance IDs for each class and constructs the shape of the target object using, for example, voxels or a point cloud. Note that a point cloud is point cloud data, and is three-dimensional data that contains information such as basic X, Y, and Z position information and color.
データ統合部26は、キーフレーム毎に各インスタンスIDのポイントクラウドを取得する。データ統合部26は、時刻tの現在のデータ、過去のt-1、t-2等のフレームの時系列データも取得管理し、これらのデータを統合する。データ統合部26は、現在のフレームに過去のフレームを含めた対象物体に関する形状情報を操作量決定部7へ出力する。例えば、テーブル上に2つの物体が置かれている場合は、2つのクラス(第1物体、第2物体)それぞれについてインスタンスIDが紐付けられている。 The data integration unit 26 acquires a point cloud for each instance ID for each key frame. The data integration unit 26 also acquires and manages the current data at time t and time series data for past frames such as t-1 and t-2, and integrates this data. The data integration unit 26 outputs shape information about the target object, including the current frame and past frames, to the operation amount determination unit 7. For example, if two objects are placed on a table, an instance ID is associated with each of the two classes (first object, second object).
[遠隔操作の概要]
図3は、本実施形態に係る遠隔操作の概要を示す図である。なお、図3に示したロボット15は、双椀と頭部とボディを備える例を示したが、ロボット15の構成や形状等はこれに限らない。
図3のように、操作者Usは、例えばHMD(ヘッドマウントディスプレイ)3と指示検出部4a、4bを装着している。ロボット15またはロボット15の周囲には環境センサ21aが設置され、作業環境にも環境センサ21bが設置されている。なお、環境センサ21は、ロボット15に取り付けられていてもよい。また、ロボット15は、エンドエフェクタ151(151a、151b)とアーム152を備える。操作者Usは、HMD3に表示された画像を見ながら指示検出部4a、4bを装着している手や指を動かすことで、ロボット15を遠隔操作する。
[Remote control overview]
Fig. 3 is a diagram showing an overview of remote control according to this embodiment. Note that, although the robot 15 shown in Fig. 3 is an example having a pair of arms, a head, and a body, the configuration and shape of the robot 15 are not limited to this.
3 , the operator Us wears, for example, an HMD (head-mounted display) 3 and instruction detection units 4a and 4b. An environmental sensor 21a is installed on the robot 15 or around the robot 15, and an environmental sensor 21b is also installed in the work environment. The environmental sensor 21a may be attached to the robot 15. The robot 15 also includes an end effector 151 (151a, 151b) and an arm 152. The operator Us remotely controls the robot 15 by moving the hand or fingers wearing the instruction detection units 4a and 4b while viewing the image displayed on the HMD 3.
[幾何プリミティブの例]
ここで、幾何プリミティブの例を、ロボット15にスパナを把持させて、ネジを締めさせる作業を例に説明する。
図4は、幾何プリミティブの例を説明するための図である。ロボット15にスパナを把持させて、ネジを締めさせる作業の場合、操作者の注目対象はスパナである。
[Example of geometric primitives]
Here, an example of a geometric primitive will be described using an example of a task in which the robot 15 is made to grip a wrench and tighten a screw.
4 is a diagram for explaining an example of a geometric primitive. In a task in which the robot 15 is made to hold a wrench and tighten a screw, the object of the operator's attention is the wrench.
画像g100の例では、対象物体を1つ(g101)の枠とする単一プリミティブである。 In the example of image g100, the target object is a single primitive with one frame (g101).
画像g110の例では、対象物体を2つ(g111、g112)の枠とする複数プリミティブである。 In the example of image g110, the target object is a multiple primitive with two frames (g111, g112).
画像g120では、ねじ締め作業の場合、注目領域が枠g112内である。
このように、幾何プリミティブにおける形状フィッティングは、1つの枠で行ってもよく、2つ以上の枠で行ってもよく、注目領域を用いてもよい。
In the image g120, in the case of screw tightening work, the area of interest is within the frame g112.
Thus, shape fitting in geometric primitives may be performed on a single frame, on two or more frames, or using regions of interest.
このように、本実施形態では、対象物体を例えば平面において幾何基本要素で近似するようにした。なお、本実施形態において、幾何基本要素は、ユークリッド幾何学における三角形、正方向、長方形、台形、多角形、円形、楕円形などの基本的な形状である。 In this way, in this embodiment, the target object is approximated, for example, on a plane, using geometric primitives. Note that in this embodiment, geometric primitives are basic shapes in Euclidean geometry, such as triangles, squares, rectangles, trapezoids, polygons, circles, and ellipses.
[処理手順例]
次に、遠隔操作補助システム1が行う処理手順例を説明する。図5は、本実施形態に係る遠隔操作補助システム1が行う処理手順例のフローチャートである。
[Example of processing procedure]
Next, a description will be given of an example of a processing procedure performed by the remote operation assistance system 1. Fig. 5 is a flowchart of an example of a processing procedure performed by the remote operation assistance system 1 according to this embodiment.
(ステップS1)環境状況判断部2は、エンドエフェクタ151が操作される環境の環境情報を取得する。環境状況判断部2は、取得した環境情報である対象物体に関する形状情報を操作量決定部7に出力する。 (Step S1) The environmental situation determination unit 2 acquires environmental information about the environment in which the end effector 151 is operated. The environmental situation determination unit 2 outputs the acquired environmental information, which is shape information about the target object, to the operation amount determination unit 7.
(ステップS2)データ統合部9は、複数の環境状況判断部2から取得した対象物体に関する形状情報に含まれるボクセル情報を用いて、インスタンスID毎に三次元形状の統合を行う。形状近似部10は、インスタンスID毎の統合された三次元形状の統合情報に基づいて幾何プリミティブ情報を生成する。把持計画部13は、形状近似部10からインスタンスID毎の幾何プリミティブ情報を取得する。 (Step S2) The data integration unit 9 integrates three-dimensional shapes for each instance ID using voxel information contained in the shape information related to the target object acquired from multiple environmental situation assessment units 2. The shape approximation unit 10 generates geometric primitive information based on the integrated information of the integrated three-dimensional shapes for each instance ID. The grasp planning unit 13 acquires the geometric primitive information for each instance ID from the shape approximation unit 10.
(ステップS3)操作量決定部7は、エンドエフェクタ151を操作する操作者の動作に関する情報をHMD3と指示検出部4から取得する。 (Step S3) The operation amount determination unit 7 acquires information about the movement of the operator operating the end effector 151 from the HMD 3 and the instruction detection unit 4.
(ステップS4)意図理解部6は、動作取得部5が出力する情報を用いて、エンドエフェクタ151によって操作する対象である対象物体と、対象物体の操作方法であるタスクを推定する。 (Step S4) The intention understanding unit 6 uses the information output by the action acquisition unit 5 to estimate the target object to be operated by the end effector 151 and the task, which is the method for operating the target object.
(ステップS5)動作推定部11は、操作意図、ロボット状態、対象物体に紐づく可能な操作から、操作意図の集合である動作を推定する。把持計画部13は、動作推定部11から動作情報を取得する。 (Step S5) The motion estimation unit 11 estimates a motion, which is a collection of operational intentions, from the operational intentions, the robot state, and possible operations linked to the target object. The grasp planning unit 13 acquires motion information from the motion estimation unit 11.
(ステップS6)把持計画部13は、取得されたインスタンスID毎の幾何プリミティブ情報と推定された動作情報を用いて、インスタンスIDが所属するクラスIDをデータベース14から探索する。例えば、スパナクラスのスパナA、スパナBというインスタンスがある場合、把持計画部13は、これらのクラスIDをデータベース14から探索する。 (Step S6) The grasp planning unit 13 uses the geometric primitive information and estimated motion information for each acquired instance ID to search the database 14 for the class ID to which the instance ID belongs. For example, if there are instances called Spanner A and Spanner B in the Spanner class, the grasp planning unit 13 searches the database 14 for these class IDs.
(ステップS7)把持計画部13は、クラスIDのクラスに紐付けられている平均形状モデルをデータベース14から取得する。例えばクラスがスパナの場合、平均形状モデルは、スパナの平均的な形状のモデルである。なお、このようなクラス毎の平均形状モデルは、データベース14に格納されている。 (Step S7) The grasp planning unit 13 obtains the average shape model associated with the class of the class ID from the database 14. For example, if the class is a wrench, the average shape model is a model of the average shape of a wrench. Note that such average shape models for each class are stored in the database 14.
(ステップS8)把持計画部13は、平均形状を幾何プリミティブに変形して領域間のマッピング関数を得る。把持計画部13は、例えば、対象物体に関する形状情報に幾何プリミティブをフィッティングさせることで、平均形状とプリミティブ形状とのマッピング関数を得ることができる。なお、対象物体は剛体に限らず、変形が定義できる物体であれば非剛体であってもよい。また、把持計画部13は、物体のクラスの一般的な(単位体積当たりの)重量をデータベース14から取得する。 (Step S8) The grasp planning unit 13 transforms the average shape into a geometric primitive to obtain a mapping function between regions. The grasp planning unit 13 can obtain a mapping function between the average shape and the primitive shape, for example, by fitting the geometric primitive to shape information about the target object. Note that the target object is not limited to a rigid body; it may be a non-rigid object as long as its deformation can be defined. The grasp planning unit 13 also obtains the general weight (per unit volume) of the object class from the database 14.
(ステップS9)把持計画部13は、動作と、タクソノミーと、クラスIDに基づいて、把持確率マップを、把持DB12から取得する。 (Step S9) The grasping planning unit 13 obtains a grasping probability map from the grasping DB 12 based on the motion, taxonomy, and class ID.
(ステップS10)把持計画部13は、得られた領域間の対応のマッピング関数に基づいて、把持確率マップを幾何プリミティブの領域にマッピングする。これにより、オンラインで得られた幾何プリミティブ形状に応じた確率ヒートマップ的な情報を得ることができる。 (Step S10) The grasp planning unit 13 maps the grasp probability map to the geometric primitive region based on the obtained mapping function of correspondence between regions. This makes it possible to obtain probability heat map-like information corresponding to the geometric primitive shape obtained online.
(ステップS11)把持計画部13は、現在の手首姿勢から、幾何学的制約を満たしながら、経路の短さ、最短経路が最も確率が高くなる把持点を、最適化問題を解いて求める。 (Step S11) The grasp planning unit 13 solves an optimization problem to find the grasp point that has the shortest path and the highest probability of being the shortest route, while satisfying geometric constraints, based on the current wrist posture.
(ステップS12)把持計画部13は、把持点が選択された後、その把持点に近づくための軌道を算出してロボット15に出力する。なお、把持計画部13は、重量を物体クラスの一般的な(単位体積当たりの)重量から変化分を適応的に制御する。 (Step S12) After a gripping point is selected, the grasp planning unit 13 calculates a trajectory for approaching the gripping point and outputs it to the robot 15. The grasp planning unit 13 adaptively controls the change in weight from the general weight (per unit volume) for the object class.
なお、上述した実施形態では、作業の一例として把持を例に説明したが、作業内容はこれに限らない。 Note that in the above-described embodiment, grasping was used as an example of a task, but the task content is not limited to this.
[単一プリミティブ、複数プリミティブの場合の処理について]
ここで、単一プリミティブ、複数プリミティブの場合の処理についてさらに説明する。図6は、本実施形態に係る単一プリミティブ、複数プリミティブの場合の処理手順のフローチャートである。
[Processing for single and multiple primitives]
Here, the processing for the single primitive and multiple primitives will be further explained. Fig. 6 is a flowchart showing the processing procedure for the single primitive and multiple primitives according to this embodiment.
(ステップS101)環境状況判断部2は、エンドエフェクタ151が操作される環境の環境情報を取得する。環境状況判断部2は、取得した環境情報である対象物体に関する形状情報を操作量決定部7に出力する。 (Step S101) The environmental situation determination unit 2 acquires environmental information about the environment in which the end effector 151 is operated. The environmental situation determination unit 2 outputs the acquired environmental information, which is shape information about the target object, to the operation amount determination unit 7.
(ステップS102)データ統合部9は、複数の環境状況判断部2から取得した対象物体に関する形状情報に含まれるボクセル情報を用いて、インスタンスID毎に三次元形状の統合を行う。形状近似部10は、インスタンスID毎の統合された三次元形状の統合情報に基づいて幾何プリミティブ情報を生成する。把持計画部13は、形状近似部10からインスタンスID毎の幾何プリミティブ情報を取得する。 (Step S102) The data integration unit 9 integrates three-dimensional shapes for each instance ID using voxel information contained in the shape information related to the target object acquired from multiple environmental situation assessment units 2. The shape approximation unit 10 generates geometric primitive information based on the integrated information of the integrated three-dimensional shapes for each instance ID. The grasp planning unit 13 acquires the geometric primitive information for each instance ID from the shape approximation unit 10.
(ステップS103)操作量決定部7は、エンドエフェクタ151を操作する操作者の動作に関する情報をHMD3と指示検出部4から取得する。 (Step S103) The operation amount determination unit 7 acquires information about the movement of the operator operating the end effector 151 from the HMD 3 and the instruction detection unit 4.
(ステップS104)意図理解部6は、動作取得部5が出力する情報を用いて、エンドエフェクタによって操作する対象である対象物体と、対象物体の操作方法であるタスクを推定する。 (Step S104) The intention understanding unit 6 uses the information output by the action acquisition unit 5 to estimate the target object to be operated by the end effector and the task, which is the method for operating the target object.
(ステップS105)動作推定部11は、操作意図、ロボット状態、対象物体に紐づく可能な操作から、操作意図の集合である動作を推定する。把持計画部13は、動作推定部11から動作情報を取得する。 (Step S105) The motion estimation unit 11 estimates a motion, which is a collection of operational intentions, from the operational intention, robot state, and possible operations linked to the target object. The grasp planning unit 13 acquires motion information from the motion estimation unit 11.
(ステップS106)把持計画部13は、取得された幾何プリミティブ情報と推定された動作情報を用いて、インスタンスIDが所属するクラスIDをデータベース14から探索する。例えば、スパナクラスのスパナA、スパナBというインスタンスがある場合は、これらのクラスIDをデータベース14から探索する。 (Step S106) The grasp planning unit 13 uses the acquired geometric primitive information and estimated motion information to search the database 14 for the class ID to which the instance ID belongs. For example, if there are instances called Spanner A and Spanner B in the Spanner class, the database 14 is searched for these class IDs.
(ステップS107)複数プリミティブの場合、把持計画部13は、作業者の操作入力とクラスIDと各プリミティブが持つ選択可能なタクソノミーを決定する。なお、単一プリミティブの場合、把持計画部13は、作業者の操作入力からタクソノミーを決定する。 (Step S107) In the case of multiple primitives, the grasp planning unit 13 determines the selectable taxonomy for each primitive based on the operator's input, the class ID, and the primitive's operation. Note that in the case of a single primitive, the grasp planning unit 13 determines the taxonomy based on the operator's input.
(ステップS108)把持計画部13は、クラスIDに対応した密度と、推定した体積から、物体の初期重量を決定する。 (Step S108) The grasp planning unit 13 determines the initial weight of the object based on the density corresponding to the class ID and the estimated volume.
(ステップS109)把持計画部13は、現在の手首姿勢から、幾何学的制約を満たし且つ最短経路で対象物の物体表面に到達する把持点を、最適化問題を解いて選択する。 (Step S109) The grasp planning unit 13 solves an optimization problem to select a grasp point from the current wrist posture that satisfies the geometric constraints and reaches the object surface via the shortest path.
(ステップS110)把持計画部13は、把持点が選択された後、その把持点に近づくための軌道を算出してロボット15に出力する。なお、把持計画部13は、重量を物体クラスの一般的な(単位体積当たりの)重量から変化分を適応的に制御する。 (Step S110) After a gripping point is selected, the grasp planning unit 13 calculates a trajectory for approaching the gripping point and outputs it to the robot 15. The grasp planning unit 13 adaptively controls the change in weight from the general weight (per unit volume) for the object class.
[処理、構成の概要]
ここで、遠隔操作補助システム1の構成の概要、処理の概要を説明する。
図7は、本実施形態に係る遠隔操作補助システムの構成の概要、処理の概要を説明するための図である。
図7のように、マスク生成部23は、RGBデータにおける画像中の物体のインスタンスIDに基づくマスク画像を生成して出力する。なお、ここでの前提条件は、画像に写っている物体をクラス分類できることである。
三次元再構成部25は、マスク画像と深度画像に基づいて、クラス毎の各インスタンスIDのポイントクラウドを三次元再構成によって求める。三次元再構成部25は、対象物体に関する形状情報であるボクセルまたは点群(ポイントクラウド)をクラスタリングして出力する。三次元再構成部25は、RGBセンサ211と深度センサ212を用いてアクティブセンシングを行い、センシングした情報を三次元点統合する。
形状近似部10は、クラスタリングされた対象物体に関する形状情報を用いてプリミティブ・フィッティングを行って物体形状を幾何基本要素(例えば直方体、円柱、球等)で近似する。
把持計画部13は、事前登録されている把持戦略をスケールさせることで操作意図に応じた物体把持を実現する。
[Processing and configuration overview]
Here, an outline of the configuration and processing of the remote operation assistance system 1 will be described.
FIG. 7 is a diagram for explaining an outline of the configuration and processing of the remote operation assistance system according to this embodiment.
7, the mask generation unit 23 generates and outputs a mask image based on the instance ID of an object in an image in RGB data. Note that a prerequisite here is that the objects in the image can be classified into classes.
The three-dimensional reconstruction unit 25 obtains a point cloud for each instance ID for each class by three-dimensional reconstruction based on the mask image and the depth image. The three-dimensional reconstruction unit 25 clusters and outputs voxels or a point group (point cloud), which is shape information related to the target object. The three-dimensional reconstruction unit 25 performs active sensing using the RGB sensor 211 and the depth sensor 212, and integrates the sensed information into three-dimensional points.
The shape approximation unit 10 performs primitive fitting using shape information on the clustered target object to approximate the object shape with geometric basic elements (for example, a rectangular parallelepiped, a cylinder, a sphere, etc.).
The grasp planning unit 13 realizes object grasping according to the operation intention by scaling a pre-registered grasp strategy.
[比較例]
ここで、比較例を、図8を用いて説明する。図8は、比較例を説明するための図である。
図8のように、従来技術では、例えばデータベースに予め情報が登録されている物体しか扱えなかった。例えば、物体がスパナの場合でも、形状、重量が異なる場合は、登録されている必要があった。そして、従来技術では、対象物体に三次元形状と重量が既知である必要があった。また、渋滞技術では、対象物の把持点や把持姿勢も既知である必要があった。
[Comparative Example]
A comparative example will now be described with reference to Fig. 8. Fig. 8 is a diagram for explaining the comparative example.
As shown in Figure 8, conventional technology could only handle objects whose information was registered in advance in a database. For example, even if the object was a wrench, if the shape and weight were different, it had to be registered. Furthermore, conventional technology required that the three-dimensional shape and weight of the target object be known. Furthermore, with congestion technology, the gripping point and gripping posture of the target object also had to be known.
これに対して、本実施形態では、前提条件として、物体クラス(例えばスパナ)と操作意図に応じた把持戦略のみを事前に与えるようにした。そして、本実施形態では、物体クラスと操作意図に応じた把持戦略を事前に与える物体形状を幾何基本要素(例えば直方体)で近似し、事前登録した把持戦略をスケールさせることで操作意図に応じた物体把持を実現するようにした。また本実施形態では、重量を物体クラスの一般的な(単位体積当たりの)重量から変化分を適応的に制御するようにした。 In contrast, in this embodiment, only the object class (e.g., a wrench) and a grasping strategy corresponding to the operation intention are provided in advance as prerequisites. Then, in this embodiment, the object shape for which a grasping strategy corresponding to the object class and operation intention is provided in advance is approximated with a geometric primitive (e.g., a rectangular parallelepiped), and the pre-registered grasping strategy is scaled to achieve object grasping corresponding to the operation intention. Furthermore, in this embodiment, the weight is adaptively controlled by the amount of change from the general weight (per unit volume) of the object class.
これにより、本実施形態によれば、事前に登録する情報が少なくなるため、様々なインスタンスに対して把持計画を行える。 As a result, according to this embodiment, less information needs to be registered in advance, allowing for grasp planning for a variety of instances.
なお、本発明における操作量決定部7の機能の全てまたは一部を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより操作量決定部7が行う処理の全てまたは一部を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、ホームページ提供環境(あるいは表示環境)を備えたWWWシステムも含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD-ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。 In addition, a program for realizing all or part of the functions of the manipulated variable determination unit 7 in this invention may be recorded on a computer-readable recording medium, and the program recorded on this recording medium may be loaded into a computer system and executed to perform all or part of the processing performed by the manipulated variable determination unit 7. Note that the term "computer system" as used here includes hardware such as an OS and peripheral devices. It also includes a WWW system equipped with a homepage provision environment (or display environment). Furthermore, "computer-readable recording medium" refers to portable media such as flexible disks, optical magnetic disks, ROMs, and CD-ROMs, as well as storage devices such as hard disks built into computer systems. Furthermore, "computer-readable recording medium" also includes devices that retain a program for a certain period of time, such as volatile memory (RAM) within a computer system that acts as a server or client when a program is transmitted via a network such as the Internet or a communication line such as a telephone line.
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであってもよい。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。 The above program may also be transmitted from a computer system that stores the program in a storage device or the like to another computer system via a transmission medium, or by transmission waves within the transmission medium. Here, the "transmission medium" that transmits the program refers to a medium that has the function of transmitting information, such as a network (communication network) such as the Internet or a communication line (communication line) such as a telephone line. The above program may also be one that realizes part of the above-mentioned functions. Furthermore, it may be a so-called differential file (differential program) that can realize the above-mentioned functions in combination with a program already recorded on the computer system.
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形および置換を加えることができる。 The above describes the form for carrying out the present invention using an embodiment, but the present invention is in no way limited to such an embodiment, and various modifications and substitutions can be made without departing from the spirit of the present invention.
1…遠隔操作補助システム、2,2-1,2-2,2-3,・・・…環境状況判断部、3…HMD、4…指示検出部、5…動作取得部、6…意図理解部、7…操作量決定部、8…モデル、9…データ統合部、10…形状近似部、11…動作推定部、12…把持DB、13…把持計画部、14…データベース、15…ロボット、16…制御部、17…近似結果反映部、31…視線検出部、151…エンドエフェクタ、152…アーム、153…センサ、21…環境センサ、22…自己位置推定部、23…マスク生成部、24…加算部、25…三次元再構成部、26…データ統合部、211…RGBセンサ、212…深度センサ 1... Remote operation assistance system, 2, 2-1, 2-2, 2-3... Environmental situation judgment unit, 3... HMD, 4... Instruction detection unit, 5... Motion acquisition unit, 6... Intention understanding unit, 7... Operation amount determination unit, 8... Model, 9... Data integration unit, 10... Shape approximation unit, 11... Motion estimation unit, 12... Grasp DB, 13... Grasp planning unit, 14... Database, 15... Robot, 16... Control unit, 17... Approximation result reflection unit, 31... Gaze detection unit, 151... End effector, 152... Arm, 153... Sensor, 21... Environmental sensor, 22... Self-position estimation unit, 23... Mask generation unit, 24... Addition unit, 25... 3D reconstruction unit, 26... Data integration unit, 211... RGB sensor, 212... Depth sensor
Claims (7)
少なくとも前記エンドエフェクタを操作する操作者の動作に関する動作情報を取得する動作取得部と、
前記動作情報を用いて、前記エンドエフェクタによって操作する対象である対象物体と、前記操作者が意図する前記対象物体の操作方法であるタスクを推定する意図理解部と、
前記対象物体が存在し、前記エンドエフェクタが前記対象物体に対して操作される環境の環境情報を取得する環境状況判断部と、
前記タスク、前記エンドエフェクタを備えるロボットの状態、及び前記環境情報により生成される前記対象物体の物体形状に基づいて、動作を推定する動作推定部と、
推定された前記動作及び取得された前記環境情報に基づいて、前記エンドエフェクタの操作量を決定する操作量決定部と、を備え、
前記操作量決定部は、
前記対象物体の物体形状を幾何基本要素に近似する形状近似部と、
前記幾何基本要素を、前記エンドエフェクタに対する事前登録された物体を把持する操作の戦略としての操作戦略の登録情報と比較して反映して把持計画を生成する把持計画部と、を備え、
前記把持計画部は、
前記対象物体の物体形状を前記幾何基本要素にフィッティングさせて、前記対象物体の物体形状の領域と前記幾何基本要素の領域との間のマッピング関数を算出し、
前記タスクを実行可能なタクソノミーを決定し、
前記動作情報と、決定した前記タクソノミーと、前記対象物体の物体形状に付与されたインスタンスIDが属するクラスIDに基づいて、操作意図毎の把持確率を示す把持確率マップを取得し、算出された領域間の対応のマッピング関数に基づいて、前記把持確率マップを前記幾何基本要素の領域にマッピングし、現在の手首姿勢に基づいて、前記把持計画を生成する、
遠隔操作補助システム。 A teleoperation assistance system for remotely operating at least an end effector,
a motion acquisition unit that acquires motion information relating to a motion of an operator operating at least the end effector;
an intention understanding unit that uses the operation information to estimate a target object to be operated by the end effector and a task that is a method of operating the target object intended by the operator ;
an environmental situation determination unit that acquires environmental information of an environment in which the target object exists and the end effector is operated with respect to the target object ;
a motion estimation unit that estimates a motion based on the task, a state of the robot equipped with the end effector, and an object shape of the target object generated based on the environmental information;
an operation amount determination unit that determines an operation amount of the end effector based on the estimated motion and the acquired environmental information ,
The operation amount determination unit
a shape approximation unit that approximates the object shape of the target object to geometric primitives;
a grasp planning unit that generates a grasp plan by comparing the geometric basic elements with registered information of an operation strategy as a strategy for an operation to grasp an object pre-registered for the end effector ,
The grasping planning unit
fitting the object shape of the target object to the geometric primitives to calculate a mapping function between the area of the object shape of the target object and the area of the geometric primitives;
determining a taxonomy capable of performing said task;
a grasping probability map indicating a grasping probability for each operation intention is obtained based on the motion information, the determined taxonomy, and a class ID to which an instance ID assigned to the object shape of the target object belongs; the grasping probability map is mapped to the region of the geometric basic element based on a mapping function of correspondence between the calculated regions; and the grasping plan is generated based on a current wrist posture.
Remote control assistance system.
請求項1に記載の遠隔操作補助システム。 a shape approximation unit that approximates the object shape of the target object to a geometric primitive for each of the instances ID ;
The remote operation assistance system according to claim 1 .
請求項1に記載の遠隔操作補助システム。 The geometric primitive may be one or more .
The remote operation assistance system according to claim 1 .
請求項1に記載の遠隔操作補助システム。 the geometric basic elements include a shape of a region of interest that is an area of the target object that is easy to grasp;
The remote operation assistance system according to claim 1 .
RGBデータを取得するRGBセンサと、
深度画像を取得する深度センサと、
インスタンスセグメンテーション(Instance Segmentation)の手法を用いて、前記RGBセンサが出力するカラー画像を用いて、画像中の物体のインスタンス(Instance)IDに基づくマスク画像を生成するマスク生成部と、
前記深度画像と前記マスク画像を用いて各インスタンスIDにおける深度画像を生成して出力する加算部と、
前記RGBセンサが出力するカラー画像に対して画像処理を行って、前記RGBセンサの位置及び姿勢を検出し、位置及び姿勢に基づいて姿勢情報を生成して出力する自己位置推定部と、
前記自己位置推定部が出力する前記RGBセンサの姿勢情報と、前記加算部が出力する各インスタンスIDにおける深度画像を用いて、クラス毎の各インスタンスIDのポイントクラウドを三次元再構成によって求める三次元再構成部と、
キーフレーム毎に各インスタンスIDのポイントクラウドを取得し、時刻tの現在のデータ、過去のt-1、t-2、・・・のフレームの時系列データを取得管理し、これらのデータを統合するデータ統合部と、
を備える請求項1または請求項2に記載の遠隔操作補助システム。 The environmental situation determination unit
an RGB sensor for acquiring RGB data;
a depth sensor for acquiring a depth image;
a mask generation unit that uses an instance segmentation technique to generate a mask image based on an instance ID of an object in the image using the color image output by the RGB sensor;
an adder that generates and outputs a depth image for each instance ID using the depth image and the mask image;
a self-position estimation unit that performs image processing on a color image output by the RGB sensor to detect a position and orientation of the RGB sensor , and generates and outputs orientation information based on the position and orientation ;
a three-dimensional reconstruction unit that obtains a point cloud for each instance ID for each class by three-dimensional reconstruction using the orientation information of the RGB sensor output by the self-position estimation unit and the depth image for each instance ID output by the addition unit;
A data integration unit that acquires a point cloud of each instance ID for each key frame, acquires and manages current data at time t, and time series data of past frames t-1, t-2, ..., and integrates these data;
3. The remote operation assistance system according to claim 1, further comprising:
少なくとも前記エンドエフェクタを操作する操作者の動作に関する動作情報を取得し、
前記動作情報を用いて、前記エンドエフェクタによって操作する対象である対象物体と、前記操作者が意図する前記対象物体の操作方法であるタスクを推定し、
前記対象物体が存在し、前記エンドエフェクタが前記対象物体に対して操作される環境の環境情報を取得し、
前記タスク、前記エンドエフェクタを備えるロボットの状態、及び前記環境情報により生成される前記対象物体の物体形状に基づいて、動作を推定し、
推定された前記動作及び取得された前記環境情報に基づいて、前記エンドエフェクタの操作量を決定し、
前記コンピュータが、
前記対象物体の物体形状を幾何基本要素に近似し、
前記幾何基本要素を、前記エンドエフェクタに対する事前登録された物体を把持する操作の戦略としての操作戦略の登録情報と比較して反映して把持計画を生成し、
前記コンピュータが、
前記対象物体の物体形状を前記幾何基本要素にフィッティングさせて、前記対象物体の物体形状の領域と前記幾何基本要素の領域との間のマッピング関数を算出し、
前記タスクを実行可能なタクソノミーを決定し、
前記動作情報と、決定した前記タクソノミーと、前記対象物体の物体形状に付与されたインスタンスIDが属するクラスIDに基づいて、操作意図毎の把持確率を示す把持確率マップを取得し、算出された領域間の対応のマッピング関数に基づいて、前記把持確率マップを前記幾何基本要素の領域にマッピングし、現在の手首姿勢に基づいて、前記把持計画を生成する、
遠隔操作補助方法。 a computer of a teleoperation assistance system that teleoperates at least the end effector,
acquiring motion information relating to the motion of an operator who operates at least the end effector ;
Using the motion information , a target object to be operated by the end effector and a task that is a method of operating the target object intended by the operator are estimated;
acquiring environmental information of an environment in which the target object exists and in which the end effector is operated relative to the target object ;
Estimating a motion based on the task, a state of the robot equipped with the end effector, and an object shape of the target object generated by the environmental information;
determining an operation amount of the end effector based on the estimated motion and the acquired environmental information ;
The computer
approximating the object shape of the target object to geometric primitives;
generating a grasp plan by comparing the geometric primitives with registered information of an operation strategy as a strategy for grasping an object pre-registered for the end effector;
The computer
fitting the object shape of the target object to the geometric primitives to calculate a mapping function between the area of the object shape of the target object and the area of the geometric primitives;
determining a taxonomy capable of performing said task;
a grasping probability map indicating a grasping probability for each operation intention is obtained based on the motion information, the determined taxonomy, and a class ID to which an instance ID assigned to the object shape of the target object belongs; the grasping probability map is mapped to the region of the geometric basic element based on a mapping function of correspondence between the calculated regions; and the grasping plan is generated based on a current wrist posture.
Remote control assistance method.
少なくとも前記エンドエフェクタを操作する操作者の動作に関する動作情報を取得させ、
前記動作情報を用いて、前記エンドエフェクタによって操作する対象である対象物体と、前記操作者が意図する前記対象物体の操作方法であるタスクを推定させ、
前記対象物体が存在し、前記エンドエフェクタが前記対象物体に対して操作される環境の環境情報を取得させ、
前記タスク、前記エンドエフェクタを備えるロボットの状態、及び前記環境情報により生成される前記対象物体の物体形状に基づいて、動作を推定させ
推定された前記動作及び取得された前記環境情報に基づいて、前記エンドエフェクタの操作量を決定させ、
前記コンピュータに、
前記対象物体の物体形状を幾何基本要素に近似させ、
前記幾何基本要素を、前記エンドエフェクタに対する事前登録された物体を把持する操作の戦略としての操作戦略の登録情報と比較して反映して把持計画を生成させ、
前記コンピュータに、
前記対象物体の物体形状を前記幾何基本要素にフィッティングさせて、前記対象物体の物体形状の領域と前記幾何基本要素の領域との間のマッピング関数を算出させ、
前記タスクを実行可能なタクソノミーを決定させ、
前記動作情報と、決定した前記タクソノミーと、前記対象物体の物体形状に付与されたインスタンスIDが属するクラスIDに基づいて、操作意図毎の把持確率を示す把持確率マップを取得し、算出された領域間の対応のマッピング関数に基づいて、前記把持確率マップを前記幾何基本要素の領域にマッピングし、現在の手首姿勢に基づいて、前記把持計画を生成させる、
プログラム。 A computer of a teleoperation assistance system that teleoperates at least the end effector ,
acquiring motion information relating to at least the motion of an operator operating the end effector;
using the motion information , a target object to be operated by the end effector and a task that is a method of operating the target object intended by the operator are estimated;
acquiring environmental information of an environment in which the target object exists and in which the end effector is operated relative to the target object ;
A motion is estimated based on the task, a state of the robot equipped with the end effector, and an object shape of the target object generated by the environmental information.
determining an operation amount of the end effector based on the estimated motion and the acquired environmental information;
The computer,
approximating the object shape of the target object to geometric primitives;
generating a grasp plan by comparing the geometric primitives with registered information of an operation strategy as a strategy for grasping an object previously registered for the end effector;
The computer,
fitting the object shape of the target object to the geometric primitives to calculate a mapping function between a region of the object shape of the target object and a region of the geometric primitives;
determining a taxonomy capable of performing said task;
a grasping probability map indicating a grasping probability for each operation intention is obtained based on the motion information, the determined taxonomy, and a class ID to which an instance ID assigned to the object shape of the target object belongs; the grasping probability map is mapped to the region of the geometric basic element based on a mapping function of correspondence between the calculated regions; and the grasping plan is generated based on a current wrist posture.
program .
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2022136628A JP7809033B2 (en) | 2022-08-30 | 2022-08-30 | Remote operation assistance system, remote operation assistance method, and program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2022136628A JP7809033B2 (en) | 2022-08-30 | 2022-08-30 | Remote operation assistance system, remote operation assistance method, and program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2024033189A JP2024033189A (en) | 2024-03-13 |
| JP7809033B2 true JP7809033B2 (en) | 2026-01-30 |
Family
ID=90193892
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2022136628A Active JP7809033B2 (en) | 2022-08-30 | 2022-08-30 | Remote operation assistance system, remote operation assistance method, and program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7809033B2 (en) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2025248629A1 (en) * | 2024-05-28 | 2025-12-04 | 日本電気株式会社 | Processing device, processing system, processing method, and recording medium |
| WO2026004855A1 (en) * | 2024-06-24 | 2026-01-02 | 株式会社ニコン | Trained model, image processing device, imaging device, and program |
Citations (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2004188533A (en) | 2002-12-10 | 2004-07-08 | Toyota Motor Corp | Handling estimation method and handling estimation device for target object |
| DE102013204789A1 (en) | 2012-03-21 | 2013-09-26 | GM Global Technology Operations LLC (n. d. Gesetzen des Staates Delaware) | METHOD FOR FOLLOWING THE INTENTION OF AN OPERATOR FOR MOVING A ROBOT SYSTEM |
| JP2015136769A (en) | 2014-01-23 | 2015-07-30 | 財團法人精密機械研究發展中心 | End effector control method |
| JP2019093461A (en) | 2017-11-20 | 2019-06-20 | 株式会社安川電機 | Holding system, learning device, holding method and model manufacturing method |
| US20200130190A1 (en) | 2018-10-29 | 2020-04-30 | Toyota Research Institute, Inc. | Intent based control of a robotic device |
| WO2020189143A1 (en) | 2019-03-20 | 2020-09-24 | Telexistence株式会社 | Control device and control method |
| US20210101286A1 (en) | 2019-03-01 | 2021-04-08 | Google Llc | Robotic manipulation using domain-invariant 3d representations predicted from 2.5d vision data |
| JP2022045905A (en) | 2020-09-09 | 2022-03-22 | ファナック株式会社 | Mix-size depalletizing |
| JP2022110260A (en) | 2021-01-18 | 2022-07-29 | ソニーグループ株式会社 | Mobile device and mobile device control method |
Family Cites Families (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH10128684A (en) * | 1996-10-30 | 1998-05-19 | Asahi Sanac Kk | Method and apparatus for creating operation program of robot |
-
2022
- 2022-08-30 JP JP2022136628A patent/JP7809033B2/en active Active
Patent Citations (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2004188533A (en) | 2002-12-10 | 2004-07-08 | Toyota Motor Corp | Handling estimation method and handling estimation device for target object |
| DE102013204789A1 (en) | 2012-03-21 | 2013-09-26 | GM Global Technology Operations LLC (n. d. Gesetzen des Staates Delaware) | METHOD FOR FOLLOWING THE INTENTION OF AN OPERATOR FOR MOVING A ROBOT SYSTEM |
| JP2015136769A (en) | 2014-01-23 | 2015-07-30 | 財團法人精密機械研究發展中心 | End effector control method |
| JP2019093461A (en) | 2017-11-20 | 2019-06-20 | 株式会社安川電機 | Holding system, learning device, holding method and model manufacturing method |
| US20200130190A1 (en) | 2018-10-29 | 2020-04-30 | Toyota Research Institute, Inc. | Intent based control of a robotic device |
| US20210101286A1 (en) | 2019-03-01 | 2021-04-08 | Google Llc | Robotic manipulation using domain-invariant 3d representations predicted from 2.5d vision data |
| WO2020189143A1 (en) | 2019-03-20 | 2020-09-24 | Telexistence株式会社 | Control device and control method |
| JP2022045905A (en) | 2020-09-09 | 2022-03-22 | ファナック株式会社 | Mix-size depalletizing |
| JP2022110260A (en) | 2021-01-18 | 2022-07-29 | ソニーグループ株式会社 | Mobile device and mobile device control method |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2024033189A (en) | 2024-03-13 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US12131529B2 (en) | Virtual teach and repeat mobile manipulation system | |
| Morales et al. | Integrated grasp planning and visual object localization for a humanoid robot with five-fingered hands | |
| CN114746906B (en) | Shared dense network with robot task specific header | |
| CN111085997A (en) | Capturing training method and system based on point cloud acquisition and processing | |
| Nickels et al. | Model-based tracking of complex articulated objects | |
| Schröder et al. | Real-time hand tracking using synergistic inverse kinematics | |
| JP7809033B2 (en) | Remote operation assistance system, remote operation assistance method, and program | |
| CN118893633B (en) | Model training method and device and mechanical arm system | |
| JPH0830327A (en) | Active environment recognition system | |
| CN118721215A (en) | Vision-based multi-mode teleoperation grasping method and system for humanoid robotic arm | |
| Xue et al. | Gesture-and vision-based automatic grasping and flexible placement in teleoperation | |
| Aleotti et al. | Grasp programming by demonstration in virtual reality with automatic environment reconstruction | |
| CN119356524A (en) | Gesture recognition algorithm and system based on color attention in AR surgical environment | |
| JP2025102036A (en) | Remote operation control device, remote operation control method, and program | |
| CN116619387A (en) | A Dexterous Hand Teleoperation Method Based on Hand Pose Estimation | |
| Infantino et al. | Visual control of a robotic hand | |
| Müller et al. | Graspy–object manipulation with nao | |
| Vodolazskii et al. | A review of robotic manipulation of deformable objects with imitation learning techniques: Progress and outlook | |
| CN114097004B (en) | Performance of autonomous tasks based on visual embedding | |
| Xin et al. | Visual servoing of unknown objects for family service robots | |
| CN121572306A (en) | A Teleoperation Method and System for Arm-Operated Robots Based on Multi-View Confidence Fusion | |
| WO2025169657A1 (en) | Machine learning device and machine learning method | |
| JP2024123546A (en) | Posture estimation device, posture estimation method, and program | |
| Dillmann | Integrated grasp planning and visual object localization for a humanoid robot with five-fingered hands |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20241127 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20250829 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20251007 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20251208 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20251223 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20260120 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7809033 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |