JP6604832B2 - Machine learning support device - Google Patents
Machine learning support device Download PDFInfo
- Publication number
- JP6604832B2 JP6604832B2 JP2015236094A JP2015236094A JP6604832B2 JP 6604832 B2 JP6604832 B2 JP 6604832B2 JP 2015236094 A JP2015236094 A JP 2015236094A JP 2015236094 A JP2015236094 A JP 2015236094A JP 6604832 B2 JP6604832 B2 JP 6604832B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- artificial intelligence
- virtual space
- learning
- machine learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Manipulator (AREA)
- Image Analysis (AREA)
Description
本発明は、機械学習支援装置に関し、特に、人工知能装置の機械学習および動作の検証を支援する機械学習支援装置に関する。 The present invention relates to a machine learning support device, and more particularly to a machine learning support device that supports machine learning and operation verification of an artificial intelligence device.
近年、映像や画像中の被写体(人物など)を認識するためにニューラルネットワークを用いた画像認識システムの開発が進められている。 In recent years, an image recognition system using a neural network for recognizing a subject (such as a person) in a video or an image has been developed.
このシステムでは、事前に、認識対象の被写体を含む画像データを入力に用いてニューラルネットワークを学習させるだけで、ニューラルネットワークがその被写体を認識できるようになる。そのため、従来専門家が人手で行っていた被写体の特徴抽出の作業を必要としない。 In this system, the neural network can recognize the subject only by learning the neural network in advance using image data including the subject to be recognized as input. For this reason, it is not necessary to perform an object feature extraction operation that has been performed manually by experts.
しかし、その事前学習には、数万から数十万、場合によっては数百万枚以上という多量の画像が必要であり、それを用意するにも、またそれを教師画像として予め分類(タグ付け)するにも、膨大な労力と時間を要する。 However, the pre-learning requires a large amount of images of tens of thousands to hundreds of thousands, and in some cases, millions or more. In order to prepare images, they are also classified (tagged) in advance as teacher images. ) Takes a lot of effort and time.
そこで、その問題を解消するため、例えば、特許文献1では、被写体が写った元画像を取得し、その元画像に画像処理を施しながら複数枚の教師画像を作成する。そして。その画像処理の内容がそれぞれ異なる複数枚の教師画像の画像データを入力に用いてニューラルネットワークを学習させるという技術を開示している。 In order to solve this problem, for example, in Patent Document 1, an original image showing a subject is acquired, and a plurality of teacher images are created while performing image processing on the original image. And then. A technique for learning a neural network using image data of a plurality of teacher images having different contents of image processing as input is disclosed.
また、例えば、特許文献2では、現実空間で認識対象の被写体(人物)を撮影し、それにより取得した元画像から被写体(人物)の人体モデル(3次元形状データ)を作成するとともに、その3次元形状データに基づき、仮想空間上に人物を生成して表示する。次に、該仮想空間上で、ユーザが人物の姿勢や動作や体格などについての変化を(マウスなどによって)指定すると、指定内容に応じた画像処理を人体モデル(3次元形状データ)に加え、その処理後の3次元形状データを基に、姿勢や動作や体格などが変化した人物(被写体)を含む教師画像を作成する。そして、上記手順により、人物(被写体)の姿勢や動作や体格などを様々に変化させながら教師画像を複数枚作成し、それらの教師画像の画像データを入力に用いてニューラルネットワークを学習させるという技術を開示している。 Further, for example, in Patent Document 2, a subject (person) to be recognized is photographed in a real space, and a human body model (three-dimensional shape data) of the subject (person) is created from the acquired original image. A person is generated and displayed in a virtual space based on the dimensional shape data. Next, in the virtual space, when the user designates a change in the posture, movement, or physique of the person (using a mouse or the like), image processing corresponding to the designated content is added to the human body model (three-dimensional shape data), Based on the processed three-dimensional shape data, a teacher image including a person (subject) whose posture, motion, physique, etc. has changed is created. Then, according to the above procedure, a technique of creating a plurality of teacher images while variously changing the posture, motion, physique, etc. of a person (subject), and learning a neural network using the image data of those teacher images as input Is disclosed.
ところで、最近では、環境の変化に応じて適切な処置動作が行えるように、各種の感覚を付加して適応能力を高めた知能ロボットが開発されている。 By the way, recently, an intelligent robot has been developed that has various adaptive feelings and an adaptive ability so that an appropriate treatment operation can be performed according to changes in the environment.
このような知能ロボットでは、外界を認識するための感覚機能として、視覚と触覚との機能を備えることが重要になる。視覚は物体(ロボットの持ち上げなどの操作の対象)を含む環境全体の認識を行うため、また触覚は物体との接触状態における動作制御のために必要である。 In such an intelligent robot, it is important to have visual and tactile functions as sensory functions for recognizing the outside world. Vision is necessary for recognizing the entire environment including an object (object of operation such as lifting a robot), and tactile sensation is necessary for motion control in contact with the object.
知能ロボットでは、これらの感覚機能のために、画像センサーと触覚センサー(力覚センサーを含む)とを備えるのが一般的である。それゆえ、画像情報と触覚情報(力覚情報を含む)との2つの感覚情報(外界認識情報)を処理する必要があり、知能ロボットでは、その外界認識情報の処理のためにニューラルネットワークを用いるものが多く出現してきている。 An intelligent robot generally includes an image sensor and a tactile sensor (including a force sensor) for these sensory functions. Therefore, it is necessary to process two sensory information (external recognition information) of image information and tactile information (including haptic information), and an intelligent robot uses a neural network to process the external recognition information. Many things are appearing.
ところが、従来技術は、既述のとおり、外界認識情報のうち、画像情報の学習には対応しているものの、触覚情報(力覚情報を含む)の学習については対応していない。 However, as described above, the conventional technology supports learning of image information among external recognition information, but does not support learning of tactile information (including haptic information).
また、話は変わるが、医薬品や食料品の分野では、薬や食物についての画像(画像センサーから出力されるセンサー情報)による瑕疵の検査に加えて、赤外分光分析による有機化合物の検出や蛍光X線分析による元素の検出など、画像だけでは分からない不純物等の検査が併せて行われ、最終的な検査判定は、それらの情報を統合して行われる。 In addition, in the field of pharmaceuticals and foodstuffs, in addition to the inspection of wrinkles based on images of drugs and food (sensor information output from image sensors), in the field of pharmaceuticals and foodstuffs, detection of organic compounds and fluorescence using infrared spectroscopy Inspection of impurities and the like that cannot be understood only by an image, such as element detection by X-ray analysis, is performed together, and final inspection determination is performed by integrating the information.
この分光分析にはマルチスペクトルカメラ(センサー)から出力される蛍光スペクトル情報(センサー情報)が用いられる。そのため、そのセンサー情報の様々なパターンをニューラルネットワークに学習させれば、知能ロボットを含む人口知能装置が自ら検査判定を行えるとともに、検査対象の薬や食物の中から、不純物等が混入した不合格品を選別して取り除けるようになる。 In this spectroscopic analysis, fluorescence spectrum information (sensor information) output from a multispectral camera (sensor) is used. Therefore, if the neural network learns various patterns of the sensor information, artificial intelligence devices including intelligent robots can make inspection decisions themselves, and rejects that contain impurities, etc. from the medicine or food to be examined You will be able to select and remove items.
また、医療の分野では、癌などの病気の診断において、その癌などの自家蛍光を検出するためにマルチスペクトルカメラ(センサー)から出力される蛍光スペクトル情報(センサー情報)が用いられる。さらに手術においては、内視鏡カメラや術野カメラ(センサー)から出力される画像(センサー情報)や、手術中に各種測定器(センサー)から出力される脈拍・心拍・血圧・血流といった測定情報(センサー情報)を取得するとともに、それらの情報を統合して手術遂行の支援が行われている。 In the medical field, in the diagnosis of diseases such as cancer, fluorescence spectrum information (sensor information) output from a multispectral camera (sensor) is used to detect autofluorescence such as cancer. Furthermore, in surgery, images (sensor information) output from endoscopic cameras and operative field cameras (sensors) and measurements such as pulse, heart rate, blood pressure, and blood flow output from various measuring devices (sensors) during surgery Information (sensor information) is acquired, and the information is integrated to support surgery.
そこで、これら複数のセンサーから得られるセンサー情報の様々なパターンをニューラルネットワークに学習させれば、人口知能装置が病気の診断や手術の遂行の支援を行えるようになる。すなわち、知能ロボットを含む人口知能装置を高度化させるには、各種のセンサーから得られるセンサー情報(マルチセンサー情報)の様々なパターンをニューラルネットワークに学習させる必要がある。 Therefore, if the neural network learns various patterns of sensor information obtained from the plurality of sensors, the artificial intelligence device can support the diagnosis of disease and the performance of surgery. That is, in order to upgrade an artificial intelligence apparatus including an intelligent robot, it is necessary to make a neural network learn various patterns of sensor information (multi-sensor information) obtained from various sensors.
しかし、従来技術は、既述のとおり、外界認識情報を含むマルチセンサー情報のうち、画像情報の学習には対応しているものの、それ以外の情報の学習については対応していない。また、学習後の人工知能装置の動作が、想定したものであるかどうかを検証する必要もある。 However, as described above, the conventional technology supports learning of image information among multi-sensor information including external world recognition information, but does not support learning of other information. In addition, it is necessary to verify whether or not the operation of the artificial intelligence apparatus after the learning is assumed.
本発明の目的は、マルチセンサー情報について、人工知能装置の機械学習および動作の検証を支援することのできる機械学習支援装置を提供することにある。 An object of the present invention is to provide a machine learning support device that can support machine learning and operation verification of an artificial intelligence device for multi-sensor information.
本発明に係る第1の機械学習支援装置は、上記目的を達成するために、複数センサーの出力情報に対応した複数の仮想情報を生成する情報生成部と、前記情報生成部が生成した前記複数の仮想情報を用いて、人工知能装置を学習させる学習支援部と、前記複数の仮想情報を用いて、該学習後の人工知能装置の動作の検証を行う検証支援部とを備え、前記複数の仮想情報のうちの一つである触覚情報は、前記学習後の人工知能装置の操作対象となる物体の仮想空間における位置および姿勢を示す物体位置情報と、該人工知能装置の可動部の前記仮想空間における位置および姿勢を示す可動部位置情報と、に基づいて生成される。 In order to achieve the above object, a first machine learning support device according to the present invention includes an information generation unit that generates a plurality of virtual information corresponding to output information of a plurality of sensors, and the plurality of information generated by the information generation unit. A learning support unit that learns the artificial intelligence device using the virtual information, and a verification support unit that verifies the operation of the artificial intelligence device after the learning using the plurality of virtual information . The tactile information, which is one of the virtual information, includes the object position information indicating the position and posture of the object to be operated by the artificial intelligence device after learning in the virtual space, and the virtual information of the movable part of the artificial intelligence device. a movable section position information indicating the position and orientation in space, Ru is generated based on.
本発明に係る第2の機械学習支援装置は、上記目的の人工知能装置の機械学習の支援を達成するために、前記第1の機械学習支援装置において、前記検証支援部が行う前記検証時に前記学習後の人工知能装置を更に強化学習させる強化学習部を備えている。 According to the second machine learning support device of the present invention, in the first machine learning support device, the verification support unit performs the verification in the first machine learning support device in order to achieve the machine learning support of the above-described artificial intelligence device. A reinforcement learning unit is provided for further reinforcement learning of the artificial intelligence device after learning.
本発明に係る第3の機械学習支援装置は、上記目的の人工知能装置の機械学習の支援を達成するために、前記第1または第2の機械学習支援装置において、前記情報生成部は、既知の情報に基づき前記学習後の人工知能装置の操作対象となる物体を含む仮想空間の画像を生成すると共に、前記既知の情報に基づき前記物体の前記仮想空間における位置および姿勢を示す前記物体位置情報を生成する視覚情報生成部と、前記物体位置情報と、予め想定される、前記学習後の人工知能装置から出力されるべき該人工知能装置の可動部の前記仮想空間における位置および姿勢を示す前記可動部位置情報とに基づいて前記触覚情報を生成する触覚情報生成部とを備えている。そして、前記学習支援部が、前記仮想空間の画像と前記物体位置情報とを入力に用いて前記人工知能装置の視覚機能を学習させ、また、前記触覚情報を入力に用いて前記人工知能装置の触覚機能を学習させる。 According to a third machine learning support device of the present invention, in order to achieve the machine learning support of the above-described artificial intelligence device, in the first or second machine learning support device, the information generation unit is known. the object position information together with generating an image of the virtual space on the basis of including the operation subject to the object of the learning after the artificial intelligence system to the information, indicating the position and orientation in the virtual space of the object based on the known information a visual information generation unit that generates, and the object position information, previously envisaged, it said indicating the position and orientation in the virtual space of the movable portion of the learning after AI the artificial intelligence system to be output from the device and a touch information generating unit that generates the haptic information based on a movable portion position information. The learning support unit learns the visual function of the artificial intelligence device using the image of the virtual space and the object position information as input, and uses the tactile information as input for the artificial intelligence device. Learn tactile functions.
本発明に係る第4の機械学習支援装置は、上記目的の人工知能装置の動作の検証の支援を達成するために、前記第1または第2の機械学習支援装置において、前記情報生成部は、既知の情報に基づき前記学習後の人工知能装置の操作対象となる物体を含む仮想空間の画像を生成する視覚情報生成部と、前記学習後の人工知能装置から出力される前記物体の前記仮想空間における位置および姿勢を示す第1の物体位置情報と、前記学習後の人工知能装置から出力される該人工知能装置の可動部の前記仮想空間における位置および姿勢を示す前記可動部位置情報とに基づき前記触覚情報を生成する触覚情報生成部とを備えている。前記視覚情報生成部は、前記第1の物体位置情報と前記可動部位置情報とに基づいて前記仮想空間における前記物体の位置および姿勢を更新する。そして、前記検証支援部は、前記仮想空間の画像を入力として与えることにより、前記学習後の人工知能装置のニューラルネットワークに第2の物体位置情報を出力させ、また、前記触覚情報を入力として与えることにより、前記学習後の人工知能装置のニューラルネットワークに前記物体に対する操作が適切であるか否かを示す触覚判定情報を出力させて、該第2の物体位置情報と該触覚判定情報とに基づき前記学習後の人工知能装置の可動部の動作を検証すると共に、前記触覚情報生成部に前記触覚情報を生成させるように、また、前記視覚情報生成部に前記更新を行わせるように、前記学習後の人工知能装置に前記第1の物体位置情報と前記可動部位置情報とを出力させる。 In order to achieve the verification of the operation of the above-described artificial intelligence device, the fourth machine learning support device according to the present invention is characterized in that in the first or second machine learning support device, the information generation unit includes: A visual information generation unit that generates an image of a virtual space including an object to be operated by the artificial intelligence device after learning based on known information; and the virtual space of the object output from the artificial intelligence device after learning based on the first object position information indicating the position and orientation, and the movable portion position information indicating the position and orientation in the virtual space of the movable portion of the artificial intelligence system, which is output from the artificial intelligence system after the learning in and a touch information generating unit for generating the haptic information. The visual information generation unit updates the position and orientation of the object in the virtual space based on the first object position information and the movable part position information. Then, the verification support unit outputs the second object position information to the neural network of the learned artificial intelligence device by giving the image of the virtual space as an input, and also gives the tactile information as an input. Thus, based on the second object position information and the tactile determination information, the neural network of the artificial intelligence apparatus after learning outputs tactile determination information indicating whether or not the operation on the object is appropriate. The learning is performed so that the operation of the movable part of the artificial intelligence apparatus after the learning is verified, the tactile information generation unit is configured to generate the tactile information, and the visual information generation unit is configured to perform the update. A later artificial intelligence apparatus is made to output the first object position information and the movable part position information.
本発明の機械学習支援装置では、情報生成部が、複数センサーの出力情報(マルチセンサー情報)に対応した複数の仮想情報を生成する。そして、学習支援部が、その情報生成部の生成した複数の仮想情報を用いて人工知能装置を機械学習させる。また、検証支援部が、情報生成部の生成した複数の仮想情報を用いて機械学習後の人工知能装置の動作の検証を行う。 In the machine learning support device of the present invention, the information generation unit generates a plurality of virtual information corresponding to the output information (multi-sensor information) of the plurality of sensors. Then, the learning support unit causes the artificial intelligence apparatus to perform machine learning using the plurality of virtual information generated by the information generation unit. Further, the verification support unit verifies the operation of the artificial intelligence apparatus after machine learning using the plurality of virtual information generated by the information generation unit.
従って、本発明の機械学習支援装置によれば、マルチセンサー情報について、人工知能装置の機械学習を支援することができる。また、本発明の機械学習支援装置によれば、機械学習後の人工知能装置の動作が想定したものであるかどうかの検証を支援することができる。 Therefore, according to the machine learning support apparatus of the present invention, it is possible to support machine learning of the artificial intelligence apparatus for multi-sensor information. Further, according to the machine learning support apparatus of the present invention, it is possible to support verification of whether or not the operation of the artificial intelligence apparatus after the machine learning is assumed.
以下、本発明の実施形態を図面に基づいて説明する。なお、ここでは、人工知能装置の一種である知能ロボットを対象に機械学習と動作の検証を行う例を説明する。そのため、マルチセンサー情報としては、知能ロボットにとって重要な外界認識情報である画像情報と触覚情報(力覚情報を含む)との2つの感覚情報を用いる。 Hereinafter, embodiments of the present invention will be described with reference to the drawings. Here, an example will be described in which machine learning and operation verification are performed on an intelligent robot that is a type of artificial intelligence device. Therefore, as the multi-sensor information, two sensory information of image information and tactile information (including haptic information), which are external world recognition information important for the intelligent robot, are used.
図1は、本発明の実施形態である機械学習支援装置の構成図である。同図に示すとおり、機械学習支援装置100は、仮想空間発生装置10と仮想知能ロボット装置20とシステム制御装置30とを有している。 FIG. 1 is a configuration diagram of a machine learning support apparatus according to an embodiment of the present invention. As shown in FIG. 1, the machine learning support device 100 includes a virtual space generation device 10, a virtual intelligent robot device 20, and a system control device 30.
仮想空間発生装置10は、CG部11と力覚発生部12とを有している。 The virtual space generation apparatus 10 includes a CG unit 11 and a force generation unit 12.
CG部11は、CG(Computer Graphics)やVR(Virtual Reality)やMR(Mixed Reality)などの従来技術により、現実の空間に対応させた3次元直交座標系の仮想空間を生成すると共に、その仮想空間の情報を管理する。さらに、CG部11は、その仮想空間に、知能ロボットの動作環境に存在すべき物体や、知能ロボットの持ち上げなどの操作の対象となる物体を生成して出現させると共に、その物体に対応する3Dモデル情報を管理する。 The CG unit 11 generates a virtual space of a three-dimensional orthogonal coordinate system corresponding to a real space by using conventional techniques such as CG (Computer Graphics), VR (Virtual Reality), and MR (Mixed Reality) and Manage spatial information. Furthermore, the CG unit 11 generates and appears in the virtual space an object that should exist in the operating environment of the intelligent robot or an object that is a target of an operation such as lifting the intelligent robot, and 3D corresponding to the object. Manage model information.
また、CG部11は、出現させた物体を含む仮想空間の画像を生成して、その画像情報を出力する。さらに、CG部11は、その生成した画像中の物体について、該物体の仮想空間における位置と姿勢を示す6次元位置情報J(x,y,z,θx,θy,θz)を生成して出力する。なお、x,y,zは3次元直交座標系における3軸上での物体の座標位置を、θx,θy,θzは該物体の回転角度を表す。 In addition, the CG unit 11 generates an image of the virtual space including the appearing object and outputs the image information. Further, the CG unit 11 generates and outputs 6-dimensional position information J (x, y, z, θx, θy, θz) indicating the position and orientation of the object in the virtual space for the object in the generated image. To do. Note that x, y, and z represent the coordinate position of the object on three axes in the three-dimensional orthogonal coordinate system, and θx, θy, and θz represent the rotation angle of the object.
力覚発生部12は、知能ロボットの指や手首や腕などに備えられる触覚センサー(力覚センサーを含む)の出力に対応した触覚情報(力覚情報を含む)を、演算によって生成して出力する。具体的には、知能ロボットの触覚センサーが、例えば、6軸力覚センサーであれば、力覚発生部12は、該センサーが検出すべき6軸力成分(fx,fy,fz,mx,my,mz)の情報を演算により生成し、その情報を仮想6軸力覚情報として出力する。なお、この場合、fx,fy,fzは3軸の力成分を、mx,my,mzは3軸のモーメント成分を表す。 The force generation unit 12 generates and outputs tactile information (including force information) corresponding to the output of the tactile sensor (including force sensor) provided on the finger, wrist, arm, etc. of the intelligent robot. To do. Specifically, if the tactile sensor of the intelligent robot is, for example, a 6-axis force sensor, the force generation unit 12 detects the 6-axis force component (fx, fy, fz, mx, my) to be detected by the sensor. , Mz) is generated by calculation, and the information is output as virtual six-axis force sense information. In this case, fx, fy, and fz represent triaxial force components, and mx, my, and mz represent triaxial moment components.
次に、仮想知能ロボット装置20は、ニューラルネットワーク21と、ニューラルネットワーク22と、ロボット制御部23と、画像処理部24とを有している。 Next, the virtual intelligent robot apparatus 20 includes a neural network 21, a neural network 22, a robot control unit 23, and an image processing unit 24.
ここで、ニューラルネットワークについて簡単に説明する。ニューラルネットワークは、脳神経系をモデル化した情報処理システムであり、ニューロンと呼ばれる入出力素子を、シナプスと呼ばれる結合強度(結合係数)が可変な素子により複数結合して構成される。なお、各ニューロンは、入力が閾値より大きければ「1(真)」、小さければ「0(偽)」を出力する機能を持つものであり、シグモイド関数やハイパボリックタンジェント(tanh)関数等の伝達関数を用いて実現される。 Here, the neural network will be briefly described. A neural network is an information processing system that models a cranial nervous system, and is configured by connecting a plurality of input / output elements called neurons with elements having a variable connection strength (coupling coefficient) called a synapse. Each neuron has a function of outputting “1 (true)” if the input is larger than the threshold value, and “0 (false)” if the input is smaller. Transfer functions such as a sigmoid function and a hyperbolic tangent (tanh) function are provided. It is realized using.
ニューラルネットワークの学習は、ニューラルネットワークの出力を目標値に近づけるように、ニューロン間のシナプス結合係数(重み係数)や各ニューロンの閾値を調整することによって行う。なお、教師付き学習の場合、誤差逆伝播法(バックプロパゲーション)を用いるようにすればニューラルネットワークの学習が早く収束する。 Learning of the neural network is performed by adjusting the synapse coupling coefficient (weighting coefficient) between neurons and the threshold value of each neuron so that the output of the neural network approaches the target value. In the case of supervised learning, the learning of the neural network converges quickly by using the error back-propagation method (back propagation).
本実施形態では、複数のニューロンから構成される層が、入力層から中間層を介して出力層へ向かう方向に結合される多層フィードフォワード型のニューラルネットワークを用いている。 In this embodiment, a multilayer feedforward neural network in which layers composed of a plurality of neurons are coupled in a direction from an input layer to an output layer via an intermediate layer is used.
ニューラルネットワーク21は、CG部11が出力した画像情報を入力として、その仮想空間の画像中の物体(知能ロボットの操作対象となる物体を含む)を認識すると共に、認識した物体の6次元位置情報J(x,y,z,θx,θy,θz)を出力する。なお、このような出力を得るには、認識対象の物体を含む仮想空間の画像情報と、その物体の仮想空間における位置と姿勢を示す6次元位置情報Jとの対応を、予めニューラルネットワーク21に学習させておく必要がある。 The neural network 21 receives the image information output from the CG unit 11 and recognizes an object (including an object to be operated by the intelligent robot) in the image of the virtual space, and also 6-dimensional position information of the recognized object. J (x, y, z, θx, θy, θz) is output. In order to obtain such an output, the correspondence between the image information of the virtual space including the object to be recognized and the six-dimensional position information J indicating the position and orientation of the object in the virtual space is stored in advance in the neural network 21. It is necessary to learn.
このような画像認識のためのニューラルネットワーク21には、その認識率の高さから、畳み込みニューラルネットワーク(CNN)を用いるのが好適である。 For such a neural network 21 for image recognition, it is preferable to use a convolutional neural network (CNN) because of its high recognition rate.
ニューラルネットワーク22は、力覚発生部12が出力した、力覚センサーの出力に対応した力覚情報である仮想6軸力覚情報(fx,fy,fz,mx,my,mz)を入力として、物体に対する知能ロボットの持ち上げなどの操作が適切であるか否かを示す力覚判定情報を出力する。具体的には、ニューラルネットワーク22は、入力の仮想6軸力覚情報が、適切な操作である場合の力覚情報のパターンの範囲内に入っているかどうかを判定して、入っていれば合格を示す情報、そうでなければ不合格を示す情報を力覚判定情報として出力する。なお、このような出力を得るには、適切な操作(合格)となる仮想6軸力覚情報の全てのパターンを、予めニューラルネットワーク22に学習させておく必要がある。 The neural network 22 receives virtual 6-axis force information (fx, fy, fz, mx, my, mz), which is force information corresponding to the output of the force sensor, output from the force sensor 12, Force sense determination information indicating whether or not an operation such as lifting an intelligent robot with respect to an object is appropriate is output. Specifically, the neural network 22 determines whether or not the input virtual 6-axis haptic information is within the range of the haptic information pattern in the case of an appropriate operation. Or information indicating failure is output as force sense determination information. In order to obtain such an output, it is necessary for the neural network 22 to learn in advance all patterns of virtual 6-axis force sense information that are appropriate operations (pass).
ロボット制御部23は、ニューラルネットワーク21から出力された物体の仮想空間における位置と姿勢を示す6次元位置情報Jに基づき物体に対する知能ロボットの持ち上げなどの操作を決定すると共に、その決定した操作の内容に応じて知能ロボットの腕や手首や指などの動作(動き)を制御する。 The robot control unit 23 determines an operation such as lifting the intelligent robot with respect to the object based on the 6-dimensional position information J indicating the position and orientation of the object in the virtual space output from the neural network 21, and details of the determined operation The movement (movement) of the arm, wrist, finger, etc. of the intelligent robot is controlled accordingly.
また、ロボット制御部23は、ニューラルネットワーク22から出力された知能ロボットの持ち上げなどの操作が適切であるか否かを示す力覚判定情報に基づき、その操作を終えて次の動作に移るか、又は知能ロボットの腕や手首や指などの動作(動き)を修正してその操作を継続するかを判定する。 Further, the robot control unit 23 may finish the operation and move to the next operation based on the force sense determination information indicating whether the operation such as lifting the intelligent robot output from the neural network 22 is appropriate. Alternatively, it is determined whether the operation (movement) of the arm, wrist or finger of the intelligent robot is corrected and the operation is continued.
ロボット制御部23は、知能ロボットの腕や手首や指などの動作(動き)を制御すると、その制御後の指の仮想空間における位置と姿勢を示すロボットの指の6次元位置情報R(x,y,z,θx,θy,θz)を出力する。また、このとき、ロボット制御部23は、そのロボットの指の6次元位置情報Rと合わせて、持ち上げなどの操作の対象となった物体につき、その制御後の仮想空間における位置と姿勢を示す6次元位置情報K(x,y,z,θx,θy,θz)も出力する。なお、ロボットの指の6次元位置情報Rは、例えば、ロボットが5本の指を有し、各指に触覚センサー(力覚センサーを含む)が備えられているとすれば、各指に対応した「ロボットの指の6次元位置情報R1」〜「ロボットの指の6次元位置情報R5」の5つの情報が出力される。また、6次元位置情報Kは、ニューラルネットワーク21から出力された物体の位置と姿勢を示す6次元位置情報Jと、ロボットの指の6次元位置情報Rとに基づいて演算を行うことにより取得することができる。 When the robot controller 23 controls the movement (movement) of the arm, wrist, finger, and the like of the intelligent robot, the robot finger 6-dimensional position information R (x, x, which indicates the position and posture of the finger in the virtual space after the control is controlled. y, z, θx, θy, θz) are output. At this time, the robot control unit 23 indicates the position and posture in the virtual space after the control of the object that is the target of the operation such as lifting, together with the 6-dimensional position information R of the finger of the robot. The dimension position information K (x, y, z, θx, θy, θz) is also output. Note that the 6-dimensional position information R of the finger of the robot corresponds to each finger, for example, if the robot has five fingers and each finger is equipped with a tactile sensor (including a force sensor). The five pieces of information “6-dimensional position information R1 of the robot finger” to “6-dimensional position information R5 of the robot finger” are output. The 6-dimensional position information K is obtained by performing calculations based on the 6-dimensional position information J indicating the position and orientation of the object output from the neural network 21 and the 6-dimensional position information R of the robot finger. be able to.
ロボット制御部23から出力されたロボットの指の6次元位置情報Rと操作対象の物体の6次元位置情報Kとは、CG部11及び力覚発生部12に入力される。CG部11は、入力されたそれらの情報に基づき、該CG部11の管理する仮想空間に出現させた部品などの物体の6次元位置の変化を検出し、その検出した変化を仮想空間に反映する。また、力覚発生部12は、入力されたそれらの情報に基づき、6軸力覚情報(fx,fy,fz,mx,my,mz)を演算によって生成すると共に、その生成した6軸力覚情報を仮想6軸力覚情報として出力する。 The 6-dimensional position information R of the finger of the robot and the 6-dimensional position information K of the operation target object output from the robot control unit 23 are input to the CG unit 11 and the force generation unit 12. Based on the input information, the CG unit 11 detects a change in the six-dimensional position of an object such as a component that appears in the virtual space managed by the CG unit 11, and reflects the detected change in the virtual space. To do. The force generation unit 12 generates 6-axis force information (fx, fy, fz, mx, my, mz) based on the input information, and the generated 6-axis force sense. Information is output as virtual 6-axis force information.
画像処理部24は、CG部11から出力された画像をそのままニューラルネットワーク21の入力として与える。但し、CG部11から参照画像および距離画像が出力された場合は、そのうちの参照画像(知能ロボットのカメラで撮影したのと同等の画像)をそのままニューラルネットワーク21の入力として与えると共に、もう一枚の距離画像(視差画像)を基に物体の距離を検出して、その検出した距離情報をロボット制御部23に与える。 The image processing unit 24 gives the image output from the CG unit 11 as it is as input to the neural network 21. However, when a reference image and a distance image are output from the CG unit 11, the reference image (an image equivalent to that captured by the camera of the intelligent robot) is provided as it is as an input to the neural network 21 and another sheet. The distance of the object is detected based on the distance image (parallax image), and the detected distance information is given to the robot controller 23.
そして、システム制御装置30は、仮想空間発生装置10および仮想知能ロボット装置20を統括制御して、知能ロボットの機械学習および動作の検証を実行する。 Then, the system control device 30 performs overall control of the virtual space generation device 10 and the virtual intelligent robot device 20, and executes machine learning and operation verification of the intelligent robot.
なお、システム制御装置30は、ワークステーション等の情報処理装置によって実現される。また、仮想空間発生装置10についても、システム制御装置30と共に、ワークステーション等で実現してもよい。特に、そのグラフィクス処理には、GPUコンピューティングを行える画像処理プロセッサを用いるとよい。 The system control device 30 is realized by an information processing device such as a workstation. The virtual space generation device 10 may also be realized by a workstation or the like together with the system control device 30. In particular, an image processor that can perform GPU computing may be used for the graphics processing.
また、特に検証時においては、システム制御装置30の指示による切り換えにより、仮想空間発生装置10のCG部11および力覚発生部12の出力の代わりに、実際の画像センサー(カメラ)および力覚センサーの出力を使用することができる。 In particular, at the time of verification, an actual image sensor (camera) and force sensor are used instead of the outputs of the CG unit 11 and the force generation unit 12 of the virtual space generation device 10 by switching according to an instruction from the system control device 30. Output can be used.
(ニューラルネットワークの学習)
以下、知能ロボットに、外界認識情報である画像情報と触覚情報(力覚情報を含む)との2つの感覚情報を機械学習(教師付き学習)させる例を説明する。
(Neural network learning)
Hereinafter, an example will be described in which the intelligent robot performs machine learning (supervised learning) of two sensory information of image information and tactile information (including haptic information) as external world recognition information.
知能ロボットが作業を行うには、2つの外界認識機能が必要となる。その一つは人の視覚に相当する機能で、もう一つは手の指の触覚(力覚を含む)に相当する機能である。 In order for the intelligent robot to work, two external world recognition functions are required. One is a function corresponding to human vision, and the other is a function corresponding to the tactile sensation (including force sensation) of the fingers of the hand.
(画像情報の学習/視覚機能)
知能ロボットに必要な視覚機能とは、カメラで撮影した画像から物体を認識し、その物体の位置と姿勢を示す6次元位置情報J(x,y,z,θx,θy,θz)を検出する機能である。
(Learning image information / visual function)
The visual function necessary for the intelligent robot is to recognize an object from an image taken by a camera and detect 6-dimensional position information J (x, y, z, θx, θy, θz) indicating the position and orientation of the object. It is a function.
知能ロボットが作業手順に沿って作業を進める中では、物体(操作対象の物体など)の6次元位置を検出しなくてはならない場面が多く出てくる。 While the intelligent robot advances the work according to the work procedure, there are many scenes in which the 6-dimensional position of an object (such as an object to be operated) must be detected.
そこで、本実施形態の機械学習支援装置は、その物体を、あたかも知能ロボットのカメラで撮影したかのように、現実の空間に対応させた3次元直交座標系の仮想空間に演算によって生成して出現させる。そして、本実施形態の機械学習支援装置は、その物体を含む仮想空間の画像と、それに対応した物体の仮想空間における位置と姿勢を示す6次元位置情報J(x,y,z,θx,θy,θz)とを生成させ、それらを教師情報としてニューラルネットワークに予め学習させる。 Therefore, the machine learning support apparatus according to the present embodiment generates the object by calculation in a virtual space of a three-dimensional orthogonal coordinate system corresponding to the real space as if it was photographed by an intelligent robot camera. Make it appear. The machine learning support apparatus according to the present embodiment includes an image of a virtual space including the object, and 6-dimensional position information J (x, y, z, θx, θy) indicating the position and orientation of the corresponding object in the virtual space. , Θz), and the neural network learns them as teacher information in advance.
これにより、知能ロボットは、作業の中で物体を認識し、その物体の6次元位置を検出できるようになる。 As a result, the intelligent robot can recognize the object in the work and detect the six-dimensional position of the object.
なお、ここで言う物体とは、部品、山積みの部品、組立て途中の半製品、先端冶具、ロボットの腕(アーム)、セット台など、作業手順に沿って作業空間(=仮想空間)に出現する全ての物体のことである。 The object mentioned here appears in the work space (= virtual space) according to the work procedure, such as parts, piled parts, semi-finished products, tip jigs, robot arms (arms), set stands, etc. All objects.
ところで、作業空間に出現する物体や作業空間自体の環境は全て既知であり、また出現する物体の3次元寸法や表面画像はCAD情報から取得することができる。そして、作業空間における照明の情報(照明の照度、方向、波長帯域などの情報)やカメラの情報(カメラの位置と方向、画角、レンズのズーム倍率、レンズの歪、画素数、SN比などの情報)についても、それらの内容の変化を含めて事前に取得することができる。 By the way, the object appearing in the work space and the environment of the work space itself are all known, and the three-dimensional dimensions and the surface image of the appearing object can be acquired from the CAD information. Information on illumination in the workspace (information on illumination illuminance, direction, wavelength band, etc.) and camera information (camera position and direction, angle of view, lens zoom magnification, lens distortion, number of pixels, SN ratio, etc.) Information) can also be acquired in advance, including changes in their contents.
つまり、これらのこと、すなわち既知の情報に基づけば、実際の作業において知能ロボットの作業空間に存在すべき全ての物体について、現実と同一のものを仮想空間(=作業空間)に出現させることができる。また、その場合、出現する物体の6次元位置についても既知となる。 In other words, based on these things, that is, based on known information, all objects that should exist in the work space of the intelligent robot in actual work can appear in the virtual space (= work space). it can. In this case, the 6-dimensional position of the appearing object is also known.
そこで、仮想空間発生装置10のCG部11は、システム制御装置30からの指示により、その既知の情報に基づき、知能ロボットの作業空間に存在すべき全ての物体について、各物体を被写体として含む仮想空間の画像を被写体毎に生成する。 Therefore, the CG unit 11 of the virtual space generation device 10 includes each object as a subject for all objects that should exist in the work space of the intelligent robot based on the known information in accordance with an instruction from the system control device 30. A spatial image is generated for each subject.
また、CG部11は、システム制御装置30からの指示により、既知の情報に基づき、その各被写体(物体)の仮想空間の画像に対応した、該被写体(物体)の仮想空間における位置と姿勢を示す6次元位置情報J(x,y,z,θx,θy,θz)を生成する。 Also, the CG unit 11 determines the position and orientation of the subject (object) in the virtual space corresponding to the image of the subject (object) in the virtual space based on the known information in accordance with an instruction from the system control device 30. 6-dimensional position information J (x, y, z, θx, θy, θz) is generated.
そして、システム制御装置30は、CG部11が生成して出力した各物体の仮想空間の画像と、それに対応した6次元位置情報Jとを教師情報として仮想知能ロボット装置20のニューラルネットワーク21に学習させる。 Then, the system control device 30 learns the virtual network image of each object generated and output by the CG unit 11 and the corresponding 6-dimensional position information J to the neural network 21 of the virtual intelligent robot device 20 as teacher information. Let
なお、学習用の画像セットには、知能ロボットのワーク誤差(カメラの精度による位置検出誤差、ロボットのブレなど)を考慮して、各物体の6次元位置を少しずつ変化させた画像を用意する。つまり、各物体をワーク誤差のぶん少しずつ、移動、回転、拡大、縮小させた画像をCG部11によって生成させ、それを学習用の画像セットとする。 In the learning image set, images in which the 6-dimensional position of each object is changed little by little are prepared in consideration of the work error of the intelligent robot (position detection error due to camera accuracy, robot shake, etc.). . That is, the CG unit 11 generates an image in which each object is moved, rotated, enlarged, and reduced little by a work error, and this is used as an image set for learning.
この場合、6次元位置の変化量は、ニューラルネットワークのパターン認識の冗長性に応じた粗さ(刻み幅)としてよい。 In this case, the change amount of the 6-dimensional position may be a roughness (step size) corresponding to the redundancy of pattern recognition of the neural network.
学習用の画像セットには、想定される範囲内における照明の変化や照明方向のばらつきに対応した画像も加えるようにする。 An image corresponding to a change in illumination or a variation in illumination direction within an assumed range is also added to the learning image set.
また、作業手順や動作のステップにおいて明らかに存在し得ないと考えられる6次元位置の画像は、学習時間の短縮のために学習セットから省くとよい。 Further, an image of a 6-dimensional position that is considered to be clearly not present in the work procedure or operation step may be omitted from the learning set in order to shorten the learning time.
ニューラルネットワーク21において、学習によって得られたニューロン間のシナプス結合係数(重み係数)や各ニューロンの閾値等は、システム制御装置30により、作業手順や動作のステップ毎に、図1には不図示の記憶装置に記録される。なお、この記憶装置が記憶する結合係数(重み係数)やニューロンの閾値等は、それに対応した作業手順や動作ステップを知能ロボットが実行するにあたり、ロボット制御部23により事前に記憶装置から読み出され、ニューラルネットワーク21にロードされて使用される。これにより、ニューラルネットワークの過学習による局所解(ローカルミニマム)を抑えることができ、認識の精度を高めることができる。 In the neural network 21, the synapse coupling coefficient (weighting coefficient) between neurons obtained by learning, the threshold value of each neuron, and the like are not shown in FIG. Recorded in a storage device. Note that the coupling coefficient (weighting coefficient), neuron threshold value, and the like stored in the storage device are read from the storage device in advance by the robot control unit 23 when the intelligent robot executes the corresponding work procedure or operation step. The neural network 21 is loaded and used. Thereby, a local solution (local minimum) due to over-learning of the neural network can be suppressed, and recognition accuracy can be improved.
(触覚情報の学習/触覚・力覚機能)
知能ロボットに必要なもう一つの外界認識機能である触覚機能とは、知能ロボットの指や手首や腕などに備えた複数の触覚センサー(力覚センサーを含む)から出力される触覚(力覚を含む)情報が、知能ロボットが適切な操作又は動作をしたときの触覚(力覚を含む)情報のパターンの範囲内に入っているかどうかを検出する機能である。
(Learning tactile information / tactile and haptic functions)
The tactile function, which is another external recognition function required for intelligent robots, is a tactile sensor (including a tactile sensor) that is output from multiple tactile sensors (including force sensors) provided on the fingers, wrists, and arms of the intelligent robot. This is a function for detecting whether or not the information is within the range of the tactile (including force) information pattern when the intelligent robot performs an appropriate operation or action.
そこで、本実施形態の機械学習支援装置は、知能ロボットの操作又は動作毎に、あたかも知能ロボットの触覚センサー(力覚センサーを含む)が検出したかのように、演算によって触覚(力覚を含む)情報を生成させる。具体的には、機械学習支援装置は、仮想空間における物体の6次元位置の情報と、予め想定される、仮想空間における知能ロボットの指や手首や腕などの位置と姿勢を示す6次元位置の情報(x,y,z,θx,θy,θz)とに基づいて演算を行うことにより触覚(力覚を含む)情報を生成させる。そして、本実施形態の機械学習支援装置は、知能ロボットが操作対象の物体に対して適切な操作をしたときに検出される触覚(力覚を含む)情報のパターン(合格パターン)を全て生成させ、それを教師情報としてニューラルネットワークに予め学習させる。 Therefore, the machine learning support apparatus according to the present embodiment performs tactile sensation (including force sensation) by calculation as if the tactile sensor (including force sensor) of the intelligent robot detects each operation or operation of the intelligent robot. ) Generate information. Specifically, the machine learning support apparatus has information on the 6-dimensional position of the object in the virtual space and the assumed 6-dimensional position indicating the position and posture of the intelligent robot such as fingers, wrists, and arms in the virtual space. Tactile (including haptic) information is generated by performing calculations based on information (x, y, z, θx, θy, θz). Then, the machine learning support device of the present embodiment generates all tactile (including haptic) information patterns (acceptance patterns) detected when the intelligent robot performs an appropriate operation on the operation target object. Then, the neural network is made to learn in advance as teacher information.
これにより、知能ロボットは、作業の中で、操作対象の物体に対する操作又は動作が適切であるか否かを判断できるようになる。 As a result, the intelligent robot can determine whether or not the operation or action on the operation target object is appropriate in the work.
よって、システム制御装置30からの指示により、仮想空間発生装置10のCG部11が、操作の対象となる部品などの物体について、上記の既知の情報に基づき、該CG部11の管理する仮想空間における物体の6次元位置情報J(x,y,z,θx,θy,θz)を生成する。 Therefore, in accordance with an instruction from the system control device 30, the CG unit 11 of the virtual space generation device 10 manages the virtual space managed by the CG unit 11 based on the known information about an object such as a part to be operated. 6-dimensional position information J (x, y, z, θx, θy, θz) of the object is generated.
次に、力覚発生部12が、システム制御装置30からの指示により、上記の既知の情報に基づき、CG部11の生成した物体の6次元位置情報Jと、予め想定される、仮想空間における知能ロボットの指や手首や腕などの位置と姿勢を示す6次元位置の情報とに基づいて演算を行うことにより触覚(力覚を含む)情報を生成する。知能ロボットの触覚センサーが、例えば、6軸力覚センサーであれば、6軸力覚情報(fx,fy,fz,mx,my,mz)が演算によって生成される。このとき、力覚発生部12は、知能ロボットが操作対象の物体に対して適切な操作をしたときに検出される力覚情報のパターン(力覚センサーがn個あるとすれば、6軸×n個=6nパターン)を全て生成する。 Next, the force sense generation unit 12 receives the 6-dimensional position information J of the object generated by the CG unit 11 based on the above-described known information in accordance with an instruction from the system control device 30, and the virtual space assumed in advance. Tactile (including haptic) information is generated by performing calculations based on the position of the intelligent robot such as fingers, wrists, and arms and information on the 6-dimensional position indicating the posture. If the tactile sensor of the intelligent robot is, for example, a 6-axis force sensor, 6-axis force information (fx, fy, fz, mx, my, mz) is generated by calculation. At this time, the force generation unit 12 detects force information patterns detected when the intelligent robot performs an appropriate operation on the object to be operated (if there are n force sensors, 6 axes × (n = 6n patterns) are all generated.
そして、システム制御装置30は、力覚発生部12が生成した力覚情報のパターン(合格パターン)を教師情報として仮想知能ロボット装置20のニューラルネットワーク22に学習させる。 Then, the system control device 30 causes the neural network 22 of the virtual intelligent robot device 20 to learn the force information pattern (pass pattern) generated by the force sense generator 12 as teacher information.
なお、合格となる力覚情報のパターンは、知能ロボットのワーク誤差(カメラの精度による位置検出誤差、ロボットのブレなど)によりその値が或る範囲内でバラついてしまう。そのため、そのバラつきの量に対応した力覚情報のパターンについても力覚発生部12に生成させて、その生成されたパターンも含めて合格パターンのセットとする。 Note that the haptic information pattern that passes is variable in a certain range due to the work error of the intelligent robot (position detection error due to camera accuracy, robot shake, etc.). Therefore, the haptic information pattern corresponding to the variation amount is also generated by the haptic generating unit 12, and the generated pattern including the generated pattern is set as a pass pattern set.
この場合、ワーク誤差によるバラつきの量は、ニューラルネットワークのパターン認識の冗長性に応じた粗さ(刻み幅)としてよい。そうすれば学習時間が短縮される。 In this case, the amount of variation due to the workpiece error may be a roughness (step size) corresponding to the redundancy of pattern recognition of the neural network. This will reduce the learning time.
ニューラルネットワーク22において、学習によって得られたニューロン間のシナプス結合係数(重み係数)や各ニューロンの閾値等は、システム制御装置30により、作業手順や動作のステップ毎に、図1には不図示の記憶装置に記録される。なお、この記憶装置が記憶する結合係数(重み係数)やニューロンの閾値等は、それに対応した作業手順や動作ステップを知能ロボットが実行するにあたり、ロボット制御部23により事前に記憶装置から読み出され、ニューラルネットワーク22にロードされて使用される。 In the neural network 22, the synapse coupling coefficient (weighting coefficient) between neurons obtained by learning, the threshold value of each neuron, and the like are not shown in FIG. Recorded in a storage device. Note that the coupling coefficient (weighting coefficient), neuron threshold value, and the like stored in the storage device are read from the storage device in advance by the robot control unit 23 when the intelligent robot executes the corresponding work procedure or operation step. And loaded into the neural network 22 for use.
(知能ロボットの動作の検証の例)
以下、学習済みのニューラルネットワークを含む知能ロボットの動作を検証する例について、図1および図2を参照して説明する。
(Example of verification of intelligent robot operation)
Hereinafter, an example of verifying the operation of an intelligent robot including a learned neural network will be described with reference to FIGS.
なお、ここでは、知能ロボットが行う「部品のランダムピッキング」の動作を例として説明する。ランダムピッキングとは、知能ロボットが、山積みされた部品の中から操作対象となる部品を認識して、その認識した部品を掴み出す作業であるが、以下では、部品を掴む(把持する)ところまでを説明する。 Here, the operation of “random picking of parts” performed by the intelligent robot will be described as an example. Random picking is an operation in which an intelligent robot recognizes a part to be operated from a pile of parts and grabs the recognized part. Will be explained.
(視覚機能によるランダムピッキング)
部品の3次元構造と表面画像との情報は、既知の情報であるCAD情報から得ることができるため、先ず、図1に示す仮想空間発生装置10のCG部11は、システム制御装置30からの指示により、その既知の情報に基づいて仮想空間に部品を出現させる。このときCG部11は、部品の仮想空間における位置と姿勢、つまり仮想空間における6次元位置(x,y,z,θx,θy,θz)をランダムに変えながら、仮想空間に複数の部品を積み上げて出現させる。そして、CG部11は、システム制御装置30からの指示により、その山積みされた部品を含む仮想空間の画像を生成する。この画像の例を図2に示す。図2の例では、5個の部品(A、B、C、D、E)が山積みされている。なお、この画像は、検証用の画像として使用される。
(Random picking by visual function)
Since the information about the three-dimensional structure of the part and the surface image can be obtained from CAD information that is known information, first, the CG unit 11 of the virtual space generator 10 shown in FIG. In response to the instruction, a part appears in the virtual space based on the known information. At this time, the CG unit 11 stacks a plurality of parts in the virtual space while randomly changing the position and orientation of the parts in the virtual space, that is, the six-dimensional position (x, y, z, θx, θy, θz) in the virtual space. To appear. Then, the CG unit 11 generates an image of a virtual space including the piled parts according to an instruction from the system control device 30. An example of this image is shown in FIG. In the example of FIG. 2, five parts (A, B, C, D, E) are stacked. This image is used as an image for verification.
ランダムピッキングでは、知能ロボットが、自分の指が部品の把持部位を掴みやすいかどうか判定を行うために、部品の把持部位とその周辺に存在する物体(山積みの他の部品など)との距離を検出する必要がある。そのため、本実施形態の機械学習支援装置では、例えば、距離画像カメラから出力される参照画像および距離画像のうちの距離画像を使用して、その距離画像を基に距離を検出することとする。但し、検証においては、CG部11が参照画像および距離画像を生成して出力する。なお、距離の検出の精度をさらに上げるために、特殊なパターンを、特殊な照明(赤外線など)によって部品などの物体の表面に投影した画像を距離画像として使用するようにしてもよい。 In random picking, the intelligent robot determines the distance between the gripping part of the part and an object (such as other parts in a pile) in order to determine whether or not its finger can easily grip the gripping part of the part. It needs to be detected. Therefore, in the machine learning support apparatus of the present embodiment, for example, a distance image is used based on the distance image using a reference image output from the distance image camera and a distance image of the distance image. However, in the verification, the CG unit 11 generates and outputs a reference image and a distance image. In order to further improve the accuracy of distance detection, an image obtained by projecting a special pattern onto the surface of an object such as a part by special illumination (such as infrared rays) may be used as the distance image.
次に、システム制御装置30からの指示により、CG部11は、先に生成した上記の検証用の画像を参照画像とし、その参照画像を基に、各部品(例えば、図2ではA、B、C、D、E)の6次元位置情報J(x,y,z,θx,θy,θz)を演算することで距離画像を生成すると共に、その参照画像と距離画像とを出力する。なお、このCG部11の処理は、既知の情報の一つである作業手順に基づいて行われる。 Next, in response to an instruction from the system control device 30, the CG unit 11 uses the previously generated verification image as a reference image, and based on the reference image, each component (for example, A and B in FIG. 2). , C, D, E), the distance image is generated by calculating 6-dimensional position information J (x, y, z, θx, θy, θz), and the reference image and the distance image are output. In addition, the process of this CG part 11 is performed based on the work procedure which is one of the known information.
その参照画像および距離画像が入力されると、仮想知能ロボット装置20の画像処理部24は、そのうちの参照画像をそのまま、仮想知能ロボット装置20の学習済みとなっているニューラルネットワーク21に入力として与える。なお、その入力の前には、作業手順や動作のステップに対応した重み係数やニューロンの閾値等が、ロボット制御部23により、必要に応じて記憶装置から読み出されてニューラルネットワーク21にロードされる。 When the reference image and the distance image are input, the image processing unit 24 of the virtual intelligent robot apparatus 20 gives the reference image as it is to the learned neural network 21 of the virtual intelligent robot apparatus 20 as an input. . Prior to the input, the weight coefficient corresponding to the work procedure and the operation step, the threshold value of the neuron, and the like are read from the storage device and loaded into the neural network 21 by the robot control unit 23 as necessary. The
この入力により、ニューラルネットワーク21は、山積みされた部品の参照画像から像の全体が写った部品を認識すると共に、認識した部品、例えば、図2では、部品A、B(C、D、Eは、いずれも像の一部がAまたはBに隠れている)の6次元位置情報J(x,y,z,θx,θy,θz)を出力する。この出力はロボット制御部23への入力となる。 By this input, the neural network 21 recognizes the part in which the entire image is shown from the reference images of the stacked parts, and the recognized parts, for example, parts A, B (C, D, E in FIG. , Each of which has a part of the image hidden by A or B), 6-dimensional position information J (x, y, z, θx, θy, θz) is output. This output is input to the robot controller 23.
また、画像処理部24は、もう一枚の距離画像を基に各部品の距離を検出して、その検出した距離情報をロボット制御部23に与える。 Further, the image processing unit 24 detects the distance of each component based on another distance image, and gives the detected distance information to the robot control unit 23.
ロボット制御部23は、入力された、部品の仮想空間における位置と姿勢を示す6次元位置情報Jと、部品の距離情報とを基に、知能ロボットの指が部品の把持部位を囲むために、他の部品などの物体と接触することなくその指を把持対象となる部品の位置まで移動することができるかどうかの判定を行う。なお、部品の把持部位は、掴んだときの重量バランスや、掴んだときに部品が傷つかないかなどの観点からピッキング対象となる部品ごとに予め決定されている。 Based on the input 6-dimensional position information J indicating the position and posture of the part in the virtual space and the distance information of the part, the robot control unit 23 surrounds the gripping part of the part. It is determined whether or not the finger can be moved to the position of the part to be grasped without coming into contact with an object such as another part. The gripping part of the component is determined in advance for each component to be picked from the viewpoint of weight balance when gripped and whether the component is not damaged when gripped.
そして、ロボット制御部23は、操作対象となる部品(例えば、図2では、部品A、B)から掴みやすい部品を選定する。図2の例では、部品Bの把持部位(g、g’)は、g側の面が部品Aと近接していて把持部位を囲むための把持動作を行えない。一方、部品Aの把持部位(g、g’)は、その面に近接する物体がないので把持動作を行うことができる。この場合、部品Aが、ロボット制御部23により操作対象として選定される。 Then, the robot control unit 23 selects parts that are easy to grasp from the parts to be operated (for example, parts A and B in FIG. 2). In the example of FIG. 2, the gripping part (g, g ′) of the part B cannot be gripped to surround the gripping part because the g-side surface is close to the part A. On the other hand, the gripping part (g, g ′) of the component A can be gripped because there is no object close to the surface. In this case, the part A is selected as an operation target by the robot control unit 23.
なお、これらのロボット制御部23の処理は、既知の情報の一つである作業手順に基づいて行われる。 In addition, the process of these robot control parts 23 is performed based on the work procedure which is one of the known information.
次に、ロボット制御部23は、選定した部品の6次元位置情報Jに基づいて、知能ロボットの指をその部品の把持部位を囲む位置に向けて移動させるべく、知能ロボットの腕や手首や指などの動作(動き)を制御する。なお、このロボット制御部23の処理は、既知の情報の一つである作業手順に基づいて行われる。また、知能ロボット自体についても仮想空間でシミュレートする場合には、この動作は情報処理のみで行われるため省略される。 Next, based on the 6-dimensional position information J of the selected part, the robot control unit 23 moves the intelligent robot's finger toward the position surrounding the gripping part of the part, the arm, wrist, and finger of the intelligent robot. Control the movement (movement). The processing of the robot control unit 23 is performed based on a work procedure that is one of known information. Further, when the intelligent robot itself is simulated in the virtual space, this operation is omitted because it is performed only by information processing.
ロボット制御部23は、その動作(動き)の制御により知能ロボットの指が操作対象の部品の把持部位を囲む位置に到達したら、その制御後の指の仮想空間における位置と姿勢を示すロボットの指の6次元位置情報R(x,y,z,θx,θy,θz)を出力する。また、このとき、ロボット制御部23は、そのロボットの指の6次元位置情報Rと合わせて、操作対象の部品につき、その制御後の仮想空間における位置と姿勢を示す6次元位置情報K(x,y,z,θx,θy,θz)も出力する。この6次元位置情報Rおよび6次元位置情報Kは、知能ロボットのワーク誤差(カメラの精度による位置検出誤差、ロボットのブレなど)を加味したものとなっている。 When the robot controller 23 reaches the position where the finger of the intelligent robot surrounds the gripping part of the operation target component by controlling its movement (movement), the robot finger 23 indicates the position and posture of the finger in the virtual space after the control. 6-dimensional position information R (x, y, z, θx, θy, θz) is output. In addition, at this time, the robot control unit 23 combines the 6-dimensional position information R of the finger of the robot with the 6-dimensional position information K (x indicating the position and orientation in the virtual space after the control of the operation target component. , Y, z, θx, θy, θz) are also output. The six-dimensional position information R and the six-dimensional position information K take into account work errors of the intelligent robot (position detection error due to camera accuracy, robot shake, etc.).
そのロボットの指の6次元位置情報R(x,y,z,θx,θy,θz)と操作対象の部品の6次元位置情報K(x,y,z,θx,θy,θz)とが入力されると、仮想空間発生装置10のCG部11は、これらの情報に基づいて、該CG部11の管理する仮想空間に出現させた部品などの物体の6次元位置の変化を検出する。そして、CG部11は、変化を検出した場合には、その変化を、管理する仮想空間に反映するため、該変化のあった部品などの物体の仮想空間における位置と姿勢の情報を更新する。なお、ここではまだ、知能ロボットの指が操作対象の部品の把持部位を囲む位置に到達した状態でしかなく、部品の位置と姿勢(6次元位置)には変化がないので更新(反映)は行われない。このCG部11の処理は、既知の情報の一つである作業手順に基づいて行われる。 6-dimensional position information R (x, y, z, θx, θy, θz) of the finger of the robot and 6-dimensional position information K (x, y, z, θx, θy, θz) of the operation target part are input. Then, the CG unit 11 of the virtual space generation device 10 detects a change in the six-dimensional position of an object such as a component that appears in the virtual space managed by the CG unit 11 based on these pieces of information. When the CG unit 11 detects a change, the CG unit 11 updates the position and orientation information of the object such as the changed part in the virtual space in order to reflect the change in the managed virtual space. It should be noted that here, the intelligent robot finger is only in a state where it has reached the position surrounding the gripping part of the operation target component, and the position (or 6-dimensional position) of the component has not changed, so the update (reflection) is Not done. The processing of the CG unit 11 is performed based on a work procedure that is one of known information.
(力覚機能によるランダムピッキング)
また、仮想空間発生装置10の力覚発生部12は、ロボットの指の6次元位置情報R(x,y,z,θx,θy,θz)と操作対象の部品の6次元位置情報K(x,y,z,θx,θy,θz)とが入力されると、これらの情報に基づいて、6軸力覚情報(fx,fy,fz,mx,my,mz)を演算によって生成する。例えば、力覚センサーがn個あるとすれば、「6軸力覚情報1」〜「6軸力覚情報n」が演算によって生成される。そして、力覚発生部12は、生成した6軸力覚情報を仮想6軸力覚情報として出力する。なお、この力覚発生部12の処理は、既知の情報の一つである作業手順に基づいて行われる。また、この出力の仮想6軸力覚情報は、仮想知能ロボット装置20の学習済みとなっているニューラルネットワーク22に入力として与えられる。また、その入力の前には、作業手順や動作のステップに対応した重み係数やニューロンの閾値等が、ロボット制御部23により、必要に応じて記憶装置から読み出されてニューラルネットワーク22にロードされる。
(Random picking with haptic function)
In addition, the force generation unit 12 of the virtual space generation device 10 includes 6-dimensional position information R (x, y, z, θx, θy, θz) of the robot finger and 6-dimensional position information K (x , Y, z, θx, θy, θz), 6-axis force information (fx, fy, fz, mx, my, mz) is generated by calculation based on these pieces of information. For example, if there are n force sensors, “6-axis force information 1” to “6-axis force information n” are generated by calculation. Then, the force sense generating unit 12 outputs the generated 6-axis force sense information as virtual 6-axis force sense information. Note that the processing of the force generation unit 12 is performed based on a work procedure that is one of known information. The output virtual 6-axis force sense information is given as an input to the learned neural network 22 of the virtual intelligent robot apparatus 20. Prior to the input, the weighting coefficient, the neuron threshold value, and the like corresponding to the work procedure and the operation step are read from the storage device and loaded into the neural network 22 by the robot control unit 23 as necessary. The
次に、ニューラルネットワーク22は、入力された仮想6軸力覚情報(fx,fy,fz,mx,my,mz)を基に、操作対象の部品などの物体に対する操作又は動作が適切であるか否かを判断して、合格または不合格を示す力覚判定情報を出力する。この出力はロボット制御部23への入力となる。 Next, whether the neural network 22 is appropriate for an operation or an operation on an object such as a component to be operated based on the input virtual 6-axis force sense information (fx, fy, fz, mx, my, mz). It judges whether or not, and haptic judgment information indicating pass or fail is output. This output is input to the robot controller 23.
ロボット制御部23は、ニューラルネットワーク22から出力された力覚判定情報に基づき、その操作を終えて次の動作に移るか、又は知能ロボットの指の動作(動き)を修正してその操作を継続するかを判定する。なお、ここではまだ、知能ロボットの指が操作対象の部品の把持部位を囲む位置に到達した状態でしかなく、知能ロボットの指は部品に触れていない。そのため、部品を把持するための次のステップの動作(操作)に移る必要があるので、この場合、ニューラルネットワーク22からは合格を示す力覚判定情報が出力される。このロボット制御部23の処理は、既知の情報の一つである作業手順に基づいて行われる。 Based on the force determination information output from the neural network 22, the robot control unit 23 ends the operation and proceeds to the next operation, or corrects the motion (movement) of the intelligent robot finger and continues the operation. Judge whether to do. It should be noted that here, the intelligent robot finger has only reached the position surrounding the gripping part of the operation target component, and the intelligent robot finger does not touch the component. Therefore, since it is necessary to move to the operation (operation) of the next step for grasping the part, in this case, the haptic determination information indicating acceptance is output from the neural network 22. The processing of the robot control unit 23 is performed based on a work procedure that is one of known information.
ニューラルネットワーク22から合格を示す力覚判定情報が出力されると、ロボット制御部23は、既知の情報の一つである作業手順に基づき、次のステップの部品を把持する動作(操作)に移る。 When the haptic determination information indicating acceptance is output from the neural network 22, the robot control unit 23 proceeds to an operation (operation) for gripping a component of the next step based on a work procedure that is one of known information. .
なお、知能ロボットの指が部品を把持する動作(操作)についての検証は、次のような処理の流れによって行われる。 The operation (operation) in which the finger of the intelligent robot grips the component is verified according to the following processing flow.
(処理1)
ロボット制御部23は、部品の把持を開始するように知能ロボットの指の動作(動き)を制御すると、その制御後の指の仮想空間における位置と姿勢を示すロボットの指の6次元位置情報R(x,y,z,θx,θy,θz)を出力する。また、このとき、ロボット制御部23は、そのロボットの指の6次元位置情報Rと合わせて、操作対象の部品につき、その制御後の仮想空間における位置と姿勢を示す6次元位置情報K(x,y,z,θx,θy,θz)も出力する。この6次元位置情報Rおよび6次元位置情報Kは、既述のとおり、知能ロボットのワーク誤差(カメラの精度による位置検出誤差、ロボットのブレなど)を加味したものとなっている。
(Process 1)
When the robot controller 23 controls the motion (movement) of the intelligent robot finger to start gripping the part, the robot finger 6-dimensional position information R indicating the position and posture of the finger in the virtual space after the control is controlled. (X, y, z, θx, θy, θz) is output. In addition, at this time, the robot control unit 23 combines the 6-dimensional position information R of the finger of the robot with the 6-dimensional position information K (x indicating the position and orientation in the virtual space after the control of the operation target component. , Y, z, θx, θy, θz) are also output. As described above, the 6-dimensional position information R and the 6-dimensional position information K include work errors of the intelligent robot (position detection error due to camera accuracy, robot shake, etc.).
(処理2)
そのロボットの指の6次元位置情報R(x,y,z,θx,θy,θz)と操作対象の部品の6次元位置情報K(x,y,z,θx,θy,θz)とが入力されると、仮想空間発生装置10のCG部11は、これらの情報に基づいて、該CG部11の管理する仮想空間に出現させた部品などの物体の6次元位置の変化を検出する。そして、CG部11は、変化を検出した場合には、その変化を、管理する仮想空間に反映するため、該変化のあった部品などの物体の仮想空間における位置と姿勢の情報を更新する。なお、このCG部11の処理は、既知の情報の一つである作業手順に基づいて行われる。
(Process 2)
6-dimensional position information R (x, y, z, θx, θy, θz) of the finger of the robot and 6-dimensional position information K (x, y, z, θx, θy, θz) of the operation target part are input. Then, the CG unit 11 of the virtual space generation device 10 detects a change in the six-dimensional position of an object such as a component that appears in the virtual space managed by the CG unit 11 based on these pieces of information. When the CG unit 11 detects a change, the CG unit 11 updates the position and orientation information of the object such as the changed part in the virtual space in order to reflect the change in the managed virtual space. In addition, the process of this CG part 11 is performed based on the work procedure which is one of the known information.
(処理3)
また、仮想空間発生装置10の力覚発生部12は、ロボットの指の6次元位置情報R(x,y,z,θx,θy,θz)と操作対象の部品の6次元位置情報K(x,y,z,θx,θy,θz)とが入力されると、これらの情報に基づいて、6軸力覚情報(fx,fy,fz,mx,my,mz)を演算によって生成する。そして、力覚発生部12は、生成した6軸力覚情報を仮想6軸力覚情報として出力する。なお、この力覚発生部12の処理は、既知の情報の一つである作業手順に基づいて行われる。また、この出力の仮想6軸力覚情報は、仮想知能ロボット装置20の学習済みとなっているニューラルネットワーク22に入力として与えられる。また、その入力の前には、作業手順や動作のステップに対応した重み係数やニューロンの閾値等が、ロボット制御部23により、必要に応じて記憶装置から読み出されてニューラルネットワーク22にロードされる。
(Process 3)
In addition, the force generation unit 12 of the virtual space generation device 10 includes 6-dimensional position information R (x, y, z, θx, θy, θz) of the robot finger and 6-dimensional position information K (x , Y, z, θx, θy, θz), 6-axis force information (fx, fy, fz, mx, my, mz) is generated by calculation based on these pieces of information. Then, the force sense generating unit 12 outputs the generated 6-axis force sense information as virtual 6-axis force sense information. Note that the processing of the force generation unit 12 is performed based on a work procedure that is one of known information. The output virtual 6-axis force sense information is given as an input to the learned neural network 22 of the virtual intelligent robot apparatus 20. Prior to the input, the weighting coefficient, the neuron threshold value, and the like corresponding to the work procedure and the operation step are read from the storage device and loaded into the neural network 22 by the robot control unit 23 as necessary. The
(処理4)
次に、ニューラルネットワーク22は、入力された仮想6軸力覚情報(fx,fy,fz,mx,my,mz)を基に、操作対象の部品などの物体に対する操作又は動作が適切であるか否かを判断して、合格または不合格を示す力覚判定情報を出力する。この出力はロボット制御部23への入力となる。
(Process 4)
Next, whether the neural network 22 is appropriate for an operation or an operation on an object such as a component to be operated based on the input virtual 6-axis force sense information (fx, fy, fz, mx, my, mz). It judges whether or not, and haptic judgment information indicating pass or fail is output. This output is input to the robot controller 23.
(処理5)
ロボット制御部23は、ニューラルネットワーク22から出力された力覚判定情報に基づき、その操作を終えて次の動作に移るか、又は知能ロボットの指の動作(動き)を修正してその操作を継続するかを判定する。なお、このロボット制御部23の処理は、既知の情報の一つである作業手順に基づいて行われる。
(Process 5)
Based on the force determination information output from the neural network 22, the robot control unit 23 ends the operation and proceeds to the next operation, or corrects the motion (movement) of the intelligent robot finger and continues the operation. Judge whether to do. The processing of the robot control unit 23 is performed based on a work procedure that is one of known information.
(処理6)
ここで、ロボット制御部23は、力覚判定情報が合格を示す場合には既述のとおり次のステップの動作(操作)に移るが、不合格を示す場合には、知能ロボットの指の動作(動き)を修正してその操作を継続するようにする。具体的には、ロボット制御部23は、知能ロボットの指の動作(動き)を、所謂サーボ制御によって制御することで対象の部品を掴むようにする。このとき、知能ロボットの指は、そのサーボ制御によって部品を掴むように少しずつ動かされるので、ロボット制御部23は、サーボ制御のフィードバックを行う毎に、その指の動きの変化に応じた知能ロボットの指の仮想空間における位置と姿勢の情報と、その指によって操作された部品の仮想空間における位置と姿勢の情報とを出力する。そのため、本実施形態の機械学習支援装置では、知能ロボットの指による部品の把持が適切に行われるまで、サーボ制御のフィードバックが行われる毎に、上記(処理1)の制御後の処理から上記(処理5)の判定処理までが繰り返し実行される。
(Process 6)
Here, the robot control unit 23 moves to the operation (operation) of the next step as described above when the haptic determination information indicates a pass, but if it indicates a failure, the robot controller 23 moves the finger of the intelligent robot. Correct (movement) and continue the operation. Specifically, the robot control unit 23 grasps the target component by controlling the movement (movement) of the finger of the intelligent robot by so-called servo control. At this time, since the finger of the intelligent robot is moved little by little so as to grasp the part by the servo control, the robot control unit 23 responds to the change in the movement of the finger every time feedback of the servo control is performed. Information on the position and orientation of the finger in the virtual space and information on the position and orientation of the part operated by the finger in the virtual space are output. Therefore, in the machine learning support device according to the present embodiment, every time feedback of servo control is performed until the component is properly gripped by the finger of the intelligent robot, the processing after the control in the above (Process 1) is The determination process up to process 5) is repeatedly executed.
このように、本実施形態の機械学習支援装置では、力覚情報については精密な制御が必要となるため、ロボット制御部23が、ロボットの指の6次元位置情報Rおよび操作対象の部品(物体)の6次元位置情報Kを力覚発生部12へフィードバックするようにしてクローズドループ制御を行っている。この場合、ニューラルネットワーク22は、検出された力覚情報が適正範囲に入っているかどうかを判定する、所謂ウィンドウコンパレータと同じ役目をしている。 As described above, in the machine learning support apparatus according to the present embodiment, precise control is required for the force information, so that the robot control unit 23 performs the 6-dimensional position information R of the robot finger and the operation target component (object ) Is fed back to the force generation unit 12 to perform closed loop control. In this case, the neural network 22 has the same function as a so-called window comparator that determines whether or not the detected haptic information is within an appropriate range.
ここで、部品の把持動作について、知能ロボットの指のサーボ制御の一例を述べる。 Here, an example of intelligent robot finger servo control will be described regarding the gripping operation of the component.
先ず、部品の把持部位を知能ロボットの指で囲んで把持動作に入り、部品の把持部位に触れたことを示す力覚情報のパターンが検知された指から動きを一旦止める。 First, the gripping part of the part is surrounded by fingers of the intelligent robot to start a gripping operation, and the movement is temporarily stopped from the finger where the pattern of force information indicating that the part touching the gripping part is detected.
次に、力覚情報のパターンに基づき、全ての指が把持部位に触れたことが検知された時点で、一斉に各指の把持動作を再開する。 Next, when it is detected that all the fingers have touched the gripped part based on the force information pattern, the gripping operation of each finger is resumed all at once.
そして、これらの把持動作を、部品の把持に適切な力覚情報のパターンが得られるまで繰り返し行う。 These gripping operations are repeated until a force information pattern suitable for gripping a component is obtained.
このようにすれば、対象の部品の6次元位置の検出誤差(ワーク誤差)を吸収しながら、部品の把持動作が行えるようになる。 In this way, the gripping operation of the component can be performed while absorbing the detection error (work error) of the six-dimensional position of the target component.
(実施形態の変形例)
以下、上記実施形態の変形例である機械学習支援装置について説明する。この変形例の機械学習支援装置は、上記実施形態の機械学習支援装置の構成に、強化学習を行うための要素を追加したものである。そのため、以下では、その追加の要素についてのみ説明するものとして、上記実施形態と共通する構成要素については同じ符号を付して重複となる説明を省略する。
(Modification of the embodiment)
Hereinafter, a machine learning support apparatus that is a modification of the above embodiment will be described. The machine learning support device of this modification is obtained by adding elements for performing reinforcement learning to the configuration of the machine learning support device of the above embodiment. Therefore, in the following, only the additional elements will be described, and the same reference numerals are given to the constituent elements common to the above-described embodiment, and redundant description will be omitted.
この変形例と上記実施形態との相違点は、図3に示すとおり、強化学習評価部40が追加されたところにある。 The difference between this modification and the above embodiment is that a reinforcement learning evaluation unit 40 is added as shown in FIG.
なお、この変形例の機械学習支援装置においても、上記実施形態の機械学習支援装置と同じく、力覚情報について、ロボット制御部23が、ロボットの指の6次元位置情報Rおよび操作対象の部品(物体)の6次元位置情報Kを力覚発生部12へフィードバックするようにしてクローズドループ制御を行っている。このクローズドループは、検証だけでなく、強化学習の制御ループとしても使用することができる。 Also in the machine learning support apparatus of this modification, the robot control unit 23 uses the 6-dimensional position information R of the finger of the robot and the operation target component (for the haptic information as in the machine learning support apparatus of the above embodiment). The closed loop control is performed by feeding back the six-dimensional position information K of the object) to the force generation unit 12. This closed loop can be used not only for verification but also as a control loop for reinforcement learning.
ところで、知能ロボットにとって重要となる外界認識機能のうちの視覚機能については、操作対象の部品などの物体を含む環境全体の認識を行うものであり、またカメラによる検出の精度の曖昧さもあり、精密な制御は必要としない。しかし、触覚(力覚を含む)機能については、物体との接触状態において動作の制御を行う必要があることから、精密な制御が必要になる。 By the way, the visual function of the outside world recognition function that is important for intelligent robots recognizes the entire environment including objects such as parts to be operated, and there is ambiguity in the accuracy of detection by the camera. No control is required. However, the tactile sensation (including force sense) function needs to be controlled precisely since it is necessary to control the operation in a contact state with an object.
そのため、ニューラルネットワークの学習に必要となる画像や触覚(力覚を含む)などの情報を教師情報として予め用意する教師付き学習では、その緻密な制御のための学習を行うことに大変な困難を伴う。 Therefore, in supervised learning that prepares information such as images and tactile sensations (including haptics) necessary for neural network learning in advance as teacher information, it is very difficult to perform learning for precise control. Accompany.
そこで、触覚(力覚を含む)情報については、強化学習によってニューラルネットワークに学習させることで、その困難を解消できる。 Therefore, the tactile information (including the force sense) information can be solved by causing the neural network to learn by reinforcement learning.
したがって、この変形例の機械学習支援装置では、触覚(力覚を含む)情報についてのニューラルネットワークの強化学習を、以下のようにして行う。 Therefore, in the machine learning support apparatus according to this modification, the reinforcement learning of the neural network for the tactile information (including the haptic information) is performed as follows.
先ず、強化学習が効率良く行われるようにニューラルネットワーク22に対し事前学習として必要程度の教師付き学習をさせておき、その後、知能ロボットの動作の検証を繰り返す中でワーク誤差を与えながら強化学習を行うようにする。 First, in order for reinforcement learning to be performed efficiently, the neural network 22 is subjected to supervised learning as much as necessary as prior learning, and then reinforcement learning is performed while giving a work error while repeatedly verifying the operation of the intelligent robot. To do.
具体的には、先ず、ニューラルネットワーク22に、事前学習を施す。事前学習には様々な方法があるが、ここでは、理想に近い力覚情報のパターンを1つ、教師情報として学習させておくこととする。 Specifically, first, prior learning is performed on the neural network 22. There are various methods for pre-learning, but here, it is assumed that one haptic information pattern that is close to ideal is learned as teacher information.
即ち、システム制御装置30からの指示により、仮想空間発生装置10のCG部11が、操作の対象となる部品などの物体について、上述した既知の情報に基づき、該CG部11の管理する仮想空間における物体の6次元位置情報J(x,y,z,θx,θy,θz)を生成する。 That is, according to an instruction from the system control device 30, the CG unit 11 of the virtual space generation device 10 manages a virtual space managed by the CG unit 11 based on the above-described known information on an object such as a part to be operated. 6-dimensional position information J (x, y, z, θx, θy, θz) of the object is generated.
このとき、その生成と合わせて、CG部11は、その部品などの物体を仮想空間に出現させて、それに対応する3Dモデル情報を管理し、また、その部品などの物体を含む仮想空間の画像を検証用の画像として生成する。 At this time, together with the generation, the CG unit 11 causes an object such as the part to appear in the virtual space, manages the corresponding 3D model information, and also displays an image of the virtual space including the object such as the part. Is generated as a verification image.
次に、力覚発生部12が、システム制御装置30からの指示により、上記の既知の情報に基づき、CG部11の生成した物体の6次元位置情報Jと、予め想定される、仮想空間における知能ロボットの指や手首や腕などの位置と姿勢を示す6次元位置の情報とに基づいて演算を行うことにより6軸力覚情報(fx,fy,fz,mx,my,mz)を生成する。 Next, the force sense generation unit 12 receives the 6-dimensional position information J of the object generated by the CG unit 11 based on the above-described known information in accordance with an instruction from the system control device 30, and the virtual space assumed in advance. 6-axis haptic information (fx, fy, fz, mx, my, mz) is generated by performing calculations based on the position of the intelligent robot's fingers, wrists, arms, etc. and 6-dimensional position information indicating the posture. .
そして、システム制御装置30は、力覚発生部12が生成した6軸力覚情報のパターン、この場合「fx,fy,fz,mx,my,mz」を、教師情報として仮想知能ロボット装置20のニューラルネットワーク22に学習させる。 Then, the system control device 30 uses the pattern of the six-axis force sense information generated by the force sense generating unit 12, in this case “fx, fy, fz, mx, my, mz”, as the teacher information of the virtual intelligent robot device 20. The neural network 22 is trained.
このようにニューラルネットワークに教師付きの事前学習をさせた後、上述したランダムピッキングと同様の検証の処理を行うようにする。 In this way, after the supervised learning with the neural network is performed in advance, the same verification processing as the above-described random picking is performed.
即ち、システム制御装置30からの指示により、CG部11は、先に生成した検証用の画像を出力する。この画像は、仮想知能ロボット装置20の画像処理部24への入力となる。 In other words, in response to an instruction from the system control device 30, the CG unit 11 outputs the previously generated verification image. This image is input to the image processing unit 24 of the virtual intelligent robot apparatus 20.
画像処理部24は、入力されたその検証用の画像をそのまま、仮想知能ロボット装置20の学習済みとなっているニューラルネットワーク21に入力として与える。ここで、ニューラルネットワーク21は、上記の知能ロボットに必要な視覚機能の部分で述べた学習方法により、事前に、この画像に含まれる操作対象の部品などの物体を学習している。 The image processing unit 24 gives the input verification image as it is to the neural network 21 that has been learned by the virtual intelligent robot apparatus 20 as input. Here, the neural network 21 learns in advance an object such as an operation target part included in the image by the learning method described in the visual function necessary for the intelligent robot.
この入力により、ニューラルネットワーク21は、検証用の画像から部品などの物体を認識すると共に、認識した部品などの物体の6次元位置情報J(x,y,z,θx,θy,θz)を出力する。この出力はロボット制御部23への入力となる。 With this input, the neural network 21 recognizes an object such as a component from the verification image and outputs 6-dimensional position information J (x, y, z, θx, θy, θz) of the recognized object such as the component. To do. This output is input to the robot controller 23.
ロボット制御部23は、入力の部品などの物体の6次元位置情報Jに基づいて、知能ロボットの指をその部品の把持部位を囲む位置に向けて移動させるべく、知能ロボットの腕や手首や指などの動作(動き)を制御する。 Based on the 6-dimensional position information J of an object such as an input part, the robot control unit 23 moves the intelligent robot's finger toward the position surrounding the gripping part of the part, the arm, wrist, and finger of the intelligent robot. Control the movement (movement).
この後の検証の処理は、上記のランダムピッキングの部分で述べた処理と同じであるため重複説明を省略する。但し、上述した知能ロボットの指が部品などの物体を把持する動作(操作)については、上記の(処理3)の処理が行われた後に、以下の(処理3−1)および(処理3−2)の処理が追加実行される。 The subsequent verification processing is the same as the processing described in the above-described random picking portion, and thus a duplicate description is omitted. However, regarding the operation (operation) in which the finger of the intelligent robot grips an object such as a component, the following (Process 3-1) and (Process 3-) are performed after the above (Process 3) is performed. The process 2) is additionally executed.
(処理3−1)
強化学習評価部40は、力覚発生部12から出力された仮想6軸力覚情報(fx,fy,fz,mx,my,mz)を入力として、その仮想6軸力覚情報を、予め設定したルールに基づいて評価すると共に、その評価結果に基づき、ニューラルネットワーク22に対する学習指示信号の出力/非出力を制御する。この学習指示信号には報酬情報が含まれている。なお、予め設定したルールとは、予め決定しておくべき評価用の力覚情報のパターンの合格範囲である。
(Process 3-1)
The reinforcement learning evaluation unit 40 receives the virtual 6-axis force sense information (fx, fy, fz, mx, my, mz) output from the force sense generation unit 12 and sets the virtual 6-axis force sense information in advance. The evaluation is performed based on the rule and the output / non-output of the learning instruction signal to the neural network 22 is controlled based on the evaluation result. This learning instruction signal includes reward information. The rule set in advance is a pass range of a pattern of force information for evaluation that should be determined in advance.
(処理3−2)
ニューラルネットワーク22は、強化学習部評価部40から学習指示信号が出力されると、強化学習評価部40への入力と並行してニューラルネットワーク22に入力される力覚発生部12から出力された仮想6軸力覚情報(fx,fy,fz,mx,my,mz)を合格の力覚情報のパターンとして学習する。この学習においては、学習指示信号に含まれる報酬情報の値が以前の学習時よりも大きい(報酬が多い)場合にのみ、入力の仮想6軸力覚情報を合格の力覚情報のパターンとして学習するようにする。
(Process 3-2)
When the learning instruction signal is output from the reinforcement learning unit evaluation unit 40, the neural network 22 outputs the virtual output from the force generation unit 12 that is input to the neural network 22 in parallel with the input to the reinforcement learning evaluation unit 40. Six-axis force sense information (fx, fy, fz, mx, my, mz) is learned as a pattern of pass force information. In this learning, only when the value of the reward information included in the learning instruction signal is larger than that in the previous learning (there is more reward), the input virtual 6-axis force information is learned as a pattern of passing force information. To do.
なお、上記では、ニューラルネットワークの事前学習として、理想に近い力覚情報のパターン(理想力覚情報パターン)を1つ、教師情報として学習させておくこととした。そのため、力覚情報のパターンの合格範囲としては、理想力覚情報パターンを、例えば、中央値として、その中央値から所定の分だけ大きい値と、所定の分だけ小さい値とによって示される範囲が合格範囲となる。この場合、報酬は、中央値に近づくほど多くなり、中央値から離れるほど少なくなる。 In the above description, as a prior learning of the neural network, one ideal force information pattern (ideal force information pattern) is learned as teacher information. Therefore, as an acceptable range of the haptic information pattern, for example, the ideal haptic information pattern is, for example, a median value, and a range indicated by a value larger by a predetermined amount than the median value and a value smaller by a predetermined amount. It becomes an acceptable range. In this case, the reward increases as it approaches the median, and decreases as it goes away from the median.
従って、この変形例の機械学習支援装置では、力覚情報の強化学習において、ロボット制御部23が、より多くの報酬を得られるように、つまり仮想6軸力覚情報のパターンが中央値の側に向かうように、知能ロボットの指の動きを修正しながらクローズドループ制御を行う。これにより、ニューラルネットワーク22の認識の精度が高められるので、知能ロボットは適切な力覚情報を認識することができるようになる。 Therefore, in the machine learning support device of this modification, in the reinforcement learning of the haptic information, the robot control unit 23 can obtain more rewards, that is, the virtual 6-axis haptic information pattern has a median value side. Closed loop control is performed while correcting the movement of the intelligent robot's finger so that As a result, the recognition accuracy of the neural network 22 is improved, so that the intelligent robot can recognize appropriate force information.
なお、ニューラルネットワーク22において、強化学習によって得られたニューロン間のシナプス結合係数(重み係数)や各ニューロンの閾値等は、システム制御装置30により、ある一連の動作ステップ毎に、図3には不図示の記憶装置に記録される。なお、この記憶装置が記憶する結合係数(重み係数)やニューロンの閾値等は、それに対応した作業手順や動作ステップを知能ロボットが実行するにあたり、ロボット制御部23により事前に記憶装置から読み出され、ニューラルネットワーク22にロードされて使用される。 In the neural network 22, the synapse connection coefficient (weighting coefficient) between neurons obtained by reinforcement learning, the threshold value of each neuron, etc. are not shown in FIG. It is recorded in the illustrated storage device. Note that the coupling coefficient (weighting coefficient), neuron threshold value, and the like stored in the storage device are read from the storage device in advance by the robot control unit 23 when the intelligent robot executes the corresponding work procedure or operation step. And loaded into the neural network 22 for use.
(他のセンサー情報の使用)
上記では、マルチセンサー情報として、画像情報と触覚情報(力覚情報を含む)との2つの感覚情報を用いる例を説明した。しかし、センサー情報はその2つに限定されない。
(Use of other sensor information)
In the above, an example in which two sensory information of image information and tactile information (including haptic information) is used as multisensor information has been described. However, the sensor information is not limited to the two.
例えば、聴覚センサー(マイクロホンなど)から出力される聴覚情報を使用する例を説明すると、知能ロボットのアーム(腕)から発せられる異常音のパターンを仮想空間発生装置10により生成して、その生成したパターンをニューラルネットワーク21又は22に予め学習させる。 For example, an example in which auditory information output from an auditory sensor (such as a microphone) is used will be described. An abnormal sound pattern generated from an arm (arm) of an intelligent robot is generated by the virtual space generator 10 and the generated pattern is generated. The pattern is learned in advance by the neural network 21 or 22.
次に、知能ロボットの動作中に、あたかも知能ロボットに備えられた聴覚センサーから出力されるように仮想空間発生装置10から異常音を示す仮想聴覚情報が出力されると、その仮想聴覚情報が入力されたニューラルネットワーク21又は22は、パターン認識により異常音の発生を認識して、異常音が発生したことを示す障害情報を出力する。 Next, when virtual auditory information indicating an abnormal sound is output from the virtual space generation device 10 as if it is output from an auditory sensor provided in the intelligent robot during operation of the intelligent robot, the virtual auditory information is input. The neural network 21 or 22 thus recognized recognizes the occurrence of an abnormal sound by pattern recognition and outputs failure information indicating that the abnormal sound has occurred.
そして、その障害情報が入力されたロボット制御部23は、知能ロボットのアーム(腕)を緊急停止するように知能ロボットの腕の動作を制御する。 Then, the robot controller 23 to which the failure information is input controls the operation of the arm of the intelligent robot so as to urgently stop the arm (arm) of the intelligent robot.
以上、上記の機械学習支援装置では、知能ロボットなどの人工知能装置の外界認識に必要な画像や触覚(力覚を含む)等の外界認識情報を、あたかも外界認識センサーで検出したかのように仮想空間に演算によって発生させ、その情報を用いて知能ロボットなどの人工知能装置の動作の検証(シミュレーション)を行う。従って、上記の機械学習支援装置によれば、知能ロボットなどの人工知能装置を高速に学習させることができるので、知能ロボットなどの人工知能装置の立ち上げに掛かる手間と時間を大幅に削減することができる。 As described above, in the above machine learning support device, it is as if the external world recognition sensor detects external world recognition information such as images and tactile sensation (including force sense) necessary for the external world recognition of an artificial intelligence device such as an intelligent robot. It is generated in a virtual space by calculation, and the information is used to verify (simulate) the operation of an artificial intelligence device such as an intelligent robot. Therefore, according to the machine learning support device described above, an artificial intelligence device such as an intelligent robot can be learned at a high speed, so that the labor and time required to start up an artificial intelligence device such as an intelligent robot can be greatly reduced. Can do.
また、上記の機械学習支援装置によれば、マルチセンサー情報について、知能ロボットなどの人工知能装置の機械学習を支援することができる。 Moreover, according to said machine learning assistance apparatus, the machine learning of artificial intelligence apparatuses, such as an intelligent robot, can be supported about multisensor information.
また、上記の機械学習支援装置によれば、機械学習後の知能ロボットなどの人工知能装置の動作が想定したものであるかどうかの検証を支援することができる。 In addition, according to the machine learning support device described above, verification of whether or not the operation of an artificial intelligence device such as an intelligent robot after machine learning is assumed can be supported.
また、上記の機械学習支援装置によれば、触覚(力覚を含む)などの精密な制御が必要になる機能についても、上記の強化学習により、知能ロボットなどの人工知能装置の学習を容易に行うことができる。 In addition, according to the machine learning support device described above, even for functions that require precise control such as tactile sensation (including force sensation), learning of an artificial intelligence device such as an intelligent robot is facilitated by the above reinforcement learning. It can be carried out.
また、上記の機械学習支援装置によれば、上記の強化学習により、知能ロボットなどの人工知能装置に対し、プログラムしにくい動作を短時間に学習させることができる。また、作業工程の変更や追加に対応した新しい動作についても、知能ロボットなどの人工知能装置に対し、容易に学習させることができる。 Further, according to the machine learning support device, it is possible to cause an artificial intelligence device such as an intelligent robot to learn an operation that is difficult to program in a short time by the reinforcement learning. In addition, an artificial intelligence device such as an intelligent robot can be easily learned about a new operation corresponding to a change or addition of a work process.
上記の学習および/または検証の作業が完了すると、知能ロボットなどの人工知能装置を完成させるために、ニューラルネットワーク21および22の重み係数やニューロンの閾値等またはニューラルネットワーク21および22自体、また、ロボット制御部23の機能の一部または全部が知能ロボットなどの人工知能装置に移植される。 When the above learning and / or verification work is completed, in order to complete an artificial intelligence apparatus such as an intelligent robot, the weighting factors of the neural networks 21 and 22, the threshold values of the neurons, the neural networks 21 and 22 themselves, and the robot Part or all of the functions of the control unit 23 are transplanted to an artificial intelligence device such as an intelligent robot.
なお、上記では、知能ロボットなどの人工知能装置を実機として説明したが、知能ロボットなどの人工知能装置は、実機ではなくシミュレーション上の仮想装置であってもよい。 In the above description, an artificial intelligence apparatus such as an intelligent robot has been described as a real machine. However, an artificial intelligence apparatus such as an intelligent robot may be a virtual apparatus on simulation instead of an actual machine.
また、上記の機械学習支援装置では、知能ロボットを外部装置としたが、知能ロボットなどの人工知能装置の中に仮想空間を発生させる機能を含めてもよい。そうすれば、人工知能装置の本来の処理に加えて、上記の学習と検証、またそれに伴う仮想空間の画像情報や力覚情報などの生成をGPU(Graphics Processing Unit)などの演算装置によって一括に処理することができてシステムの効率化が図れる。 In the above machine learning support device, the intelligent robot is an external device, but a function of generating a virtual space may be included in an artificial intelligence device such as an intelligent robot. Then, in addition to the original processing of the artificial intelligence device, the above learning and verification, and the generation of virtual space image information and haptic information, etc. are collectively performed by an arithmetic device such as a GPU (Graphics Processing Unit). The system can be processed and the efficiency of the system can be improved.
また、上記の機械学習支援装置を、コンピューター統合生産システムCIM(Computer Integrated Manufacturing)の一つの機能としてCAD(Computer Aided Design)システム等と組み合わせるようにしてもよい。そうすれば、製品の設計と同時に組立てのシミュレーションを行うことができるので製品設計を最適化することができるようになる。 The machine learning support apparatus may be combined with a CAD (Computer Aided Design) system or the like as one function of a computer integrated manufacturing system CIM (Computer Integrated Manufacturing). By doing so, it is possible to perform assembly simulation simultaneously with product design, so that product design can be optimized.
(検査装置への適用の例)
医薬品、食料品、材料などの検査では、画像による瑕疵の検査に加えて、赤外分光分析による有機化合物の検出や、蛍光X線分析による元素の検出など、画像では分からない不純物等の検査が併せて行われ、最終的な検査判定は、それらの情報を統合して行われる。
(Example of application to inspection equipment)
In the inspection of pharmaceuticals, foodstuffs, materials, etc., in addition to inspection of sputum by images, inspection of impurities, etc. that are not understood by images, such as detection of organic compounds by infrared spectroscopic analysis and detection of elements by fluorescent X-ray analysis, etc. In addition, the final inspection determination is performed by integrating the information.
これらの分光(スペクトル)データは指紋領域と呼ばれ、そのスペクトルのパターン化が概になされているため、これを基に人工知能装置を学習させるための仮想データを作成することができる。 These spectroscopic (spectral) data are called fingerprint regions, and the spectrum patterning is roughly performed. Based on this, virtual data for learning the artificial intelligence apparatus can be created.
この場合、上記の機械学習支援装置では、例えば、分光データの特徴スペクトル部分を保持したまま、その他の波形部分をランダムに変化させるなどして学習用の仮想データセットを作成する。 In this case, in the machine learning support apparatus described above, for example, a virtual data set for learning is created by randomly changing other waveform portions while retaining the characteristic spectrum portion of the spectral data.
次に、上記の機械学習支援装置は、その学習用の仮想データセットを使用して人工知能装置を予め学習させる。 Next, the machine learning support apparatus learns the artificial intelligence apparatus in advance using the learning virtual data set.
そして、上記の機械学習支援装置は、様々な瑕疵を持つ検査対象の物体を仮想空間に出現させて検査工程の検証を行う。 The machine learning support apparatus verifies the inspection process by causing objects to be inspected having various wrinkles to appear in the virtual space.
また、上記の機械学習支援装置は、その検証の中で強化学習(教師なし学習)を実施することによって人工知能装置の検査能力を向上させる。 Further, the machine learning support apparatus improves the inspection ability of the artificial intelligence apparatus by performing reinforcement learning (unsupervised learning) during the verification.
(MEカメラへの適用の例)
内視鏡カメラや術野カメラにおいては、画像の観察や記録という目的の他に、手術の遂行を支援する機能が必要となる。例えば、癌の手術では、該カメラによって、癌独自の血管構造の画像に強調処理を加えたり、癌の自家蛍光を検出したり(蛍光色素や試薬を利用して行う)、血管を造影することで、手術の遂行における癌の病変部の術中診断を支援する。
(Example of application to ME camera)
Endoscopic cameras and surgical field cameras require functions for supporting the performance of surgery in addition to the purpose of observing and recording images. For example, in cancer surgery, the camera performs enhancement processing on an image of a blood vessel structure unique to cancer, detects autofluorescence of cancer (using a fluorescent dye or a reagent), and contrasts blood vessels. This will support intraoperative diagnosis of cancerous lesions in the performance of surgery.
ところで、癌は、その旺盛な増殖性から独自の血管構造を持ち、癌の発生部位によってその血管構造が異なる。つまり、癌は発生部位によって血管構造に独自のパターンを持つことから、診断のためのパターン化が既になされており、これを基に人工知能装置を学習させるための仮想データを作成することができる。 By the way, cancer has a unique blood vessel structure because of its vigorous proliferative properties, and the blood vessel structure varies depending on the site of occurrence of cancer. In other words, because cancer has a unique pattern in the blood vessel structure depending on the site of occurrence, patterning for diagnosis has already been made, and based on this, virtual data for learning the artificial intelligence device can be created .
また、自家蛍光は、通常の撮影用のカメラとは別のマルチスペクトルカメラなどによって蛍光スペクトルを検出しているが、その自家蛍光スペクトルも癌組織によって独自のパターンを持つため、これに基づいて人工知能装置の学習のための仮想データを作成することができる。 In addition, autofluorescence is detected by a multispectral camera, etc., that is different from the camera for normal photography. The autofluorescence spectrum also has its own pattern depending on the cancer tissue. Virtual data for intelligent device learning can be created.
また、手術中には、測定器により脈拍・心拍・血圧・血流などの測定が行われており、それらを統合した手術遂行の支援が通常行われている。これらの測定データも概にパターン化がなされているので、これを基に人工知能装置の学習のための仮想データを作成することができる。 Further, during the operation, measurement of pulse, heart rate, blood pressure, blood flow, and the like is performed by a measuring instrument, and the operation for integrating the operation is usually supported. Since these measurement data are also generally patterned, virtual data for learning of the artificial intelligence apparatus can be created based on this pattern.
よって、上記の機械学習支援装置では、例えば、上記の血管構造パターンや自家蛍光スペクトルパターンや測定データパターンを、実際の手術において想定される所定の範囲内で様々に変化させて学習用の仮想データセットを作成する。 Therefore, in the machine learning support apparatus, for example, the vascular structure pattern, the autofluorescence spectrum pattern, and the measurement data pattern are variously changed within a predetermined range assumed in actual surgery to learn virtual data for learning. Create a set.
次に、上記の機械学習支援装置は、その学習用の仮想データセットを使用して人工知能装置を予め学習させる。 Next, the machine learning support apparatus learns the artificial intelligence apparatus in advance using the learning virtual data set.
そして、上記の機械学習支援装置は、癌の病変部を含む人体内部モデルを仮想空間に出現させて手術の遂行における術中診断の検証を行う。また、上記の機械学習支援装置は、その検証の中で強化学習(教師なし学習)を実施することによって人工知能装置の診断能力を向上させる。 The machine learning support apparatus verifies the intraoperative diagnosis in the performance of the operation by causing the internal model of the human body including the cancerous lesion to appear in the virtual space. In addition, the machine learning support apparatus improves the diagnosis ability of the artificial intelligence apparatus by performing reinforcement learning (unsupervised learning) during the verification.
(その他)
医療分野では、内視鏡やロボットサージェリーなどのシミュレーションのために人体内部のモデル化がなされている。そのため、そのモデル化した情報を使用して、上記の機械学習支援装置における仮想空間で、そのモデルのレベルやバリエーションを増やすようにすれば人工知能装置の学習を仮想空間で短時間に行うことができるようになる。これにより、内視鏡の安全挿入の支援や手術の支援、医療過誤回避の支援が可能となる。
(Other)
In the medical field, modeling of the inside of the human body is performed for simulation of endoscopes and robot surgeries. Therefore, if the modeled information is used to increase the level and variation of the model in the virtual space in the machine learning support device, the artificial intelligence device can be learned in the virtual space in a short time. become able to. This makes it possible to support safe insertion of an endoscope, support for surgery, and support for avoiding medical errors.
また、人体のモデル化も進んでいるため、そのモデル化した情報を使用すれば、様々な検体モデルを上記の機械学習支援装置における仮想空間に出現させて、手術遂行の支援の検証や学習を行うことができる。 In addition, since the modeling of the human body is also progressing, if the modeled information is used, various specimen models appear in the virtual space in the machine learning support apparatus, and verification and learning of the support for performing the surgery are performed. It can be carried out.
さらに、その人体内部や人体のモデル化した情報を使用すれば、上記の機械学習支援装置における仮想空間での確定診断の検証の支援に加え、手術での切除部をより少なくするための支援、動脈などの傷つけると危険な箇所を避けて手術するなどの安全確保の支援にも適用することができる。 Furthermore, if the information modeled inside the human body and the human body is used, in addition to the support for verification of the definitive diagnosis in the virtual space in the machine learning support device, the support for reducing the excision part in the operation, It can also be applied to support for ensuring safety, such as performing surgery while avoiding dangerous places such as arteries.
また、自動車の分野では、道路などをモデル化した情報が既にナビゲーションシステムなどにあるので、そのモデル化した情報を使用すれば、上記の機械学習支援装置における仮想空間での自動車の自動運転の学習に適用することができる。 Also, in the field of automobiles, information that models roads and the like is already in the navigation system and the like, and if the modeled information is used, learning of automatic driving of the automobile in the virtual space in the above machine learning support device Can be applied to.
10 仮想空間発生装置
11 CG部
12 力覚発生部
20 仮想知能ロボット装置
21 ニューラルネットワーク
22 ニューラルネットワーク
23 ロボット制御部
24 画像処理部
25 強化学習指示部
30 システム制御装置
40 強化学習評価部
100 機械学習支援装置
DESCRIPTION OF SYMBOLS 10 Virtual space generator 11 CG part 12 Force sense generation part 20 Virtual intelligent robot apparatus 21 Neural network 22 Neural network 23 Robot control part 24 Image processing part 25 Reinforcement learning instruction part 30 System controller 40 Reinforcement learning evaluation part 100 Machine learning support apparatus
Claims (4)
前記情報生成部が生成した前記複数の仮想情報を用いて、人工知能装置を学習させる学習支援部と、
前記複数の仮想情報を用いて、該学習後の人工知能装置の動作の検証を行う検証支援部と
を備え、
前記複数の仮想情報のうちの一つである触覚情報は、前記学習後の人工知能装置の操作対象となる物体の仮想空間における位置および姿勢を示す物体位置情報と、該人工知能装置の可動部の前記仮想空間における位置および姿勢を示す可動部位置情報と、に基づいて生成される
ことを特徴とする機械学習支援装置。 An information generation unit that generates a plurality of virtual information corresponding to the output information of the plurality of sensors;
A learning support unit for learning the artificial intelligence device using the plurality of virtual information generated by the information generation unit;
A verification support unit that verifies the operation of the artificial intelligence apparatus after the learning using the plurality of virtual information ,
The tactile information, which is one of the plurality of virtual information, includes object position information indicating the position and orientation of the object to be operated by the artificial intelligence device after learning in the virtual space, and a movable part of the artificial intelligence device. Is generated based on the movable part position information indicating the position and orientation in the virtual space.
A machine learning support device.
前記検証支援部が行う前記検証時に前記学習後の人工知能装置を更に強化学習させる強化学習部
を備えたことを特徴とする機械学習支援装置。 The machine learning support device according to claim 1,
A machine learning support apparatus, comprising: a reinforcement learning section that further learns the artificial intelligence apparatus after learning during the verification performed by the verification support section.
前記情報生成部は、
既知の情報に基づき前記学習後の人工知能装置の操作対象となる物体を含む仮想空間の画像を生成すると共に、前記既知の情報に基づき前記物体の前記仮想空間における位置および姿勢を示す前記物体位置情報を生成する視覚情報生成部と、
前記物体位置情報と、予め想定される、前記学習後の人工知能装置から出力されるべき該人工知能装置の可動部の前記仮想空間における位置および姿勢を示す前記可動部位置情報とに基づいて前記触覚情報を生成する触覚情報生成部と
を備え、
前記学習支援部が、前記仮想空間の画像と前記物体位置情報とを入力に用いて前記人工知能装置の視覚機能を学習させ、また、前記触覚情報を入力に用いて前記人工知能装置の触覚機能を学習させる
ことを特徴とする機械学習支援装置。 The machine learning support apparatus according to claim 1 or 2,
The information generator is
And generates an image of the virtual space including the operation subject to the object of known based on information the learning after the artificial intelligence system, the object position indicating a position and a posture in the virtual space of the object based on the known information A visual information generator for generating information;
And the object position information, previously envisaged, on the basis of the said movable portion position information indicating the position and orientation in the virtual space of the movable portion of the artificial intelligence system to be output from the artificial intelligence system after the learning A tactile information generation unit that generates tactile information,
The learning support unit learns the visual function of the artificial intelligence device using the image of the virtual space and the object position information as input, and also uses the haptic information as input for the haptic function of the artificial intelligence device. Machine learning support device characterized by learning.
前記情報生成部は、
既知の情報に基づき前記学習後の人工知能装置の操作対象となる物体を含む仮想空間の画像を生成する視覚情報生成部と、
前記学習後の人工知能装置から出力される前記物体の前記仮想空間における位置および姿勢を示す第1の物体位置情報と、前記学習後の人工知能装置から出力される該人工知能装置の可動部の前記仮想空間における位置および姿勢を示す前記可動部位置情報とに基づき前記触覚情報を生成する触覚情報生成部と
を備え、
前記視覚情報生成部は、前記第1の物体位置情報と前記可動部位置情報とに基づいて前記仮想空間における前記物体の位置および姿勢を更新し、
前記検証支援部は、前記仮想空間の画像を入力として与えることにより、前記学習後の人工知能装置のニューラルネットワークに第2の物体位置情報を出力させ、また、前記触覚情報を入力として与えることにより、前記学習後の人工知能装置のニューラルネットワークに前記物体に対する操作が適切であるか否かを示す触覚判定情報を出力させて、該第2の物体位置情報と該触覚判定情報とに基づき前記学習後の人工知能装置の可動部の動作を検証すると共に、前記触覚情報生成部に前記触覚情報を生成させるように、また、前記視覚情報生成部に前記更新を行わせるように、前記学習後の人工知能装置に前記第1の物体位置情報と前記可動部位置情報とを出力させる
ことを特徴とする機械学習支援装置。 The machine learning support apparatus according to claim 1 or 2,
The information generator is
A visual information generation unit that generates an image of a virtual space including an object to be operated by the artificial intelligence device after learning based on known information;
First object position information indicating the position and posture of the object in the virtual space output from the learned artificial intelligence device, and a movable part of the artificial intelligence device output from the learned artificial intelligence device. and a touch information generating unit that generates the haptic information based on said movable portion position information indicating the position and orientation in the virtual space,
The visual information generation unit updates the position and orientation of the object in the virtual space based on the first object position information and the movable part position information;
The verification support unit outputs the second object position information to the neural network of the learned artificial intelligence device by giving the image of the virtual space as an input, and also gives the tactile information as an input. , Causing the neural network of the learned artificial intelligence device to output tactile determination information indicating whether or not the operation on the object is appropriate, and learning based on the second object position information and the tactile determination information Verifying the operation of the movable part of the later artificial intelligence device, causing the tactile information generation unit to generate the tactile information, and causing the visual information generation unit to perform the update. An artificial intelligence device causes the first object position information and the movable part position information to be output. A machine learning support apparatus, comprising:
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2015236094A JP6604832B2 (en) | 2015-12-02 | 2015-12-02 | Machine learning support device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2015236094A JP6604832B2 (en) | 2015-12-02 | 2015-12-02 | Machine learning support device |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2017102755A JP2017102755A (en) | 2017-06-08 |
| JP6604832B2 true JP6604832B2 (en) | 2019-11-13 |
Family
ID=59016619
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2015236094A Active JP6604832B2 (en) | 2015-12-02 | 2015-12-02 | Machine learning support device |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP6604832B2 (en) |
Families Citing this family (25)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US10902581B2 (en) * | 2017-06-19 | 2021-01-26 | Apeel Technology, Inc. | System and method for hyperspectral image processing to identify foreign object |
| DE102017213658A1 (en) * | 2017-08-07 | 2019-02-07 | Robert Bosch Gmbh | Handling arrangement with a handling device for performing at least one work step and method and computer program |
| CN109426860A (en) * | 2017-08-23 | 2019-03-05 | 幻视互动(北京)科技有限公司 | A kind of MR mixed reality information processing method neural network based and device |
| JP2019057250A (en) * | 2017-09-22 | 2019-04-11 | Ntn株式会社 | Work information processing apparatus and work recognition method |
| JP2019067238A (en) * | 2017-10-03 | 2019-04-25 | エヌ・ティ・ティ・コミュニケーションズ株式会社 | Control device, control method and control program |
| CN108051999B (en) * | 2017-10-31 | 2020-08-25 | 中国科学技术大学 | Accelerator beam trajectory control method and system based on deep reinforcement learning |
| JP6955702B2 (en) | 2018-03-06 | 2021-10-27 | オムロン株式会社 | Information processing equipment, information processing methods, and programs |
| JP7052546B2 (en) * | 2018-05-11 | 2022-04-12 | トヨタ自動車株式会社 | Autonomous mobile systems, autonomous mobiles, charging docks, control methods, and programs |
| KR102179598B1 (en) * | 2018-06-27 | 2020-11-18 | 한국전력공사 | Apparatus and method for learning facilities using video file |
| JP7054450B2 (en) * | 2018-09-10 | 2022-04-14 | 日本電気硝子株式会社 | Work inspection method |
| JP6600398B1 (en) * | 2018-09-15 | 2019-10-30 | 株式会社ブロードリーフ | AI creation verification device |
| CN109118860A (en) * | 2018-09-19 | 2019-01-01 | 江苏金惠甫山软件科技有限公司 | Expert English language training by qualified teachers system and method based on artificial intelligence |
| EP3859304B1 (en) * | 2018-09-27 | 2024-09-18 | HORIBA, Ltd. | Method for generating data for particle analysis, program for generating data for particle analysis, and device for generating data for particle analysis |
| JP2020106936A (en) * | 2018-12-26 | 2020-07-09 | オムロン株式会社 | Image inspection system design device, image inspection system design method, and image inspection system design program |
| KR102194539B1 (en) * | 2019-08-14 | 2020-12-23 | 한국공항공사 | Boarding bridge access system and autopilot method |
| US20210056391A1 (en) * | 2019-08-20 | 2021-02-25 | Mind Machine Learning, Inc. | Systems and Methods for Simulating Sense Data and Creating Perceptions |
| JP7358890B2 (en) | 2019-10-01 | 2023-10-11 | 富士フイルムビジネスイノベーション株式会社 | Object texture measurement device |
| KR102323946B1 (en) * | 2019-10-16 | 2021-11-08 | 엘지전자 주식회사 | Robot and method for controlling the same |
| WO2021084587A1 (en) * | 2019-10-28 | 2021-05-06 | 株式会社安川電機 | Machine learning data generation device, machine learning device, work system, computer program, machine learning data generation method, and work machine manufacturing method |
| JP2021070122A (en) * | 2019-10-31 | 2021-05-06 | ミネベアミツミ株式会社 | Learning data generation method |
| WO2021111879A1 (en) * | 2019-12-05 | 2021-06-10 | Hoya株式会社 | Learning model generation method, program, skill assistance system, information processing device, information processing method, and endoscope processor |
| JP7423387B2 (en) * | 2020-03-31 | 2024-01-29 | ミネベアミツミ株式会社 | Calibration system, information processing system, robot control system, calibration method, information processing method, robot control method, calibration program, information processing program, calibration device, information processing device, and robot control device |
| JP7461638B2 (en) * | 2020-05-25 | 2024-04-04 | 国立大学法人広島大学 | Tactile evaluation device, tactile evaluation method, and program |
| WO2022054498A1 (en) * | 2020-09-11 | 2022-03-17 | ソニーグループ株式会社 | Medical arm control system, medical arm device, medical arm control method, and program |
| KR102345267B1 (en) * | 2020-10-12 | 2021-12-31 | 서울대학교산학협력단 | Target-oriented reinforcement learning method and apparatus for performing the same |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH06203166A (en) * | 1993-01-06 | 1994-07-22 | Fujitsu Ltd | Multi-dimensional position measurement, control device, and learning method |
| JPH0780790A (en) * | 1993-09-16 | 1995-03-28 | Fujitsu Ltd | 3D object grip system |
-
2015
- 2015-12-02 JP JP2015236094A patent/JP6604832B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| JP2017102755A (en) | 2017-06-08 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6604832B2 (en) | Machine learning support device | |
| JP7662716B2 (en) | Surgical system with training or assistance function | |
| Li et al. | Survey on mapping human hand motion to robotic hands for teleoperation | |
| US11344374B2 (en) | Detection of unintentional movement of a user interface device | |
| CN111055279B (en) | Multi-mode object grabbing method and system based on combination of touch sense and vision | |
| Rahmatizadeh et al. | From virtual demonstration to real-world manipulation using LSTM and MDN | |
| Ekvall et al. | Learning and evaluation of the approach vector for automatic grasp generation and planning | |
| Li et al. | Robonurse-vla: Robotic scrub nurse system based on vision-language-action model | |
| Etukuru et al. | Robot utility models: General policies for zero-shot deployment in new environments | |
| Ottenhaus et al. | Visuo-haptic grasping of unknown objects based on gaussian process implicit surfaces and deep learning | |
| Pedram et al. | Toward synergic learning for autonomous manipulation of deformable tissues via surgical robots: An approximate q-learning approach | |
| CN102470530A (en) | Method of producing teaching data of robot and robot teaching system | |
| Khadivar et al. | EMG-driven shared human-robot compliant control for in-hand object manipulation in hand prostheses | |
| Vicente et al. | Towards markerless visual servoing of grasping tasks for humanoid robots | |
| Huang et al. | Grasping novel objects with a dexterous robotic hand through neuroevolution | |
| Fekri et al. | A deep learning force estimator system for intracardiac catheters | |
| Murphy et al. | A surgical robotic framework for safe and autonomous data-driven learning and manipulation of an unknown deformable tissue with an integrated critical space | |
| CN113561172A (en) | A dexterous hand control method and device based on binocular vision acquisition | |
| Mikada et al. | Three‐dimensional posture estimation of robot forceps using endoscope with convolutional neural network | |
| WO2023165807A1 (en) | Robot and method for controlling a robot | |
| Soleymani et al. | Artificial intelligence in robot-assisted surgery: Applications to surgical skills assessment and transfer | |
| Ángel-López et al. | Kinematic hand analysis using motion capture technology | |
| Infantino et al. | A cognitive architecture for robotic hand posture learning | |
| US20230311331A1 (en) | Device and method for controlling a robot to perform a task | |
| Agrawal | Automating endoscopic camera motion for teleoperated minimally invasive surgery using inverse reinforcement learning |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181030 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190723 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190822 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191008 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191015 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6604832 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |