Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP4469757B2 - Image processing device - Google Patents
[go: Go Back, main page]

JP4469757B2 - Image processing device - Google Patents

Image processing device Download PDF

Info

Publication number
JP4469757B2
JP4469757B2 JP2005160605A JP2005160605A JP4469757B2 JP 4469757 B2 JP4469757 B2 JP 4469757B2 JP 2005160605 A JP2005160605 A JP 2005160605A JP 2005160605 A JP2005160605 A JP 2005160605A JP 4469757 B2 JP4469757 B2 JP 4469757B2
Authority
JP
Japan
Prior art keywords
image
position information
dimensional position
image processing
frame time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005160605A
Other languages
Japanese (ja)
Other versions
JP2006338203A (en
Inventor
学 西山
征司 十倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2005160605A priority Critical patent/JP4469757B2/en
Publication of JP2006338203A publication Critical patent/JP2006338203A/en
Application granted granted Critical
Publication of JP4469757B2 publication Critical patent/JP4469757B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Image Processing (AREA)
  • Image Analysis (AREA)

Description

本発明は、複数カメラを用いて異なるフレーム時刻に撮影された画像を画像処理することにより、対象物の三次元位置情報を算出する画像処理装置及び画像処理方法に関する。   The present invention relates to an image processing apparatus and an image processing method for calculating three-dimensional position information of an object by performing image processing on images taken at different frame times using a plurality of cameras.

人物に追従する移動ロボットの視覚処理系に関して種々の研究開発が進められている。移動ロボットが人物等の移動体に追従するよう移動するとき、視覚処理系はまず移動体を撮像してその三次元位置を画像処理により計測する。この計測結果に従って、ロボットは移動のための駆動系の制御量等を算出する。   Various researches and developments have been made on visual processing systems for mobile robots that follow people. When the mobile robot moves to follow a moving body such as a person, the visual processing system first images the moving body and measures its three-dimensional position by image processing. According to this measurement result, the robot calculates a control amount of the drive system for movement.

従来、監視システム等で用いられてきた背景差分による人物検出技術や、画像処理により人物の頭部を認識する技術が知られており、これらの技術を移動ロボットの視覚処理系に応用することが考えられる。しかしながら、ロボットの移動により背景画像は大きく変化することから、背景差分法は移動ロボットの視覚処理系には適さない。また、人との位置関係や遮蔽などで追従対象の頭部が必ずしもロボットの視界内にとらえられるとは限らないことから、人物の頭部認識技術も有効ではない。移動ロボットが人間の生活空間内で活動することを考慮すると、処理対象のデータを削減して高速に処理できることが必要である。   Conventionally, there are known human detection techniques based on background differences used in surveillance systems and the like, and techniques for recognizing a person's head through image processing, and these techniques can be applied to the visual processing system of a mobile robot. Conceivable. However, since the background image changes greatly due to the movement of the robot, the background subtraction method is not suitable for the visual processing system of the mobile robot. In addition, since the head to be tracked is not always captured in the field of view of the robot due to the positional relationship with the person or due to shielding, the human head recognition technology is not effective. Considering that a mobile robot is active in a human living space, it is necessary to reduce the data to be processed and process it at high speed.

ここで、複数カメラを用いて異なるフレーム時刻(シャッタータイミング)に撮影された画像を画像処理することにより、対象物の三次元位置情報を高速に算出する技術が知られている(例えば下記非特許文献1)。
清水彰一,藤吉弘亘,”カメラ間のシャッタータイミングのずれを利用した高速三次元位置推定”,Proc. of MIRU2004,vol.1,pp.428−433,July,2004.
Here, a technique is known in which three-dimensional position information of an object is calculated at high speed by performing image processing on images taken at different frame times (shutter timings) using a plurality of cameras (for example, the following non-patent documents). Reference 1).
Shoichi Shimizu and Hironobu Fujiyoshi, “High-speed three-dimensional position estimation using shift in shutter timing between cameras”, Proc. of MIRU 2004, vol. 1, pp. 428-433, July, 2004.

複数のカメラで撮像時刻を同期して移動体を撮像し、これにより同一のフレーム時刻に得られる画像の対をステレオ画像処理することにより移動体の三次元位置情報を求める従来の構成では、ステレオ画像処理のスループットは、該移動体を撮像するカメラのフレームレートに依存して制限されてしまうという問題点がある。処理結果を制御系の入力情報として用いるようなシステムにおいて、画像処理のスループットは対象の動きに対する反応性能を決定付ける重要な要素である。   In a conventional configuration in which a moving object is imaged with a plurality of cameras in synchronism with the imaging time, and the three-dimensional position information of the moving object is obtained by performing stereo image processing on a pair of images obtained at the same frame time. There is a problem in that the throughput of image processing is limited depending on the frame rate of the camera that captures the moving object. In a system that uses a processing result as input information for a control system, the throughput of image processing is an important factor that determines the reaction performance with respect to the movement of the object.

そこで本発明は、移動体の三次元位置情報を撮像カメラのスループットに制限されることなく高いスループットで得ることのできる画像処理装置及び画像処理方法を提供することを目的とする。   Therefore, an object of the present invention is to provide an image processing apparatus and an image processing method capable of obtaining three-dimensional position information of a moving body with high throughput without being limited by the throughput of an imaging camera.

本発明の一観点に係る画像処理装置は、移動体を撮像する第一の撮像手段と、前記移動体を前記第一の撮像手段とは異なる視点から撮像する第二の撮像手段と、第一のフレーム時刻に前記第一の撮像手段により撮像された第一の画像と該第一のフレーム時刻以後の第二のフレーム時刻に前記第二の撮像手段により撮像された第二の画像と該第二のフレーム時刻以後の第三のフレーム時刻に前記第一の撮像手段により撮像された第三の画像とをそれぞれ取得する画像取得手段と、前記第一の画像と前記第二の画像とをステレオ画像処理することにより前記移動体の第一の三次元位置情報を算出し、前記第二の画像と前記第三の画像とをステレオ画像処理することにより前記移動体の第二の三次元位置情報を算出するステレオ画像処理手段と、前記第一の三次元位置情報と前記第二の三次元位置情報とから前記移動体の推定三次元位置情報を算出する算出手段とを具備する画像処理装置。   An image processing apparatus according to an aspect of the present invention includes: a first imaging unit that images a moving body; a second imaging unit that images the moving body from a different viewpoint from the first imaging unit; A first image picked up by the first image pickup means at the frame time, a second image picked up by the second image pickup means at a second frame time after the first frame time, and the first image An image acquisition unit that acquires a third image captured by the first imaging unit at a third frame time after the second frame time, and the first image and the second image in stereo. The first three-dimensional position information of the moving object is calculated by image processing, and the second three-dimensional position information of the moving object is processed by stereo image processing of the second image and the third image. Stereo image processing means for calculating Image processing apparatus comprising a calculating means for calculating the estimated three-dimensional position information of the movable body from a first three-dimensional position information and the second three-dimensional position information.

本発明によれば、移動体の三次元位置情報を撮像カメラのスループットに制限されることなく高いスループットで得ることのできる画像処理装置及び画像処理方法を提供できる。   ADVANTAGE OF THE INVENTION According to this invention, the image processing apparatus and image processing method which can obtain the three-dimensional position information of a moving body with a high throughput without being restrict | limited to the throughput of an imaging camera can be provided.

以下、図面を参照しながら本発明の実施形態を説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

図1は、本発明の一実施形態に係る画像処理装置(視覚処理系)を示すブロック図である。本実施形態は、図2に示すようなロボット1に本発明を適用したものである。ロボット1は、複数の撮像装置(カメラ)101a〜101b、アーム3、車輪4等を備え、これらは図示しない制御部によって制御される。このようなロボット1がアーム3で物を掴んだり、特定の人物を追いかけ続けたりといったタスクを行う場合に、ロボット1はこれら移動体(対象物)の三次元位置情報を得ることが必要である。本実施形態は、この三次元位置情報の生成を比較的簡単な装置構成及び画像処理により実現するものである。   FIG. 1 is a block diagram showing an image processing apparatus (visual processing system) according to an embodiment of the present invention. In this embodiment, the present invention is applied to a robot 1 as shown in FIG. The robot 1 includes a plurality of imaging devices (cameras) 101a to 101b, an arm 3, wheels 4 and the like, and these are controlled by a control unit (not shown). When such a robot 1 performs a task such as grasping an object with the arm 3 or continuing to chase a specific person, the robot 1 needs to obtain three-dimensional position information of these moving bodies (objects). . In the present embodiment, the generation of the three-dimensional position information is realized by a relatively simple device configuration and image processing.

本発明の実施にあたり複数の撮像装置が必要であるが、図1及び図2の構成では2台の撮像装置101a〜101bを用いるものとする。また、2つの撮像装置間の位置関係は既知であるものとする。移動体を撮像する撮像装置101aに対し撮像装置101bは異なる視点から該移動体を撮像する。   In implementing the present invention, a plurality of imaging devices are required. In the configuration of FIGS. 1 and 2, two imaging devices 101a to 101b are used. It is assumed that the positional relationship between the two imaging devices is known. The imaging apparatus 101b images the moving body from different viewpoints with respect to the imaging apparatus 101a that images the moving body.

映像信号切り替え部102は、2台の撮像装置101a〜101bの各々から出力される映像信号を交互に切り替えて画像取得部103に供給する。画像取得部103は映像信号切り替え部102からの映像信号を入力し、コンピュータで処理しやすいディジタルの画像データに変換する。これにより、フレーム時刻が異なる対象物の複数の画像が本実施形態の画像処理装置に取り込まれる。   The video signal switching unit 102 alternately switches video signals output from each of the two imaging devices 101 a to 101 b and supplies the video signals to the image acquisition unit 103. The image acquisition unit 103 receives the video signal from the video signal switching unit 102 and converts it into digital image data that can be easily processed by a computer. Thereby, a plurality of images of the object having different frame times are taken into the image processing apparatus of the present embodiment.

具体的には、第一の撮像周期における第一のフレーム時刻に撮像装置101aにより撮像された第一の画像の画像データと、この第一の撮像周期に対して時間ずれを有する第二の撮像周期における第二のフレーム時刻に撮像装置101bにより撮像された第二の画像の画像データと、上記第一の撮像周期における上記第二のフレーム時刻以後の第三のフレーム時刻に撮像装置101aにより撮像された第三の画像の画像データとがそれぞれ連続的に取得される。   Specifically, the image data of the first image captured by the imaging device 101a at the first frame time in the first imaging cycle and the second imaging having a time lag with respect to the first imaging cycle. Image data of the second image captured by the imaging device 101b at the second frame time in the cycle, and imaging by the imaging device 101a at the third frame time after the second frame time in the first imaging cycle. The image data of the third image thus obtained is continuously acquired.

画像記録部104は、画像取得部103を介して得られた画像データを一時的に記録する。画像記録部104は、少なくとも撮像装置101a〜101bの各々により撮像された1フレーム前の画像データを参照できるように記録保持動作を行う。   The image recording unit 104 temporarily records image data obtained via the image acquisition unit 103. The image recording unit 104 performs a recording and holding operation so that at least one frame of previous image data captured by each of the imaging devices 101a to 101b can be referred to.

ステレオ画像処理部105,106は画像取得部103を介して得られた画像データをステレオ画像処理することにより移動体の三次元位置情報を算出する。ステレオ画像処理においては、2台の撮像装置101a〜101bで撮影された画像間での視差を計測する。視差計測においては、ブロックマッチング処理により画像間の対応点探索を行う。   The stereo image processing units 105 and 106 calculate the three-dimensional position information of the moving object by performing stereo image processing on the image data obtained via the image acquisition unit 103. In stereo image processing, the parallax between images taken by the two imaging devices 101a to 101b is measured. In parallax measurement, a corresponding point search between images is performed by block matching processing.

推定三次元位置情報算出部107は、ステレオ画像処理部105、106によりそれぞれ算出された移動体の三次元位置情報に基づいて、該移動体の推定三次元位置情報を算出する。この算出において、ステレオ画像処理部105により算出された一方の三次元位置情報が表す第一の距離と、ステレオ画像処理部106により算出された他方の三次元位置情報が表す第二の距離との平均値を該移動体の推定三次元位置情報とする。制御部109は推定三次元位置情報算出部108により得られた移動体の推定三次元位置情報からロボット1の制御量を求める。   The estimated three-dimensional position information calculation unit 107 calculates the estimated three-dimensional position information of the moving object based on the three-dimensional position information of the moving object calculated by the stereo image processing units 105 and 106, respectively. In this calculation, the first distance represented by one of the three-dimensional position information calculated by the stereo image processing unit 105 and the second distance represented by the other three-dimensional position information calculated by the stereo image processing unit 106. The average value is used as the estimated three-dimensional position information of the moving body. The control unit 109 obtains the control amount of the robot 1 from the estimated three-dimensional position information of the moving object obtained by the estimated three-dimensional position information calculation unit 108.

図1において、2台の撮像装置101a〜101b及び映像信号切り替え部102を除く構成要素は同図に示すようにコンピュータ110として実現される。   In FIG. 1, the components excluding the two imaging devices 101a to 101b and the video signal switching unit 102 are realized as a computer 110 as shown in FIG.

図3は本発明の一実施形態に係る非同期ステレオ画像処理の概念図である。   FIG. 3 is a conceptual diagram of asynchronous stereo image processing according to an embodiment of the present invention.

本実施形態のように例えば2台の撮像装置101a〜101bを備える場合、上記のように撮像装置間で半周期(1/2周期)の時刻ずれが生じるように画像取り込みを行う。こうして撮影される非同期画像系列において、撮像装置101aのフレーム時刻tの画像f1と撮像装置101bのフレーム時刻t+0.5Δtの画像f2との組、撮像装置101bのフレーム時刻t+0.5Δtの画像f2と撮像装置101aのフレーム時刻t+Δtの画像f3との組、撮像装置101aのフレーム時刻t+Δtの画像f3と撮像装置101bの時刻t+1.5Δtの画像f4との組...というようにフレーム時刻が異なる画像の対を組み合わせてステレオ画像処理をする。   For example, when two imaging devices 101a to 101b are provided as in the present embodiment, image capturing is performed so that a time shift of a half cycle (1/2 cycle) occurs between the imaging devices as described above. In the asynchronous image sequence thus captured, a set of the image f1 at the frame time t of the imaging device 101a and the image f2 at the frame time t + 0.5Δt of the imaging device 101b, and the image f2 and the imaging at the frame time t + 0.5Δt of the imaging device 101b. A set of the image f3 at the frame time t + Δt of the device 101a, a set of the image f3 at the frame time t + Δt of the imaging device 101a and the image f4 at the time t + 1.5Δt of the imaging device 101b. . . Thus, stereo image processing is performed by combining pairs of images with different frame times.

すると、撮像装置101aから撮像装置101bへの順でのステレオ視で得られる三次元座標の結果D1,D2,D3...は同期撮影した場合に得られる真値よりも遠く、撮像装置101bから撮像装置101aへの順での結果D4,D5..は近くなる(もしくは遠近が逆転した結果になる。これは撮像装置間の位置関係と対象物の移動方向により決まる)。   Then, the results D1, D2, D3... Of the three-dimensional coordinates obtained by stereo viewing in the order from the imaging device 101a to the imaging device 101b. . . Is farther than the true value obtained in the case of synchronous shooting, and results D4, D5,... In the order from the imaging device 101b to the imaging device 101a. . Becomes closer (or the result of reversing the perspective is determined by the positional relationship between the imaging devices and the moving direction of the object).

そこで、連続する2つのステレオ視の結果(例えばD1とD4,D4とD2,D2とD5)を平均して三次元座標の推定値E1,E2,E3,E4...とする。これにより、撮像装置が2台の場合は実質2倍のフレームレートでのステレオ画像処理が可能になる。尚、移動体の推定される軌跡と実際の軌跡との差は図3では誇張して示してある。   Therefore, two consecutive stereo results (for example, D1 and D4, D4 and D2, D2 and D5) are averaged to estimate the three-dimensional coordinates E1, E2, E3, E4. . . And Thereby, when there are two imaging devices, stereo image processing at a substantially double frame rate is possible. Note that the difference between the estimated trajectory of the moving object and the actual trajectory is exaggerated in FIG.

図4は本発明の一実施形態に係る非同期ステレオ画像処理手順を示すフローチャートである。ここでは、撮像された非同期画像系列から一つの推定三次元位置情報を算出する手順を説明する。   FIG. 4 is a flowchart showing an asynchronous stereo image processing procedure according to an embodiment of the present invention. Here, a procedure for calculating one estimated three-dimensional position information from the captured asynchronous image series will be described.

先ずST1では、映像信号切り替え部102を介して撮像装置101a〜101bから画像データを取得する。映像信号切り替え部102は、撮像装置を1台ずつ交互に切り替えながら画像データの取り込みを行う。映像信号の切り替えには一定の時間を要するために、2台の撮像装置101a〜101bから得られる2つの画像データの撮影時刻(フレーム時刻)には「ずれ」が生じる。尚、信号の切り替えに要する時間は常に一定であるものとする。結果として、フレーム時刻がt,t+0.5Δt,t+Δtの画像がそれぞれ取得される。   First, in ST1, image data is acquired from the imaging devices 101a to 101b via the video signal switching unit 102. The video signal switching unit 102 captures image data while alternately switching the imaging devices one by one. Since a certain time is required for switching the video signal, there is a “deviation” between the shooting times (frame times) of the two image data obtained from the two imaging devices 101a to 101b. It is assumed that the time required for signal switching is always constant. As a result, images with frame times t, t + 0.5Δt, and t + Δt are acquired.

図5は撮像装置101a,101bの撮影タイミング(時刻)を示す図である。この図5のように時間的にずれを有する2つの画像をステレオ画像対としてステレオ画像処理を行うわけであるが、一般的なステレオ画像処理は、複数の撮像装置により同時刻に撮影された画像データを用いて行うことを前提としており、撮影時刻にずれがあると誤差が生じ、正しいステレオ画像処理結果が得られない。そこで本発明の実施形態では、この誤差を低減し、時刻にずれのある画像対を用いる場合であっても適切にステレオ画像処理が行えるようにする。   FIG. 5 is a diagram illustrating the shooting timing (time) of the imaging devices 101a and 101b. As shown in FIG. 5, two images having a time shift are used as stereo image pairs to perform stereo image processing. In general stereo image processing, images captured by a plurality of imaging devices at the same time are used. It is premised on using data, and if there is a difference in the photographing time, an error occurs, and a correct stereo image processing result cannot be obtained. Therefore, in the embodiment of the present invention, this error is reduced so that stereo image processing can be appropriately performed even when image pairs having a time lag are used.

図4のST2では、得られた画像データを画像記録部104により一時的に保存する。ここでは、少なくとも最新の画像よりも1つ前の画像データが保存されるようにしておく。それよりも前の画像データは順次消去される。   In ST2 of FIG. 4, the obtained image data is temporarily stored by the image recording unit 104. Here, at least one image data before the latest image is stored. Image data before that is sequentially deleted.

続くST3では、フレーム時刻tに撮像装置101aにより撮像された画像とフレーム時刻t+0.5Δtに撮像装置101bにより撮像された画像との対(第一の画像対)間で視差を計測する。視差の計測は具体的には以下のように行う。   In subsequent ST3, the parallax is measured between a pair (first image pair) of the image captured by the imaging device 101a at the frame time t and the image captured by the imaging device 101b at the frame time t + 0.5Δt. Specifically, the parallax is measured as follows.

図6は、上記フレーム時刻tの画像データ501と、上記フレーム時刻t+0.5Δtの画像データ502とを示している。今、画像データ501中の点pの視差を求める場合、pを中心とした小領域w1を作成する。そして、画像データ502を対象としてブロックマッチングを行い、最も類似度の高い小領域を探索する。探索範囲は点pの座標から一定範囲内とし、類似度はブロック内の画素値の2乗誤差の総和などを用いる。図6の場合では、小領域w1に最も類似するのは小領域w2である。この探索により得られる領域と元の領域との座標の差が視差に相当する。このような視差の計測を三次元位置情報を求めたい全ての点で行い、視差情報として記録しておく。   FIG. 6 shows the image data 501 at the frame time t and the image data 502 at the frame time t + 0.5Δt. Now, when obtaining the parallax of the point p in the image data 501, a small region w1 centered on p is created. Then, block matching is performed on the image data 502, and a small region having the highest similarity is searched. The search range is within a certain range from the coordinates of the point p, and the similarity is the sum of the square errors of the pixel values in the block. In the case of FIG. 6, the small area w2 is most similar to the small area w1. The difference in coordinates between the area obtained by this search and the original area corresponds to parallax. Such parallax measurement is performed at all points where three-dimensional position information is desired and recorded as parallax information.

ST4では、ステレオ画像処理部105が上記視差情報から第一の三次元位置情報を算出する。異なる撮像装置で撮影された画像間の対応点を求め、三次元位置情報を獲得する手法については、参考文献(徐剛・辻三郎著,「三次元ビジョン」,第7章 両眼視)に記載されているように既によく知られているが、簡単に説明すると、撮像装置の光学特性と撮像装置間の位置関係が既知であれば、図7のように撮像装置101aの画像902上の点p’’と撮像装置101bの画像901上の点p’から、これらが示す部位が元々あった三次元位置pを求めることができる。
次にST5では、上記ST3と同様にして、ステレオ画像処理部106が上記フレーム時刻t+0.5Δtに撮像装置101bにより撮像された画像とフレーム時刻t+Δtに撮像装置101aにより撮像された画像との対(第二の画像対)間で視差を計測する。続くST6では、上記ST4と同様の計算を行って第二の三次元位置情報を算出する。
In ST4, the stereo image processing unit 105 calculates first three-dimensional position information from the parallax information. The method of obtaining corresponding points between images taken with different imaging devices and acquiring 3D position information is described in the reference (by Xugang and Saburo Tsubasa, “3D Vision”, Chapter 7 Binocular Vision). However, if the optical characteristics of the imaging device and the positional relationship between the imaging devices are known, a point on the image 902 of the imaging device 101a as shown in FIG. From p ″ and the point p ′ on the image 901 of the image pickup apparatus 101b, the three-dimensional position p where the site indicated by these originally exists can be obtained.
Next, in ST5, in the same manner as in ST3, a pair of an image captured by the imaging device 101b at the frame time t + 0.5Δt and an image captured by the imaging device 101a at the frame time t + Δt ( The parallax is measured between the second image pair). In subsequent ST6, the same calculation as in ST4 is performed to calculate the second three-dimensional position information.

図8は2つの撮像装置101a,101bの撮影タイミングを示したものである。上記ST3乃至ST6の結果として、一方の点線で囲まれた時刻tと時刻t+0.5Δtにそれぞれ撮影された2つの画像のステレオ画像処理結果(第一の三次元位置情報)と、他方の点線で囲まれた時刻t+0.5Δtと時刻t+Δtにそれぞれ撮影された2つの画像のステレオ画像処理結果(第二の三次元位置情報)とが得られることになる。   FIG. 8 shows shooting timings of the two imaging devices 101a and 101b. As a result of ST3 to ST6, the stereo image processing results (first three-dimensional position information) of two images respectively captured at time t and time t + 0.5Δt surrounded by one dotted line, and the other dotted line Stereo image processing results (second three-dimensional position information) of two images captured at time t + 0.5Δt and time t + Δt, respectively, are obtained.

ST7では、これら第一の三次元位置情報と第二の三次元位置情報とから推定三次元位置情報(図3の例えばE1に相当)を算出する。具体的には、第一の三次元位置情報は撮像装置から移動体までの一方の距離(図3の例えばD1)を表しており、第二の三次元位置情報は撮像装置から移動体までの他方の距離(図3の例えばD4)を表している。推定三次元位置情報算出部107は、該第一の距離と第二の距離との平均値を移動体の推定三次元位置情報として算出する。   In ST7, estimated three-dimensional position information (corresponding to, for example, E1 in FIG. 3) is calculated from the first three-dimensional position information and the second three-dimensional position information. Specifically, the first three-dimensional position information represents one distance (for example, D1 in FIG. 3) from the imaging device to the moving body, and the second three-dimensional position information represents the distance from the imaging device to the moving body. The other distance (for example, D4 in FIG. 3) is shown. The estimated three-dimensional position information calculation unit 107 calculates an average value of the first distance and the second distance as estimated three-dimensional position information of the moving object.

そしてST8において、得られた推定三次元位置情報をもとに制御部109はロボット1に対する次のような制御量を算出する。例えば、追従する対象との距離を一定に保ち続けるよう車輪の回転量を決める、対象となる物体を掴むために関節を動かす、などである。あるいは、撮像装置から対象物までの三次元距離が目標に近づくように、サーボモーターなどの移動駆動制御の回転量や回転速度を決定する。   In ST8, the control unit 109 calculates the following control amount for the robot 1 based on the obtained estimated three-dimensional position information. For example, the rotation amount of the wheel is determined so as to keep the distance to the target to be tracked constant, and the joint is moved to grasp the target object. Alternatively, the rotation amount and the rotation speed of the movement drive control such as the servo motor are determined so that the three-dimensional distance from the imaging device to the object approaches the target.

最後にST9の判定処理では、継続して三次元位置情報の計測を行うか否かを判定する。処理を継続する場合はST1に戻って画像データの取得を行う。   Finally, in the determination process of ST9, it is determined whether or not to continuously measure the three-dimensional position information. When the process is continued, the process returns to ST1 to acquire image data.

以上説明した実施形態によれば、連続する2つのステレオ視の結果を平均して三次元座標の推定値とする。これにより、撮像装置が2台の場合は実質2倍のフレームレートでのステレオ画像処理が可能になる。本実施形態の場合、1台の撮像装置での画像と、その前後に別の撮像装置で撮影された画像のみから三次元位置情報を得ることができることから、誤差が蓄積することがない。また、従来のステレオ視の枠組みを若干変更するのみで容易に実現可能である。また、本実施形態は画像処理性能が非力なハードウェア構成にも好適である。   According to the embodiment described above, the result of two consecutive stereo visions is averaged to obtain an estimated value of three-dimensional coordinates. Thereby, when there are two imaging devices, stereo image processing at a substantially double frame rate is possible. In the case of the present embodiment, since three-dimensional position information can be obtained only from an image taken by one imaging device and images taken by other imaging devices before and after that, no error is accumulated. Further, it can be easily realized by slightly changing the conventional stereo vision framework. Further, the present embodiment is also suitable for a hardware configuration that has poor image processing performance.

尚、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。   Note that the present invention is not limited to the above-described embodiment as it is, and can be embodied by modifying the constituent elements without departing from the scope of the invention in the implementation stage. In addition, various inventions can be formed by appropriately combining a plurality of components disclosed in the embodiment. For example, some components may be deleted from all the components shown in the embodiment. Furthermore, constituent elements over different embodiments may be appropriately combined.

例えば、上述した実施形態では撮像装置の台数を2台としたが、撮像装置の台数が2台以上のn台の場合に対しても撮像装置台数−1個の記憶された三次元位置情報と最新の三次元位置情報との平均を求めることにより同等の作用効果を奏することができる。   For example, in the above-described embodiment, the number of image pickup devices is two, but the number of image pickup devices—one stored three-dimensional position information and the number of image pickup devices is n even when the number of image pickup devices is two or more. By obtaining an average with the latest three-dimensional position information, an equivalent effect can be obtained.

また、上述した実施形態では撮像装置間での画像の撮像時刻のずれは0.5Δtとしたが、任意の時刻ずれに対しても、撮像時刻に応じた加重平均を求めることにより同等の結果を得ることが可能である。例えば撮像時刻のずれが0.25Δtである場合、フレーム時刻t(第一のフレーム時刻)に撮像装置101aにより撮像された画像と、フレーム時刻t+0.25Δt(第二のフレーム時刻)に撮像装置101bにより撮像された画像と、フレーム時刻t+Δt(第三のフレーム時刻)に撮像装置101aにより撮像された画像とを用いて上述の処理を行うのであるが、推定三次元位置情報算出部107は、第一のフレーム時刻から第二のフレーム時刻までの時間と第二のフレーム時刻から第三のフレーム時刻までの時間の比(1/4:3/4)に応じた重み付け値を上記第一の距離と第二の距離にそれぞれ乗じて加算することにより、上述と同様の結果を得ることができる。   In the above-described embodiment, the shift in the image capturing time between the image capturing apparatuses is set to 0.5 Δt. However, for any time shift, an equivalent result can be obtained by obtaining a weighted average according to the capturing time. It is possible to obtain. For example, when the difference in imaging time is 0.25Δt, the image captured by the imaging device 101a at the frame time t (first frame time) and the imaging device 101b at the frame time t + 0.25Δt (second frame time). The above-described processing is performed using the image captured by the image capturing apparatus 101a and the image captured by the image capturing apparatus 101a at the frame time t + Δt (third frame time). The weighting value corresponding to the ratio (1/4: 3/4) of the time from the first frame time to the second frame time and the time from the second frame time to the third frame time is the first distance. By multiplying and adding to the second distance, the same result as described above can be obtained.

本発明の一実施形態に係る画像処理装置のブロック図1 is a block diagram of an image processing apparatus according to an embodiment of the present invention. 本発明の一実施形態に係るロボットの外観を示す図The figure which shows the external appearance of the robot which concerns on one Embodiment of this invention. 本発明の一実施形態に係る非同期ステレオ画像処理の概念図1 is a conceptual diagram of asynchronous stereo image processing according to an embodiment of the present invention. 本発明の一実施形態に係る非同期ステレオ画像処理手順を示すフローチャートThe flowchart which shows the asynchronous stereo image processing procedure which concerns on one Embodiment of this invention. 2台の撮像装置による撮影タイミング(時刻)を示す図The figure which shows the imaging timing (time) by two imaging devices 最新の画像データと、同じ撮像装置で得られた1フレーム前の画像データとを示す図The figure which shows the newest image data and the image data of 1 frame before obtained with the same imaging device 2次元画像対と三次元位置情報とを示す図A diagram showing a two-dimensional image pair and three-dimensional position information 本発明の一実施形態に係る2つの撮像装置のそれぞれの撮影タイミングを示す図The figure which shows each imaging | photography timing of the two imaging devices which concern on one Embodiment of this invention.

符号の説明Explanation of symbols

101a〜101b…撮像装置;
102…映像信号切り替え部;
103…画像取得部;
104…画像記録部;
105,106…ステレオ画像処理部;
107…推定三次元位置情報算出部;
109…制御部;
110…コンピュータ;
101a-101b ... imaging device;
102 ... Video signal switching unit;
103 ... Image acquisition unit;
104: Image recording unit;
105, 106 ... stereo image processing unit;
107: Estimated three-dimensional position information calculation unit;
109 ... control unit;
110: Computer;

Claims (4)

移動体を撮像する第一の撮像手段と、
前記移動体を前記第一の撮像手段とは異なる視点から撮像する第二の撮像手段と、
第一のフレーム時刻に前記第一の撮像手段により撮像された第一の画像と該第一のフレーム時刻以後の第二のフレーム時刻に前記第二の撮像手段により撮像された第二の画像と該第二のフレーム時刻以後の第三のフレーム時刻に前記第一の撮像手段により撮像された第三の画像とをそれぞれ取得する画像取得手段と、
前記第一の画像上の任意点に対応する前記第二の画像上の第一の対応点を探索することにより第一の視差を計測し、該第一の視差に基づいて前記移動体まで第一の距離を示す第一の三次元位置情報を算出し、前記第二の画像上の任意点に対応する前記第三の画像上の第二の対応点を探索することにより第二の視差を計測し、該第二の視差に基づいて前記移動体まで第二の距離を示す第二の三次元位置情報を算出するステレオ画像処理手段と、
前記第一の三次元位置情報と前記第二の三次元位置情報とから前記移動体の推定三次元位置情報を算出する算出手段とを具備する画像処理装置。
First imaging means for imaging a moving body;
Second imaging means for imaging the moving body from a different viewpoint from the first imaging means;
A first image picked up by the first image pickup means at a first frame time and a second image picked up by the second image pickup means at a second frame time after the first frame time; Image acquisition means for respectively acquiring a third image captured by the first imaging means at a third frame time after the second frame time;
The first parallax measured by searching the first corresponding point on the second image corresponding to an arbitrary point on the first image, to the moving object based on said first parallax Second parallax by calculating first three-dimensional position information indicating a first distance and searching for a second corresponding point on the third image corresponding to an arbitrary point on the second image was measured, and the stereo image processing means for calculating a second three-dimensional position information indicating the second distance to the moving object based on said second parallax,
An image processing apparatus comprising: a calculation unit that calculates estimated three-dimensional position information of the moving object from the first three-dimensional position information and the second three-dimensional position information.
前記画像取得手段は、前記第一のフレーム時刻と前記第三のフレーム時刻の中間の時刻に相当する第二のフレーム時刻に前記第二の撮像手段により撮像された画像を前記第二の画像として取得する請求項1記載の画像処理装置。   The image acquisition means uses, as the second image, an image captured by the second imaging means at a second frame time corresponding to an intermediate time between the first frame time and the third frame time. The image processing apparatus according to claim 1, which is acquired. 記算出手段は、前記第一の距離と前記第二の距離との平均値を前記移動体の推定三次元位置情報として算出する請求項1又は2記載の画像処理装置。 Before SL calculating means, the image processing apparatus according to claim 1 or 2, wherein an average value of said second distance and said first distance as an estimated three-dimensional position information of the movable body. 記第一及び第二の対応点のそれぞれをブロックマッチングにより探索する請求項1乃至3のいずれかに記載の画像処理装置。 Pre Symbol image processing apparatus according to any one of claims 1 to 3 each of the first and second corresponding point is searched by block matching.
JP2005160605A 2005-05-31 2005-05-31 Image processing device Expired - Fee Related JP4469757B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005160605A JP4469757B2 (en) 2005-05-31 2005-05-31 Image processing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005160605A JP4469757B2 (en) 2005-05-31 2005-05-31 Image processing device

Publications (2)

Publication Number Publication Date
JP2006338203A JP2006338203A (en) 2006-12-14
JP4469757B2 true JP4469757B2 (en) 2010-05-26

Family

ID=37558724

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005160605A Expired - Fee Related JP4469757B2 (en) 2005-05-31 2005-05-31 Image processing device

Country Status (1)

Country Link
JP (1) JP4469757B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5358137B2 (en) * 2008-07-31 2013-12-04 Kddi株式会社 Image generating apparatus, method and program
JP6725675B2 (en) * 2016-10-07 2020-07-22 富士フイルム株式会社 Self-position estimating device, self-position estimating method, program, and image processing device
WO2019186677A1 (en) * 2018-03-27 2019-10-03 株式会社日立製作所 Robot position/posture estimation and 3d measurement device

Also Published As

Publication number Publication date
JP2006338203A (en) 2006-12-14

Similar Documents

Publication Publication Date Title
JP4160572B2 (en) Image processing apparatus and image processing method
KR100866491B1 (en) Image processing method and device
US10789765B2 (en) Three-dimensional reconstruction method
KR101964861B1 (en) Cameara apparatus and method for tracking object of the camera apparatus
US20030012410A1 (en) Tracking and pose estimation for augmented reality using real features
CN105659580A (en) A kind of automatic focusing method, device and electronic equipment
CN113724299B (en) A three-dimensional trajectory method for mobile robot tracking targets based on electro-hydraulic adjustable focus lens
JPH08511137A (en) Electronic image stabilization system and method
KR20140015892A (en) Apparatus and method for alignment of images
EP1857978A1 (en) Method, system and computer product for deriving three-dimensional information progressivly from a streaming video sequence
JP2016152027A (en) Image processing device, image processing method and program
JP2011112507A (en) Apparatus and method for three-dimensional position measurement
JP6494402B2 (en) Image processing apparatus, imaging apparatus, image processing method, and program
KR20150082417A (en) Method for initializing and solving the local geometry or surface normals of surfels using images in a parallelizable architecture
JP3988574B2 (en) Image processing device
JP4469757B2 (en) Image processing device
JP2014096761A (en) Image processing apparatus, and control method and control program of the same
Russo et al. Blurring prediction in monocular slam
Ryu et al. Digital Image Stabilization for humanoid eyes inspired by human VOR system
JP4559375B2 (en) Object position tracking method, apparatus, and program
KR20120090866A (en) Tracking method of multiple objects using mobile device in augumented reality environment and system using the same
JP2004132759A (en) Three-dimensional image generation data imaging device, three-dimensional image generation data imaging method, and computer program
WO2019208234A1 (en) Position estimation device, position estimation method, and program thereof
He et al. Dynamic Objects Detection Based on Stereo Visual Inertial System in Highly Dynamic Environment
JP6089549B2 (en) Information processing apparatus, information processing system, and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061024

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090820

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090901

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091102

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100202

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100301

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130305

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130305

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140305

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees