Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP7566613B2 - Object detection device, object detection method, and object detection program - Google Patents
[go: Go Back, main page]

JP7566613B2 - Object detection device, object detection method, and object detection program - Google Patents

Object detection device, object detection method, and object detection program Download PDF

Info

Publication number
JP7566613B2
JP7566613B2 JP2020209543A JP2020209543A JP7566613B2 JP 7566613 B2 JP7566613 B2 JP 7566613B2 JP 2020209543 A JP2020209543 A JP 2020209543A JP 2020209543 A JP2020209543 A JP 2020209543A JP 7566613 B2 JP7566613 B2 JP 7566613B2
Authority
JP
Japan
Prior art keywords
likelihood
candidate
frame
image
candidate region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020209543A
Other languages
Japanese (ja)
Other versions
JP2022096438A (en
Inventor
勝大 堀江
寛 助川
謙太朗 横井
雄大 福井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Infrastructure Systems and Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Infrastructure Systems and Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Infrastructure Systems and Solutions Corp filed Critical Toshiba Corp
Priority to JP2020209543A priority Critical patent/JP7566613B2/en
Publication of JP2022096438A publication Critical patent/JP2022096438A/en
Application granted granted Critical
Publication of JP7566613B2 publication Critical patent/JP7566613B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Description

本発明の実施形態は、対象物検出装置、対象物検出方法及び対象物検出プログラムに関する。 Embodiments of the present invention relate to an object detection device, an object detection method, and an object detection program.

赤外線カメラ等の撮像装置によって取得された赤外線画像等を画像処理することによって、例えば空中を移動する対象物を検出する技術が知られている。 There is known technology for detecting objects moving through the air, for example, by processing infrared images captured by an imaging device such as an infrared camera.

特許第5713939号公報Patent No. 5713939 特許第6042146号公報Patent No. 6042146

領域間の分離度に基づく物体輪郭抽出, 電子情報通信学会論文誌 D, Vol.J80-D2, No.6, pp.1406-1414Object Contour Extraction Based on Region Separability, IEICE Transactions on Computer Vision, Vol. J80-D2, No. 6, pp. 1406-1414

地表及び雲のような複数の対象物が混在した複雑な背景では、コントラストの変化及びノイズの影響等によって画像処理で検出される背景の領域の形状が変化することがある。この場合において、この背景の領域の変化が目的の対象物の移動と誤検出されることがある。また、輝度帯を指定して目的の対象物を検出することも考えられるが、この場合であっても複雑な背景の方で高い輝度値が連続している領域が目的の対象物と誤検出される可能性がある。 In a complex background that contains multiple objects such as the ground and clouds, the shape of the background area detected by image processing may change due to changes in contrast and the effects of noise. In such cases, this change in the background area may be mistakenly detected as the movement of the target object. It is also possible to detect the target object by specifying a luminance band, but even in this case, there is a possibility that a continuous area of high luminance values in the complex background may be mistakenly detected as the target object.

実施形態は、複雑な背景があったとしても、目的の対象物を精度良く検出できる対象物検出装置、対象物検出方法及び対象物検出プログラムを提供する。 The embodiments provide an object detection device, an object detection method, and an object detection program that can accurately detect a target object even in a complex background.

一態様の対象物検出装置は、特徴量抽出部と、追跡部と、決定部とを有する。特徴量抽出部は、撮像装置から時系列に取得された画像の特徴量に基づいて画像における対象物の候補領域及び候補領域の尤度を抽出する。追跡部は、時系列に抽出された尤度を蓄積することで現在の画像における候補領域の中から対象物である確度が高い候補領域を追跡する。決定部は、追跡部が追跡した候補領域に基づき最終的な対象物の位置を決定する。追跡部は、過去の画像に基づいて抽出された第1の候補領域において尤度の値を有するフレーム尤度マップに現在の画像に基づいて抽出された第2の候補領域における尤度の値を加算し、フレーム尤度マップの第2の候補領域を除く座標において尤度の値を一定値だけ減算し、加算及び減算によって算出された総合尤度マップに基づいて追跡する。 An object detection device according to one embodiment includes a feature extraction unit, a tracking unit, and a determination unit. The feature extraction unit extracts candidate regions of an object in an image and likelihoods of the candidate regions based on feature amounts of the images acquired in time series from an imaging device. The tracking unit tracks candidate regions in a current image that are highly likely to be the object by accumulating the likelihoods extracted in time series. The determination unit determines a final position of the object based on the candidate regions tracked by the tracking unit. The tracking unit adds a likelihood value in a second candidate region extracted based on a current image to a frame likelihood map having a likelihood value in a first candidate region extracted based on a past image, subtracts a certain value from the likelihood value at coordinates of the frame likelihood map excluding the second candidate region, and tracks the object based on a comprehensive likelihood map calculated by the addition and subtraction.

図1は、各実施形態に係る対象物検出装置を含む対象物検出システムの一例を示す図である。FIG. 1 is a diagram showing an example of an object detection system including an object detection device according to each embodiment. 図2は、第1の実施形態にかかる対象物検出装置の機能ブロック図である。FIG. 2 is a functional block diagram of the object detection device according to the first embodiment. 図3Aは、探索領域の例を示す図である。FIG. 3A is a diagram showing an example of a search area. 図3Bは、探索領域の例を示す図である。FIG. 3B is a diagram showing an example of a search region. 図4Aは、特徴量抽出処理において入力される画像の例を示す図である。FIG. 4A is a diagram showing an example of an image input in the feature extraction process. 図4Bは、特徴量抽出処理の結果の例を示す図である。FIG. 4B is a diagram showing an example of a result of the feature extraction process. 図5は、第1の実施形態における特徴量追跡処理の一例を示す図である。FIG. 5 is a diagram illustrating an example of feature amount tracking processing according to the first embodiment. 図6は、第1の実施形態における対象物検出装置の処理の一例を示すフローチャートである。FIG. 6 is a flowchart illustrating an example of processing performed by the object detection device according to the first embodiment. 図7は、第1の実施形態における総合尤度マップの算出処理を示すフローチャートである。FIG. 7 is a flowchart showing the process of calculating the overall likelihood map in the first embodiment. 図8は、撮像方向の制御の概要を示す図である。FIG. 8 is a diagram showing an outline of control of the imaging direction. 図9Aは、画角の制御の概要を示す図である。FIG. 9A is a diagram showing an overview of the control of the angle of view. 図9Bは、画角の制御の概要を示す図である。FIG. 9B is a diagram showing an overview of the control of the angle of view. 図10は、第1の実施形態の変形例における特徴量追跡処理の一例を示す図である。FIG. 10 is a diagram illustrating an example of feature amount tracking processing in the modified example of the first embodiment. 図11は、第1の実施形態の変形例における総合尤度マップの算出処理を示すフローチャートである。FIG. 11 is a flowchart showing a process of calculating the overall likelihood map in the modified example of the first embodiment. 図12は、第2の実施形態にかかる対象物検出装置の機能ブロック図である。FIG. 12 is a functional block diagram of an object detection device according to the second embodiment. 図13は、探索範囲設定処理の一例を示す図である。FIG. 13 is a diagram illustrating an example of the search range setting process. 図14Aは、探索範囲設定処理の変形例を示す図である。FIG. 14A is a diagram showing a modified example of the search range setting process. 図14Bは、探索範囲設定処理の変形例を示す図である。FIG. 14B is a diagram showing a modified example of the search range setting process. 図15は、第2の実施形態における対象物検出装置の処理の一例を示すフローチャートである。FIG. 15 is a flowchart illustrating an example of processing performed by the object detection device according to the second embodiment.

(第1の実施形態)
第1の実施形態について図面を参照して説明する。図1は、各実施形態に係る対象物検出装置を含む対象物検出システムの一例を示す図である。対象物検出システム1は、撮像装置10と、対象物検出装置20とを備える。対象物検出システム1は、例えば飛しょう体の制御システム又は飛しょう体自身に設けられる。そして、対象物検出システム1は、撮像装置10を用いて取得された画像に対して画像処理を施すことによって目的の対象物を検出する。対象物は、例えば飛しょう体といった移動する対象物である。ここで、図1では、対象物検出システム1以外の構成については図示が省略されている。例えば、対象物検出システム1が搭載される飛しょう体は、推進力を得るための推進装置、移動方向を変えるための操舵装置等を有していてもよい。また、飛しょう体の制御システムは、飛しょう体自身に設けられてもよい。
(First embodiment)
The first embodiment will be described with reference to the drawings. FIG. 1 is a diagram showing an example of an object detection system including an object detection device according to each embodiment. The object detection system 1 includes an imaging device 10 and an object detection device 20. The object detection system 1 is provided in, for example, a control system of a flying object or the flying object itself. The object detection system 1 detects a target object by performing image processing on an image acquired using the imaging device 10. The object is, for example, a moving object such as a flying object. Here, in FIG. 1, configurations other than the object detection system 1 are omitted. For example, the flying object on which the object detection system 1 is mounted may have a propulsion device for obtaining a propulsive force, a steering device for changing a moving direction, and the like. The control system of the flying object may also be provided in the flying object itself.

撮像装置10は、対象物を含むシーンの画像を逐次に撮像するカメラである。例えば、撮像装置10は、赤外領域に感度を有する撮像素子を有する赤外線カメラであってよい。撮像装置10は、可視光領域に感度を有する撮像素子を有するカメラであってもよい。撮像装置10は、撮像素子のそれぞれの画素で受光した光の強度に応じた輝度値を有する画像を生成する。そして、撮像装置10は、生成した画像を対象物検出装置20に出力する。ここで、撮像装置10は、撮像方向を変更できるようにパン・チルト機構を有していてよい。また、撮像装置10は、画角を変更できるようにズーム光学系を有していてもよい。撮像装置10は、撮像方向の変更と画角の変更の何れか一方だけができるように構成されていてもよい。 The imaging device 10 is a camera that sequentially captures images of a scene including an object. For example, the imaging device 10 may be an infrared camera having an imaging element sensitive in the infrared region. The imaging device 10 may be a camera having an imaging element sensitive in the visible light region. The imaging device 10 generates an image having a luminance value according to the intensity of light received by each pixel of the imaging element. The imaging device 10 then outputs the generated image to the object detection device 20. Here, the imaging device 10 may have a pan/tilt mechanism so that the imaging direction can be changed. The imaging device 10 may also have a zoom optical system so that the angle of view can be changed. The imaging device 10 may be configured to be able to change only either the imaging direction or the angle of view.

対象物検出装置20は、入力装置201と、プロセッサ202と、メモリ203と、記憶装置204と、出力装置205とを有している。 The object detection device 20 has an input device 201, a processor 202, a memory 203, a storage device 204, and an output device 205.

入力装置201は、撮像装置10で逐次に取得される画像をプロセッサ202に入力するためのインターフェイス装置である。 The input device 201 is an interface device for inputting images sequentially acquired by the imaging device 10 to the processor 202.

プロセッサ202は、記憶装置204に記憶された対象物検出プログラム2041を実行することによって、入力装置201を介して取得された画像における対象物を検出する。プロセッサ202は、例えばCPUである。プロセッサ202は、MPU、GPU、ASIC、FPGA等であってもよい。プロセッサ202は、単一のCPU等であってもよいし、複数のCPU等であってもよい。 The processor 202 detects an object in an image acquired via the input device 201 by executing an object detection program 2041 stored in the storage device 204. The processor 202 is, for example, a CPU. The processor 202 may be an MPU, a GPU, an ASIC, an FPGA, or the like. The processor 202 may be a single CPU, or a plurality of CPUs, or the like.

メモリ203は、ROM及びRAMを含む。ROMは、対象物検出装置20の起動プログラム及び対象物検出装置20の動作に必要な各種のパラメータを記憶する。RAMは、プロセッサ202による各種の処理における作業メモリとして用いられ得る。例えば、RAMは、後で説明する尤度マップを一時的に保存しておくために用いられる。 The memory 203 includes a ROM and a RAM. The ROM stores the startup program of the object detection device 20 and various parameters necessary for the operation of the object detection device 20. The RAM can be used as a working memory for various processes performed by the processor 202. For example, the RAM is used to temporarily store a likelihood map, which will be described later.

記憶装置204は、対象物検出プログラム2041を記憶している記憶装置である。記憶装置204は、フラッシュメモリ等であってよい。 The storage device 204 is a storage device that stores the object detection program 2041. The storage device 204 may be a flash memory or the like.

出力装置205は、プロセッサ202で検出された対象物の情報を必要に応じて外部に出力するためのインターフェイス装置である。例えば、出力装置205は、飛しょう体の制御システムに必要な情報を送信する通信インターフェイスを含む。 The output device 205 is an interface device for outputting information about the object detected by the processor 202 to the outside as necessary. For example, the output device 205 includes a communication interface for transmitting information required for the control system of the flying object.

図2は、第1の実施形態にかかる対象物検出装置20の機能ブロック図である。図2に示すように、本実施形態の対象物検出装置20は、撮像制御部301と、特徴量抽出部302と、追跡部303と、決定部304と、出力制御部305とを備える。例えば、プロセッサ202は、対象物検出プログラム2041を実行することによって撮像制御部301と、特徴量抽出部302と、追跡部303と、決定部304と、出力制御部305として動作する。撮像制御部301と、特徴量抽出部302と、追跡部303と、決定部304と、出力制御部305とは、専用のハードウェア等によって構成されてもよい。 2 is a functional block diagram of the object detection device 20 according to the first embodiment. As shown in FIG. 2, the object detection device 20 of this embodiment includes an image capture control unit 301, a feature extraction unit 302, a tracking unit 303, a determination unit 304, and an output control unit 305. For example, the processor 202 operates as the image capture control unit 301, the feature extraction unit 302, the tracking unit 303, the determination unit 304, and the output control unit 305 by executing the object detection program 2041. The image capture control unit 301, the feature extraction unit 302, the tracking unit 303, the determination unit 304, and the output control unit 305 may be configured by dedicated hardware or the like.

撮像制御部301は、撮像装置10の動作を制御する。撮像制御部301は、撮像装置10に対して撮像方向の指示をする。また、撮像制御部301は、撮像装置10における画角の変更、すなわちズームイン又はズームアウトを指示する。例えば、撮像制御部301は、後で説明する尤度の高い座標が次のフレームで撮像される画像の中心になるように撮像装置10をパン又はチルトさせる。また、例えば、撮像制御部301は、尤度の高さに応じて撮像装置10をズームイン又はズームアウトさせる。例えば、撮像制御部301は、尤度が高いときには撮像装置10をズームインさせ、尤度が低いときには撮像装置10をズームアウトさせる。また、撮像制御部301は、撮像装置10から入力装置201を介して時系列に入力された画像を取得し、取得した画像を特徴量抽出部302に送信する。 The imaging control unit 301 controls the operation of the imaging device 10. The imaging control unit 301 instructs the imaging device 10 on the imaging direction. The imaging control unit 301 also instructs the imaging device 10 to change the angle of view, i.e., to zoom in or out. For example, the imaging control unit 301 pans or tilts the imaging device 10 so that the coordinates with high likelihood, which will be described later, become the center of the image captured in the next frame. For example, the imaging control unit 301 also zooms in or out the imaging device 10 depending on the level of likelihood. For example, the imaging control unit 301 zooms in the imaging device 10 when the likelihood is high, and zooms out the imaging device 10 when the likelihood is low. The imaging control unit 301 also acquires images input in time series from the imaging device 10 via the input device 201, and transmits the acquired images to the feature extraction unit 302.

特徴量抽出部302は、特徴量抽出処理をする。特徴量抽出処理は、撮像制御部301によって時系列に取得された画像における特徴量から対象物の候補領域及び尤度を抽出する処理である。尤度は、対象物の確からしさを表す値である。 The feature extraction unit 302 performs feature extraction processing. The feature extraction processing is processing for extracting candidate regions and likelihoods of objects from features in images acquired in time series by the imaging control unit 301. The likelihoods are values that represent the likelihood of an object.

例えば、特徴量抽出部302は、画像の中に探索領域を設定する。探索領域は、例えば図3Aに示す中心領域401と周辺領域402とを有する。中心領域401は、2×2画素の領域である。周辺領域402は、中心領域401の外側の1画素の領域である。探索領域のサイズは、図3Aのサイズに限らない。例えば図3Bに示すように、周辺領域402が、中心領域401の外側の2画素の領域であってもよい。複数の探索領域が画像の中に設定されてもよい。これらの複数の探索領域は、同じサイズであってもよいし、異なるサイズであってもよい。 For example, the feature extraction unit 302 sets a search area in the image. The search area has, for example, a central area 401 and a peripheral area 402 as shown in FIG. 3A. The central area 401 is a 2×2 pixel area. The peripheral area 402 is a one pixel area outside the central area 401. The size of the search area is not limited to the size shown in FIG. 3A. For example, as shown in FIG. 3B, the peripheral area 402 may be a two pixel area outside the central area 401. Multiple search areas may be set in the image. These multiple search areas may be the same size or different sizes.

探索領域を設定した後、特徴量抽出部302は、それぞれの探索領域における特徴量としての分離度を計算する。分離度は、中心領域401と周辺領域402との輝度値の分散の比である。そして、特徴量抽出部302は、分離度に基づいて探索領域の中から候補領域を抽出する。例えば、特徴量抽出部302は、分離度の高い探索領域を候補領域として抽出する。抽出される候補領域は、1つでもよいし、複数でもよい。 After setting the search areas, the feature extraction unit 302 calculates the degree of separation as a feature for each search area. The degree of separation is the ratio of the variance of the brightness values of the central area 401 and the peripheral area 402. The feature extraction unit 302 then extracts candidate areas from the search areas based on the degree of separation. For example, the feature extraction unit 302 extracts search areas with a high degree of separation as candidate areas. There may be one or more candidate areas extracted.

図4A及び図4Bは、特徴量抽出処理の例である。図4Aは、特徴量抽出部302に入力された画像の例である。図4Aに示す画像500は、対象物Oを含む画像である。図4Bは、特徴量抽出処理がされた画像の例である。例えば、図4Bでは、候補領域501、502、503が抽出されている。候補領域501、502、503のうち、候補領域501は、中心領域に対象物Oを含むために候補領域として抽出された領域である。候補領域502、503は、背景の影響によって候補領域として抽出された領域である。 Figures 4A and 4B are examples of feature extraction processing. Figure 4A is an example of an image input to the feature extraction unit 302. Image 500 shown in Figure 4A is an image that includes an object O. Figure 4B is an example of an image that has been subjected to feature extraction processing. For example, candidate regions 501, 502, and 503 are extracted in Figure 4B. Of candidate regions 501, 502, and 503, candidate region 501 is an area that is extracted as a candidate region because it includes object O in its central region. Candidate regions 502 and 503 are areas that are extracted as candidate regions due to the influence of the background.

図4Bに示すような候補領域を抽出した後、特徴量抽出部302は、候補領域501、502、503の左上X座標X1、X2、X3、左上Y座標Y1、Y2、Y3、幅W1、W2、W3、高さH1、H2、H3、尤度S1、S2、S3を追跡部303へ送る。ここで、尤度S1、S2、S3としては、例えば分離度が用いられ得る。 After extracting candidate regions as shown in FIG. 4B, the feature extraction unit 302 sends the upper left X coordinates X1, X2, X3, the upper left Y coordinates Y1, Y2, Y3, the widths W1, W2, W3, the heights H1, H2, H3, and the likelihoods S1, S2, S3 of the candidate regions 501, 502, 503 to the tracking unit 303. Here, the likelihoods S1, S2, S3 may be, for example, the degree of separation.

ここで、特徴量抽出部302は、分離度によって候補領域を抽出する構成に限らない。特徴量抽出部302は、輝度値の二値化、大津の二値化(中心領域と周辺領域とのクラス間分散とクラス内分散との比によって算出される分離度による二値化)、エッジ検出等の公知の画像処理を用いて候補領域を抽出してもよい。また、特徴量抽出部302は、フレーム間差分等の、前のフレームの画像との差分を抽出することによって候補領域を抽出してもよい。 Here, the feature extraction unit 302 is not limited to a configuration that extracts candidate regions based on the degree of separation. The feature extraction unit 302 may extract candidate regions using known image processing such as binarization of luminance values, Otsu's binarization (binarization based on the degree of separation calculated by the ratio of the inter-class variance and the intra-class variance between the central region and the peripheral region), and edge detection. The feature extraction unit 302 may also extract candidate regions by extracting differences from the image of the previous frame, such as inter-frame differences.

また、特徴量抽出部302は、抽出した候補領域のうち、尤度の値と中心領域の平均輝度値の一方又は両方が予め設定された値よりも低い領域を候補領域から削除してもよい。尤度の値が低いことは、中心領域と周辺領域とがあまり分離されていない、すなわち対象物の確からしさが低いことを意味する。また、中心領域の輝度値が低いことは、その候補領域は背景である可能性が高いことを意味する。したがって、このような尤度の値と中心領域の平均輝度値の一方又は両方が予め設定された値よりも低い領域が候補領域から削除されることにより、背景の領域が対象物の領域として誤抽出されることが抑制され得る。候補領域が削除される際の閾値となる輝度値は、予め定められた値ではなく、中心領域と周辺領域の平均輝度値との差であってもよい。これにより、閾値が候補領域毎に自動で設定され得る。 The feature extraction unit 302 may also remove from the candidate regions any of the extracted candidate regions in which either or both of the likelihood value and the average brightness value of the central region are lower than a preset value. A low likelihood value means that the central region and the peripheral regions are not well separated, i.e., the likelihood of the object being low. A low brightness value in the central region means that the candidate region is highly likely to be the background. Therefore, by removing from the candidate region any of the regions in which either or both of the likelihood value and the average brightness value of the central region are lower than a preset value, it is possible to prevent the background region from being erroneously extracted as the object region. The brightness value that is the threshold value when removing the candidate region may not be a predetermined value, but may be the difference between the average brightness values of the central region and the peripheral region. This allows the threshold to be automatically set for each candidate region.

追跡部303は、特徴量追跡処理をする。特徴量追跡処理は、特徴量抽出部302から送られた候補領域の情報としての、左上X座標、左上Y座標、幅、高さ、尤度に基づいて算出される総合尤度マップに基づいて対象物を追跡する処理である。総合尤度マップは、複数フレームのフレーム尤度マップから算出される。総合尤度マップ及びフレーム尤度マップは、それぞれ、各座標が尤度の値を有しているマップである。 The tracking unit 303 performs feature tracking processing. The feature tracking processing is processing for tracking an object based on an overall likelihood map calculated based on the top left X coordinate, top left Y coordinate, width, height, and likelihood as information on the candidate area sent from the feature extraction unit 302. The overall likelihood map is calculated from frame likelihood maps of multiple frames. The overall likelihood map and the frame likelihood map are maps in which each coordinate has a likelihood value.

図5は、第1の実施形態における特徴量追跡処理の一例を示す図である。追跡部303は、現在のフレームtにおいて入力された特徴量の抽出結果を含む画像500aから現在のフレームにおけるフレーム尤度マップ600aを算出する。フレームtにおけるフレーム尤度マップ600aは、画像500aにおいて抽出された候補領域501a、502a、503aにおける尤度の値を、予め保持されている初期値の尤度マップに加算することで算出される。初期値の尤度マップは、すべての座標における尤度の値が初期値、例えばゼロのマップである。具体的には、追跡部303は、初期値の尤度マップにおける候補領域501aと対応する候補領域601aのそれぞれの座標に、候補領域501aに含まれるそれぞれの座標の尤度の値を加算する。同様に、追跡部303は、初期値の尤度マップにおける候補領域502aと対応する候補領域602aのそれぞれの座標に、候補領域502aに含まれるそれぞれの座標の尤度の値を加算し、初期値の尤度マップにおける候補領域503aと対応する候補領域603aの座標に、候補領域503aに含まれるそれぞれの座標の尤度の値を加算する。ここで、図5では、候補領域毎に異なるハッチングが付されることによって、尤度の値の違いが示されている。図5の例では、候補領域601aの尤度の値は、候補領域602a、603aの尤度の値に比べて高いものとする。 Figure 5 is a diagram showing an example of feature tracking processing in the first embodiment. The tracking unit 303 calculates a frame likelihood map 600a in the current frame from an image 500a including the extraction result of the feature input in the current frame t. The frame likelihood map 600a in the frame t is calculated by adding the likelihood values in the candidate areas 501a, 502a, and 503a extracted in the image 500a to a likelihood map of initial values stored in advance. The likelihood map of initial values is a map in which the likelihood values in all coordinates are initial values, for example, zero. Specifically, the tracking unit 303 adds the likelihood values of each coordinate included in the candidate area 501a to each coordinate of the candidate area 601a corresponding to the candidate area 501a in the likelihood map of initial values. Similarly, the tracking unit 303 adds the likelihood value of each coordinate included in the candidate area 502a to the coordinates of the candidate area 602a corresponding to the candidate area 502a in the initial value likelihood map, and adds the likelihood value of each coordinate included in the candidate area 503a to the coordinates of the candidate area 603a corresponding to the candidate area 503a in the initial value likelihood map. Here, in FIG. 5, the difference in the likelihood value is shown by applying different hatching to each candidate area. In the example of FIG. 5, the likelihood value of the candidate area 601a is higher than the likelihood values of the candidate areas 602a and 603a.

フレームtにおけるフレーム尤度マップ600aを算出した後、追跡部303は、フレーム尤度マップ600aと1つ前のフレームt-1において算出済みの総合尤度マップ700bとから現在のフレームtにおける総合尤度マップ700aを算出する。具体的には、追跡部303は、フレーム尤度マップ600aのそれぞれの座標の尤度の値を、総合尤度マップ700bの対応する座標の尤度の値に加算する。一方で、追跡部303は、加算された総合尤度マップ700bにおいて、フレーム尤度マップ600aにおいて尤度の値を有していない座標、すなわち候補領域601a、602a、603a以外の座標については予め設定された一定値を減算する。このようにして追跡部303は、総合尤度マップ700aを算出する。 After calculating the frame likelihood map 600a for frame t, the tracking unit 303 calculates the overall likelihood map 700a for the current frame t from the frame likelihood map 600a and the overall likelihood map 700b calculated for the previous frame t-1. Specifically, the tracking unit 303 adds the likelihood value of each coordinate in the frame likelihood map 600a to the likelihood value of the corresponding coordinate in the overall likelihood map 700b. Meanwhile, the tracking unit 303 subtracts a preset constant value from the added overall likelihood map 700b for coordinates that do not have a likelihood value in the frame likelihood map 600a, i.e., coordinates other than the candidate areas 601a, 602a, and 603a. In this way, the tracking unit 303 calculates the overall likelihood map 700a.

例えば、図5において、追跡部303は、フレーム尤度マップ600aにおける候補領域601a、601b、601cの尤度の値を総合尤度マップ700bにおける対応する座標の尤度の値に加算する。さらに、追跡部303は、総合尤度マップ700bにおける候補領域601a、602a、603a以外の領域については予め設定された一定値を減算する。 For example, in FIG. 5, the tracking unit 303 adds the likelihood values of the candidate regions 601a, 601b, and 601c in the frame likelihood map 600a to the likelihood values of the corresponding coordinates in the overall likelihood map 700b. Furthermore, the tracking unit 303 subtracts a preset constant value from the regions other than the candidate regions 601a, 602a, and 603a in the overall likelihood map 700b.

ここで、総合尤度マップ700bにおいて尤度の値を有している候補領域701b、702b、703b、704b、705b、706bは、フレーム尤度マップ600aにおいて尤度の値を有している候補領域601a、602a、603aの何れとも一致していない。したがって、フレーム尤度マップ600aにおける候補領域701b、702b、703b、704b、705b、706bと対応する座標の尤度の値からは一定値が減算される。図5の総合尤度マップ700aにおいては、候補領域601a、602a、603aと対応する候補領域701a、702a、703aに加えて、候補領域703bと対応する候補領域704a、候補領域704bと対応する候補領域705a、候補領域706bと対応する候補領域706aだけが尤度の値を有している例が示されている。また、候補領域704a、705a、候補領域706aの尤度の値は、元の値よりも小さくなる。 Here, the candidate areas 701b, 702b, 703b, 704b, 705b, and 706b having likelihood values in the overall likelihood map 700b do not match any of the candidate areas 601a, 602a, and 603a having likelihood values in the frame likelihood map 600a. Therefore, a fixed value is subtracted from the likelihood values of the coordinates corresponding to the candidate areas 701b, 702b, 703b, 704b, 705b, and 706b in the frame likelihood map 600a. In the overall likelihood map 700a in FIG. 5, in addition to the candidate areas 701a, 702a, and 703a corresponding to the candidate areas 601a, 602a, and 603a, only the candidate area 704a corresponding to the candidate area 703b, the candidate area 705a corresponding to the candidate area 704b, and the candidate area 706a corresponding to the candidate area 706b have likelihood values. In addition, the likelihood values of candidate areas 704a, 705a, and candidate area 706a are smaller than the original values.

このようにして算出される総合尤度マップでは、1フレーム前の尤度マップにおける候補領域と同じ座標の候補領域が現在のフレームにおいても抽出された場合にはその候補領域における尤度はより高くなる。一方、1フレーム前の尤度マップにおける候補領域と異なる座標の候補領域が現在のフレームにおいて抽出された場合には1フレーム前において抽出された候補領域の尤度は低くなる。例えば、対象物と考えられる尤度の高い候補領域が画像の中心になるように撮像装置10が制御されている場合、この尤度の高い候補領域は、画像の中心から殆ど動かない。また、対象物は、時間経過に伴う形状の変化も殆どないと考えられる。一方で、雲等の背景については時間経過に伴う位置の変化及び形状の変化等により、候補領域の位置が変動し得る。このため、実施形態の特徴量追跡処理では、目的の対象物を含む確度の高い候補領域の尤度は時間経過とともに高くなり易く、対象物と似た背景が候補領域として抽出されてもこの背景の候補領域の尤度は時間経過とともに低くなり易い。このようにして、実施形態では、対象物と似た背景の領域が誤抽出された場合でも、誤抽出された背景の領域の尤度を下げることができ、結果として目的の対象物を精度良く検出することができる。 In the overall likelihood map calculated in this way, if a candidate area with the same coordinates as a candidate area in the likelihood map one frame ago is extracted in the current frame, the likelihood of that candidate area will be higher. On the other hand, if a candidate area with different coordinates from the candidate area in the likelihood map one frame ago is extracted in the current frame, the likelihood of the candidate area extracted in the previous frame will be lower. For example, if the imaging device 10 is controlled so that a candidate area with a high likelihood of being the object is at the center of the image, this candidate area with a high likelihood hardly moves from the center of the image. In addition, it is considered that the object hardly changes in shape over time. On the other hand, the position of the candidate area for the background such as clouds may change due to changes in position and shape over time. For this reason, in the feature tracking process of the embodiment, the likelihood of a candidate area with a high probability of including the target object tends to increase over time, and even if a background similar to the object is extracted as a candidate area, the likelihood of the candidate area of this background tends to decrease over time. In this way, in the embodiment, even if a background area similar to the target object is erroneously extracted, the likelihood of the erroneously extracted background area can be reduced, and as a result, the target object can be detected with high accuracy.

追跡部303は、前述のようにして算出された総合尤度マップ700aのうちで最も高い尤度を有する候補領域の座標とその候補領域の尤度の値とを決定部304に送る。図5の例では、追跡部303は、候補領域701aの左上X座標、左上Y座標、幅、高さと、尤度を決定部304へ送る。 The tracking unit 303 sends the coordinates of the candidate area having the highest likelihood in the overall likelihood map 700a calculated as described above and the likelihood value of that candidate area to the determination unit 304. In the example of FIG. 5, the tracking unit 303 sends the upper left X coordinate, upper left Y coordinate, width, height, and likelihood of the candidate area 701a to the determination unit 304.

ここで、前のフレームにおいて総合尤度マップが保持されていない場合には、前のフレームにおけるフレーム尤度マップが総合尤度マップとして用いられる。この場合、フレーム尤度マップの尤度の値がそのまま総合尤度マップの尤度の値として流用される。図5の例では、t-2フレームにおける画像500cの前のフレームは存在しない。この場合、画像500cに基づいて算出されるフレーム尤度マップ600cは、t-1フレームにおける総合尤度マップ700bを算出するための1フレーム前の総合尤度マップとして流用される。総合尤度マップ700bは、t-1フレームにおける画像500bに基づいて算出されるフレーム尤度マップ600bとフレーム尤度マップ600cとから算出される。 Here, if no overall likelihood map is held for the previous frame, the frame likelihood map for the previous frame is used as the overall likelihood map. In this case, the likelihood values of the frame likelihood map are used as they are for the overall likelihood map. In the example of FIG. 5, there is no frame prior to image 500c in the t-2 frame. In this case, frame likelihood map 600c calculated based on image 500c is used as the overall likelihood map for the previous frame for calculating overall likelihood map 700b in the t-1 frame. Overall likelihood map 700b is calculated from frame likelihood map 600b calculated based on image 500b in the t-1 frame and frame likelihood map 600c.

また、前のフレームにおいてフレーム尤度マップが保持されていない場合、すなわち現在のフレームが最初のフレームである場合には、前述した予め保持されている初期値の尤度マップが総合尤度マップとして用いられてよい。 In addition, if a frame likelihood map is not stored for the previous frame, i.e., if the current frame is the first frame, the aforementioned initial value likelihood map stored in advance may be used as the overall likelihood map.

また、図5では、フレーム尤度マップ600a、600b、600c及び総合尤度マップ700a、700bは、尤度の値を輝度値とした画像として示されている。しかしながら、フレーム尤度マップ及び総合尤度マップは、必ずしも画像化される必要はない。フレーム尤度マップ及び総合尤度マップは、座標毎の尤度の値を有していればよい。 In addition, in FIG. 5, the frame likelihood maps 600a, 600b, 600c and the overall likelihood maps 700a, 700b are shown as images in which the likelihood value is the brightness value. However, the frame likelihood map and the overall likelihood map do not necessarily need to be visualized. It is sufficient for the frame likelihood map and the overall likelihood map to have a likelihood value for each coordinate.

また、実施形態では、尤度の高い候補領域が画像の中心になるように撮像装置10が制御される前提で説明している。しかしながら、対象物の移動が撮像のフレームの間隔に比べて小さければフレーム間での画像上での対象物の移動も少ないため、結果として尤度の値は時間経過とともに高くなり易い。このような撮像のフレームの間隔に比べて移動の小さい対象物が追跡される場合には、尤度の高い候補領域が画像の中心になるように撮像装置10が制御されなくてもよい。 In addition, in the embodiment, the imaging device 10 is assumed to be controlled so that a candidate area with a high likelihood is located at the center of the image. However, if the movement of the object is small compared to the interval between imaging frames, the movement of the object in the image between frames is also small, and as a result, the likelihood value tends to increase over time. When tracking an object with small movement compared to the interval between such imaging frames, the imaging device 10 does not need to be controlled so that a candidate area with a high likelihood is located at the center of the image.

決定部304は、追跡部303から現在のフレームにおける総合尤度マップを取得する。そして、決定部304は、総合尤度マップから画像における最終的な対象物の位置を決定する。具体的には、決定部304は、総合尤度マップの中で最も高い尤度の値が一定値以上であるか否かに応じて最終的な対象物の位置を決定する。決定部304は、例えば検出した尤度の値が一定値以上である場合、その尤度を有している候補領域の座標を最終的な対象物の位置として決定する。一方、決定部304は、例えば総合尤度マップの中で最も高い尤度の値が一定値以上でない場合、その尤度を有している候補領域の座標を最終的な対象物の位置として決定しない。 The determination unit 304 acquires the overall likelihood map for the current frame from the tracking unit 303. The determination unit 304 then determines the final position of the object in the image from the overall likelihood map. Specifically, the determination unit 304 determines the final position of the object depending on whether the highest likelihood value in the overall likelihood map is equal to or greater than a certain value. For example, if the detected likelihood value is equal to or greater than a certain value, the determination unit 304 determines the coordinates of the candidate area having that likelihood as the final position of the object. On the other hand, for example, if the highest likelihood value in the overall likelihood map is not equal to or greater than a certain value, the determination unit 304 does not determine the coordinates of the candidate area having that likelihood as the final position of the object.

出力制御部305は、決定部304で決定された対象物の位置の情報を出力するための制御をする。例えば、出力制御部305は、対象物の位置の情報を、出力装置204を介して飛しょう体の制御システムに出力する。 The output control unit 305 controls the output of information about the position of the object determined by the determination unit 304. For example, the output control unit 305 outputs the information about the position of the object to the control system of the flying object via the output device 204.

図6は、第1の実施形態における対象物検出装置20の処理の一例を示すフローチャートである。図6の処理は、例えばプロセッサ202によって行われる。 Figure 6 is a flowchart showing an example of processing of the object detection device 20 in the first embodiment. The processing of Figure 6 is performed by, for example, the processor 202.

ステップS101において、プロセッサ202は、撮像装置10から画像を取得する。 In step S101, the processor 202 acquires an image from the imaging device 10.

ステップS102において、プロセッサ202は、取得した画像の特徴量を抽出し、特徴量に基づいて候補領域及びその尤度を抽出する。 In step S102, the processor 202 extracts features of the acquired image and extracts candidate regions and their likelihoods based on the features.

ステップS103において、プロセッサ202は、特徴量が抽出されたか否かを判定する。ステップS103において、特徴量が抽出されたと判定されたときには、処理はステップS104に移行する。ステップS103において、例えば候補領域としての高い分離度を有する探索領域がなかったと判定されたときには、処理はステップS101に戻る。この場合、プロセッサ202は、次のフレームの画像の取得を実施して同様の処理を繰り返す。 In step S103, the processor 202 determines whether or not a feature has been extracted. If it is determined in step S103 that a feature has been extracted, the process proceeds to step S104. If it is determined in step S103 that there is no search area with a high degree of separation as a candidate area, for example, the process returns to step S101. In this case, the processor 202 acquires an image of the next frame and repeats the same process.

ステップS104において、プロセッサ202は、それぞれの候補領域の座標と尤度とから、現在のフレームにおけるフレーム度マップを算出する。 In step S104, the processor 202 calculates a frame likelihood map for the current frame from the coordinates and likelihood of each candidate region.

ステップS105において、プロセッサ202は、現在のフレームにおけるフレーム尤度マップから現在のフレームにおける総合尤度マップを算出する。ここで、総合尤度マップの算出処理について説明する。 In step S105, the processor 202 calculates an overall likelihood map for the current frame from the frame likelihood map for the current frame. Here, the process of calculating the overall likelihood map is described.

図7は、第1の実施形態における総合尤度マップの算出処理を示すフローチャートである。ステップS201において、プロセッサ202は、現在のフレームにおけるフレーム尤度マップの候補領域に対応する座標から尤度の値を取得する。 Figure 7 is a flowchart showing the calculation process of the overall likelihood map in the first embodiment. In step S201, the processor 202 obtains a likelihood value from coordinates corresponding to a candidate area in the frame likelihood map in the current frame.

ステップS202において、プロセッサ202は、取得した尤度の値を、1つ前のフレームにおいて算出された総合尤度マップに加算する。前述したように、1つ前のフレームの総合尤度マップが存在しない場合には、1つ前のフレームにおけるフレーム尤度マップが総合尤度マップとして用いられてよい。さらに、現在のフレームが最初のフレームであるときには、初期値の尤度マップが総合尤度マップとして用いられてよい。 In step S202, the processor 202 adds the acquired likelihood value to the overall likelihood map calculated in the previous frame. As described above, if there is no overall likelihood map for the previous frame, the frame likelihood map for the previous frame may be used as the overall likelihood map. Furthermore, when the current frame is the first frame, the initial value of the likelihood map may be used as the overall likelihood map.

ステップS203において、プロセッサ202は、1つ前のフレームにおいて算出された総合尤度マップにおける、現在のフレームにおけるフレーム尤度マップの候補領域外のそれぞれの座標の尤度の値から一定値を減算する。このようにして、現在のフレームにおける総合尤度マップが算出される。 In step S203, the processor 202 subtracts a constant value from the likelihood value of each coordinate outside the candidate area of the frame likelihood map in the current frame in the overall likelihood map calculated in the previous frame. In this manner, the overall likelihood map in the current frame is calculated.

ステップS204において、プロセッサ202は、現在のフレームにおける総合尤度マップの中で、最も高い尤度を有する候補領域の座標及び尤度の情報を抽出する。その後、プロセッサ202は、図7の処理を終了する。 In step S204, the processor 202 extracts the coordinates and likelihood information of the candidate region with the highest likelihood from the overall likelihood map in the current frame. The processor 202 then ends the processing of FIG. 7.

ここで、図6の説明に戻る。現在のフレームにおける総合尤度マップを算出した後のステップS106において、プロセッサ202は、抽出した尤度が一定値以上であるか否かを判定する。ステップS106において、尤度が一定値以上でないと判定されたときには、処理はステップS107に移行する。ステップS106において、尤度が一定値以上であると判定されたときには、処理はステップS109に移行する。 Now, let us return to the explanation of FIG. 6. In step S106 after calculating the overall likelihood map for the current frame, the processor 202 determines whether the extracted likelihood is equal to or greater than a certain value. If it is determined in step S106 that the likelihood is not equal to or greater than the certain value, the process proceeds to step S107. If it is determined in step S106 that the likelihood is equal to or greater than the certain value, the process proceeds to step S109.

ステップS107において、プロセッサ202は、最も高い尤度を有する候補領域が次のフレームで撮像される画像の中心になるように撮像装置10の撮像方向を制御する。すなわち、プロセッサ202は、撮像装置10をパン又はチルトさせる。図8は、撮像方向の制御の概要を示す図である。プロセッサ202は、例えば、現在のフレーム500aから生成される総合尤度マップ700aのうちで最も高い尤度を有する候補領域701aの座標を取得する。そして、プロセッサ202は、取得した候補領域701aの例えば中心の座標と画像中心の座標との画像間の距離を算出する。そして、プロセッサ202は、画像間の距離に基づいて撮像装置10のパン量及びチルト量を決定し、決定したパン量及びチルト量に応じて撮像装置10をパン及びチルトさせる。このようにして、次のフレームにおいて撮像される画像500eでは、前のフレームにおいて最も高い尤度を有する候補領域701aと対応する候補領域501eが画像中心になる。最も高い尤度を有する候補領域は、対象物Oが存在する確度が高い領域である。対象物Oが存在する確度が高い領域が画像中心となるように撮像がされることにより、撮像される画像から対象物Oが失われる可能性が低減される。 In step S107, the processor 202 controls the imaging direction of the imaging device 10 so that the candidate area with the highest likelihood is the center of the image captured in the next frame. That is, the processor 202 pans or tilts the imaging device 10. FIG. 8 is a diagram showing an overview of the control of the imaging direction. The processor 202 acquires, for example, the coordinates of the candidate area 701a with the highest likelihood in the overall likelihood map 700a generated from the current frame 500a. Then, the processor 202 calculates the distance between the images, for example, between the coordinates of the center of the acquired candidate area 701a and the coordinates of the center of the image. Then, the processor 202 determines the pan amount and tilt amount of the imaging device 10 based on the distance between the images, and pans and tilts the imaging device 10 according to the determined pan amount and tilt amount. In this way, in the image 500e captured in the next frame, the candidate area 501e corresponding to the candidate area 701a with the highest likelihood in the previous frame becomes the image center. The candidate area with the highest likelihood is an area with a high probability that the object O exists. By capturing an image so that the area where there is a high probability that the object O is present is at the center of the image, the possibility of the object O being lost from the captured image is reduced.

ステップS108において、プロセッサ202は、最も高い尤度を有する候補領域の尤度の値に応じて撮像装置10の画角を制御する。すなわち、プロセッサ202は、撮像装置10をズームイン又はズームアウトさせる。その後、処理はステップS101に戻る。この場合、プロセッサ202は、次のフレームの画像の取得を実施して同様の処理を繰り返す。 In step S108, the processor 202 controls the angle of view of the imaging device 10 according to the likelihood value of the candidate area having the highest likelihood. That is, the processor 202 causes the imaging device 10 to zoom in or out. Thereafter, the process returns to step S101. In this case, the processor 202 acquires the image of the next frame and repeats the same process.

図9A及び図9Bは、画角の制御の概要を示す図である。ここで、図9Aは、尤度の値が高い場合の制御の概要を示し、図9Bは、尤度の値が低い場合の制御の概要を示す。 Figures 9A and 9B are diagrams showing an overview of the control of the angle of view. Here, Figure 9A shows an overview of the control when the likelihood value is high, and Figure 9B shows an overview of the control when the likelihood value is low.

プロセッサ202は、例えば、総合尤度マップ700aにおいて取得した最大の尤度の値があらかじめ設定されている閾値よりも大きい場合には、図9Aに示すように、最大の尤度の値を有する座標を中心にして撮像装置10をズームインさせる。これにより、次のフレームにおいて撮像される画像500dでは、前のフレームにおいて最も高い尤度を有する座標を中心とした狭い範囲が拡大される。これにより、対象物Oである確度の高い座標の付近が拡大されることで対象物Oをより明確に撮像することが可能である。また、プロセッサ202は、例えば、総合尤度マップ700aにおいて取得した最大の尤度の値があらかじめ設定されている閾値よりも小さい場合には、図9Bに示すように、最大の尤度の値を有する座標を中心にして撮像装置10をズームアウトさせる。尤度の値が小さいことは、その座標を含む対象物が目的の対象物Oである確度が低いことを意味する。この場合において、撮像装置10がズームアウトされることにより、対象物の周辺領域を増やすことができる。これにより、撮像される画像から対象物Oが失われる可能性が低減される。なお、尤度の閾値は、手動によって設定されてよい。 For example, when the maximum likelihood value acquired in the overall likelihood map 700a is greater than a preset threshold, the processor 202 causes the imaging device 10 to zoom in on the coordinates having the maximum likelihood value as shown in FIG. 9A. As a result, in the image 500d captured in the next frame, a narrow range centered on the coordinates having the highest likelihood in the previous frame is enlarged. As a result, it is possible to capture the object O more clearly by enlarging the vicinity of the coordinates having a high probability of being the object O. Also, for example, when the maximum likelihood value acquired in the overall likelihood map 700a is smaller than a preset threshold, the processor 202 causes the imaging device 10 to zoom out on the coordinates having the maximum likelihood value as shown in FIG. 9B. A small likelihood value means that the object including the coordinates is less likely to be the target object O. In this case, the imaging device 10 is zoomed out, so that the surrounding area of the object can be increased. This reduces the possibility that the object O will be lost from the captured image. The likelihood threshold may be set manually.

ここで、図6の説明に戻る。ステップS109において、プロセッサ202は、最も高い尤度を有する候補領域の座標を対象物Oの座標として例えば飛しょう体の制御システムに出力する。これを受けて、飛しょう体の制御システムは、対象物Oを追跡するように飛しょう体を制御し得る。 Returning now to the description of FIG. 6, in step S109, the processor 202 outputs the coordinates of the candidate region having the highest likelihood as the coordinates of the target object O, for example, to a control system of the flying object. In response to this, the control system of the flying object can control the flying object to track the target object O.

以上説明したとおり、第1の実施形態によれば、複数のフレームにおいて抽出された特徴量から算出される尤度を蓄積することによって対象物の候補領域が選別される。つまり、尤度の高い候補領域が同じ座標に有り続ければ尤度は高くなり、異なる座標に変化すると尤度は低くなる。このようにして算出される尤度に基づいて対象物が決定されることにより、第1の実施形態では、複雑な背景に対する誤検出を抑制して安定してかつ精度良く対象物を検出することができる。 As described above, according to the first embodiment, candidate regions of objects are selected by accumulating likelihoods calculated from features extracted in multiple frames. In other words, if a candidate region with high likelihood remains at the same coordinates, the likelihood is high, and if it changes to different coordinates, the likelihood is low. By determining the object based on the likelihood calculated in this way, in the first embodiment, false detections against complex backgrounds are suppressed, and the object can be detected stably and accurately.

(第1の実施形態の変形例)
第1の実施形態の変形例を説明する。第1の実施形態では、追跡部303は、過去の総合尤度マップに現在のフレーム尤度マップを加算することで現在の総合尤度マップを算出している。これに対し、追跡部303は、現在のフレーム尤度マップに過去の複数のフレーム尤度マップを加算することで現在の総合尤度マップを算出してもよい。
(Modification of the first embodiment)
A modified example of the first embodiment will be described. In the first embodiment, the tracking unit 303 calculates the current overall likelihood map by adding the current frame likelihood map to the past overall likelihood map. Alternatively, the tracking unit 303 may calculate the current overall likelihood map by adding a plurality of past frame likelihood maps to the current frame likelihood map.

図10は、第1の実施形態の変形例における特徴量追跡処理の一例を示す図である。図10の例では、現在のフレームtを含む4フレームのフレーム尤度マップから総合尤度マップが算出される。追跡部303は、現在のフレームtの画像500a、1つ前のフレームt-1の画像500b、2つ前のフレームt-1の画像500c、3つ前のフレームt-2の画像500dのそれぞれからフレーム尤度マップ600a、600b、600c、600dを算出する。フレーム尤度マップの算出手法は、第1の実施形態と同様でよい。具体的には、追跡部303は、抽出されたそれぞれの候補領域における尤度の値を、予め保持されている初期値の尤度マップに加算することでフレーム尤度マップを算出する。 Figure 10 is a diagram showing an example of feature tracking processing in a modified example of the first embodiment. In the example of Figure 10, an overall likelihood map is calculated from the frame likelihood maps of four frames including the current frame t. The tracking unit 303 calculates frame likelihood maps 600a, 600b, 600c, and 600d from an image 500a of the current frame t, an image 500b of the previous frame t-1, an image 500c of the frame t-1 two frames ago, and an image 500d of the frame t-2 three frames ago. The method of calculating the frame likelihood map may be the same as in the first embodiment. Specifically, the tracking unit 303 calculates the frame likelihood map by adding the likelihood value in each extracted candidate region to the likelihood map of the initial value stored in advance.

変形例の追跡部303は、これらの複数フレームのフレーム尤度マップに基づいて、総合尤度マップを算出する。具体的には、追跡部303は、現在のフレームに対して時間差の小さいフレーム尤度マップの尤度を高くし、現在のフレームに対して時間差の大きいフレーム尤度マップの尤度を低くして、それぞれのフレーム尤度マップが所持している各座標の尤度の値を加算することで総合尤度マップを算出する。 The tracking unit 303 of the modified example calculates an overall likelihood map based on the frame likelihood maps of these multiple frames. Specifically, the tracking unit 303 increases the likelihood of a frame likelihood map with a small time difference from the current frame, decreases the likelihood of a frame likelihood map with a large time difference from the current frame, and calculates the overall likelihood map by adding up the likelihood values of each coordinate held by each frame likelihood map.

例えば、追跡部303は、フレームtのフレーム尤度マップ600aのそれぞれの尤度の値を100%とした、すなわち尤度の値に係数1.0を乗じたフレーム尤度マップ800a、フレームt-1のフレーム尤度マップ600bのそれぞれの尤度の値を75%に減衰した、すなわち尤度の値に係数0.75を乗じたフレーム尤度マップ800b、フレームt-2のフレーム尤度マップ600cのそれぞれの尤度の値を50%に減衰した、すなわち尤度の値に係数0.5を乗じたフレーム尤度マップ800c、フレームt-3のフレーム尤度マップ600dの尤度を25%に減衰した、すなわち尤度の値に係数0.25を乗じたフレーム尤度マップ800dを算出する。そして、追跡部303は、これらの4つのフレームのフレーム尤度マップ800a、800b、800c、800dの各座標の尤度を合算して総合尤度マップ700aを算出する。このような総合尤度マップ700aであっても過去のフレームのフレーム尤度マップと現在のフレームのフレーム尤度マップとで同じ座標に尤度の値があれば、その座標の尤度の値が増加するように総合尤度マップが作成される。一方で、過去のフレームであるほど尤度の減衰量が大きいので、過去の尤度の値が現在のフレームの総合尤度マップに与える影響は少ない。このため、過去のフレームにおいて対象物の誤検出があってもその影響は時間の経過とともに補正される。このため、変形例においても複雑な背景に対する誤検出を抑制して安定してかつ精度良く対象物を検出することができる。 For example, the tracking unit 303 calculates a frame likelihood map 800a in which the likelihood values of each of the frame likelihood maps 600a for frame t are set to 100%, i.e., the likelihood values are multiplied by a coefficient of 1.0; a frame likelihood map 800b in which the likelihood values of each of the frame likelihood maps 600b for frame t-1 are attenuated to 75%, i.e., the likelihood values are multiplied by a coefficient of 0.75; a frame likelihood map 800c in which the likelihood values of each of the frame likelihood maps 600c for frame t-2 are attenuated to 50%, i.e., the likelihood values are multiplied by a coefficient of 0.5; and a frame likelihood map 800d in which the likelihood of each of the frame likelihood maps 600d for frame t-3 is attenuated to 25%, i.e., the likelihood values are multiplied by a coefficient of 0.25. Then, the tracking unit 303 calculates the overall likelihood map 700a by adding up the likelihoods of the coordinates of the frame likelihood maps 800a, 800b, 800c, and 800d of these four frames. Even with such an overall likelihood map 700a, if there is a likelihood value at the same coordinate in the frame likelihood map of a past frame and the frame likelihood map of the current frame, the overall likelihood map is created so that the likelihood value at that coordinate increases. On the other hand, since the amount of likelihood attenuation is greater for an older frame, the impact of the past likelihood value on the overall likelihood map of the current frame is small. Therefore, even if there is a false detection of an object in a past frame, the impact is corrected over time. Therefore, even in the modified example, it is possible to suppress false detection against a complex background and detect an object stably and accurately.

図11は、第1の実施形態の変形例における総合尤度マップの算出処理を示すフローチャートである。ステップS301において、プロセッサ202は、現在のフレームにおけるフレーム尤度マップの候補領域に対応する座標から尤度の値を取得する。 Figure 11 is a flowchart showing the calculation process of the overall likelihood map in a modified example of the first embodiment. In step S301, the processor 202 obtains a likelihood value from coordinates corresponding to a candidate area in the frame likelihood map in the current frame.

ステップS302において、プロセッサ202は、現在のフレーム、1つ前のフレーム、2つ前のフレーム、3つ前のフレームにおいて算出されたフレーム尤度マップのそれぞれの座標の尤度の値にフレーム毎に割り当てられた係数を乗じることでそれぞれのフレーム尤度マップを減衰させる。 In step S302, the processor 202 attenuates each frame likelihood map by multiplying the likelihood value of each coordinate in the frame likelihood map calculated for the current frame, the previous frame, the frame two frames ago, and the frame three frames ago by a coefficient assigned to each frame.

ステップS303において、プロセッサ202は、減衰されたそれぞれのフレーム尤度マップの対応する座標の尤度の値を加算する。このようにして、現在のフレームにおける総合尤度マップが算出される。 In step S303, the processor 202 adds the likelihood values of the corresponding coordinates of each attenuated frame likelihood map. In this way, the overall likelihood map for the current frame is calculated.

ステップS304において、プロセッサ202は、現在のフレームにおける総合尤度マップの中で、最も高い尤度を有する候補領域の座標及び尤度の情報を抽出する。その後、プロセッサ202は、図11の処理を終了する。 In step S304, the processor 202 extracts the coordinates and likelihood information of the candidate region with the highest likelihood from the overall likelihood map in the current frame. The processor 202 then ends the processing of FIG. 11.

以上のような変形例であってもこのため、複雑な背景に対しても誤検出を抑制して安定して対象物を検出することができる。 Even with the above modified example, it is possible to suppress false detections and stably detect objects even against a complex background.

ここで、変形例で示した総合尤度マップの算出手法は一例である。例えば、減衰量は、現在のフレームが最も高くなるように設定されていれば、変形例で説明した量に限定されるものではない。同様に、加算するフレーム数も現在のフレームを含んでいればよく、4フレームに限定されるものではない。また、必ずしも連続したフレームのフレーム尤度マップが加算されなくてもよい。さらに、第1の実施形態と同様に過去のフレーム尤度マップとして過去の総合尤度マップが減衰されて用いられてもよい。 The calculation method of the overall likelihood map shown in the modified example is just one example. For example, the amount of attenuation is not limited to the amount described in the modified example, as long as it is set so that the current frame is the highest. Similarly, the number of frames to be added is not limited to four frames, as long as it includes the current frame. Furthermore, it is not necessary to add the frame likelihood maps of consecutive frames. Furthermore, a past overall likelihood map may be attenuated and used as a past frame likelihood map, as in the first embodiment.

(第2の実施形態)
次に第2の実施形態を説明する。図12は、本実施形態にかかる対象物検出装置20の機能ブロック図である。ここで、図12において、図2と同じ構成要素については図2と同じ参照符号が付されている。図12と同じ参照符号が付されている構成要素については、必要に応じて説明を省略又は簡略化する。
Second Embodiment
Next, a second embodiment will be described. Fig. 12 is a functional block diagram of an object detection device 20 according to this embodiment. In Fig. 12, the same components as those in Fig. 2 are given the same reference numerals as those in Fig. 2. Descriptions of components given the same reference numerals as those in Fig. 12 will be omitted or simplified as necessary.

本実施形態の対象物検出装置20は、撮像制御部301と、探索範囲設定部306と、特徴量抽出部302と、追跡部303と、決定部304と、出力制御部305とを備える。例えば、プロセッサ202は、対象物検出プログラム2041を実行することによって撮像制御部301と、探索範囲設定部306と、特徴量抽出部302と、追跡部303と、決定部304と、出力制御部305として動作する。撮像制御部301と、探索範囲設定部306と、特徴量抽出部302と、追跡部303と、決定部304と、出力制御部305とは、専用のハードウェア等によって構成されてもよい。 The object detection device 20 of this embodiment includes an image capture control unit 301, a search range setting unit 306, a feature extraction unit 302, a tracking unit 303, a determination unit 304, and an output control unit 305. For example, the processor 202 operates as the image capture control unit 301, the search range setting unit 306, the feature extraction unit 302, the tracking unit 303, the determination unit 304, and the output control unit 305 by executing the object detection program 2041. The image capture control unit 301, the search range setting unit 306, the feature extraction unit 302, the tracking unit 303, the determination unit 304, and the output control unit 305 may be configured by dedicated hardware or the like.

探索範囲設定部306は、特徴量抽出部302による特徴量抽出の際の探索範囲の位置を設定する。具体的には、探索範囲設定部306は、過去のフレームにおいて算出された総合尤度マップにおける尤度の値に基づき、現在のフレームにおける探索範囲の位置を設定する。 The search range setting unit 306 sets the position of the search range when the feature extraction unit 302 extracts features. Specifically, the search range setting unit 306 sets the position of the search range in the current frame based on the likelihood value in the overall likelihood map calculated in the past frame.

図13は、探索範囲設定部306の探索範囲設定処理の一例を示す図である。例えば、1つ前のフレームにおいて得られた画像500aから算出された総合尤度マップ700aにおいて、候補領域701aの尤度の値が最も高かったとする。この場合、探索範囲設定部306は、候補領域701aの例えば中心座標を中心として予め設定された範囲を探索範囲として設定する。そして、探索範囲設定部306は、設定した探索範囲の左上X座標X4、左上Y座標Y4、幅W4、高さH4を特徴量抽出部302に送る。ここで、幅W4、高さH4は、手動で設定されてよい。特徴量抽出部302は、次のフレームの画像500eにおける探索範囲Aについて特徴量抽出処理を実施する。 Figure 13 is a diagram showing an example of the search range setting process of the search range setting unit 306. For example, assume that the likelihood value of the candidate area 701a is the highest in the overall likelihood map 700a calculated from the image 500a obtained in the previous frame. In this case, the search range setting unit 306 sets a range set in advance with, for example, the central coordinate of the candidate area 701a as the center as the search range. Then, the search range setting unit 306 sends the upper left X coordinate X4, the upper left Y coordinate Y4, the width W4, and the height H4 of the set search range to the feature extraction unit 302. Here, the width W4 and the height H4 may be set manually. The feature extraction unit 302 performs feature extraction processing for the search range A in the image 500e of the next frame.

ここで、探索範囲は、最初のフレームについては総合尤度マップがないので、探索範囲設定部306は、例えば画像の全域を探索範囲に設定する。 Here, since there is no overall likelihood map for the first frame, the search range setting unit 306 sets the search range to, for example, the entire image.

また、探索範囲設定部306は、画像内に複数の探索範囲を設定してもよい。この場合において、探索範囲設定部306は、例えば総合尤度マップにおける尤度の値の高い順に複数の探索範囲を設定してもよい。このとき、探索範囲設定部306は、複数の探索範囲が相互に重複しないように設定してもよい。 The search range setting unit 306 may also set multiple search ranges within the image. In this case, the search range setting unit 306 may set multiple search ranges, for example, in descending order of likelihood value in the overall likelihood map. In this case, the search range setting unit 306 may set the multiple search ranges so that they do not overlap with each other.

また、探索範囲設定部306は、探索範囲の大きさ、すなわち幅W4及び高さH4を前のフレームにおいて算出された総合尤度マップにおける最も高い尤度の値に応じて設定してもよい。 The search range setting unit 306 may also set the size of the search range, i.e., the width W4 and height H4, according to the highest likelihood value in the overall likelihood map calculated in the previous frame.

図14A及び図14Bは、探索範囲設定処理の変形例を示す図である。ここで、図14Aは、尤度の値が低いときの探索範囲設定処理の変形例を示す図である。また、図14Bは、尤度の値が高いときの探索範囲設定処理の変形例を示す図である。 Figures 14A and 14B are diagrams showing modified examples of the search range setting process. Here, Figure 14A is a diagram showing a modified example of the search range setting process when the likelihood value is low. Also, Figure 14B is a diagram showing a modified example of the search range setting process when the likelihood value is high.

探索範囲設定部306は、例えば前のフレームにおいて算出された総合尤度マップにおける最大の尤度の値が、あらかじめ設定された閾値よりも低い場合は、図14Aに示すように尤度が最も高い座標を中心として、もとの探索範囲より一定の幅及び高さだけ拡大された探索範囲A1を設定し、探索範囲A1の左上X座標X5、左上Y座標Y5、幅W5、高さH5を特徴量抽出部302に送る。一方、探索範囲設定部306は、例えば前のフレームにおいて算出された総合尤度マップにおける最大の尤度の値が、あらかじめ設定された閾値よりも高い場合は、図14Bに示すように尤度が最も高い座標を中心として、もとの探索範囲より一定の幅及び高さだけ縮小された探索範囲A2を設定し、探索範囲A2の左上X座標X6、左上Y座標Y6、幅W6、高さH6を特徴量抽出部302に送る。ここで、閾値は、1つでもよいし、複数でもよい。複数の閾値がある場合において、閾値に応じて探索範囲の幅及び高さが設定されてよい。 For example, if the maximum likelihood value in the overall likelihood map calculated in the previous frame is lower than a preset threshold, the search range setting unit 306 sets a search range A1 that is expanded by a certain width and height from the original search range with the highest likelihood as the center as shown in FIG. 14A, and sends the upper left X coordinate X5, the upper left Y coordinate Y5, the width W5, and the height H5 of the search range A1 to the feature extraction unit 302. On the other hand, if the maximum likelihood value in the overall likelihood map calculated in the previous frame is higher than a preset threshold, the search range setting unit 306 sets a search range A2 that is reduced by a certain width and height from the original search range with the highest likelihood as the center as shown in FIG. 14B, and sends the upper left X coordinate X6, the upper left Y coordinate Y6, the width W6, and the height H6 of the search range A2 to the feature extraction unit 302. Here, the threshold may be one or more. When there are multiple thresholds, the width and height of the search range may be set according to the thresholds.

図15は、第2の実施形態における対象物検出装置20の処理の一例を示すフローチャートである。図15の処理は、例えばプロセッサ202によって行われる。ここで、図15において、図6と同様の処理については説明を適宜に省略又は簡略化する。 Figure 15 is a flowchart showing an example of processing of the object detection device 20 in the second embodiment. The processing in Figure 15 is performed by, for example, the processor 202. Here, in Figure 15, the explanation of processing similar to that in Figure 6 is appropriately omitted or simplified.

ステップS401において、プロセッサ202は、撮像装置10から画像を取得する。 In step S401, the processor 202 acquires an image from the imaging device 10.

ステップS402において、プロセッサ202は、取得した画像に対して探索範囲を設定する。前述したように、最初のフレームの探索範囲は、画像の全域であってよい。一方、最初のフレームの後の探索範囲は、前のフレームにおいて算出された総合尤度マップに基づいて設定される。プロセッサ202は、前のフレームにおいて算出された総合尤度マップにおける最も高い尤度の値を有する座標を中心とした範囲で探索範囲を設定する。このとき、プロセッサ202は、探索範囲の幅及び高さを、最も高い尤度の値と閾値との比較に応じて設定してもよい。 In step S402, the processor 202 sets a search range for the acquired image. As described above, the search range for the first frame may be the entire image. On the other hand, the search range after the first frame is set based on the overall likelihood map calculated in the previous frame. The processor 202 sets the search range in a range centered on the coordinate having the highest likelihood value in the overall likelihood map calculated in the previous frame. At this time, the processor 202 may set the width and height of the search range according to a comparison between the highest likelihood value and a threshold value.

ステップS403-S410の処理は、図6のステップS102-S109の処理と同じである。したがって、説明を省略する。 The processing in steps S403-S410 is the same as the processing in steps S102-S109 in FIG. 6. Therefore, the description is omitted.

以上説明したとおり、第2の実施形態では前のフレームにおいて算出された総合尤度マップの尤度の値に基づいて次のフレームの特徴量の探索範囲が設定される。前述したように対象物は、フレーム間で大きく移動することはないことがある。この場合においては、画像中で探索範囲を制限することで背景等を誤って抽出することが抑制され得る。 As described above, in the second embodiment, the search range for the features of the next frame is set based on the likelihood value of the overall likelihood map calculated in the previous frame. As mentioned above, the object may not move significantly between frames. In this case, by limiting the search range in the image, erroneous extraction of the background, etc. can be suppressed.

[その他の変形例]
前述した各実施形態及びその変形例の対象物検出装置20において実行される対象物検出プログラムは、インストール可能な形式又は実行可能な形式のファイルでCD-ROM、フレキシブルディスク(FD)、CD-R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録されて提供されてもよい。また、対象物検出プログラムは、インターネット等のネットワークに接続されたコンピュータ上に格納されてもよく、対象物検出装置20は、必要に応じてネットワーク経由で対象物検出プログラムをダウンロードして利用してもよい。
[Other Modifications]
The object detection program executed in the object detection device 20 of each of the above-described embodiments and modified examples thereof may be provided by being recorded in an installable or executable file format on a computer-readable recording medium such as a CD-ROM, a flexible disk (FD), a CD-R, or a digital versatile disk (DVD). The object detection program may also be stored on a computer connected to a network such as the Internet, and the object detection device 20 may download and use the object detection program via the network as necessary.

本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。 Although several embodiments of the present invention have been described, these embodiments are presented as examples and are not intended to limit the scope of the invention. These novel embodiments can be embodied in various other forms, and various omissions, substitutions, and modifications can be made without departing from the gist of the invention. These embodiments and their modifications are included in the scope and gist of the invention, and are included in the scope of the invention and its equivalents described in the claims.

1 対象物検出システム、10 撮像装置、20 対象物検出装置、201 入力装置、202 プロセッサ、203 メモリ、204 記憶装置、205 出力装置、301 撮像制御部、302 特徴量抽出部、303 追跡部、304 決定部、305 出力制御部、306 探索範囲設定部。 1 Object detection system, 10 Imaging device, 20 Object detection device, 201 Input device, 202 Processor, 203 Memory, 204 Storage device, 205 Output device, 301 Imaging control unit, 302 Feature extraction unit, 303 Tracking unit, 304 Determination unit, 305 Output control unit, 306 Search range setting unit.

Claims (13)

撮像装置から時系列に取得された画像の特徴量に基づいて前記画像における対象物の候補領域及び前記候補領域の尤度を抽出する特徴量抽出部と、
時系列に抽出された前記尤度を蓄積することで現在の前記画像における前記候補領域の中から前記対象物である確度が高い候補領域を追跡する追跡部と、
前記追跡部が追跡した候補領域に基づき最終的な前記対象物の位置を決定する決定部と、
を備え、
前記追跡部は、
過去の画像に基づいて抽出された第1の候補領域において尤度の値を有するフレーム尤度マップに現在の画像に基づいて抽出された第2の候補領域における尤度の値を加算し、
前記フレーム尤度マップの前記第2の候補領域を除く座標において尤度の値を一定値だけ減算し、
前記加算及び前記減算によって算出された総合尤度マップに基づいて追跡する対象物検出装置。
a feature extraction unit that extracts candidate regions of an object in an image acquired in time series from an imaging device and likelihoods of the candidate regions based on feature amounts of the images;
a tracking unit that tracks a candidate area that is highly likely to be the object from among the candidate areas in the current image by accumulating the likelihoods extracted in time series;
a determination unit that determines a final position of the object based on the candidate area tracked by the tracking unit;
Equipped with
The tracking unit is
adding a likelihood value in a second candidate region extracted based on the current image to a frame likelihood map having a likelihood value in a first candidate region extracted based on a past image;
subtracting a constant value from the likelihood value at coordinates of the frame likelihood map excluding the second candidate region;
An object detection device that performs tracking based on a total likelihood map calculated by the addition and subtraction .
撮像装置から時系列に取得された画像の特徴量に基づいて前記画像における対象物の候補領域及び前記候補領域の尤度を抽出する特徴量抽出部と、a feature extraction unit that extracts candidate regions of an object in an image and likelihoods of the candidate regions based on feature amounts of the images acquired in time series from an imaging device;
時系列に抽出された前記尤度を蓄積することで現在の前記画像における前記候補領域の中から前記対象物である確度が高い候補領域を追跡する追跡部と、a tracking unit that tracks a candidate area that is highly likely to be the object from among the candidate areas in the current image by accumulating the likelihoods extracted in time series;
前記追跡部が追跡した候補領域に基づき最終的な前記対象物の位置を決定する決定部と、a determination unit that determines a final position of the object based on the candidate area tracked by the tracking unit;
を備え、Equipped with
前記追跡部は、The tracking unit is
過去の画像に基づいて抽出された第1の候補領域において尤度の値を有する第1のフレーム尤度マップに現在の画像に基づいて抽出された第2の候補領域において尤度の値を有する第2のフレーム尤度マップを加算し、adding a second frame likelihood map having a likelihood value in a second candidate region extracted based on a current image to a first frame likelihood map having a likelihood value in a first candidate region extracted based on a past image;
前記加算によって算出された総合尤度マップに基づいて追跡し、Tracking based on the overall likelihood map calculated by the addition;
前記加算の際に前記第1のフレーム尤度マップを、前記第2のフレーム尤度マップとの時間差に応じて減衰させる対象物検出装置。An object detection apparatus that attenuates the first frame likelihood map in accordance with a time difference between the first frame likelihood map and the second frame likelihood map during the addition.
前記特徴量抽出部は、抽出した前記候補領域のうち、前記尤度と、前記候補領域の中心領域の輝度値との少なくとも何れかが一定値よりも低い前記候補領域を削除する請求項1又は2に記載の対象物検出装置。 The object detection device according to claim 1 or 2, wherein the feature extraction unit deletes, from the extracted candidate regions, candidate regions in which at least one of the likelihood and the luminance value of a central region of the candidate region is lower than a certain value. 前記特徴量抽出部は、前記候補領域の中心領域と周辺領域の平均輝度値の差に基づいて前記一定値を設定する請求項に記載の対象物検出装置。 The object detection device according to claim 3 , wherein the feature extraction unit sets the constant value based on a difference between average luminance values of a central region and a peripheral region of the candidate region. 前記特徴量抽出部による前記抽出が実施される前記画像の探索範囲を設定する探索範囲設定部をさらに備え、
前記探索範囲設定部は、前記尤度の蓄積結果に基づいて前記探索範囲の位置を設定する請求項1に記載の対象物検出装置。
a search range setting unit that sets a search range of the image in which the extraction by the feature amount extraction unit is performed,
The object detection device according to claim 1 , wherein the search range setting unit sets the position of the search range based on an accumulation result of the likelihood.
前記探索範囲設定部は、さらに、前記尤度の蓄積結果に基づいて前記探索範囲の大きさを設定する請求項に記載の対象物検出装置。 The object detection device according to claim 5 , wherein the search range setting unit further sets a size of the search range based on an accumulation result of the likelihood. 前記画像を撮像する撮像装置による撮像方向と画角の少なくとも何れかを前記尤度の蓄積結果に基づいて制御する撮像制御部をさらに備える請求項1に記載の対象物検出装置。 The object detection device according to claim 1, further comprising an imaging control unit that controls at least one of the imaging direction and the angle of view of the imaging device that captures the image based on the accumulation result of the likelihood. 飛しょう体に搭載される請求項1に記載の対象物検出装置。 The object detection device according to claim 1, which is mounted on a flying object. 前記決定部で決定された前記対象物の位置の情報を前記飛しょう体の制御システムに出力する出力制御部をさらに備える請求項に記載の対象物検出装置。 The object detection device according to claim 8 , further comprising an output control unit that outputs information on the position of the object determined by the determination unit to a control system of the flying object. 撮像装置から時系列に取得された画像の特徴量に基づいて前記画像における対象物の候補領域及び前記候補領域の尤度を抽出することと、
時系列に抽出された前記尤度を蓄積することで現在の前記画像における前記候補領域の中から前記対象物である確度が高い候補領域を追跡することと、
前記追跡された候補領域に基づき最終的な前記対象物の位置を決定することと、
を備え、
前記対象物である確度が高い候補領域を追跡することは、
過去の画像に基づいて抽出された第1の候補領域において尤度の値を有するフレーム尤度マップに現在の画像に基づいて抽出された第2の候補領域における尤度の値を加算することと、
前記フレーム尤度マップの前記第2の候補領域を除く座標において尤度の値を一定値だけ減算することと、
前記加算及び前記減算によって算出された総合尤度マップに基づいて追跡することと、
を含む対象物検出方法。
extracting a candidate region of an object in an image acquired in time series from an imaging device and a likelihood of the candidate region based on feature amounts of the image;
Tracking a candidate area that is highly likely to be the object from among the candidate areas in the current image by accumulating the likelihood extracted in time series; and
determining a final object position based on the tracked candidate regions; and
Equipped with
Tracking a candidate region that is likely to be an object of interest includes:
adding a likelihood value for a second candidate region extracted based on the current image to a frame likelihood map having a likelihood value for a first candidate region extracted based on a past image;
subtracting a constant value from the likelihood value at coordinates of the frame likelihood map excluding the second candidate region;
tracking based on a total likelihood map calculated by the addition and the subtraction;
An object detection method comprising :
撮像装置から時系列に取得された画像の特徴量に基づいて前記画像における対象物の候補領域及び前記候補領域の尤度を抽出することと、extracting a candidate region of an object in an image acquired in time series from an imaging device and a likelihood of the candidate region based on feature amounts of the image;
時系列に抽出された前記尤度を蓄積することで現在の前記画像における前記候補領域の中から前記対象物である確度が高い候補領域を追跡することと、Tracking a candidate area that is highly likely to be the object from among the candidate areas in the current image by accumulating the likelihood extracted in time series; and
前記追跡された候補領域に基づき最終的な前記対象物の位置を決定することと、determining a final object position based on the tracked candidate regions; and
を備え、Equipped with
前記対象物である確度が高い候補領域を追跡することは、Tracking a candidate region that is likely to be an object of interest includes:
過去の画像に基づいて抽出された第1の候補領域において尤度の値を有する第1のフレーム尤度マップに現在の画像に基づいて抽出された第2の候補領域において尤度の値を有する第2のフレーム尤度マップを加算することと、adding a second frame likelihood map having a likelihood value in a second candidate region extracted based on a current image to a first frame likelihood map having a likelihood value in a first candidate region extracted based on a past image;
前記加算によって算出された総合尤度マップに基づいて追跡することと、tracking based on the overall likelihood map calculated by the addition;
前記加算の際に前記第1のフレーム尤度マップを、前記第2のフレーム尤度マップとの時間差に応じて減衰させることと、attenuating the first frame likelihood map according to a time difference between the first frame likelihood map and the second frame likelihood map during the addition;
を含む対象物検出方法。An object detection method comprising:
撮像装置から時系列に取得された画像の特徴量に基づいて前記画像における対象物の候補領域及び前記候補領域の尤度を抽出することと、
時系列に抽出された前記尤度を蓄積することで現在の前記画像における前記候補領域の中から前記対象物である確度が高い候補領域を追跡することと、
前記追跡された候補領域に基づき最終的な前記対象物の位置を決定することと、
をプロセッサに実行させるための対象物検出プログラムであって、
前記対象物である確度が高い候補領域を追跡することは、
過去の画像に基づいて抽出された第1の候補領域において尤度の値を有するフレーム尤度マップに現在の画像に基づいて抽出された第2の候補領域における尤度の値を加算することと、
前記フレーム尤度マップの前記第2の候補領域を除く座標において尤度の値を一定値だけ減算することと、
前記加算及び前記減算によって算出された総合尤度マップに基づいて追跡することと、
を含む対象物検出プログラム
extracting a candidate region of an object in an image acquired in time series from an imaging device and a likelihood of the candidate region based on feature amounts of the image;
Tracking a candidate area that is highly likely to be the object from among the candidate areas in the current image by accumulating the likelihood extracted in time series; and
determining a final object position based on the tracked candidate regions; and
An object detection program for causing a processor to execute the above,
Tracking a candidate region that is likely to be an object of interest includes:
adding a likelihood value for a second candidate region extracted based on the current image to a frame likelihood map having a likelihood value for a first candidate region extracted based on a past image;
subtracting a constant value from the likelihood value at coordinates of the frame likelihood map excluding the second candidate region;
tracking based on a total likelihood map calculated by the addition and the subtraction;
An object detection program including :
撮像装置から時系列に取得された画像の特徴量に基づいて前記画像における対象物の候A candidate for an object in an image is selected based on a feature amount of the image acquired in time series from an imaging device.
補領域及び前記候補領域の尤度を抽出することと、extracting likelihoods of the complement region and the candidate region;
時系列に抽出された前記尤度を蓄積することで現在の前記画像における前記候補領域のThe likelihoods extracted in time series are accumulated to obtain a candidate region in the current image.
中から前記対象物である確度が高い候補領域を追跡することと、tracking a candidate region that is highly likely to be the object from among the candidate regions;
前記追跡された候補領域に基づき最終的な前記対象物の位置を決定することと、determining a final object position based on the tracked candidate regions; and
をプロセッサに実行させるための対象物検出プログラムであって、An object detection program for causing a processor to execute the above,
前記対象物である確度が高い候補領域を追跡することは、Tracking a candidate region that is likely to be an object of interest includes:
過去の画像に基づいて抽出された第1の候補領域において尤度の値を有する第1のフレーム尤度マップに現在の画像に基づいて抽出された第2の候補領域において尤度の値を有する第2のフレーム尤度マップを加算することと、adding a second frame likelihood map having a likelihood value in a second candidate region extracted based on a current image to a first frame likelihood map having a likelihood value in a first candidate region extracted based on a past image;
前記加算によって算出された総合尤度マップに基づいて追跡することと、tracking based on the overall likelihood map calculated by the addition;
前記加算の際に前記第1のフレーム尤度マップを、前記第2のフレーム尤度マップとの時間差に応じて減衰させることと、attenuating the first frame likelihood map according to a time difference between the first frame likelihood map and the second frame likelihood map during the addition;
を含む対象物検出プログラム。An object detection program including:
JP2020209543A 2020-12-17 2020-12-17 Object detection device, object detection method, and object detection program Active JP7566613B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020209543A JP7566613B2 (en) 2020-12-17 2020-12-17 Object detection device, object detection method, and object detection program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020209543A JP7566613B2 (en) 2020-12-17 2020-12-17 Object detection device, object detection method, and object detection program

Publications (2)

Publication Number Publication Date
JP2022096438A JP2022096438A (en) 2022-06-29
JP7566613B2 true JP7566613B2 (en) 2024-10-15

Family

ID=82163693

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020209543A Active JP7566613B2 (en) 2020-12-17 2020-12-17 Object detection device, object detection method, and object detection program

Country Status (1)

Country Link
JP (1) JP7566613B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024024090A1 (en) * 2022-07-29 2024-02-01 ヤマハ発動機株式会社 Component count device and robot system
JP2024041217A (en) * 2022-09-14 2024-03-27 東日本旅客鉄道株式会社 Track material deterioration diagnosis system

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012127618A1 (en) 2011-03-22 2012-09-27 株式会社モルフォ Moving-body detection device, moving-body detection method, moving-body detection program, moving-body tracking device, moving-body tracking method, and moving-body tracking program
JP2012221162A (en) 2011-04-07 2012-11-12 Toyota Central R&D Labs Inc Object detection device and program
JP2020149641A (en) 2019-03-15 2020-09-17 オムロン株式会社 Object tracking device and object tracking method

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012127618A1 (en) 2011-03-22 2012-09-27 株式会社モルフォ Moving-body detection device, moving-body detection method, moving-body detection program, moving-body tracking device, moving-body tracking method, and moving-body tracking program
JP2012221162A (en) 2011-04-07 2012-11-12 Toyota Central R&D Labs Inc Object detection device and program
JP2020149641A (en) 2019-03-15 2020-09-17 オムロン株式会社 Object tracking device and object tracking method

Also Published As

Publication number Publication date
JP2022096438A (en) 2022-06-29

Similar Documents

Publication Publication Date Title
JP6525545B2 (en) INFORMATION PROCESSING APPARATUS, INFORMATION PROCESSING METHOD, AND COMPUTER PROGRAM
JP5624998B2 (en) Image processing apparatus, image processing method, computer program, and moving body
JP4516516B2 (en) Person detection device, person detection method, and person detection program
EP2579569B1 (en) Image processing device, image processing method, integrated circuit, and program
JP7566613B2 (en) Object detection device, object detection method, and object detection program
JP6188592B2 (en) Object detection apparatus, object detection method, and object detection program
US20190124264A1 (en) Control apparatus, image capturing apparatus, control method, and computer-readable storage medium
US11210530B2 (en) Semiconductor device, mobile apparatus, and method of controlling mobile apparatus
JP4578864B2 (en) Automatic tracking device and automatic tracking method
US9706121B2 (en) Image processing apparatus and image processing method
US9489721B2 (en) Image processing apparatus, image processing method, and storage medium
JP4913801B2 (en) Shielding object image identification apparatus and method
JP2016173795A (en) Image processing apparatus, image processing method, and program
US20210089818A1 (en) Deposit detection device and deposit detection method
KR101290517B1 (en) Photographing apparatus for tracking object and method thereof
JP2009223504A (en) Vehicle detection device, method, and program
US20250182528A1 (en) Image processing apparatus, image processing method, and storage medium
JP7509044B2 (en) Information processing device and information processing method
JP2010074315A (en) Object tracking method and imaging device
KR20180138236A (en) Fire point detection system and method in a dynamic environment
US20160071286A1 (en) Image processing apparatus, imaging apparatus, control method, and storage medium
US10943103B2 (en) Human body detection apparatus, human body detection method, information processing apparatus, information processing method, and storage medium
JP4415870B2 (en) Fall / fall detection system and program
JP4740755B2 (en) Monitoring device using images
JP2010021597A (en) Imaging device and imaging method

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20230105

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230906

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240530

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240702

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240820

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240903

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20241002

R150 Certificate of patent or registration of utility model

Ref document number: 7566613

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313115

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350