Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP7567979B2 - Object tracking method and object tracking device - Google Patents
[go: Go Back, main page]

JP7567979B2 - Object tracking method and object tracking device - Google Patents

Object tracking method and object tracking device Download PDF

Info

Publication number
JP7567979B2
JP7567979B2 JP2023071553A JP2023071553A JP7567979B2 JP 7567979 B2 JP7567979 B2 JP 7567979B2 JP 2023071553 A JP2023071553 A JP 2023071553A JP 2023071553 A JP2023071553 A JP 2023071553A JP 7567979 B2 JP7567979 B2 JP 7567979B2
Authority
JP
Japan
Prior art keywords
unit
tracking
detection
camera
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2023071553A
Other languages
Japanese (ja)
Other versions
JP2023083565A (en
Inventor
亮磨 大網
博義 宮野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JP2023083565A publication Critical patent/JP2023083565A/en
Priority to JP2024170268A priority Critical patent/JP7726357B2/en
Application granted granted Critical
Publication of JP7567979B2 publication Critical patent/JP7567979B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/246Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/292Multi-camera tracking
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30232Surveillance
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30241Trajectory

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)
  • Closed-Circuit Television Systems (AREA)

Description

本発明は、物体追跡装置、物体追跡システム、物体追跡方法、表示制御装置、物体検出装置、プログラムおよび記録媒体に関する。 The present invention relates to an object tracking device, an object tracking system, an object tracking method, a display control device, an object detection device, a program, and a recording medium.

近年、複数のカメラ等を用いて、人物を追跡するシステムが開発されている。例えば、特許文献1に記載されている移動体追跡システムは、カメラ毎に分散的に人物を追跡する複数のカメラ内追跡手段を使用する。そして、そのシステムは、複数のカメラ内追跡手段間で連携して移動体を追跡する。また、特許文献2には、複数の撮像部間で撮像された同一のオブジェクトを個々のオブジェクトの追跡結果に基づき追跡する方法が記載されている。 In recent years, systems have been developed that use multiple cameras and the like to track people. For example, the moving object tracking system described in Patent Document 1 uses multiple in-camera tracking means that track people in a distributed manner for each camera. The system tracks moving objects in cooperation between the multiple in-camera tracking means. Patent Document 2 also describes a method for tracking the same object captured by multiple imaging units based on the tracking results of each object.

また、関連する技術として、追跡する必要のない物体を、早めに追跡対象から外す方法が特許文献3に記載されている。 As a related technique, Patent Document 3 describes a method for early removal of objects that do not need to be tracked from the tracking targets.

また、1つの撮影手段で撮影した画像における移動体を検出する装置が、特許文献4に記載されている。 In addition, Patent Document 4 describes a device that detects a moving object in an image captured by a single imaging means.

特開2004-72628号公報JP 2004-72628 A 特表2009-510541号公報Special Publication No. 2009-510541 国際公開第2013/012091号International Publication No. 2013/012091 特開2006-202047号公報JP 2006-202047 A

しかしながら、上述した特許文献1または2に記載の技術では、例えば、物体から遠く離れた位置にカメラが存在する場合、このカメラの撮影画像における物体(移動体)の追跡精度が低くなる可能性がある。この場合、特許文献1または2の技術では、そのカメラの追跡精度の影響を受け、オブジェクトの追跡結果を統合できなかったり、統合できた場合であっても統合時に求められる該オブジェクトの位置の検出精度が低くなったりする場合があった。 However, with the technology described in Patent Document 1 or 2 above, for example, if a camera is located far away from an object, the tracking accuracy of the object (moving body) in the image captured by this camera may be low. In this case, with the technology described in Patent Document 1 or 2, the tracking accuracy of the camera may affect the results of tracking of the object, and even if the results are integrated, the detection accuracy of the object's position required during integration may be low.

本発明は上記課題に鑑みてなされたものであり、その目的は、より高精度に物体を追跡可能な技術を提供することにある。 The present invention was made in consideration of the above problems, and its purpose is to provide a technology that can track objects with higher accuracy.

本発明の一態様に係る物体追跡装置は、センサの出力情報から物体を検出し、検出結果を出力する複数の検出手段と、前記複数の検出手段の夫々によって出力された、複数の前記検出結果に基づいて前記物体を追跡し、共通座標系で表現された前記物体の追跡情報を生成する統合追跡手段と、を備え、前記統合追跡手段は、前記生成した追跡情報を、前記複数の検出手段の夫々に出力し、前記検出手段は、前記追跡情報に基づいて、前記物体を検出する。 An object tracking device according to one aspect of the present invention includes a plurality of detection means for detecting an object from output information of a sensor and outputting the detection results, and an integrated tracking means for tracking the object based on the detection results output by each of the plurality of detection means and generating tracking information of the object expressed in a common coordinate system, the integrated tracking means outputs the generated tracking information to each of the plurality of detection means, and the detection means detects the object based on the tracking information.

本発明の一態様に係る物体追跡システムは、センサと、前記センサによって取得された情報からなる出力情報を受信する物体追跡装置とを備え、前記物体追跡装置は、前記出力情報から前記物体を検出し、検出結果を出力する複数の検出手段と、前記複数の検出手段の夫々によって出力された、複数の前記検出結果に基づいて前記物体を追跡し、共通座標系で表現された前記物体の追跡情報を生成する統合追跡手段と、を備え、前記統合追跡手段は、前記生成した追跡情報を、前記複数の検出手段の夫々に出力し、前記検出手段は、前記追跡情報に基づいて、前記物体を検出する。 An object tracking system according to one aspect of the present invention includes a sensor and an object tracking device that receives output information consisting of information acquired by the sensor, the object tracking device including a plurality of detection means that detect the object from the output information and output the detection results, and an integrated tracking means that tracks the object based on the plurality of detection results output by each of the plurality of detection means and generates tracking information of the object expressed in a common coordinate system, the integrated tracking means outputs the generated tracking information to each of the plurality of detection means, and the detection means detects the object based on the tracking information.

本発明の一態様に係る物体追跡方法は、センサの出力情報から物体を検出し、検出結果を出力し、前記出力された複数の前記検出結果に基づいて前記物体を追跡し、共通座標系で表現された前記物体の追跡情報を生成し、生成した前記追跡情報を出力し、前記物体の検出は、前記追跡情報に基づいて、前記物体を検出する。 An object tracking method according to one aspect of the present invention detects an object from output information of a sensor, outputs a detection result, tracks the object based on the output detection results, generates tracking information of the object expressed in a common coordinate system, outputs the generated tracking information, and detects the object based on the tracking information.

本発明の一態様に係る表示制御装置は、表示装置に表示データを表示させる表示制御装置であって、前記表示データは、センサの出力情報のうち、物体の追跡情報に基づいて該物体を探索する探索範囲であって、該出力情報を出力するセンサ固有の個別座標系で表現された探索範囲を示すものであり、前記物体の追跡情報は、複数のセンサの夫々における出力情報における前記探索範囲内から検出された該物体の検出結果に基づいて、該物体を追跡した結果を示す情報である。 A display control device according to one aspect of the present invention is a display control device that displays display data on a display device, the display data being a search range for searching for an object based on object tracking information among the output information of a sensor, the search range being expressed in an individual coordinate system specific to the sensor that outputs the output information, and the object tracking information being information indicating the result of tracking the object based on the detection result of the object detected within the search range in the output information of each of a plurality of sensors.

本発明の一態様に係る物体検出装置は、複数の物体検出装置の夫々から出力された、複数の検出結果に基づいて追跡された、物体の追跡結果を示す追跡情報であって、共通座標系で表現された追跡情報に基づいて、センサの出力情報から前記物体を検出する。 An object detection device according to one aspect of the present invention detects an object from sensor output information based on tracking information that indicates the tracking results of an object tracked based on multiple detection results output from multiple object detection devices and expressed in a common coordinate system.

なお、上記各装置、物体追跡システムまたは物体追跡方法を、コンピュータによって実現するコンピュータプログラム、およびそのコンピュータプログラムが格納されている、コンピュータ読み取り可能な記憶媒体も、本発明の範疇に含まれる。 The scope of the present invention also includes a computer program for implementing the above-mentioned devices, object tracking system, or object tracking method by a computer, and a computer-readable storage medium on which the computer program is stored.

本発明によれば、より高精度に物体を追跡することができる。 The present invention makes it possible to track objects with greater accuracy.

本発明の第1の実施の形態に係る物体追跡装置の機能構成の一例を示す機能ブロック図である。1 is a functional block diagram showing an example of a functional configuration of an object tracking device according to a first embodiment of the present invention. 本発明の第1の実施の形態に係る物体追跡システムの全体構成の概略の一例を示す図である。1 is a diagram showing an example of a schematic overall configuration of an object tracking system according to a first embodiment of the present invention; ターゲットとトラッカーとを対応付ける処理を説明するための図である。FIG. 11 is a diagram for explaining a process of associating a target with a tracker. 本発明の第1の実施の形態に係る物体追跡装置の検出部の機能構成の一例を示す機能ブロック図である。2 is a functional block diagram showing an example of a functional configuration of a detection unit of the object tracking device according to the first embodiment of the present invention. FIG. 本発明の第1の実施の形態に係る物体追跡装置の検出部におけるオブジェクト検出部の機能構成の一例を示す機能ブロック図である。3 is a functional block diagram showing an example of a functional configuration of an object detection unit in a detection unit of the object tracking device according to the first embodiment of the present invention. FIG. 本発明の第1の実施の形態に係る物体追跡装置の統合追跡部の機能構成の一例を示す機能ブロック図である。2 is a functional block diagram showing an example of a functional configuration of an integrated tracking unit of the object tracking device according to the first embodiment of the present invention. FIG. 本発明の第1の実施の形態に係る統合追跡部が行うオブジェクトの逐次追跡処理を説明するための図である。5A to 5C are diagrams for explaining a sequential tracking process of an object performed by an integrated tracking unit according to the first embodiment of the present invention; 本発明の第1の実施の形態に係る物体追跡装置の物体追跡処理の流れの一例を示すフローチャートである。5 is a flowchart showing an example of the flow of an object tracking process of the object tracking device according to the first embodiment of the present invention. 本発明の第2の実施の形態に係る物体追跡装置の機能構成の一例を示す機能ブロック図である。FIG. 11 is a functional block diagram showing an example of a functional configuration of an object tracking device according to a second embodiment of the present invention. 本発明の第2の実施の形態係る物体追跡装置の検出部の機能構成の一例を示す機能ブロック図である。FIG. 11 is a functional block diagram showing an example of a functional configuration of a detection unit of an object tracking device according to a second embodiment of the present invention. 本発明の第2の実施の形態に係る物体追跡装置の適用例を説明するための図である。11 is a diagram for explaining an application example of an object tracking device according to a second embodiment of the present invention. FIG. 本発明の第2の実施の形態に係る物体追跡装置の適用例を説明するための図である。11 is a diagram for explaining an application example of an object tracking device according to a second embodiment of the present invention. FIG. 本発明の第2の実施の形態に係る物体追跡装置の適用例を説明するための図である。11 is a diagram for explaining an application example of an object tracking device according to a second embodiment of the present invention. FIG. 本発明の第2の実施の形態に係る物体追跡装置の適用例を説明するための図である。11 is a diagram for explaining an application example of an object tracking device according to a second embodiment of the present invention. FIG. 本発明の第3の実施の形態に係る物体追跡装置の検出部の機能構成の一例を示す機能ブロック図である。FIG. 13 is a functional block diagram showing an example of a functional configuration of a detection unit of an object tracking device according to a third embodiment of the present invention. 本発明の第3の実施の形態に係る物体追跡装置の検出部におけるオブジェクト検出部の機能構成の一例を示す機能ブロック図である。FIG. 13 is a functional block diagram showing an example of a functional configuration of an object detection unit in a detection unit of an object tracking device according to a third embodiment of the present invention. 本発明の第4の実施の形態に係る物体追跡装置の統合追跡部の機能構成の一例を示す機能ブロック図である。FIG. 13 is a functional block diagram showing an example of a functional configuration of an integrated tracking unit of an object tracking device according to a fourth embodiment of the present invention. 本発明の第4の実施の形態に係る統合追跡部が行うオブジェクトの一括追跡処理を説明するための図である。13A and 13B are diagrams for explaining a collective tracking process of objects performed by an integrated tracking unit according to a fourth embodiment of the present invention; 本発明の各実施の形態を実現可能なコンピュータ(情報処理装置)のハードウェア構成を例示的に説明する図である。FIG. 1 is a diagram illustrating an example of a hardware configuration of a computer (information processing device) capable of implementing each embodiment of the present invention.

<第1の実施の形態>
本発明の第1の実施の形態について図面を参照して詳細に説明する。まず、図2を参照して、本発明の物体追跡システム(単にシステムとも呼ぶ)の全体構成について説明する。図2は、本実施の形態に係る物体追跡システム1の全体構成の概略の一例を示す図である。図2に示す通り、本実施の形態に係る物体追跡システム1は、物体追跡装置10と、複数のカメラ(20-1~20-N(Nは自然数))と、1以上の表示装置30とを備えている。なお、本実施の形態では、複数のカメラ(20-1~20-N)の夫々を区別しない場合、または、総称する場合には、これらをカメラ20と呼ぶ。
First Embodiment
A first embodiment of the present invention will be described in detail with reference to the drawings. First, the overall configuration of the object tracking system (also simply referred to as the system) of the present invention will be described with reference to FIG. 2. FIG. 2 is a diagram showing an example of a schematic overall configuration of the object tracking system 1 according to the present embodiment. As shown in FIG. 2, the object tracking system 1 according to the present embodiment includes an object tracking device 10, a plurality of cameras (20-1 to 20-N (N is a natural number)), and one or more display devices 30. In this embodiment, when the plurality of cameras (20-1 to 20-N) are not distinguished from one another or when they are referred to collectively, they are called cameras 20.

物体追跡装置10、カメラ20および表示装置30は、ネットワーク40を介して互いに通信可能に接続されている。なお、表示装置30は、物体追跡システム1に含まれていなくてもよい。また、表示装置30は、ネットワーク40を介さず、物体追跡装置10に直接接続される構成であってもよい。 The object tracking device 10, the camera 20, and the display device 30 are connected to each other via the network 40 so that they can communicate with each other. Note that the display device 30 does not have to be included in the object tracking system 1. In addition, the display device 30 may be configured to be directly connected to the object tracking device 10 without going through the network 40.

カメラ20は、物体を検知するセンサとして機能する。なお、本実施の形態では、物体を検知するセンサとして、カメラ20を用いた場合を例に説明を行うが、本発明はこれに限定されるものではない。センサは、カメラに限らず、電波センサなど、位置測位が可能なものであればよい。また、電波センサとカメラとが一体となったセンサのように複数のセンサが混在するものを用いてもよい。センサとして、カメラ20を用いることにより、物体追跡装置10は、色などの視覚的な情報をより好適に取得することができる。 The camera 20 functions as a sensor that detects objects. Note that in this embodiment, an example will be described in which the camera 20 is used as a sensor that detects objects, but the present invention is not limited to this. The sensor is not limited to a camera, and may be anything capable of position measurement, such as a radio wave sensor. Also, a mixture of multiple sensors, such as a sensor that combines a radio wave sensor and a camera, may be used. By using the camera 20 as a sensor, the object tracking device 10 can more appropriately acquire visual information such as color.

また、本実施の形態では、センサが取得する情報とは、カメラが撮影した映像であるとして、説明を行うが、センサが電波センサの場合、センサが取得する情報は、該電波センサによって取得される電波である。 In addition, in this embodiment, the information acquired by the sensor is described as being video captured by a camera, but if the sensor is a radio wave sensor, the information acquired by the sensor is radio waves acquired by the radio wave sensor.

物体追跡装置10は、複数のカメラ20の夫々で撮影された映像に含まれる物体を追跡する装置である。なお、物体追跡装置10の機能構成については、図面を変えて説明する。 The object tracking device 10 is a device that tracks objects contained in images captured by each of the multiple cameras 20. The functional configuration of the object tracking device 10 will be explained using a different drawing.

表示装置30は、物体追跡装置10によるオブジェクトの追跡結果を表示する。なお、表示装置30は、カメラ20が撮影した映像を表示するものであってもよい。また、表示装置30は、動線情報などのその他の情報を表示するものであってもよい。 The display device 30 displays the results of the object tracking performed by the object tracking device 10. The display device 30 may also display images captured by the camera 20. The display device 30 may also display other information such as movement line information.

(物体追跡装置10)
次に、物体追跡装置10の機能について説明する。図1は、本実施の形態に係る物体追跡装置10の機能構成の一例を示す機能ブロック図である。図1に示す通り、物体追跡装置10は、複数の検出部(100-1~100-N)と、統合追跡部200とを備えている。なお、本実施の形態では、複数の検出部(100-1~100-N)の夫々を区別しない場合、または、総称する場合には、これらを検出部100と呼ぶ。
(Object tracking device 10)
Next, the functions of the object tracking device 10 will be described. Fig. 1 is a functional block diagram showing an example of the functional configuration of the object tracking device 10 according to the present embodiment. As shown in Fig. 1, the object tracking device 10 includes a plurality of detection units (100-1 to 100-N) and an integrated tracking unit 200. In this embodiment, when the plurality of detection units (100-1 to 100-N) are not distinguished from one another or when they are referred to collectively, they are referred to as detection units 100.

(検出部100)
検出部100は、後述する統合追跡部200から出力される追跡情報であって、物体(オブジェクト)を検出する対象のフレームの前フレームにおけるオブジェクトの追跡情報に基づいて、カメラ20の出力情報からオブジェクトを検出する。ここで、本実施の形態において、カメラ20の出力情報とは、カメラ20が撮影した映像を示す映像データを示す。
(Detection Unit 100)
The detection unit 100 detects an object from the output information of the camera 20 based on tracking information of an object in a frame preceding a frame in which the object is to be detected, which is output from the integrated tracking unit 200 described later. Here, in this embodiment, the output information of the camera 20 refers to video data showing an image captured by the camera 20.

本実施の形態では、複数の検出部100と複数のカメラ20とは一対一で対応付けられているものとする。例えば、検出部100-1は、カメラ20-1が撮影した映像からオブジェクトを検出し、検出部100-2は、カメラ20-2が撮影した映像からオブジェクトを検出する。なお、本実施の形態はこれに限定されるものではなく、例えば、検出部100-1は、カメラ20-Nが撮影した映像からオブジェクトを検出してもよい。 In this embodiment, the multiple detection units 100 and the multiple cameras 20 are in one-to-one correspondence. For example, the detection unit 100-1 detects an object from an image captured by the camera 20-1, and the detection unit 100-2 detects an object from an image captured by the camera 20-2. Note that this embodiment is not limited to this, and for example, the detection unit 100-1 may detect an object from an image captured by the camera 20-N.

また、カメラ20と検出部100とが一対一で対応付けられていなくてもよい。例えば、検出部100-1は、複数のカメラ20の夫々が撮影した映像からオブジェクトを検出してもよい。 Furthermore, the cameras 20 and the detection units 100 do not have to be associated one-to-one. For example, the detection unit 100-1 may detect objects from images captured by each of the multiple cameras 20.

以下、検出部100の動作について説明する。検出部100は、カメラ20から、カメラ20が撮影した映像を示す映像データ(以降、カメラ映像と呼ぶ)を受信する。図1では、カメラ20-n(nは、1~N)が撮影した映像を示す映像データを、カメラ映像(n)と記載している。ここで、カメラ映像は、監視カメラ等のカメラ20で撮影した映像をリアルタイムで取得したものでもよいし、カメラ20で撮影した映像を一旦、図示しない記憶部等に蓄積しておき、それを後で復号(または再生)したものであってもよい。この映像データには、撮影された時間を示す時間情報が含まれている。 The operation of the detection unit 100 will be described below. The detection unit 100 receives from the camera 20 video data showing the video captured by the camera 20 (hereinafter referred to as camera video). In FIG. 1, video data showing the video captured by the camera 20-n (n is 1 to N) is described as camera video (n). Here, the camera video may be video captured by a camera 20 such as a surveillance camera and acquired in real time, or video captured by the camera 20 that has been temporarily stored in a storage unit (not shown) and later decoded (or played back). This video data includes time information showing the time the video was captured.

また、検出部100は、統合追跡部200から前フレームにおけるオブジェクトの追跡情報を受信する。なお、前フレームとは、オブジェクトを検出する対象となるフレーム(現時点のフレーム)の、直前のフレームであってもよいし、現時点のフレームから所定数前のフレームであってもよい。また、前フレームとは1つであってもよいし、複数であってもよい。なお、検出部100が最初のフレームに対するオブジェクトの検出を行う場合、前フレームにおけるオブジェクトの追跡情報は存在しないため、検出部100は、前フレームにおけるオブジェクトの追跡情報を受信しない(使用しない)。 The detection unit 100 also receives tracking information of the object in the previous frame from the integrated tracking unit 200. The previous frame may be the frame immediately before the frame (the current frame) in which the object is to be detected, or may be a frame a predetermined number of frames before the current frame. The previous frame may be one or multiple. When the detection unit 100 detects an object for the first frame, there is no tracking information of the object in the previous frame, so the detection unit 100 does not receive (does not use) tracking information of the object in the previous frame.

検出部100は、受信したカメラ映像と前フレームにおけるオブジェクトの追跡情報とを用いて、該カメラ映像からオブジェクトの検出(オブジェクト検出と呼ぶ)を行う。なお、上述したとおり、最初のフレームに対してオブジェクト検出を行う場合、検出部100は、前フレームにおけるオブジェクトの追跡情報を使わずに検出を行う。なお、以下では、検出されたオブジェクトのことを、ターゲットと呼ぶ。即ち、オブジェクトの検出結果(オブジェクト検出結果、または、単に検出結果とも呼ぶ)は、ターゲットの集合となる。 The detection unit 100 detects objects (called object detection) from the received camera image using the camera image and object tracking information in the previous frame. As described above, when performing object detection on the first frame, the detection unit 100 performs the detection without using the object tracking information in the previous frame. In the following, the detected object is called a target. In other words, the object detection result (also called the object detection result, or simply the detection result) is a collection of targets.

オブジェクト検出結果は、ターゲット毎の、例えば、ターゲットの位置を表す情報、該ターゲットの大きさを表す情報等を含んでいる。具体的には、オブジェクト検出結果は、例えば、オブジェクトを検出した映像中のフレームにおける、ターゲットが占める領域(ターゲット領域)の外接矩形の情報、ターゲット領域の重心の座標値、ターゲットの幅を示す情報、ターゲットの高さを示す情報等を含んでいる。なお、オブジェクト検出結果は、これに限定されるものではない。例えば、オブジェクト検出結果は、ターゲット領域の重心の座標値に代えて、または、加えて、ターゲット領域の最上端の座標値や最下端の座標値等を含んでもよい。オブジェクト検出結果は、ターゲット毎に、ターゲットの位置および大きさ等を表す情報を含んでいればよい。 The object detection result includes, for each target, information that indicates, for example, the position of the target, information that indicates the size of the target, etc. Specifically, the object detection result includes, for example, information on the circumscribing rectangle of the area occupied by the target (target area) in the frame of the video in which the object is detected, the coordinate values of the center of gravity of the target area, information indicating the width of the target, information indicating the height of the target, etc. Note that the object detection result is not limited to this. For example, the object detection result may include, instead of or in addition to the coordinate values of the center of gravity of the target area, the coordinate values of the topmost end and bottommost end of the target area, etc. It is sufficient that the object detection result includes, for each target, information that indicates the position, size, etc. of the target.

なお、本実施の形態では、オブジェクト検出結果は、ターゲット毎に、ターゲットの最下端の座標値と、ターゲットの外接矩形を示す情報とを含むことを例に説明を行う。なお、ターゲットの最下端の座標値とは、オブジェクトが床面(地面)と接する点の座標値および/またはオブジェクトの外接矩形の下辺の中点の座標値を示す。また、ターゲットの最下端の座標値とは、オブジェクトが人の場合には足元の座標値であってもよい。 In this embodiment, the object detection result includes, for each target, the coordinate value of the bottom edge of the target and information indicating the circumscribing rectangle of the target. The coordinate value of the bottom edge of the target indicates the coordinate value of the point where the object contacts the floor (ground) and/or the coordinate value of the midpoint of the bottom side of the circumscribing rectangle of the object. Furthermore, the coordinate value of the bottom edge of the target may be the coordinate value of the feet when the object is a person.

そして、検出部100は、オブジェクト検出結果に含まれる座標値を、複数のカメラ20で撮影される空間(撮影空間)内で定義される共通の共通座標系における座標値に変換し、変換した座標値をオブジェクト検出結果とする。 Then, the detection unit 100 converts the coordinate values included in the object detection result into coordinate values in a common coordinate system defined within the space captured by the multiple cameras 20 (captured space), and regards the converted coordinate values as the object detection result.

また、オブジェクト検出結果は、上述した情報の他に、ターゲットの形状を表す情報を含んでもよい。つまり、オブジェクト検出結果は、ターゲット領域を表すシルエット情報などを含んでもよい。ここで、シルエット情報とは、ターゲット領域の内部の画素と外部の画素を区別する情報であり、例えば、内部の画素値を255、外部の画素値を0に設定した画像情報であったり、MPEG-7で標準化されているようなシェイプディスクリプタ(形状特徴量)をシルエット形状から抽出した値である。また、オブジェクト検出結果は、オブジェクトの外見の特徴量を含んでもよい。例えば、オブジェクト検出結果は、該オブジェクトの色、模様、形状などの特徴量も含んでいてもよい。 In addition to the above information, the object detection result may also include information representing the shape of the target. In other words, the object detection result may also include silhouette information representing the target area. Here, silhouette information is information that distinguishes between pixels inside the target area and pixels outside it, and is, for example, image information in which the internal pixel values are set to 255 and the external pixel values are set to 0, or a value extracted from the silhouette shape of a shape descriptor (shape feature) as standardized in MPEG-7. The object detection result may also include features of the object's appearance. For example, the object detection result may also include features such as the color, pattern, and shape of the object.

さらに、オブジェクト検出結果は、オブジェクト検出の確からしさ(確度)を表す尤度を記述する情報(ターゲットの尤度情報)をターゲット毎に含んでもよい。ターゲットの尤度情報とは、ターゲットの尤度の算出に必要な情報であり、オブジェクト検出時のスコアの値、検出されたオブジェクトのカメラからの距離、大きさなど、オブジェクト検出の確度に関連する情報である。また、検出部100は、ターゲットの尤度自体を算出し、算出した尤度をターゲットの尤度情報としてもよい。 Furthermore, the object detection result may include information (target likelihood information) describing the likelihood representing the certainty (accuracy) of object detection for each target. The target likelihood information is information required to calculate the likelihood of a target, and is information related to the accuracy of object detection, such as the score value at the time of object detection, the distance from the camera of the detected object, and the size of the detected object. In addition, the detection unit 100 may calculate the likelihood of the target itself, and use the calculated likelihood as the target likelihood information.

そして、検出部100は、オブジェクト検出結果を統合追跡部200へ出力する。 Then, the detection unit 100 outputs the object detection result to the integrated tracking unit 200.

(統合追跡部200)
統合追跡部200は、検出部100の夫々から出力された検出結果を受け取る。そして、統合追跡部200は、この各検出結果に基づいてオブジェクトを追跡する。具体的には、統合追跡部200は、検出部100の夫々が検出部100に紐付けられたカメラ20によって撮影された映像から検出した、1または複数のオブジェクトに対するオブジェクト検出結果を用いて、該オブジェクトを追跡する(オブジェクト追跡を行う)。そして、統合追跡部200は、共通座標系で表現されたオブジェクトの追跡結果(オブジェクト追跡結果)を生成する。このように、統合追跡部200は、各検出部100が、該検出部100に紐付けられたカメラ20によって撮影された映像から検出したオブジェクト検出結果を統合し、オブジェクト追跡を行う。そのため、統合追跡部200が行うオブジェクト追跡を、オブジェクト統合追跡とも呼ぶ。
(Integrated Tracking Unit 200)
The integrated tracking unit 200 receives the detection results output from each of the detection units 100. The integrated tracking unit 200 then tracks the object based on each of the detection results. Specifically, the integrated tracking unit 200 tracks the object (performs object tracking) using the object detection results for one or more objects detected by each of the detection units 100 from the video captured by the camera 20 linked to the detection unit 100. The integrated tracking unit 200 then generates a tracking result (object tracking result) of the object expressed in a common coordinate system. In this way, the integrated tracking unit 200 integrates the object detection results detected by each detection unit 100 from the video captured by the camera 20 linked to the detection unit 100, and performs object tracking. Therefore, the object tracking performed by the integrated tracking unit 200 is also called object integrated tracking.

以後、オブジェクト追跡結果として生成される、オブジェクト毎の情報をトラッカーと呼ぶ。つまり、トラッカーには、追跡されたオブジェクトの情報(オブジェクト追跡結果)として、追跡されたオブジェクトの位置を示す情報、該オブジェクトの運動モデル等が含まれるとするが本発明はこれに限定されるものではない。なお、追跡されたオブジェクトの位置は、オブジェクトの、現時点より前(過去)の位置であるため、オブジェクトの過去の位置とも呼ぶ。 Hereinafter, the information for each object generated as the result of object tracking will be referred to as a tracker. In other words, the tracker includes, as information on the tracked object (object tracking result), information indicating the position of the tracked object, a motion model of the object, etc., but the present invention is not limited to this. Note that the position of the tracked object is the position of the object prior to the current time (past), and therefore is also referred to as the past position of the object.

つまり、オブジェクト追跡とは、オブジェクト検出で検出されたターゲットと、このターゲットの検出前に生成されたトラッカーとを対応付けることによって、フレーム間におけるオブジェクト同士を対応付けていく処理とみなせる。このオブジェクト追跡について、図3を参照して説明する。図3は、統合追跡部200によるターゲットとトラッカーとを対応付ける処理を説明するための図である。図3に示す通り、ターゲットの数をM個、トラッカーの数をK個とする(MおよびKは、0以上の整数)。統合追跡部200は、このM個のターゲットとK個のトラッカーとの間で対応付けを行う。統合追跡部200は、ターゲットとトラッカーとを対応付ける際、まず、トラッカーに含まれる情報によって示される、オブジェクトの過去の位置から該オブジェクトの現在の位置を予測し、ターゲットとトラッカーとの関連性を表す指標を用いて対応付けを行う。 In other words, object tracking can be considered as a process of associating objects between frames by associating targets detected by object detection with trackers generated before the detection of the targets. This object tracking will be described with reference to FIG. 3. FIG. 3 is a diagram for explaining the process of associating targets and trackers by the integrated tracking unit 200. As shown in FIG. 3, the number of targets is M, and the number of trackers is K (M and K are integers equal to or greater than 0). The integrated tracking unit 200 associates these M targets with the K trackers. When associating targets with trackers, the integrated tracking unit 200 first predicts the current position of the object from the past position of the object indicated by information included in the tracker, and then associates the targets with the trackers using an index indicating the relevance of the targets to the trackers.

つまり、統合追跡部200は、前フレームにおいて検出されたオブジェクトの位置と、トラッカー毎に算出され保持されるオブジェクトの運動モデルと、に基づいて、オブジェクトの現フレーム上の位置を予測する。この手法としては、カルマンフィルタを用いる方法、または、パーティクルフィルタを用いる方法など、既存の様々な方法を用いることができる。 In other words, the integrated tracking unit 200 predicts the position of the object in the current frame based on the position of the object detected in the previous frame and the motion model of the object calculated and stored for each tracker. This can be done using various existing methods, such as a method using a Kalman filter or a method using a particle filter.

そして、統合追跡部200は、例えば、以下の(1)~(3)に挙げる情報に基づいて、前フレームにおけるオブジェクト追跡結果(トラッカー)と、検出結果に含まれるオブジェクト(ターゲット)とを対応付ける。
(1)トラッカーを用いて予測したオブジェクトの現フレーム上の位置とターゲットの位置との距離の近さ
(2)ターゲットと、トラッカーによって追跡結果が示されるオブジェクトと、の間の外見特徴量の類似性
(3)ターゲットおよびトラッカーそれぞれの尤度
この対応付けの処理は、図3に示すような2部グラフのコスト最小化問題に帰着させることができる。よって、統合追跡部200は、ハンガリアン法などのアルゴリズムによってこの問題を解くことができる。
Then, the integrated tracking unit 200 associates the object tracking result (tracker) in the previous frame with the object (target) included in the detection result, based on, for example, the information listed in (1) to (3) below.
(1) The proximity of the position of the object in the current frame predicted by the tracker to the position of the target (2) The similarity of the appearance features between the target and the object whose tracking result is indicated by the tracker (3) The likelihood of the target and the tracker This matching process can be reduced to a cost minimization problem of a bipartite graph as shown in Fig. 3. Therefore, the integrated tracking unit 200 can solve this problem by an algorithm such as the Hungarian method.

図3では、ターゲットとトラッカーとが対応付けられた場合を、矢印を用いて示している。つまり、一番上のターゲットは、一番上のトラッカーと対応付いていることを示している。 In Figure 3, arrows are used to indicate when targets and trackers are associated. In other words, the top target is associated with the top tracker.

そして、トラッカーと対応付かないターゲットが存在する場合には、統合追跡部200は、該ターゲットが新規に現れたオブジェクトとみなせるかどうかを判定する。そして、統合追跡部200は、該ターゲットが新規に現れた可能性が高いと判定した場合、該ターゲットに関連するトラッカーを新規に追加する。図3においては、符号mで示したターゲット(ターゲットmと呼ぶ)が、トラッカーと対応付かないターゲットであるとする。このとき、統合追跡部200は、ターゲットmが新たに表れたオブジェクトとみなせるか否かの判定を行い、みなせる場合、ターゲットmに関連するトラッカーを新規に作成する。 If there is a target that does not correspond to a tracker, the integrated tracking unit 200 judges whether the target can be considered to be a newly appeared object. If the integrated tracking unit 200 judges that there is a high possibility that the target has newly appeared, it adds a new tracker related to the target. In FIG. 3, the target indicated by the symbol m (referred to as target m) is assumed to be a target that does not correspond to a tracker. In this case, the integrated tracking unit 200 judges whether target m can be considered to be a newly appeared object, and if so, creates a new tracker related to target m.

一方、ターゲットと対応付かないトラッカーが存在する場合には、統合追跡部200は、該トラッカーが撮影空間から消えたオブジェクトに関する情報か否かを判定する。そして、統合追跡部200は、該トラッカーが撮影空間から消えたオブジェクトに関する情報である可能性が高い場合、該トラッカーを削除する。図3においては、符号kで示したトラッカー(トラッカーkと呼ぶ)が、ターゲットと対応付かないトラッカーであるとする。このとき、統合追跡部200は、トラッカーkが、消えたオブジェクトに関する情報か否かの判定を行い、該トラッカーkが消えたオブジェクトに関する情報の場合、トラッカーkを削除する。 On the other hand, if there is a tracker that does not correspond to the target, the integrated tracking unit 200 judges whether the tracker is information about an object that has disappeared from the shooting space. Then, if there is a high possibility that the tracker is information about an object that has disappeared from the shooting space, the integrated tracking unit 200 deletes the tracker. In FIG. 3, the tracker indicated by the symbol k (called tracker k) is assumed to be a tracker that does not correspond to the target. In this case, the integrated tracking unit 200 judges whether tracker k is information about a disappeared object, and deletes tracker k if tracker k is information about a disappeared object.

統合追跡部200は、これらの処理をフレーム単位で繰り返すことにより、オブジェクト追跡を行っていく。なお、統合追跡部200は、トラッカーに全カメラ20で共通の一意のID(identifier)を与え、このIDによって追跡結果(トラッカー)を管理する。また、統合追跡部200は、追跡結果の確からしさを評価した値(以後、トラッカーの尤度(重み)と呼ぶ)をトラッカーのパラメータとして、該トラッカーに含める。なお、トラッカーに含まれる、追跡されたオブジェクトの位置を示す情報によって示される位置であって、最も新しいオブジェクトの位置を、トラッカーの位置と呼ぶ。また、このときのオブジェクトの大きさをトラッカーの大きさとも呼ぶ。 The integrated tracking unit 200 repeats these processes on a frame-by-frame basis to track objects. The integrated tracking unit 200 assigns each tracker a unique ID (identifier) that is common to all cameras 20, and manages the tracking results (trackers) using this ID. The integrated tracking unit 200 also includes in the tracker a value that evaluates the likelihood of the tracking result (hereinafter referred to as the tracker's likelihood (weight)) as a tracker parameter. The position indicated by the information indicating the position of the tracked object contained in the tracker, and the most recent position of the object, is referred to as the tracker position. The size of the object at this time is also referred to as the size of the tracker.

また、統合追跡部200は、対応付けの結果に基づいて、各トラッカーの位置を示す情報およびトラッカーの尤度の情報等を更新する。トラッカーの位置の情報は、複数のカメラ20で撮影される撮影空間内で定義される共通座標系で表現された情報である。この共通座標系で表現された情報とは、共通座標系における座標値である。この共通座標系における座標値とは、例えば、複数のカメラ20が、ある店舗内に設置されたカメラである場合、実世界におけるフロアの位置を示す座標系である。これに対し、各カメラ20に固有の座標系を、該カメラ20の個別座標系と呼ぶ。この個別座標系は、カメラ20の撮影画像上の座標系である。以降、共通座標系で表現された位置の情報を、共通座標系の座標値として説明を行う。また、カメラ20の個別座標系で表現された位置の情報を、カメラ20の個別座標系の座標値として説明を行う。 The integrated tracking unit 200 also updates the information indicating the position of each tracker and the tracker likelihood information, etc., based on the result of the association. The tracker position information is information expressed in a common coordinate system defined in the shooting space captured by the multiple cameras 20. The information expressed in this common coordinate system is a coordinate value in the common coordinate system. For example, if the multiple cameras 20 are cameras installed in a store, the coordinate value in this common coordinate system is a coordinate system indicating the position of the floor in the real world. In contrast, the coordinate system unique to each camera 20 is called the individual coordinate system of the camera 20. This individual coordinate system is a coordinate system on the captured image of the camera 20. Hereinafter, the position information expressed in the common coordinate system will be described as the coordinate value of the common coordinate system. Furthermore, the position information expressed in the individual coordinate system of the camera 20 will be described as the coordinate value of the individual coordinate system of the camera 20.

そして、統合追跡部200は、対応付けの結果に基づいて情報が更新されたトラッカーを、新たなオブジェクト追跡結果として生成する。そして、統合追跡部200は、生成したオブジェクト追跡結果(トラッカー)のうち、トラッカーの位置および/または大きさを示す情報、および、トラッカーの尤度の情報等を、オブジェクト追跡の追跡結果を示す情報(追跡情報)として出力する。 The integrated tracking unit 200 then generates a tracker whose information has been updated based on the matching result as a new object tracking result. The integrated tracking unit 200 then outputs, from the generated object tracking result (tracker), information indicating the position and/or size of the tracker, and information on the likelihood of the tracker, etc., as information indicating the tracking result of object tracking (tracking information).

この追跡情報は、各トラッカーの位置を示す情報として、各トラッカーの共通座標系の座標値を含んでいる。この追跡情報は、検出部100にフィードバックされる。つまり、検出部100は、この追跡情報を受信し、該追跡情報を、以降のフレームに対するオブジェクト検出に用いる。 This tracking information includes coordinate values of each tracker in a common coordinate system as information indicating the position of each tracker. This tracking information is fed back to the detection unit 100. In other words, the detection unit 100 receives this tracking information and uses it for object detection in subsequent frames.

なお、統合追跡部200は、上記追跡情報と、トラッカーのその他の情報を含むオブジェクト追跡結果を検出部100に出力する構成であってもよい。 The integrated tracking unit 200 may be configured to output the object tracking results including the above tracking information and other information of the tracker to the detection unit 100.

このように、本実施の形態に係る物体追跡装置10は、複数のカメラの夫々で撮影された映像を用いて、この複数のカメラ20の夫々で撮影された映像に対するオブジェクト検出結果を統合して、オブジェクト追跡を行う。そして、物体追跡装置10は、得られた追跡情報を次のフレームでのオブジェクト検出にフィードバックする。 In this way, the object tracking device 10 according to this embodiment uses images captured by each of the multiple cameras and integrates the object detection results for the images captured by each of the multiple cameras 20 to track objects. The object tracking device 10 then feeds back the obtained tracking information to object detection in the next frame.

このように、物体追跡装置10は、前のフレームに対する追跡結果を用いて、映像からオブジェクトを検出する。例えば、あるカメラ20から見えないが、他のカメラ20から見えているオブジェクトがある場合、物体追跡装置10は、あるカメラ20からは見えないオブジェクトに対する追跡結果も、このあるカメラ20の映像におけるオブジェクト検出に用いる。これにより、検出部100は、このあるカメラ20から見える範囲に同じオブジェクトが現れた場合に、このオブジェクトを好適に検出することができる。そのため、物体追跡装置10は、このオブジェクトに対するオブジェクト追跡を精度よく行うことができる。 In this way, the object tracking device 10 detects an object from the video using the tracking results for the previous frame. For example, if there is an object that is not visible from one camera 20 but is visible from another camera 20, the object tracking device 10 uses the tracking results for the object that is not visible from the one camera 20 to detect the object in the video of the one camera 20. This allows the detection unit 100 to suitably detect the object when the same object appears within the range visible from the one camera 20. Therefore, the object tracking device 10 can perform object tracking for this object with high accuracy.

したがって、物体追跡装置10は、前のフレームに対する追跡結果を用いない場合に比べ、オブジェクトの検出精度を高めることができる。また、物体追跡装置10は、検出精度が高い検出結果の全てを用いてオブジェクト追跡を行うため、全体として得られる追跡結果の精度も向上する。 Therefore, the object tracking device 10 can improve the object detection accuracy compared to when the tracking results for the previous frame are not used. In addition, since the object tracking device 10 performs object tracking using all detection results with high detection accuracy, the accuracy of the tracking results obtained overall is also improved.

(検出部100の詳細)
次に、図4から図8を参照して、物体追跡装置10の各部の機能についてより詳細に説明する。図4は、本実施の形態に係る物体追跡装置10の検出部100のより詳細な機能構成の一例を示す機能ブロック図である。図4に示す通り、検出部100は、オブジェクト検出部110と、共通座標変換部(第2の変換部)120と、個別座標変換部(第1の変換部)130とを備えている。なお、図4では、検出部100が受信するカメラ映像(n)(nは、1~N)を、単にカメラ映像と記載している。
(Details of the detection unit 100)
Next, the function of each unit of the object tracking device 10 will be described in more detail with reference to Fig. 4 to Fig. 8. Fig. 4 is a functional block diagram showing an example of a more detailed functional configuration of the detection unit 100 of the object tracking device 10 according to the present embodiment. As shown in Fig. 4, the detection unit 100 includes an object detection unit 110, a common coordinate conversion unit (second conversion unit) 120, and an individual coordinate conversion unit (first conversion unit) 130. Note that in Fig. 4, the camera video (n) (n is 1 to N) received by the detection unit 100 is simply referred to as the camera video.

個別座標変換部130は、統合追跡部200から出力される追跡情報を、統合追跡部200から受信する。そして、個別座標変換部130は、この追跡情報に含まれる、各トラッカーの共通座標系の座標値を、各カメラ20が撮影するフレーム上の座標値(つまり、各カメラ20固有の個別座標系で表現された座標値)に変換する。共通座標系の座標値を(X,Y,Z)とし、カメラ20の個別座標系の座標値を(x,y)と表したとき、個別座標変換部130は、トラッカーの共通座標系の座標値(X,Y,Z)から、該個別座標変換部130を備える検出部100に紐付けられたカメラ20の個別座標系の座標値(x,y)を求める。このとき、個別座標変換部130は、少なくとも、検出部100に紐付けられたカメラ20の、カメラ位置、姿勢等を表すカメラパラメータをキャリブレーションにより求めておくことが好ましい。これにより、個別座標変換部130は、得られたカメラパラメータを用いて、共通座標系の座標値を、カメラ20の個別座標系の座標値に変換する。 The individual coordinate conversion unit 130 receives tracking information output from the integrated tracking unit 200 from the integrated tracking unit 200. The individual coordinate conversion unit 130 then converts the coordinate values of the common coordinate system of each tracker included in this tracking information into coordinate values on the frame captured by each camera 20 (i.e., coordinate values expressed in the individual coordinate system specific to each camera 20). When the coordinate values of the common coordinate system are (X, Y, Z) and the coordinate values of the individual coordinate system of the camera 20 are expressed as (x, y), the individual coordinate conversion unit 130 obtains the coordinate values (x, y) of the individual coordinate system of the camera 20 linked to the detection unit 100 equipped with the individual coordinate conversion unit 130 from the coordinate values (X, Y, Z) of the common coordinate system of the tracker. At this time, it is preferable that the individual coordinate conversion unit 130 obtains at least the camera parameters representing the camera position, attitude, etc. of the camera 20 linked to the detection unit 100 by calibration. As a result, the individual coordinate conversion unit 130 uses the obtained camera parameters to convert the coordinate values in the common coordinate system into coordinate values in the individual coordinate system of the camera 20.

なお、このカメラパラメータは、検出部100内の図示しない記憶部等に格納されるものであってもよいし、個別座標変換部130内の記憶領域に格納されるものであってもよい。後者の場合、個別座標変換部130は、共通座標変換部120にカメラパラメータを供給する構成であってもよい。 The camera parameters may be stored in a storage unit (not shown) in the detection unit 100, or may be stored in a storage area in the individual coordinate conversion unit 130. In the latter case, the individual coordinate conversion unit 130 may be configured to supply the camera parameters to the common coordinate conversion unit 120.

例えば、オブジェクトが人物であり、トラッカーの位置を示す情報が、該人物の足元位置を示す座標値と頭頂位置を示す座標値であるとする。そして、この足元位置の座標値と、頭頂位置の座標値とを、それぞれ(X0,Y0,0)、(X0,Y0,H)(Hは人物の高さを表す)とする。また、個別座標変換部130を備える検出部100に紐付けられたカメラ20が、カメラ20-1であるとする。 For example, suppose the object is a person, and the information indicating the position of the tracker is coordinate values indicating the position of the person's feet and the position of the top of the head. The coordinate values of the feet and the top of the head are (X0, Y0, 0) and (X0, Y0, H) (H represents the height of the person), respectively. Also, suppose the camera 20 linked to the detection unit 100 equipped with the individual coordinate transformation unit 130 is camera 20-1.

このとき、個別座標変換部130は、カメラ20-1に関するカメラパラメータを用いて、該カメラ20-1が撮影するフレーム上における足元位置(x0,y0)と頭頂位置(x1,y1)とをそれぞれ求める。もし、トラッカーの位置を示す情報が外接矩形を示す情報を含む場合、該外接矩形の幅を示す値は、以前に、カメラパラメータを用いて共通座標系の座標値に変換することにより、求められている。そのため、個別座標変換部130は、この外接矩形の幅として再び上記カメラパラメータを用いて変換した値を用いてもよい。 At this time, the individual coordinate transformation unit 130 uses the camera parameters for the camera 20-1 to determine the foot position (x0, y0) and the top of the head position (x1, y1) on the frame captured by the camera 20-1. If the information indicating the tracker position includes information indicating a circumscribing rectangle, the value indicating the width of the circumscribing rectangle has previously been determined by converting it into coordinate values in a common coordinate system using the camera parameters. Therefore, the individual coordinate transformation unit 130 may use a value converted again using the above camera parameters as the width of this circumscribing rectangle.

また、トラッカーによって追跡結果が示されるオブジェクトの全てが1つのカメラ20から見えるわけではなく、このカメラ20の視界の外側に存在する場合もある。したがって、追跡情報に含まれるトラッカーの位置を示す情報が、検出部100に紐付けられたカメラ20から見えないオブジェクトに関する情報の場合、個別座標変換部130は、オブジェクトの上記カメラ20の個別座標系の座標値を求めることができない。よって、個別座標変換部130は、このようなカメラ20の画角外で見えないオブジェクトに関するトラッカーの共通座標系の座標値を、個別座標系の座標値に変換しないようにしてもよい。この際、個別座標変換部130は、各カメラ20で見える共通座標系の座標値の範囲を、カメラ20毎に、図示しない記憶部等に予め登録しておき、各オブジェクトがこの中に入っているかどうかを判定するようにしてもよい。また、個別座標変換部130は、実際に個別座標系の座標値に変換して、紐付けられたカメラ20で監視している領域の外側を示す異常な値になったり、値が求まらなかったりしたときに、座標値を変換したオブジェクトがカメラ20から見えないオブジェクトであると判定してもよい。 In addition, not all objects for which tracking results are shown by a tracker are visible from one camera 20, and may exist outside the field of view of this camera 20. Therefore, if the information indicating the position of the tracker included in the tracking information is information regarding an object that is not visible from the camera 20 linked to the detection unit 100, the individual coordinate conversion unit 130 cannot obtain the coordinate values of the object in the individual coordinate system of the camera 20. Therefore, the individual coordinate conversion unit 130 may not convert the coordinate values of the common coordinate system of the tracker related to such an object that is not visible outside the angle of view of the camera 20 into coordinate values of the individual coordinate system. In this case, the individual coordinate conversion unit 130 may register in advance in a storage unit (not shown) or the like for each camera 20 the range of coordinate values of the common coordinate system visible from each camera 20, and determine whether each object is within this range. In addition, the individual coordinate conversion unit 130 may actually convert into coordinate values of the individual coordinate system, and when an abnormal value indicating the outside of the area monitored by the linked camera 20 is obtained or a value cannot be obtained, determine that the object whose coordinate values have been converted is an object that is not visible from the camera 20.

そして、個別座標変換部130は、統合追跡部200から出力された追跡情報に含まれるトラッカーの共通座標系の座標値が、検出部100に紐付けられたカメラ20の個別座標系の座標値に変換された結果(追跡情報)を、オブジェクト検出部110に出力する。つまり、個別座標変換部130は、共通座標系で表現された追跡情報を、個別座標系で表現された追跡情報に変換し、該変換後の追跡情報をオブジェクト検出部110に出力する。以降、単に「個別座標系の座標値」と記載した場合、検出部100に紐付けられたカメラ20の個別座標系の座標値を示す。 Then, the individual coordinate conversion unit 130 converts the coordinate values in the common coordinate system of the tracker included in the tracking information output from the integrated tracking unit 200 into coordinate values in the individual coordinate system of the camera 20 linked to the detection unit 100, and outputs the result (tracking information) to the object detection unit 110. In other words, the individual coordinate conversion unit 130 converts the tracking information expressed in the common coordinate system into tracking information expressed in the individual coordinate system, and outputs the converted tracking information to the object detection unit 110. Hereinafter, when simply written as "coordinate values in the individual coordinate system," it refers to the coordinate values in the individual coordinate system of the camera 20 linked to the detection unit 100.

オブジェクト検出部110は、オブジェクト検出部110を備える検出部100に紐付けられたカメラ20からのカメラ映像を受信する。また、オブジェクト検出部110は、個別座標変換部130から個別座標系の座標値に変換された追跡情報を受信する。そして、オブジェクト検出部110は、上記追跡情報に基づいて、受信したカメラ映像からオブジェクトを検出する。 The object detection unit 110 receives camera images from a camera 20 linked to a detection unit 100 that includes the object detection unit 110. The object detection unit 110 also receives tracking information that has been converted into coordinate values in an individual coordinate system from an individual coordinate conversion unit 130. The object detection unit 110 then detects an object from the received camera images based on the tracking information.

そして、オブジェクト検出部110は、検出結果を生成する。オブジェクト検出部110は、生成した検出結果を共通座標変換部120に出力する。なお、この検出結果は、個別座標系で表現された検出結果である。 Then, the object detection unit 110 generates a detection result. The object detection unit 110 outputs the generated detection result to the common coordinate transformation unit 120. Note that this detection result is a detection result expressed in an individual coordinate system.

図5を参照して、オブジェクト検出部110の構成についてより詳細に説明する。図5は、本実施の形態に係るオブジェクト検出部110の機能構成の一例を示す機能ブロック図である。図5に示す通り、オブジェクト検出部110は、認識型オブジェクト検出部(第1の物体検出部)111と、探索範囲設定部112とを備えている。 The configuration of the object detection unit 110 will be described in more detail with reference to FIG. 5. FIG. 5 is a functional block diagram showing an example of the functional configuration of the object detection unit 110 according to this embodiment. As shown in FIG. 5, the object detection unit 110 includes a recognition-type object detection unit (first object detection unit) 111 and a search range setting unit 112.

探索範囲設定部112は、個別座標変換部130から、個別座標系の座標値に変換された追跡情報を受信する。そして、探索範囲設定部112は、この個別座標系の座標値に変換された追跡情報を用いて、現フレームに対するオブジェクトの検出を行う対象となるエリア(探索範囲)を求める。つまり、探索範囲設定部112は、個別座標系の座標値に変換された、前フレームの追跡結果からなる追跡情報に基づいて、現フレームのオブジェクトの位置を予測する。そして、探索範囲設定部112は、予測した位置から、オブジェクトを検索する検出範囲を求める。なお、この探索範囲をオブジェクトの検出範囲とも呼ぶ。 The search range setting unit 112 receives the tracking information converted into coordinate values in the individual coordinate system from the individual coordinate conversion unit 130. Then, using the tracking information converted into coordinate values in the individual coordinate system, the search range setting unit 112 determines an area (search range) in which to detect an object in the current frame. That is, the search range setting unit 112 predicts the position of the object in the current frame based on the tracking information consisting of the tracking result of the previous frame converted into coordinate values in the individual coordinate system. Then, the search range setting unit 112 determines a detection range in which to search for the object from the predicted position. This search range is also called the detection range of the object.

ここで、探索範囲設定部112が受信する追跡情報は、現在処理を行おうとするフレームの時間から見ると、過去のフレームにおけるオブジェクト追跡の結果(過去の追跡結果とも呼ぶ)になる。そこで、探索範囲設定部112は、各オブジェクトの動きを予測し、現フレームにおける各オブジェクトの位置を予測する。以降、この予測したオブジェクトの位置を予測位置と呼ぶ。そして、探索範囲設定部112は、この予測位置の近傍を該オブジェクトの探索範囲として設定する。 The tracking information received by the search range setting unit 112 is the result of object tracking in a past frame (also called the past tracking result) when viewed from the time of the frame currently being processed. Therefore, the search range setting unit 112 predicts the movement of each object and predicts the position of each object in the current frame. Hereinafter, this predicted object position is called the predicted position. Then, the search range setting unit 112 sets the vicinity of this predicted position as the search range for that object.

探索範囲設定部112は、過去の追跡結果から算出されるオブジェクト毎の運動モデルを用いて、オブジェクト毎の動きを予測することが好ましい。例えば、探索範囲設定部112は、過去数フレーム(2フレームでもよい)の追跡結果でオブジェクトの位置が変化していないときには、該オブジェクトが静止していると判定し、追跡結果で得られたオブジェクトの位置をそのまま予測位置とする。また、探索範囲設定部112は、過去数フレームの追跡結果でオブジェクトが移動している場合には、該オブジェクトが等速で動いていると仮定し、過去フレームからの時間差を考慮して予測位置を求めてもよい。 It is preferable that the search range setting unit 112 predicts the movement of each object using a motion model for each object calculated from past tracking results. For example, when the position of an object has not changed in the tracking results for the past few frames (or even two frames), the search range setting unit 112 determines that the object is stationary, and sets the position of the object obtained in the tracking results as the predicted position. In addition, when the tracking results for the past few frames show that the object is moving, the search range setting unit 112 may assume that the object is moving at a constant speed, and determine the predicted position taking into account the time difference from the past frame.

探索範囲設定部112がオブジェクト毎の動きを予測する際に使用する過去数フレームの追跡結果は、追跡情報に含まれるものであってもよい。また、上記過去数フレームの追跡結果から得られるオブジェクトの運動モデルも、上記追跡情報に含まれるものであってもよい。 The tracking results of the past few frames used by the search range setting unit 112 when predicting the movement of each object may be included in the tracking information. In addition, the motion model of the object obtained from the tracking results of the past few frames may also be included in the tracking information.

また、この予測位置は、追跡情報に含まれていてもよい。つまり、統合追跡部200が、オブジェクト追跡時にカルマンフィルタまたはパーティクルフィルタで求まった値を予測位置として、追跡情報に含めてもよい。 This predicted position may also be included in the tracking information. In other words, the integrated tracking unit 200 may include in the tracking information the value obtained by the Kalman filter or particle filter during object tracking as the predicted position.

また、例えば、カメラ20が撮影可能な範囲の外縁部分には、該カメラ20の画角に新たなオブジェクトが出現する可能性がある。また、カメラ20が撮影している場所が出入口のような場所を含む場合も、該カメラ20の画角に新たなオブジェクトが出現する可能性がある。したがって、探索範囲設定部112は、このようなカメラ20が撮影した映像に含まれるフレーム上における、これらの領域(フレームの外縁部および/または出入口部分)も併せてオブジェクト探索範囲に含めることが好ましい。 In addition, for example, a new object may appear in the angle of view of the camera 20 at the outer edge of the range that the camera 20 can capture. In addition, if the location captured by the camera 20 includes a place such as an entrance/exit, a new object may appear in the angle of view of the camera 20. Therefore, it is preferable that the search range setting unit 112 also includes these areas (the outer edge of the frame and/or the entrance/exit part) on the frame contained in the image captured by such a camera 20 in the object search range.

探索範囲設定部112は、設定したオブジェクトの探索範囲を示す情報(探索範囲情報)を認識型オブジェクト検出部111に出力する。 The search range setting unit 112 outputs information indicating the set search range of the object (search range information) to the recognition-type object detection unit 111.

認識型オブジェクト検出部111は、探索範囲設定部112から、探索範囲情報を受信する。認識型オブジェクト検出部111は、受信した探索範囲情報に基づいて、認識型オブジェクト検出部111に入力されるカメラ映像からオブジェクトを検出する。認識型オブジェクト検出部111は、入力されたカメラ映像のフレームを、一旦、認識型オブジェクト検出部111内のバッファ等の記憶手段に蓄えておき、探索範囲情報を受信すると、この情報を適用してオブジェクト検出処理を実行する。具体的には、認識型オブジェクト検出部111は、探索範囲情報によって示される領域(探索範囲)に対して、オブジェクトの画像特徴を学習させた識別器を用いて、オブジェクト検出を行う。 The recognition-type object detection unit 111 receives search range information from the search range setting unit 112. Based on the received search range information, the recognition-type object detection unit 111 detects objects from the camera video input to the recognition-type object detection unit 111. The recognition-type object detection unit 111 temporarily stores frames of the input camera video in a storage means such as a buffer within the recognition-type object detection unit 111, and upon receiving search range information, applies this information to perform object detection processing. Specifically, the recognition-type object detection unit 111 performs object detection using a classifier that has learned the image features of objects for the area (search range) indicated by the search range information.

例えば、オブジェクトが人物の場合には、認識型オブジェクト検出部111は、人物の特徴的な部位(例えば、頭部または上半身)を学習させた識別器を適用し、人物の検出を行う。また、認識型オブジェクト検出部111は、上記識別器として、人物全体を学習させた識別器を用いてもよい。認識型オブジェクト検出部111は、この識別器として、様々なものを用いることができる。例えば、認識型オブジェクト検出部111は、頭部、上半身、および、人物全身等の画像をCNN(Convolutional Neural Network)で学習させて得られる識別器を用いることができる。また、認識型オブジェクト検出部111は、HOG(Histogram Of Gaussian)等の特徴抽出を行い、SVM(Support Vector Machine;サポートベクタマシン)、または、GLVQ(Generalised Learning Vector Quantization;一般化学習ベクトル量子化)等の識別器を用いるようにしてもよい。なお、上記以外でも、認識型オブジェクト検出部111は、既存の様々な認識ベースの検出手法を用いることができる。 For example, when the object is a person, the recognition-type object detection unit 111 detects the person by applying a classifier that has been trained on characteristic parts of the person (e.g., the head or upper body). The recognition-type object detection unit 111 may also use a classifier that has been trained on the entire person as the classifier. The recognition-type object detection unit 111 can use various types of classifiers as this classifier. For example, the recognition-type object detection unit 111 can use a classifier obtained by training images of the head, upper body, and entire body of a person using a CNN (Convolutional Neural Network). The recognition-type object detection unit 111 may also extract features using a Histogram Of Gaussian (HOG) or the like, and use a classifier such as a Support Vector Machine (SVM) or Generalized Learning Vector Quantization (GLVQ). In addition to the above, the recognition-type object detection unit 111 may use various existing recognition-based detection methods.

このように、本実施の形態に係る認識型オブジェクト検出部111は、探索範囲設定部112によって設定された探索範囲内において、物体を検出する。つまり、認識型オブジェクト検出部111は、探索範囲設定部112が前フレームにおける追跡結果を用いて絞り込んだ探索範囲内で、オブジェクト検出を行う。そのため、認識型オブジェクト検出部111は、フレームにおける、オブジェクトが存在する可能性が低い範囲でのオブジェクト検出を行わないため、余分な誤検知を低減できる。また、認識型オブジェクト検出部111は、オブジェクト検出の処理の高速化を図ることができる。 In this manner, the recognition-type object detection unit 111 according to this embodiment detects an object within the search range set by the search range setting unit 112. In other words, the recognition-type object detection unit 111 performs object detection within the search range narrowed down by the search range setting unit 112 using the tracking result in the previous frame. Therefore, the recognition-type object detection unit 111 does not perform object detection in a range in a frame where an object is unlikely to exist, thereby reducing unnecessary false positives. Furthermore, the recognition-type object detection unit 111 can speed up the object detection process.

また、認識型オブジェクト検出部111がオブジェクト検出を行う探索範囲は、探索範囲情報で示される領域だけでなく、背景差分等によって求まるシルエット情報で定まる領域も含まれてもよい。また、認識型オブジェクト検出部111は、シルエット情報で定まる領域とオブジェクト探索範囲情報で指定される領域の共通部分を、オブジェクト検出を実行する領域(探索範囲)としてもよい。 The search range in which the recognition-type object detection unit 111 performs object detection may include not only the area indicated by the search range information, but also an area determined by silhouette information obtained by background difference or the like. The recognition-type object detection unit 111 may also determine the intersection of the area determined by silhouette information and the area specified by the object search range information as the area in which object detection is performed (search range).

そして、認識型オブジェクト検出部111は、オブジェクト検出を行った結果(検出結果)を生成し、該検出結果を共通座標変換部120に出力する。このとき、検出結果に含まれるオブジェクトの座標値は、個別座標系の座標値である。 Then, the recognition-type object detection unit 111 generates the result of the object detection (detection result) and outputs the detection result to the common coordinate transformation unit 120. At this time, the coordinate values of the object included in the detection result are coordinate values in the individual coordinate system.

図4に戻り、検出部100の共通座標変換部120の機能について説明する。共通座標変換部120は、オブジェクト検出部110から、個別座標系で表現された、オブジェクト検出結果を受信する。そして、個別座標変換部130は、受信した検出結果に含まれる個別座標系の座標値を、共通座標系の座標値に変換する。これにより、共通座標変換部120は、個々のカメラ20に対するオブジェクトの検出位置を統合するための情報を生成することができる。 Returning to FIG. 4, the function of the common coordinate transformation unit 120 of the detection unit 100 will be described. The common coordinate transformation unit 120 receives object detection results expressed in individual coordinate systems from the object detection unit 110. The individual coordinate transformation unit 130 then transforms the coordinate values of the individual coordinate systems contained in the received detection results into coordinate values of a common coordinate system. This allows the common coordinate transformation unit 120 to generate information for integrating the detection positions of objects for each camera 20.

具体的には、共通座標変換部120は、共通座標変換部120を備える検出部100に紐付けられたカメラ20のカメラパラメータを用いて、オブジェクト検出結果に含まれる個別座標系の座標値を共通座標系の座標値に変換する。例えば、共通座標変換部120は、カメラ20が撮影したフレーム上でのオブジェクトの下端の座標が(x0,y0)のとき、これを共通座標系の座標である(X0,Y0,0)に変換する。ここで、地面をZ=0の平面としているため、Z軸方向の成分が0となっている。また、オブジェクトの上端の座標が(x1,y1)のとき(ここでは、オブジェクトの上端は、オブジェクトの下端の真上(鉛直方向上方)にあると仮定)、オブジェクトの高さをHとする。このとき、共通座標変換部120は、このオブジェクトの上端の座標(x1,y1)を、共通座標系の座標である(X0,Y0,H)に変換する。なお、共通座標変換部120は、これを満たすHを探索することにより、オブジェクトの高さを求める。このようにして、共通座標変換部120は、検出されたオブジェクト毎に、共通座標系での座標値(X,Y,Z)を求める。 Specifically, the common coordinate conversion unit 120 converts the coordinate values of the individual coordinate system included in the object detection result into coordinate values of the common coordinate system using the camera parameters of the camera 20 linked to the detection unit 100 equipped with the common coordinate conversion unit 120. For example, when the coordinates of the bottom end of the object on the frame captured by the camera 20 are (x0, y0), the common coordinate conversion unit 120 converts this to the coordinates of the common coordinate system (X0, Y0, 0). Here, since the ground is a plane of Z = 0, the component in the Z axis direction is 0. In addition, when the coordinates of the top end of the object are (x1, y1) (here, it is assumed that the top end of the object is directly above (vertically above) the bottom end of the object), the height of the object is H. At this time, the common coordinate conversion unit 120 converts the coordinates (x1, y1) of the top end of this object into the coordinates of the common coordinate system (X0, Y0, H). The common coordinate conversion unit 120 finds the height of the object by searching for H that satisfies this. In this way, the common coordinate transformation unit 120 determines the coordinate values (X, Y, Z) in the common coordinate system for each detected object.

なお、Hが既知の場合、共通座標変換部120は、その既知の値をそのまま用いてもよい。 If H is known, the common coordinate transformation unit 120 may use the known value as is.

共通座標変換部120は、座標変換後の座標値(共通座標系の座標値)を含む検出結果を、統合追跡部200に出力する。つまり、共通座標変換部120は、共通座標系で表現された検出結果を統合追跡部200に出力する。なお、共通座標変換部120は、検出結果に含まれる1または複数のターゲット(オブジェクト)の夫々に対し、シルエット情報および該オブジェクトの外見特徴(色、模様、形状など)の特徴量等の情報を該オブジェクトに関する情報として含めてもよい。そして、共通座標変換部120は、これらの情報を含んだ検出結果を統合追跡部200に出力してもよい。 The common coordinate transformation unit 120 outputs the detection result including the coordinate values after coordinate transformation (coordinate values in the common coordinate system) to the integrated tracking unit 200. In other words, the common coordinate transformation unit 120 outputs the detection result expressed in the common coordinate system to the integrated tracking unit 200. Note that the common coordinate transformation unit 120 may include information about one or more targets (objects) included in the detection result, such as silhouette information and feature quantities of the object's appearance characteristics (color, pattern, shape, etc.), as information about the object. The common coordinate transformation unit 120 may then output the detection result including this information to the integrated tracking unit 200.

(統合追跡部200の詳細)
次に、図6を参照して、統合追跡部200の機能構成についてより詳細に説明する。図6は、本実施の形態に係る物体追跡装置10の統合追跡部200のより詳細な機能構成の一例を示す機能ブロック図である。図6に示す通り、統合追跡部200は、予測部210と、記憶部220と、対応付け部230と、更新部240と、を備えている。なお、本実施の形態における統合追跡部200は、各カメラ20からの映像をカメラ単位で逐次追跡するため、逐次追跡部とも呼ぶ。
(Details of the Integrated Tracking Unit 200)
Next, the functional configuration of the integrated tracking unit 200 will be described in more detail with reference to Fig. 6. Fig. 6 is a functional block diagram showing an example of a more detailed functional configuration of the integrated tracking unit 200 of the object tracking device 10 according to this embodiment. As shown in Fig. 6, the integrated tracking unit 200 includes a prediction unit 210, a storage unit 220, an association unit 230, and an update unit 240. Note that the integrated tracking unit 200 in this embodiment is also called a sequential tracking unit because it sequentially tracks the images from each camera 20 on a camera-by-camera basis.

この統合追跡部200が行う、逐次のオブジェクト追跡(オブジェクトの逐次追跡、逐次統合追跡とも呼ぶ。)について、図7を用いて説明する。図7は、本実施の形態に係る統合追跡部200が行うオブジェクトの逐次追跡処理を説明するための図である。図7には、カメラ数が3つの場合に、カメラA、カメラB、カメラCの夫々で画像を取得するタイミングの一例を示している。図7において、横軸は、時間軸を示しており、右側にいくほど、時間的に後であることを示している。図7に示す通り、カメラAは時間t1、t5およびt8で画像を取得している。同様に、カメラBは、時間t2、t4、t6およびt9で画像を取得し、カメラCは時間t3およびt7で画像を取得している。 The sequential object tracking (also called sequential object tracking or sequential integrated tracking) performed by the integrated tracking unit 200 will be described with reference to FIG. 7. FIG. 7 is a diagram for explaining the sequential object tracking process performed by the integrated tracking unit 200 according to this embodiment. FIG. 7 shows an example of the timing of image acquisition by each of cameras A, B, and C when there are three cameras. In FIG. 7, the horizontal axis indicates the time axis, and the further to the right, the later in time it is. As shown in FIG. 7, camera A acquires images at times t1, t5, and t8. Similarly, camera B acquires images at times t2, t4, t6, and t9, and camera C acquires images at times t3 and t7.

図7に示す通り、各カメラ20で取得されるフレーム(画像)の時間(タイムスタンプ)は、すべてのカメラ20で一致しているとは限らず、通常ばらばらであることが多い。また、フレーム間隔も、カメラ20ごとに異なる場合もあり、また、同じカメラ20でも不均一であることもある。 As shown in FIG. 7, the time (timestamp) of the frame (image) captured by each camera 20 is not necessarily the same for all cameras 20, and is usually often different. The frame interval may also differ for each camera 20, and may also be non-uniform even for the same camera 20.

そして、検出部100がこのカメラ20間で非同期に出力されたカメラ映像から、時間順に検出を行い、検出結果を統合追跡部200に出力する。 Then, the detection unit 100 performs detection in chronological order from the camera images output asynchronously between the cameras 20, and outputs the detection results to the integrated tracking unit 200.

本実施の形態に係る統合追跡部200は、時間的に早い時間の画像から順に、逐次追跡処理を実行する。即ち、図7の場合、統合追跡部200は、まず、カメラAの時間t1の画像に対するオブジェクト検出結果を用いて、複数カメラ間の統合を行い、オブジェクト追跡を行う。それが終わると、統合追跡部200は、続いて、カメラBの時間t2、カメラCの時間t3、カメラBの時間t4、・・・の順に、オブジェクト検出結果を用いて、複数カメラ間の統合を行い、オブジェクト追跡を行う。この際、オブジェクトの全てがどのカメラ20からも見えているわけではないため、統合追跡部200は、カメラ20毎に見えている可能性が高いオブジェクトに対してオブジェクト追跡を行う。 The integrated tracking unit 200 according to this embodiment performs sequential tracking processing in order from the earliest image in time. That is, in the case of FIG. 7, the integrated tracking unit 200 first performs integration between multiple cameras using the object detection results for the image of camera A at time t1, and performs object tracking. After that, the integrated tracking unit 200 then performs integration between multiple cameras using the object detection results in the order of camera B at time t2, camera C at time t3, camera B at time t4, ..., and performs object tracking. At this time, since not all objects are visible from all cameras 20, the integrated tracking unit 200 performs object tracking for objects that are likely to be visible from each camera 20.

図6に戻り、統合追跡部200の各部について説明する。 Returning to Figure 6, we will now explain each part of the integrated tracking unit 200.

記憶部220には、統合追跡部200が受信した検出結果に含まれるオブジェクト(ターゲット)と対応付ける、トラッカーの情報が格納されている。この記憶部220に格納されている、トラッカーの情報は、トラッカーのIDを用いて、更新部240によって管理されている。このトラッカーの情報とは、例えば、トラッカーに追跡結果が含まれるオブジェクトに関する情報、トラッカーの尤度等を含むパラメータ等であるが、本発明はこれに限定されるものではない。オブジェクトに関する情報には、オブジェクトの過去の位置を示す情報、該オブジェクトの運動モデル等が含まれるが本発明はこれに限定されるものではない、オブジェクトに関する情報には、上述したオブジェクト検出結果に含まれる情報が含まれてもよい。 The memory unit 220 stores tracker information that is associated with objects (targets) included in the detection results received by the integrated tracking unit 200. The tracker information stored in the memory unit 220 is managed by the update unit 240 using the tracker ID. The tracker information is, for example, information about an object whose tracking result is included in the tracker, parameters including the tracker's likelihood, etc., but the present invention is not limited to this. The information about the object includes information indicating the object's past position, a motion model of the object, etc., but the present invention is not limited to this, and the information about the object may include information included in the object detection results described above.

なお、図6では、記憶部220が統合追跡部200内に内蔵されることを例に説明を行うが、本発明はこれに限定されるものではない。記憶部220は、統合追跡部200とは、別に、物体追跡装置10内に設けられるものであってもよい。また、記憶部220は、物体追跡装置10とは別個の記憶装置等で実現されるものであってもよい。 In FIG. 6, the memory unit 220 is described as being built into the integrated tracking unit 200, but the present invention is not limited to this. The memory unit 220 may be provided in the object tracking device 10 separately from the integrated tracking unit 200. The memory unit 220 may also be realized by a storage device or the like separate from the object tracking device 10.

記憶部220が統合追跡部200内に内蔵されない場合、記憶部220は、物体追跡装置10内で使用するデータ等を格納する構成であってもよい。例えば、記憶部220には、例えば、カメラ20で撮影したカメラ映像、各カメラ20のカメラパラメータ、各カメラ20で見える共通座標系の座標値の範囲等が格納されていてもよい。 When the memory unit 220 is not built into the integrated tracking unit 200, the memory unit 220 may be configured to store data used in the object tracking device 10. For example, the memory unit 220 may store, for example, camera images captured by the cameras 20, camera parameters of each camera 20, and the range of coordinate values of a common coordinate system visible by each camera 20.

予測部210は、記憶部220を参照し、現フレーム上のオブジェクトの位置を予測する。具体的には、予測部210は、前フレームにおけるオブジェクトの追跡結果(トラッカー)を用いて、該オブジェクトの運動モデルに基づいて、該オブジェクトの現在の位置を予測する。ここで、オブジェクトの位置を示す情報は共通座標系で表現されている。 The prediction unit 210 refers to the storage unit 220 and predicts the position of the object in the current frame. Specifically, the prediction unit 210 predicts the current position of the object based on a motion model of the object, using the tracking result (tracker) of the object in the previous frame. Here, the information indicating the object's position is expressed in a common coordinate system.

また、予測部210が位置の予測に使用するオブジェクトの運動モデルは、記憶部220に格納されているものであってもよいし、予測部210が追跡結果を用いて、オブジェクトの位置の予測を行う前に算出したものであってもよい。 The motion model of the object used by the prediction unit 210 to predict the position may be stored in the memory unit 220, or may be calculated by the prediction unit 210 using the tracking results before predicting the object's position.

予測部210によるオブジェクトの位置の予測には、例えば、カルマンフィルタまたはパーティクルフィルタ等の予測処理を適用することができる。また、予測部210は、単純に、過去数回分の追跡結果からオブジェクトの速度を算出し、等速直線運動を仮定して、前フレームにおける位置からの移動量を速度から予測して該前フレームにおける位置に加算することにより、現在の位置を予測してもよい。 The prediction unit 210 can use prediction processing such as a Kalman filter or a particle filter to predict the object's position. Alternatively, the prediction unit 210 may simply calculate the object's speed from the results of the past few tracking attempts, and, assuming uniform linear motion, predict the amount of movement from the position in the previous frame from the speed and add it to the position in the previous frame to predict the current position.

そして、予測部210は、予測結果を対応付け部230に出力する。 Then, the prediction unit 210 outputs the prediction result to the association unit 230.

対応付け部230は、検出部100の夫々から出力される検出結果を受信する。なお、図6において、検出結果(n)(nは、1~N)は、検出部100-nから出力された検出結果を示している。また、対応付け部230は、予測部210から、予測結果を受信する。そして、対応付け部230は、記憶部220を参照し、上記予測結果を用いて、検出結果に含まれるターゲットと、トラッカーとの対応付けを行う。 The matching unit 230 receives the detection results output from each of the detection units 100. In FIG. 6, detection result (n) (n is 1 to N) indicates the detection result output from the detection unit 100-n. The matching unit 230 also receives the prediction result from the prediction unit 210. The matching unit 230 then refers to the storage unit 220 and uses the prediction result to match the targets included in the detection result with the tracker.

対応付け部230は、対応付け全体として最も確度が高くなる組み合わせを求める。あるターゲットmと、あるトラッカーkが対応付く尤度は、ターゲットmおよびトラッカーkのそれぞれの尤度Pmおよびηkと、両者が同一のオブジェクトである可能性を表す尤度qkmとを掛け合わせたものになる。よって、対応付け部230は、ターゲットおよびトラッカーの各ペアに対してこの値を算出し、全体として最大となる組み合わせを求める。 The matching unit 230 finds the combination that will give the highest accuracy in the overall matching. The likelihood that a certain target m will match a certain tracker k is calculated by multiplying the likelihoods Pm and ηk of the target m and tracker k, respectively, by the likelihood qkm that indicates the possibility that the two are the same object. Therefore, the matching unit 230 calculates this value for each pair of target and tracker, and finds the combination that will give the highest accuracy overall.

ここで、ターゲットの尤度(第1の尤度)は、オブジェクト検出の確からしさ(確度)を表す値である。オブジェクト検出の確度は、検出対象のオブジェクト(検出オブジェクトと呼ぶ)の画面上(フレーム上)における大きさ、カメラ20から、オブジェクトの検出位置までの距離、カメラ20からのオブジェクトの見え方等に依存する。 Here, the target likelihood (first likelihood) is a value that represents the certainty (accuracy) of object detection. The accuracy of object detection depends on the size of the object to be detected (called the detected object) on the screen (on the frame), the distance from the camera 20 to the detection position of the object, how the object appears from the camera 20, etc.

例えば、検出オブジェクトが小さく、該検出オブジェクトのサイズが検出できるサイズの限界に近い場合には、オブジェクト検出の確度は低くなる。また、検出オブジェクトの大きさが、カメラパラメータによって想定されるオブジェクトの見かけの大きさからずれている場合、オブジェクト検出の確度は低くなる。また、オブジェクトの検出位置がカメラ20から離れていたり、オブジェクトの存在する領域に対する照明条件が悪く、オブジェクトが検出されにくい場所であったりする場合には、オブジェクト検出の確度は低くなる。また、識別器の学習に用いたデータと、実際の見え方が大きく異なる場合(例えば、角度が異なるなど)にも、オブジェクト検出の確度は低くなる。 For example, if the detected object is small and the size of the detected object is close to the limit of the size that can be detected, the accuracy of object detection will be low. Also, if the size of the detected object deviates from the apparent size of the object assumed by the camera parameters, the accuracy of object detection will be low. Also, if the detected position of the object is far from the camera 20 or the lighting conditions for the area where the object exists are poor and the object is difficult to detect, the accuracy of object detection will be low. Also, if the data used to train the classifier differs significantly from the actual appearance (for example, the angle is different), the accuracy of object detection will be low.

対応付け部230は、このような特性を反映させて、ターゲットの尤度を算出する。具体的には、対応付け部230は、検出部100から受信した検出結果に含まれる、ターゲットの尤度情報を用いて、ターゲットの尤度を算出する。なお、検出部100がターゲットの尤度を算出し、算出した尤度をターゲットの尤度情報として検出結果に含めている場合、対応付け部230は、このターゲットの尤度情報に含まれる尤度をそのまま用いてもよい。なお、ターゲットの尤度はここに記載したすべての項目を反映させる必要はなく、主要な要因のみを反映させるようにしてもよい。 The matching unit 230 calculates the likelihood of the target by reflecting such characteristics. Specifically, the matching unit 230 calculates the likelihood of the target using the likelihood information of the target included in the detection result received from the detection unit 100. Note that, if the detection unit 100 calculates the likelihood of the target and includes the calculated likelihood in the detection result as the likelihood information of the target, the matching unit 230 may use the likelihood included in this likelihood information of the target as is. Note that the likelihood of the target does not need to reflect all the items described here, and may reflect only the main factors.

トラッカーの尤度(第2の尤度)は、オブジェクト追跡の確からしさ(確度)を表す値である。オブジェクト追跡の確度は、前フレームにおけるオブジェクト追跡の追跡結果に依存して変化する。例えば、現フレームの前の(過去の)フレームまでにおける追跡結果で、ターゲットと確実に対応付いているトラッカーは、オブジェクト追跡の確度が高いと言え、あまり対応づいていないトラッカーは、オブジェクト追跡の確度が低いと言える。よって、対応付け部230は、各フレームにおいて、ターゲットとトラッカーとが対応付いたかどうかの結果に基づいて、尤度を変化させていけばよく、対応付いた場合にトラッカーの尤度を上げ、対応付かなかった場合にトラッカーの尤度を下げるようにすればよい。 The tracker likelihood (second likelihood) is a value that indicates the reliability (accuracy) of object tracking. The accuracy of object tracking changes depending on the tracking result of object tracking in the previous frame. For example, a tracker that is reliably associated with a target in the tracking results up to the previous (past) frame of the current frame can be said to have a high accuracy of object tracking, and a tracker that is not so associated can be said to have a low accuracy of object tracking. Therefore, the association unit 230 can change the likelihood based on the result of whether or not the target and tracker are associated in each frame, and can increase the likelihood of the tracker when there is association, and decrease the likelihood of the tracker when there is no association.

また、この際、トラッカーの位置が、カメラ20から遠い位置にある場合には、このトラッカーの位置の誤差が大きくなると考えられる。その結果、このようなトラッカーは、検出結果に含まれるオブジェクト(ターゲット)と対応付きにくくなる。このため、対応付け部230は、トラッカーの位置とカメラ20との距離に応じて、該トラッカーの尤度を変化させる比率を変更させてもよい。更に対応付け部230は、カメラ20が、トラッカーによって追跡結果が示されるオブジェクトを見たときの、該カメラ20を含む水平面と視線方向とがなす角(俯角または仰角)に応じて、該トラッカーの尤度を変化させる比率を変えてもよい。 In addition, in this case, if the tracker is located far from the camera 20, the error in the tracker's position is likely to be large. As a result, such a tracker is difficult to associate with an object (target) included in the detection result. For this reason, the association unit 230 may change the ratio at which the likelihood of the tracker is changed depending on the distance between the tracker's position and the camera 20. Furthermore, the association unit 230 may change the ratio at which the likelihood of the tracker is changed depending on the angle (depression angle or elevation angle) between the horizontal plane including the camera 20 and the line of sight when the camera 20 sees the object for which the tracking result is indicated by the tracker.

例えば、トラッカーによって追跡結果が示されるオブジェクト(以降、トラッカーのオブジェクトと呼ぶ)がカメラ20から近く、該オブジェクトに対するカメラ20の俯角が所定の角度より大きい場合には、オブジェクトの位置の精度は高い。よって、該トラッカーと、ターゲットとが対応付きやすい。そのため、このような場合、対応付け部230は、トラッカーの尤度を変化させる比率をより大きくする。 For example, if an object whose tracking results are indicated by the tracker (hereinafter referred to as the tracker's object) is close to the camera 20 and the depression angle of the camera 20 with respect to the object is greater than a predetermined angle, the accuracy of the object's position is high. Therefore, the tracker and the target are easily associated. Therefore, in such a case, the association unit 230 increases the ratio at which the tracker's likelihood is changed.

また、例えば、トラッカーのオブジェクトがカメラ20から遠く該オブジェクトに対するカメラ20の俯角が所定の角度より浅い場合、カメラ20が撮影したフレーム上における該オブジェクトのサイズは小さくなる。また、画像上での少しの位置のずれが、実空間上では大きなずれになる。よって、該オブジェクトの検出位置の精度は低くなる可能性が高い。そのため、このような場合、対応付け部230は、トラッカーの尤度を変化させる比率をより小さくする。このようにして、対応付け部230は、トラッカーの尤度を算出する。 For example, if the tracker object is far from the camera 20 and the depression angle of the camera 20 with respect to the object is shallower than a predetermined angle, the size of the object in the frame captured by the camera 20 will be small. Also, a slight positional deviation on the image will result in a large deviation in real space. Therefore, the accuracy of the detected position of the object is likely to be low. Therefore, in such a case, the association unit 230 reduces the ratio at which the tracker likelihood is changed. In this way, the association unit 230 calculates the tracker likelihood.

以上のように、対応付け部230は、トラッカーのオブジェクトに近いカメラ20で検出された検出結果を優先的にトラッカーの尤度に反映できるため、全体として追跡の精度を上げることができる。なお、トラッカーの尤度にはここに記載したすべての項目を反映させる必要はなく、主要な要因のみを反映させるようにしてもよい。 As described above, the association unit 230 can preferentially reflect the detection results detected by the camera 20 that is close to the tracker's object in the tracker's likelihood, thereby improving the overall tracking accuracy. Note that the tracker's likelihood does not need to reflect all of the items described here, and it may be arranged to reflect only the main factors.

また、ターゲットmとトラッカーkと間の同一性を表す尤度qkmは、両者が同一である確度を表している。ターゲットが示すオブジェクトと、トラッカーのオブジェクトとが同一のオブジェクトの場合には、ターゲットとトラッカーのオブジェクトとの位置は近くなる可能性が高い。そのため、対応付け部230は、ターゲットとトラッカーのオブジェクトとの間の距離に応じて尤度を変化させる。つまり、対応付け部230は、ターゲットmとトラッカーkのオブジェクトとの距離が近い場合に、尤度qkmの値をより大きく、距離が離れている場合に尤度qkmの値をより小さくすればよい。 The likelihood qkm, which indicates the identity between target m and tracker k, represents the degree of certainty that the two are identical. If the object indicated by the target and the object of the tracker are the same object, the positions of the target and the object of the tracker are likely to be close to each other. Therefore, the association unit 230 changes the likelihood according to the distance between the target and the object of the tracker. In other words, the association unit 230 should increase the value of the likelihood qkm when the distance between target m and the object of the tracker k is close, and decrease the value of the likelihood qkm when the distance is large.

この際、ターゲットmがカメラ20から離れていたり、カメラ20の該ターゲットmに対する俯角が所定の角度より浅かったりする場合には、ターゲットmの位置の精度が低くなる可能性が高い。よって、対応付け部230は、単純なユークリッド距離を用いた距離の計算ではなく、ターゲットの検出位置に含まれる誤差(曖昧さ)を考慮した、マハラノビス距離を用いて、ターゲットとトラッカーのオブジェクトとの間の距離を求めてもよい。また、対応付け部230は、上記方法の他に、曖昧さを考慮して、距離に応じた尤度qkmの変化の度合いを制御するようにしてもよい。即ち、対応付け部230は、上記曖昧さがより大きい場合には、ターゲットmとトラッカーkのオブジェクトとの間の距離に応じて、尤度qkmの変化をより小さくする。これにより、対応付け部230は、ターゲットの位置ずれが対応付けに与える影響を軽減させる。 In this case, if the target m is far from the camera 20 or the depression angle of the camera 20 with respect to the target m is shallower than a predetermined angle, the accuracy of the position of the target m is likely to be low. Therefore, the matching unit 230 may obtain the distance between the target and the tracker object using the Mahalanobis distance, which takes into account the error (ambiguity) contained in the detected position of the target, instead of calculating the distance using a simple Euclidean distance. In addition to the above method, the matching unit 230 may also control the degree of change in the likelihood qkm according to the distance, taking into account the ambiguity. That is, when the ambiguity is greater, the matching unit 230 reduces the change in the likelihood qkm according to the distance between the target m and the tracker k object. In this way, the matching unit 230 reduces the effect of the target position shift on the matching.

さらに、対応付け部230は、ターゲットおよびトラッカーの外見の類似性も考慮してもよい。即ち、対応付け部230は、ターゲットおよびトラッカーのオブジェクトの色、模様、形状といった特徴を抽出しておき、これらの類似性を評価して、尤度qkmを求めるようにしてもよい。 Furthermore, the matching unit 230 may also take into account the similarity in appearance between the target and the tracker. That is, the matching unit 230 may extract features such as the color, pattern, and shape of the target and tracker objects, evaluate the similarity between them, and obtain the likelihood qkm.

例えば、対応付け部230は、オブジェクトの色ヒストグラムを、ターゲットおよびトラッカーのオブジェクトの両方に対して算出し、これらの類似度を色ヒストグラムの重なり等によって評価し、尤度qkmに反映させてもよい。なお、ターゲットおよびトラッカーの同一性を表す尤度qkmも、トラッカーの尤度ηkおよびターゲットの尤度Pmと同様に、上述した全ての項目を反映させる必要はなく、主要な要因のみを反映させるようにしてもよい。 For example, the matching unit 230 may calculate color histograms of objects for both the target and tracker objects, evaluate the similarity between them based on the overlap of the color histograms, etc., and reflect this in the likelihood qkm. Note that the likelihood qkm representing the identity of the target and tracker, like the tracker likelihood ηk and the target likelihood Pm, does not need to reflect all of the above-mentioned items, and may reflect only the main factors.

また、対応付け部230は、オブジェクトがカメラ20の画角外に出たり、他のオブジェクトに遮蔽されたりして、検出されない場合も考慮して、上記の各尤度を算出してもよい。これにより、統合追跡部200は、オブジェクトが未検出であったり、画角外に出てしまったりする場合であっても、高精度にオブジェクトを追跡することができる。 The matching unit 230 may also calculate each of the above likelihoods taking into consideration cases where an object is not detected because it is outside the angle of view of the camera 20 or is occluded by another object. This allows the integrated tracking unit 200 to track an object with high accuracy even when the object is not detected or is outside the angle of view.

以上のように、各尤度を算出し、全体として各尤度が最大となるターゲットとトラッカーとの対応付けを求める問題は、各尤度を単調非増加関数によってコストに変換して用いることにより、コストが最小となる割当問題(どのターゲットをどのトラッカーに対応付けるか)に帰着できる。この割当問題は、例えば、ハンガリアン法等の手法により、効率的に算出することが可能である。 As described above, the problem of calculating each likelihood and finding the correspondence between targets and trackers that maximizes each likelihood overall can be reduced to an assignment problem (which target is associated with which tracker) that minimizes cost by converting each likelihood into a cost using a monotonically non-increasing function. This assignment problem can be calculated efficiently using a method such as the Hungarian method.

そして、対応付け部230は対応付けの結果を更新部240に出力する。この対応付けの結果には、どのターゲットとトラッカーとが対応付くかを示す情報と、少なくともトラッカーの尤度を含む上記各尤度とが含まれる。 Then, the matching unit 230 outputs the matching result to the update unit 240. This matching result includes information indicating which target and tracker are associated with each other, and each of the likelihoods described above, including at least the tracker likelihood.

なお、本実施の形態において、対応付け部230は、ターゲットの尤度と、トラッカーの尤度との両方の尤度を用いて、対応付けを行ったが、どちらか一方の尤度を用いて対応付けを行ってもよい。 In this embodiment, the matching unit 230 performs matching using both the likelihood of the target and the likelihood of the tracker, but it may also perform matching using only one of the likelihoods.

更新部240は、トラッカーの情報の更新を行う。そして、更新部240は、このトラッカーを新たなオブジェクト追跡結果として生成する。具体的には、更新部240は、対応付け部230から、対応付けの結果を受信する。そして、更新部240は、この結果に基づいて、トラッカーのオブジェクトの現在位置を算出する。そして、更新部240は、記憶部220に格納された該トラッカー情報を更新する。更新を行う情報は、例えば、トラッカーに追跡結果が含まれるオブジェクトの位置および/またはサイズ、該オブジェクトの運動モデル、および、トラッカーの尤度等のパラメータであるが、本発明はこれに限定されるものではない。更新部240は、記憶部220に格納された情報のうち、更新があった情報を更新すればよい。 The update unit 240 updates the tracker information. The update unit 240 then generates this tracker as a new object tracking result. Specifically, the update unit 240 receives the result of the association from the association unit 230. The update unit 240 then calculates the current position of the object of the tracker based on this result. The update unit 240 then updates the tracker information stored in the storage unit 220. The information to be updated is, for example, the position and/or size of the object whose tracking result is included in the tracker, the motion model of the object, and parameters such as the tracker likelihood, but the present invention is not limited to this. The update unit 240 only needs to update the information that has been updated among the information stored in the storage unit 220.

まず、更新部240による、トラッカーのオブジェクトの現在位置の算出について説明する。更新部240は、トラッカーのオブジェクトの現在位置を、ターゲットの位置の精度を考慮して算出する。例えば、更新部240がトラッカーを用いてオブジェクトの位置を予測した予測位置と、該トラッカーに対応付いたターゲットの検出位置とに対し、重みづけを行い、該トラッカーのオブジェクトの現在位置を算出するとする。この場合、更新部240は、ターゲットの位置の確度によって、該重みを制御してもよい。 First, the calculation of the current position of the tracker object by the update unit 240 will be described. The update unit 240 calculates the current position of the tracker object taking into account the accuracy of the target position. For example, the update unit 240 weights the predicted position of the object predicted using the tracker and the detected position of the target associated with the tracker, and calculates the current position of the tracker object. In this case, the update unit 240 may control the weight depending on the accuracy of the target position.

例えば、ターゲットがカメラ20から離れた位置にあり、該カメラ20のターゲットに対する俯角が浅い場合には、このターゲットの位置の精度は低い可能性が高い。このような場合、更新部240は、このターゲットの位置に対する重みをより小さくする。 For example, if a target is located far away from the camera 20 and the depression angle of the camera 20 relative to the target is shallow, the accuracy of the target's position is likely to be low. In such a case, the update unit 240 reduces the weighting of the target's position.

一方、ターゲットがカメラ20に近い位置にあり、該カメラ20ターゲットに対する俯角が所定の値より大きい場合には、このターゲットの位置の精度は高いと想定される。このような場合、更新部240は、このターゲットの位置に対する重みをより大きくする。 On the other hand, if the target is located close to the camera 20 and the depression angle of the camera 20 relative to the target is greater than a predetermined value, the accuracy of the target's position is assumed to be high. In such a case, the update unit 240 assigns a larger weight to the target's position.

更新部240は、予測位置と、重みを設定した位置とを用いて、トラッカーのオブジェクトの現在位置を算出する。 The update unit 240 uses the predicted position and the weighted position to calculate the current position of the tracker object.

このように、更新部240がターゲットの位置に対する重みを決定することで、ターゲットに近いカメラ20による、オブジェクトの検出位置の予測結果がより強く反映されるようになる。したがって、物体追跡装置10は、オブジェクトの位置の予測精度を向上させることができる。 In this way, the update unit 240 determines the weight for the target position, so that the prediction result of the object detection position by the camera 20 that is closer to the target is more strongly reflected. Therefore, the object tracking device 10 can improve the prediction accuracy of the object position.

そして、更新部240は、記憶部220に格納されたオブジェクトに関する情報に含まれる、オブジェクトの最も新しい位置を、算出したオブジェクトの現在位置に更新する。 Then, the update unit 240 updates the most recent position of the object contained in the information about the object stored in the memory unit 220 to the calculated current position of the object.

次に、更新部240が行うトラッカーの尤度の更新について説明する。 Next, we will explain how the update unit 240 updates the tracker likelihood.

トラッカーのオブジェクトがカメラ20から離れた位置にある場合、該オブジェクトの大きさは小さくなる。そのため、検出部100は、このようなオブジェクトを検出し辛くなる。 When a tracker object is located far away from the camera 20, the size of the object becomes smaller. Therefore, it becomes difficult for the detection unit 100 to detect such an object.

また、フレームに含まれるオブジェクトが、学習に用いたオブジェクトの見え方と異なる見え方である場合に、検出部100の認識型オブジェクト検出部111が認識型のオブジェクト検出を行う場合について説明する。フレームに含まれるオブジェクトが、学習に用いたオブジェクトの見え方と異なる見え方である場合とは、例えば、トラッカーのオブジェクトの位置から想定される、該オブジェクトに対するカメラ20の俯角と、学習に用いたオブジェクトに対するカメラ20の俯角と、が大きく異なる場合である。このような場合、検出部100の認識型オブジェクト検出部111は、フレームに含まれるオブジェクトを検出し辛くなる。 The following describes a case where the recognition-type object detection unit 111 of the detection unit 100 performs recognition-type object detection when an object included in a frame looks different from the object used for learning. An example of a case where an object included in a frame looks different from the object used for learning is when the depression angle of the camera 20 relative to the object, which is assumed based on the position of the object on the tracker, is significantly different from the depression angle of the camera 20 relative to the object used for learning. In such a case, it becomes difficult for the recognition-type object detection unit 111 of the detection unit 100 to detect the object included in the frame.

このようなオブジェクトを検出し辛い状況の場合、フレームに含まれるオブジェクトは、未検出となってしまう可能性がある。この場合、このオブジェクトに関連するトラッカーに対応付くターゲットが存在しない可能性がある。 In such a difficult-to-detect situation, an object in the frame may go undetected. In this case, there may be no target associated with the tracker associated with this object.

したがって、更新部240は、ターゲットに関連付いていないトラッカーのうち、オブジェクトが検出されづらい状況にあるオブジェクトのトラッカーの尤度の変化を小さく抑える。 Therefore, the update unit 240 keeps small changes in the likelihood of trackers of objects that are not associated with a target and are in a situation where the object is difficult to detect.

このようにして、更新部240は、オブジェクトが検出されにくい場合の追跡への影響を抑え、検出されやすいカメラでの検出の結果をトラッカーの尤度に大きく反映させることができる。そして、次のフレームに対するオブジェクト追跡の際に、対応付け部230は、このトラッカーの尤度に基づいて、対応付けを行うため、統合追跡部200は、よりオブジェクト追跡の精度を向上させることができる。 In this way, the update unit 240 can reduce the impact on tracking when an object is difficult to detect, and can allow the detection results from a camera where the object is easy to detect to be reflected significantly in the tracker's likelihood. Then, when tracking an object in the next frame, the matching unit 230 performs matching based on the tracker's likelihood, so the integrated tracking unit 200 can further improve the accuracy of object tracking.

そして、記憶部220に格納されたトラッカーの尤度のうち、対応付け部230が算出したトラッカーの尤度と、上記変化を小さく抑えたトラッカーの尤度とを、更新する。 Then, among the tracker likelihoods stored in the memory unit 220, the likelihood of the tracker calculated by the association unit 230 and the likelihood of the tracker that has minimized the above-mentioned change are updated.

次に、更新部240による、トラッカーのオブジェクトの運動モデルの更新について説明する。例えば、統合追跡部200が、カルマンフィルタを用いてオブジェクトの位置を予測することによって、オブジェクト追跡を行う場合について説明する。この場合、更新部240は、ターゲットと対応付いたトラッカーのオブジェクトの位置座標を、検出された位置座標として、記憶部220に格納された、カルマンフィルタの状態変数の更新式に代入し、カルマンフィルタの状態を更新する。 Next, the updating of the motion model of the tracker object by the update unit 240 will be described. For example, a case will be described in which the integrated tracking unit 200 performs object tracking by predicting the object's position using a Kalman filter. In this case, the update unit 240 substitutes the position coordinates of the tracker object associated with the target as the detected position coordinates into the update equation for the state variables of the Kalman filter stored in the memory unit 220, and updates the state of the Kalman filter.

また、上記以外にも更新部240は、記憶部220に格納された、トラッカーのその他のパラメータ等を更新する。 In addition to the above, the update unit 240 also updates other parameters of the tracker stored in the memory unit 220.

例えば、オブジェクト自体が姿勢を変更する場合がある。例えば、オブジェクトが人物の場合には、該人物がしゃがんだり、屈んだりすることにより、該オブジェクトの見かけの高さが変わる。このように、運動モデル以外に、オブジェクトのサイズ等も変更がある場合、更新部240は、記憶部220に格納された情報のうち、この変更があった情報の更新を行う。 For example, the object itself may change its posture. For example, if the object is a person, the apparent height of the object may change when the person crouches or bends. In this way, when there are changes to the size of the object in addition to the motion model, the update unit 240 updates the information stored in the memory unit 220 that has changed.

さらに、トラッカーのパラメータとして、トラッカーのオブジェクトの存在する確率、追跡結果の信頼度を表す重み等が含まれている場合、この重みは対応付け部230による対応付けの結果に応じて変化する。したがって、更新部240は、この重み等のパラメータを更新する。 Furthermore, if the tracker parameters include the probability that the tracker's object exists, a weight indicating the reliability of the tracking result, etc., this weight changes according to the result of the matching by the matching unit 230. Therefore, the update unit 240 updates these parameters such as the weight.

また、更新部240は、トラッカーの更新として、トラッカーの生成、削除を行う。まず、更新部240は、対応付け部230による対応付けの処理後、トラッカーと対応付かないターゲットが存在するか否かを判定する。このトラッカーと対応付かないターゲットは、カメラ20で撮影される範囲内に新たに現れたオブジェクトである可能性がある。そのため、更新部240は、トラッカーと対応付かないターゲットが存在する場合、このターゲットが上記範囲内に新たに表れたオブジェクトとみなせるか否かの判定を行う。 The update unit 240 also creates and deletes trackers as a way of updating the trackers. First, the update unit 240 determines whether or not there is a target that does not correspond to a tracker after the matching process by the matching unit 230. This target that does not correspond to a tracker may be an object that has newly appeared within the range captured by the camera 20. Therefore, when there is a target that does not correspond to a tracker, the update unit 240 determines whether or not this target can be considered as an object that has newly appeared within the above range.

つまり、更新部240は、トラッカーと対応付かないターゲットが存在する場合、このターゲットの存在する確率を評価する。そして、更新部240は、この確率が所定の値以上か否かを判定する。そして、この確率が所定の値以上の場合、更新部240は、このターゲットが示すオブジェクトが、上記範囲内に新たに表れたオブジェクトであると判定する。そして、更新部240は、上記範囲内に新たに表れたオブジェクトと判定したオブジェクト(ターゲット)に関連するトラッカーを新規に作成する。 In other words, when a target that does not correspond to a tracker exists, the update unit 240 evaluates the probability that this target exists. Then, the update unit 240 judges whether this probability is equal to or greater than a predetermined value. Then, when this probability is equal to or greater than the predetermined value, the update unit 240 judges that the object indicated by this target is an object that has newly appeared within the above range. Then, the update unit 240 creates a new tracker associated with the object (target) that has been judged to be an object that has newly appeared within the above range.

また、更新部240は、ターゲットと対応付かないトラッカーが存在するか否かを判定する。このターゲットと対応付かないトラッカーは、カメラ20で撮影される範囲内から消えた(範囲内から範囲外に移動した)オブジェクトに関するトラッカーである可能性がある。そのため、更新部240は、ターゲットと対応付かないトラッカーが存在する場合、このターゲットが上記範囲内から消えたオブジェクトに関するトラッカーとみなせるか否かを判定する。 The update unit 240 also determines whether or not there is a tracker that does not correspond to the target. This tracker that does not correspond to the target may be a tracker related to an object that has disappeared from the range captured by the camera 20 (moved from within the range to outside the range). Therefore, when a tracker that does not correspond to the target exists, the update unit 240 determines whether or not this target can be considered to be a tracker related to an object that has disappeared from the above-mentioned range.

つまり、更新部240は、ターゲットと対応付かないトラッカーが存在する場合、このトラッカーに関するオブジェクトの存在する確率を評価する。そして、更新部240は、この確率が所定の値を下回るかを判定する。そして、この確率が所定の値を下回った場合、更新部240は、このトラッカーに関するオブジェクトが、上記範囲内から消えたオブジェクトであると判定する。そして、更新部240は、上記範囲内から消えたオブジェクトと判定したオブジェクトに関するトラッカーを削除する。 In other words, when a tracker that does not correspond to a target exists, the update unit 240 evaluates the probability that an object related to this tracker exists. Then, the update unit 240 judges whether this probability is below a predetermined value. Then, when this probability is below the predetermined value, the update unit 240 judges that the object related to this tracker is an object that has disappeared from within the above range. Then, the update unit 240 deletes the tracker related to the object that has been judged to be an object that has disappeared from within the above range.

オブジェクトの存在する確率とは、トラッカーの尤度によって求められる。つまり、更新部240は、ターゲットと対応付かないトラッカーが存在する場合、このトラッカーの尤度を減じていく。そして、トラッカーの尤度の値が所定の閾値を下回った場合、更新部240は、該トラッカーを削除するようにする。 The probability that an object exists is determined by the likelihood of the tracker. In other words, if there is a tracker that does not correspond to the target, the update unit 240 reduces the likelihood of this tracker. Then, if the tracker's likelihood value falls below a predetermined threshold, the update unit 240 deletes the tracker.

そして、更新部240は、最終的に残ったトラッカーを、このフレームにおけるオブジェクトの追跡結果として生成する。そして、更新部240は、このうち、トラッカーの位置を示す情報およびトラッカーのオブジェクトの大きさに関する情報等を、オブジェクト追跡の追跡結果を示す情報(追跡情報)として出力する。 The update unit 240 then generates the final remaining tracker as the tracking result of the object in this frame. The update unit 240 then outputs information indicating the position of the tracker and information regarding the size of the object of the tracker as information indicating the tracking result of the object tracking (tracking information).

このように、本実施の形態に係る物体追跡装置10によれば、オブジェクト追跡は、各カメラ20から出力されたカメラ映像に含まれる時間情報が古いものから順に行われる。複数のカメラ20の夫々の映像データから検出されるオブジェクトは、カメラ20毎の確度の高い検出結果を統合し、この検出結果および過去の追跡結果が反映された追跡結果を用いて検出される。そのため、物体追跡装置10の統合追跡部200が行うオブジェクト追跡の追跡精度が向上する。 In this way, according to the object tracking device 10 of this embodiment, object tracking is performed in order of the time information included in the camera images output from each camera 20, starting with the oldest. Objects detected from the video data of each of the multiple cameras 20 are detected by integrating the most accurate detection results from each camera 20 and using tracking results that reflect these detection results and past tracking results. This improves the tracking accuracy of object tracking performed by the integrated tracking unit 200 of the object tracking device 10.

次に、図8を用いて、本実施の形態に係る物体追跡装置10の物体追跡処理の流れについて説明する。図8は、本実施の形態に係る物体追跡装置10の物体追跡処理の流れの一例を示すフローチャートである。 Next, the flow of the object tracking process of the object tracking device 10 according to this embodiment will be described with reference to FIG. 8. FIG. 8 is a flowchart showing an example of the flow of the object tracking process of the object tracking device 10 according to this embodiment.

図8に示す通り、まず、検出部100の認識型オブジェクト検出部111が該オブジェクト検出部110を備える検出部100に紐付けられたカメラ20からのカメラ映像を受信する(ステップS81)。 As shown in FIG. 8, first, the recognition-type object detection unit 111 of the detection unit 100 receives camera images from the camera 20 linked to the detection unit 100 that includes the object detection unit 110 (step S81).

検出部100は、受信したカメラ映像のフレームが、該カメラ20から出力される最初のフレームか否かを確認し(ステップS82)、最初のフレームの場合(ステップS82にてYES)、処理をステップS85に進める。 The detection unit 100 checks whether the received camera video frame is the first frame output from the camera 20 (step S82), and if it is the first frame (YES in step S82), the process proceeds to step S85.

受信したカメラ映像のフレームが最初のフレームではない場合(ステップS82にてNO)、個別座標変換部130が、統合追跡部200から出力される、前フレームに対する追跡情報を、個別座標系で表現された追跡情報に変換する(ステップS83)。 If the received camera image frame is not the first frame (NO in step S82), the individual coordinate conversion unit 130 converts the tracking information for the previous frame output from the integrated tracking unit 200 into tracking information expressed in an individual coordinate system (step S83).

そして、オブジェクト検出部110の探索範囲設定部112がステップS83にて変換された追跡情報を用いて、現フレームに対するオブジェクトの探索範囲を設定する(ステップS84)。 Then, the search range setting unit 112 of the object detection unit 110 uses the tracking information converted in step S83 to set the object search range for the current frame (step S84).

そして、認識型オブジェクト検出部111が、受信したカメラ映像からオブジェクトを検出する(ステップS85)。 Then, the recognition-type object detection unit 111 detects objects from the received camera image (step S85).

次に、個別座標変換部130が、認識型オブジェクト検出部111による検出結果を、共通座標系で表現された検出結果に変換する(ステップS86)。 Next, the individual coordinate conversion unit 130 converts the detection result by the recognition-type object detection unit 111 into a detection result expressed in a common coordinate system (step S86).

次に、統合追跡部200の予測部210が、トラッカーの情報を用いて、現フレーム上のオブジェクトの位置を予測する(ステップS87)。 Next, the prediction unit 210 of the integrated tracking unit 200 uses the tracker information to predict the position of the object in the current frame (step S87).

そして、対応付け部230が、検出結果に含まれるオブジェクト(ターゲット)と、トラッカーとを対応付ける(ステップS88)。 Then, the association unit 230 associates the object (target) included in the detection result with the tracker (step S88).

次に、更新部240がトラッカーのオブジェクトの位置およびオブジェクトの運動モデル等の、トラッカーの情報の更新を行う(ステップS89)。 Next, the update unit 240 updates the tracker information, such as the position of the object in the tracker and the motion model of the object (step S89).

更に、更新部240がトラッカーの生成および/または削除を行う(ステップS90)。そして、物体追跡装置10は、検出部100にフレームが入力されなくなるまで、この処理を繰り返す。 Furthermore, the update unit 240 creates and/or deletes trackers (step S90). Then, the object tracking device 10 repeats this process until no more frames are input to the detection unit 100.

(効果)
以上のように、本実施の形態に係る物体追跡装置10によれば、より高精度に物体を追跡することができる。なぜならば、検出部100が、カメラ20の出力情報から、該出力情報(映像のフレーム)の前の出力情報に対する追跡情報に基づいて、物体を検出するからである。そして、統合追跡部200が、各検出部100が出力した、複数の検出結果に基づいて、物体を追跡し、共通座標系で表現された物体の追跡情報を生成するからである。
(effect)
As described above, the object tracking device 10 according to the present embodiment can track an object with higher accuracy because the detection unit 100 detects an object from the output information of the camera 20 based on tracking information for the output information prior to the output information (video frame).Then, the integrated tracking unit 200 tracks the object based on multiple detection results output by each detection unit 100, and generates tracking information of the object expressed in a common coordinate system.

例えば、あるカメラ20から見えないが、他のカメラ20から見えているオブジェクトがある場合、物体追跡装置10は、あるカメラ20からは見えないオブジェクトに対する追跡結果も、このあるカメラ20の映像におけるオブジェクト検出に用いる。これにより、検出部100は、このあるカメラ20から見える範囲に同じオブジェクトが現れた場合に、このオブジェクトを好適に検出することができる。そのため、物体追跡装置10は、このオブジェクトに対するオブジェクト追跡を精度よく行うことができる。 For example, if there is an object that is not visible from one camera 20 but is visible from another camera 20, the object tracking device 10 uses the tracking results for the object that is not visible from the one camera 20 for object detection in the video of the one camera 20. This allows the detection unit 100 to suitably detect the object when the same object appears within the range visible from the one camera 20. Therefore, the object tracking device 10 can perform object tracking for the object with high accuracy.

したがって、物体追跡装置10は、前のフレームに対する追跡結果を用いない場合に比べ、オブジェクトの検出精度を高めることができる。また、物体追跡装置10は、検出精度が高い検出結果の全てを用いてオブジェクト追跡を行うため、全体として得られる追跡結果の精度も向上する。 Therefore, the object tracking device 10 can improve the object detection accuracy compared to when the tracking results for the previous frame are not used. In addition, since the object tracking device 10 performs object tracking using all detection results with high detection accuracy, the accuracy of the tracking results obtained overall is also improved.

このように、本実施の形態に係る物体追跡装置10は、複数のカメラ20の夫々が撮影している領域をまたがって移動する人物等の動線を抽出することが可能になる。これにより、物体追跡装置10による追跡結果は、例えば、店舗内を回遊する顧客の行動を分析し、マーケティングや店舗のレイアウト変更の基礎情報とすることができる。また、この追跡結果は、セキュリティ目的で、エリア間をうろつく人物を検出に利用することができる。 In this way, the object tracking device 10 according to this embodiment is able to extract the movement paths of people or the like who move across the areas photographed by each of the multiple cameras 20. As a result, the tracking results by the object tracking device 10 can be used, for example, to analyze the behavior of customers moving around a store, and can be used as basic information for marketing or changing the layout of the store. In addition, the tracking results can be used to detect people wandering between areas for security purposes.

また、探索範囲設定部112が追跡結果を用いて、カメラ映像における、オブジェクト検出を行う検索範囲を設定するため、認識型オブジェクト検出部111は、余分な誤検知を低減できる。また、認識型オブジェクト検出部111は、オブジェクト検出の処理の高速化を図ることができる。 In addition, since the search range setting unit 112 uses the tracking results to set a search range for object detection in the camera video, the recognition-type object detection unit 111 can reduce unnecessary false positives. In addition, the recognition-type object detection unit 111 can speed up the object detection process.

また、統合追跡部200が、ターゲットの尤度および/またはトラッカーの尤度を用いて、オブジェクト追跡を行うことにより、物体追跡装置10は、より信頼性の高いオブジェクト追跡結果を得ることができる。また、物体追跡装置10は、このようにして得られたオブジェクト追跡結果を用いて、オブジェクト検索を行うため、よりオブジェクト追跡の精度を高めることができる。これにより、全体として、物体追跡装置10は、オブジェクト追跡の精度を向上させることができる。 In addition, the integrated tracking unit 200 performs object tracking using the likelihood of the target and/or the likelihood of the tracker, which allows the object tracking device 10 to obtain more reliable object tracking results. Furthermore, the object tracking device 10 performs object search using the object tracking results obtained in this manner, which allows the object tracking device 10 to further improve the accuracy of object tracking overall.

<第2の実施の形態>
次に、本発明の第2の実施の形態について、図面を参照して説明する。なお、説明の便宜上、前述した第1の実施の形態で説明した図面に含まれる部材と同じ機能を有する部材については、同じ符号を付し、その説明を省略する。
Second Embodiment
Next, a second embodiment of the present invention will be described with reference to the drawings. For the sake of convenience, the same reference numerals are used for components having the same functions as those included in the drawings described in the first embodiment, and the description thereof will be omitted.

本実施の形態に係る物体追跡システム2は、図2を用いて説明した第1の実施の形態に係る物体追跡システム1の物体追跡装置10の代わりに、物体追跡装置50を備える構成である。物体追跡システム2のその他のシステム構成については、図2に示した物体追跡システム1と同様であるため、説明を省略する。 The object tracking system 2 according to this embodiment is configured to include an object tracking device 50 instead of the object tracking device 10 of the object tracking system 1 according to the first embodiment described with reference to FIG. 2. The other system configurations of the object tracking system 2 are similar to those of the object tracking system 1 shown in FIG. 2, and therefore will not be described.

(物体追跡装置50)
物体追跡装置50の機能について、図9を参照して説明を行う。図9は、本実施の形態に係る物体追跡装置50の機能構成の一例を示す機能ブロック図である。図9に示す通り、物体追跡装置50は、複数の検出部(100-1~100-N)と、統合追跡部200と、表示制御部300とを備えている。なお、上述した第1の実施の形態と同様に本実施の形態では、複数の物体検出部(100-1~100-N)の夫々を区別しない場合、または、総称する場合には、これらを検出部100と呼ぶ。
(Object Tracking Device 50)
The function of the object tracking device 50 will be described with reference to Fig. 9. Fig. 9 is a functional block diagram showing an example of the functional configuration of the object tracking device 50 according to this embodiment. As shown in Fig. 9, the object tracking device 50 includes a plurality of detection units (100-1 to 100-N), an integrated tracking unit 200, and a display control unit 300. In this embodiment, similar to the first embodiment described above, when the plurality of object detection units (100-1 to 100-N) are not distinguished from one another or when they are collectively referred to, they are called detection units 100.

表示制御部300は、表示装置30に表示させる画像(映像)を制御するものである。具体的には、表示制御部300は、統合追跡部200が出力する追跡情報を、表示装置30に表示可能なデータに変換した表示データを生成し、表示装置30に送信する。統合追跡部200が出力する追跡情報は、共通座標系で表現されている。そのため、表示制御部300は、共通座標系で表示装置30に表示可能な表示データを生成する。 The display control unit 300 controls the image (video) to be displayed on the display device 30. Specifically, the display control unit 300 generates display data by converting the tracking information output by the integrated tracking unit 200 into data that can be displayed on the display device 30, and transmits the display data to the display device 30. The tracking information output by the integrated tracking unit 200 is expressed in a common coordinate system. Therefore, the display control unit 300 generates display data that can be displayed on the display device 30 in the common coordinate system.

なお、このとき、統合追跡部200は、表示装置30にオブジェクトの動線を表示するために必要な情報(例えば、トラッカーのオブジェクトの過去の位置を示す情報)を追跡情報として、表示制御部300に出力することが好ましい。この追跡情報は、検出部100にフィードバックする情報と同じであってもよいし、異なるものであってもよい。 At this time, it is preferable that the integrated tracking unit 200 outputs information required to display the object's movement line on the display device 30 (e.g., information indicating the tracker's past positions of the object) as tracking information to the display control unit 300. This tracking information may be the same as the information fed back to the detection unit 100, or it may be different.

そして、表示装置30は、受信した表示データを画面に表示する。これにより、物体追跡装置50は、追跡結果をユーザに提示することができる。 The display device 30 then displays the received display data on the screen. This allows the object tracking device 50 to present the tracking results to the user.

また、本実施の形態に係る物体追跡装置50の検出部100は、オブジェクト検出部110の探索範囲設定部112が設定する探索範囲を、表示装置30に表示可能なデータに変換した表示データを生成し、表示装置30に送信する。探索範囲設定部112が出力する探索範囲情報は、個別座標系で表現されている。したがって、表示制御部300は、探索範囲情報を出力した検出部100に紐付いたカメラ20のカメラパラメータを用いて、個別座標系で表示装置30に表示可能な表示データを生成する。 The detection unit 100 of the object tracking device 50 according to this embodiment generates display data by converting the search range set by the search range setting unit 112 of the object detection unit 110 into data that can be displayed on the display device 30, and transmits the display data to the display device 30. The search range information output by the search range setting unit 112 is expressed in an individual coordinate system. Therefore, the display control unit 300 generates display data that can be displayed on the display device 30 in the individual coordinate system, using the camera parameters of the camera 20 linked to the detection unit 100 that output the search range information.

そして、表示装置30は、受信した表示データを画面に表示する。これにより、物体追跡装置50は、各検出部100から出力された、オブジェクトの探索範囲情報を用いて、該探索範囲をユーザに提示することができる。 The display device 30 then displays the received display data on the screen. This allows the object tracking device 50 to present the search range to the user using the object search range information output from each detection unit 100.

なお、表示装置30は、複数であってもよい。例えば、表示装置30は、共通座標系で表示される表示データと、個別座標系で表示される表示データとを異なる表示装置30で受信して、夫々において、受信した表示データを画面に表示する構成であってもよい。また、表示装置30は、1つの画面の表示領域を分割して、複数の表示データを画面に表示する構成であってもよい。このように、本実施の形態に係る表示装置30における表示データ表示方法は特に限定されない。 Note that there may be multiple display devices 30. For example, the display devices 30 may be configured to receive display data displayed in a common coordinate system and display data displayed in individual coordinate systems at different display devices 30, and each display the received display data on its screen. The display device 30 may also be configured to divide the display area of one screen and display multiple pieces of display data on the screen. In this way, the method of displaying display data in the display device 30 according to this embodiment is not particularly limited.

また、表示制御部300は、検出部100内に夫々備えられる構成であってもよい。図10は、本実施の形態に係る物体追跡装置50の検出部100の機能構成の一例を示す機能ブロック図である。図10に示す通り、検出部100は、オブジェクト検出部110と、共通座標変換部120と、個別座標変換部130と、表示制御部150とを備えている。また、オブジェクト検出部110は、図5に示すオブジェクト検出部110と同様に、認識型オブジェクト検出部111と、探索範囲設定部112とを備えている。 The display control unit 300 may be configured to be provided within the detection unit 100. FIG. 10 is a functional block diagram showing an example of the functional configuration of the detection unit 100 of the object tracking device 50 according to this embodiment. As shown in FIG. 10, the detection unit 100 includes an object detection unit 110, a common coordinate transformation unit 120, an individual coordinate transformation unit 130, and a display control unit 150. Similarly to the object detection unit 110 shown in FIG. 5, the object detection unit 110 includes a recognition-type object detection unit 111 and a search range setting unit 112.

図10に示す探索範囲設定部112は、設定した探索範囲を示す探索範囲情報を表示制御部150に出力する。表示制御部150は、探索範囲設定部112から出力された探索範囲情報を受信し、表示制御部300と同様に、表示装置30に表示可能なデータに変換した表示データを生成する。探索範囲設定部112が出力する探索範囲情報は、個別座標系で表現されている。したがって、表示制御部150は、該表示制御部150を備える検出部100に紐付いたカメラ20のカメラパラメータを用いて、個別座標系で表示装置30に表示可能な表示データを生成する。 The search range setting unit 112 shown in FIG. 10 outputs search range information indicating the set search range to the display control unit 150. The display control unit 150 receives the search range information output from the search range setting unit 112, and generates display data by converting the information into data that can be displayed on the display device 30, similar to the display control unit 300. The search range information output by the search range setting unit 112 is expressed in an individual coordinate system. Therefore, the display control unit 150 generates display data that can be displayed on the display device 30 in the individual coordinate system, using the camera parameters of the camera 20 linked to the detection unit 100 that includes the display control unit 150.

そして、表示制御部150は、生成した表示データを表示装置30に送信する。そして、表示装置30は、受信した表示データを画面に表示する。 The display control unit 150 then transmits the generated display data to the display device 30. The display device 30 then displays the received display data on the screen.

(適用例)
本実施の形態に係る物体追跡装置50の適用例を図11から14を参照して説明する。図11から図14は、本実施の形態に係る物体追跡装置50の適用例を説明するための図である。
(Application example)
Application examples of the object tracking device 50 according to the present embodiment will be described with reference to Figures 11 to 14. Figures 11 to 14 are diagrams for explaining application examples of the object tracking device 50 according to the present embodiment.

まず、図11は、棚R1と棚R2と、複数のカメラ(A~F)が設置された室内を、重力方向とは逆の方向から見た場合の室内の例を示す図である。図11に示す通り、図11の横方向を共通座標系におけるX軸とし、縦方向をY軸としている。棚R1と棚R2とは、長手方向が、Y軸方向と平行になるように、X軸上に並べて設置されている。 First, FIG. 11 is a diagram showing an example of a room in which shelves R1, R2, and multiple cameras (A to F) are installed, viewed from the direction opposite to the direction of gravity. As shown in FIG. 11, the horizontal direction of FIG. 11 is the X-axis in a common coordinate system, and the vertical direction is the Y-axis. Shelves R1 and R2 are installed side by side on the X-axis so that their longitudinal directions are parallel to the Y-axis direction.

カメラAは、この部屋の出入口に近接した位置に設置されている。本実施の形態では、カメラA~Fによって、この室内が、全て撮影されているとみなす。つまり、図11に示す通り、複数のカメラ(A~F)が設置された室内空間は、撮影空間となる。また、カメラA~Fは、互いに共通する場所を撮影している。 Camera A is installed in a position close to the entrance of this room. In this embodiment, it is assumed that the entire room is photographed by cameras A to F. In other words, as shown in FIG. 11, the indoor space in which multiple cameras (A to F) are installed becomes the photographed space. Furthermore, cameras A to F photograph the same locations.

図12は、カメラAとカメラBとの夫々が撮影した映像の一例を示す図である。図12の上側の図は、カメラAで撮影した映像のあるフレームを示す図であり、下側の図は、カメラBで撮影した映像のあるフレームを示す図である。これらのフレームにおける座標値は、カメラ毎の個別座標系の座標値で表現される。 Figure 12 shows an example of images captured by each of camera A and camera B. The upper diagram in Figure 12 shows a frame of an image captured by camera A, and the lower diagram shows a frame of an image captured by camera B. The coordinate values in these frames are expressed as coordinate values in the individual coordinate system for each camera.

なお、本実施の形態における物体追跡装置50は、カメラ20が撮影した映像を、表示装置30に表示する構成であってもよい。 Note that the object tracking device 50 in this embodiment may be configured to display the image captured by the camera 20 on the display device 30.

図12に示す通り、カメラAで撮影した映像には、人物C1が含まれる。また、カメラAは出入口の近辺に設置されているため、この映像に出入口が含まれている。また、カメラBで撮影した映像には、人物C1と人物C2とが含まれる。 As shown in FIG. 12, the image captured by camera A includes person C1. Also, because camera A is installed near the entrance, the image includes the entrance. Also, the image captured by camera B includes person C1 and person C2.

人物C2は、カメラAから見ると、棚R1の陰に隠れている。したがって、図12の映像の時点では、人物C2は、カメラAからは見えないオブジェクトとなっている。仮にこれらの映像のフレームがカメラAおよびカメラBで撮影された映像の最初のフレームの場合、前フレームにおける追跡情報が無いため、物体追跡装置50は、これらのフレームから、オブジェクトを検出し、追跡情報を生成する。 When viewed from camera A, person C2 is hidden behind shelf R1. Therefore, at the time of the image in FIG. 12, person C2 is an object that is not visible to camera A. If these image frames are the first frames of the images captured by cameras A and B, there is no tracking information in the previous frames, so the object tracking device 50 detects the object from these frames and generates tracking information.

そして、探索範囲設定部112は、個別座標系で表現された追跡情報を用いて、カメラAが撮影した映像の、次のフレームに対するオブジェクトの探索範囲を設定する。同様に、探索範囲設定部112は、個別座標系で表現された追跡情報を用いて、カメラBが撮影した映像の、次のフレームに対するオブジェクトの探索範囲を設定する。 Then, the search range setting unit 112 uses the tracking information expressed in the individual coordinate system to set a search range for the object for the next frame of the video captured by camera A. Similarly, the search range setting unit 112 uses the tracking information expressed in the individual coordinate system to set a search range for the object for the next frame of the video captured by camera B.

図13は、表示装置30に表示された探索範囲の一例を示す図である。図13の上側の図は、カメラAから出力されるフレームに対する、オブジェクトの探索範囲の例を示す図であり、下側の図は、カメラBから出力されるフレームに対する、オブジェクトの探索範囲の例を示す図である。 Figure 13 is a diagram showing an example of a search range displayed on the display device 30. The upper diagram in Figure 13 shows an example of a search range for an object for a frame output from camera A, and the lower diagram shows an example of a search range for an object for a frame output from camera B.

図13の上側の図に示す通り、探索範囲設定部112は、図12の上側の図における人物C1の位置から、探索範囲A1を求めている。また、探索範囲設定部112は、室内への出入口部分の領域を探索範囲N1として求めている。また、探索範囲設定部112は、フレームの外縁部を、探索範囲N2およびN3として求めている。そして、探索範囲設定部112は、求めた探索範囲A1、N1~N3をまとめた情報を探索範囲情報として、認識型オブジェクト検出部111および表示制御部150または表示制御部300に出力する。そして、表示制御部150または表示制御部300は、表示装置30にこの探索範囲情報によって示される探索範囲を、画面上に表示可能な表示データに変換し、表示装置30に送信する。 As shown in the upper diagram of FIG. 13, the search range setting unit 112 determines a search range A1 from the position of person C1 in the upper diagram of FIG. 12. The search range setting unit 112 also determines the area of the entrance/exit part to the room as search range N1. The search range setting unit 112 also determines the outer edge of the frame as search ranges N2 and N3. The search range setting unit 112 then outputs information summarizing the determined search ranges A1, N1 to N3 as search range information to the recognition-type object detection unit 111 and the display control unit 150 or the display control unit 300. The display control unit 150 or the display control unit 300 then converts the search range indicated by this search range information on the display device 30 into display data that can be displayed on the screen, and transmits it to the display device 30.

表示制御部150または表示制御部300から表示データを受け取った表示装置30は、図13の上側の図に示すように、画面上に探索範囲を表示する。 The display device 30, which receives display data from the display control unit 150 or the display control unit 300, displays the search range on the screen as shown in the upper diagram of Figure 13.

次に、図13の下側の図について説明する。図13の下側の図に示す通り、探索範囲設定部112は、図12の下側の図における人物C1および人物C2の位置から、夫々、探索範囲B1および探索範囲B2を求めている。また、探索範囲設定部112は、フレームの外縁部を、探索範囲N4~N7して求めている。そして、探索範囲設定部112は、求めた探索範囲B1、B2、N4~N7をまとめた情報を探索範囲情報として、認識型オブジェクト検出部111および表示制御部150または表示制御部300に出力する。そして、表示制御部150または表示制御部300は、表示装置30にこの探索範囲情報によって示される探索範囲を、画面上に表示可能な表示データに変換し、表示装置30に送信する。 Next, the lower diagram of FIG. 13 will be described. As shown in the lower diagram of FIG. 13, the search range setting unit 112 determines search ranges B1 and B2 from the positions of person C1 and person C2 in the lower diagram of FIG. 12, respectively. The search range setting unit 112 also determines the outer edge of the frame as search ranges N4 to N7. The search range setting unit 112 then outputs information summarizing the determined search ranges B1, B2, and N4 to N7 as search range information to the recognition-type object detection unit 111 and the display control unit 150 or the display control unit 300. The display control unit 150 or the display control unit 300 then converts the search range indicated by this search range information on the display device 30 into display data that can be displayed on the screen, and transmits it to the display device 30.

表示制御部150または表示制御部300から表示データを受け取った表示装置30は、図13の下側の図に示すように、画面上に探索範囲を表示する。 The display device 30, which receives display data from the display control unit 150 or the display control unit 300, displays the search range on the screen as shown in the lower diagram of Figure 13.

なお、表示装置30は、探索範囲を、領域毎に異なる様態となるように表示してもよい。例えば、表示装置30は、既に検出されたオブジェクトに対する探索範囲と、フレームの外縁部に対する探索範囲とを、互いに異なる色で表示してもよい。 The display device 30 may display the search range in a different manner for each area. For example, the display device 30 may display the search range for an already detected object and the search range for the outer edge of the frame in different colors.

そして、統合追跡部200が、その後のフレームにおいて検出された、人物C1と人物C2とに関するトラッカーを生成する。そして、統合追跡部200は、人物C1および人物C2の夫々動線を表示するために必要な情報を追跡情報として、表示制御部300に出力する。 Then, the integrated tracking unit 200 generates trackers for the persons C1 and C2 detected in the subsequent frames. The integrated tracking unit 200 then outputs information required to display the respective movement lines of the persons C1 and C2 to the display control unit 300 as tracking information.

統合追跡部200から追跡情報を受け取った表示制御部300は、該追跡情報を表示装置30に表示可能な表示データに変換し、該表示データを表示装置30に送信する。 The display control unit 300 receives the tracking information from the integrated tracking unit 200, converts the tracking information into display data that can be displayed on the display device 30, and transmits the display data to the display device 30.

そして、表示装置30は、表示制御部300から受信した表示データを画面に表示する。図14は、表示装置30が、人物C1および人物C2の夫々の追跡結果を示した動線を画面(表示画面)に表示した際の例を示す図である。図14に示す通り、本適用例では、表示画面には、共通座標系におけるXY平面でオブジェクトの追跡結果が表示されるものとする。図14では、人物C1の動線が実線で、人物C2の動線が一点鎖線で表示される。このように、表示装置30は、オブジェクトの追跡結果を画面に表示することができる。 Then, the display device 30 displays the display data received from the display control unit 300 on the screen. FIG. 14 is a diagram showing an example in which the display device 30 displays on a screen (display screen) the movement lines showing the respective tracking results of person C1 and person C2. As shown in FIG. 14, in this application example, the display screen displays the tracking results of the objects on the XY plane in the common coordinate system. In FIG. 14, the movement line of person C1 is displayed as a solid line, and the movement line of person C2 is displayed as a dashed line. In this way, the display device 30 can display the tracking results of the objects on the screen.

<第3の実施の形態>
次に、本発明の第3の実施の形態について、図面を参照して説明する。なお、説明の便宜上、前述した第1および第2の実施の形態で説明した図面に含まれる部材と同じ機能を有する部材については、同じ符号を付し、その説明を省略する。
Third Embodiment
Next, a third embodiment of the present invention will be described with reference to the drawings. For the sake of convenience, the same reference numerals are used to designate components having the same functions as those in the drawings described in the first and second embodiments, and the description thereof will be omitted.

本実施の形態に係る物体追跡装置10は、図1に示した物体追跡装置10の検出部100の代わりに、検出部400を備える構成である。この検出部400の構成について、図15を参照して説明を行う。図15は、本実施の形態に係る物体追跡装置10の検出部400の機能構成の一例を示す機能ブロック図である。 The object tracking device 10 according to this embodiment is configured to include a detection unit 400 instead of the detection unit 100 of the object tracking device 10 shown in FIG. 1. The configuration of this detection unit 400 will be described with reference to FIG. 15. FIG. 15 is a functional block diagram showing an example of the functional configuration of the detection unit 400 of the object tracking device 10 according to this embodiment.

検出部400は、図4および図5に示す検出部100のオブジェクト検出部110に代えて、オブジェクト検出部140を備える。また、検出部400は、記憶部160を更に備える構成である。つまり、本実施の形態に係る検出部400は、図15に示す通り、オブジェクト検出部140と、共通座標変換部120と、個別座標変換部130と、記憶部160とを備える。 The detection unit 400 includes an object detection unit 140 instead of the object detection unit 110 of the detection unit 100 shown in Figs. 4 and 5. The detection unit 400 also includes a storage unit 160. That is, the detection unit 400 according to this embodiment includes the object detection unit 140, the common coordinate transformation unit 120, the individual coordinate transformation unit 130, and the storage unit 160, as shown in Fig. 15.

本実施の形態では、第1の実施の形態に係る物体追跡装置10の検出部100のオブジェクト検出部110の代わりに、オブジェクト検出部140を備える構成を例に説明を行う。なお、本発明はこれに限定さえるものではなく、第2の実施の形態に係る物体追跡装置50の検出部100のオブジェクト検出部110の代わりにオブジェクト検出部140を備える構成であってもよい。つまり、本実施の形態に係る検出部100は、表示制御部150または表示制御部300に表示対象となるデータを出力する構成であってもよい。 In this embodiment, an example is described in which an object detection unit 140 is provided instead of the object detection unit 110 of the detection unit 100 of the object tracking device 10 according to the first embodiment. Note that the present invention is not limited to this, and the object tracking device 50 according to the second embodiment may be provided with an object detection unit 140 instead of the object detection unit 110 of the detection unit 100. In other words, the detection unit 100 according to this embodiment may be configured to output data to be displayed to the display control unit 150 or the display control unit 300.

記憶部160には、座標系の変換の際に使用される、カメラ20毎のカメラパラメータが格納されている。更に、記憶部160には、個別座標変換部130が、追跡情報に含まれる共通座標系の座標値が紐付けられたカメラ20で撮影される範囲に含まれるか否かを確認する際に使用する共通座標系の座標値の範囲を示す情報が格納されている。また、記憶部160には、カメラ20で撮影した映像が格納されてもよい。なお、この映像は一時的に格納されるものであってもよい。 The storage unit 160 stores camera parameters for each camera 20 that are used when converting the coordinate system. Furthermore, the storage unit 160 stores information indicating the range of coordinate values in the common coordinate system that the individual coordinate conversion unit 130 uses when checking whether or not the coordinate values in the common coordinate system included in the tracking information are included in the range captured by the linked camera 20. The storage unit 160 may also store video captured by the camera 20. Note that this video may be stored temporarily.

なお、図15では、記憶部160が検出部400内に内蔵されることを例に説明を行うが、本発明はこれに限定されるものではない。記憶部160は、検出部400とは、別に、物体追跡装置10内に設けられるものであってもよい。また、記憶部160は、物体追跡装置10とは別個の記憶装置等で実現されるものであってもよい。 In FIG. 15, the memory unit 160 is described as being built into the detection unit 400, but the present invention is not limited to this. The memory unit 160 may be provided in the object tracking device 10 separately from the detection unit 400. The memory unit 160 may also be realized by a storage device or the like separate from the object tracking device 10.

次に、検出部400のオブジェクト検出部140の詳細な機能構成について、図16を参照して説明する。図16は、本実施の形態に係る検出部400のオブジェクト検出部140の機能構成の一例を示す機能ブロック図である。図16に示す通り、オブジェクト検出部140は、認識型オブジェクト検出部(第1の物体検出手段)141と、非認識型オブジェクト検出部(第2の物体検出手段)142と、検出パラメータ更新部143と、検出結果統合部144とを備えている。 Next, the detailed functional configuration of the object detection unit 140 of the detection unit 400 will be described with reference to FIG. 16. FIG. 16 is a functional block diagram showing an example of the functional configuration of the object detection unit 140 of the detection unit 400 according to this embodiment. As shown in FIG. 16, the object detection unit 140 includes a recognition-type object detection unit (first object detection means) 141, a non-recognition-type object detection unit (second object detection means) 142, a detection parameter update unit 143, and a detection result integration unit 144.

本実施の形態では、辞書(識別器)等を用いたオブジェクト検出を「認識型オブジェクト検出」と呼ぶ。一方、識別器等を用いないオブジェクト検出を、「非認識型オブジェクト検出」と呼ぶ。 In this embodiment, object detection using a dictionary (classifier) or the like is called "recognition-based object detection." On the other hand, object detection without using a classifier or the like is called "non-recognition-based object detection."

認識型オブジェクト検出部141は、認識型オブジェクト検出部141に入力されるカメラ映像からオブジェクトを検出する。認識型オブジェクト検出部141は、フレーム全体に対してオブジェクトの検出を行う。なお、認識型オブジェクト検出部141は、図16に破線で示す通り、後述する検出パラメータ更新部143から出力される探索範囲情報に基づいて、オブジェクト検出を行ってもよい。このとき、認識型オブジェクト検出部141は、第1の実施の形態において説明した認識型オブジェクト検出部111と同様の方法で、オブジェクト検出を行う。 The recognition-type object detection unit 141 detects objects from the camera image input to the recognition-type object detection unit 141. The recognition-type object detection unit 141 detects objects in the entire frame. Note that, as shown by the dashed line in FIG. 16, the recognition-type object detection unit 141 may perform object detection based on search range information output from the detection parameter update unit 143 described later. At this time, the recognition-type object detection unit 141 performs object detection in the same manner as the recognition-type object detection unit 111 described in the first embodiment.

また、認識型オブジェクト検出部141は、探索範囲情報が検出パラメータ更新部143から出力されないとき、フレーム全体に対してオブジェクト検出を行うのではなく、別の基準を用いて、オブジェクト検出を行ってもよい。例えば、認識型オブジェクト検出部141は、シルエット情報を利用して、シルエットがある領域とその周囲の領域に対してのみオブジェクトの検出を行ってもよい。 In addition, when search range information is not output from the detection parameter update unit 143, the recognition-type object detection unit 141 may perform object detection using a different criterion rather than performing object detection on the entire frame. For example, the recognition-type object detection unit 141 may use silhouette information to perform object detection only on the area where the silhouette is located and the area surrounding it.

認識型オブジェクト検出部141は、オブジェクト検出の検出結果を第1の検出結果として、検出結果統合部144に出力する。 The recognition-type object detection unit 141 outputs the detection result of the object detection to the detection result integration unit 144 as a first detection result.

また、認識型オブジェクト検出部141は、後述する非認識型オブジェクト検出部142によるオブジェクト検出に備えて、この時点で、オブジェクトの外見特徴を抽出してもよい。オブジェクトの外見特徴としては、オブジェクトの色、模様、形状などの情報が挙げられるが本発明はこれに限定されるものではない。認識型オブジェクト検出部141は、オブジェクトの外見特徴としてこれらの特徴量を抽出する。この際、認識型オブジェクト検出部141によるオブジェクト検出で用いる領域と、非認識型オブジェクト検出部142によるオブジェクト検出で用いる領域とは同一でなくてもよい。例えば、オブジェクトが人物の場合、認識型オブジェクト検出部141によるオブジェクト検出では、頭部を検出し、非認識型オブジェクト検出部142によるオブジェクト検出では、服の領域までを検出するとする。このとき認識型オブジェクト検出部141は、該服の領域を含むように、オブジェクトの外見特徴の特徴量を抽出する。そして、認識型オブジェクト検出部141は、抽出された特徴量をテンプレート情報として、抽出に用いた領域を示す情報(抽出領域情報)とともに出力してもよい。また、認識型オブジェクト検出部141は、特徴量自体を認識型オブジェクト検出部141内部で保持しておき、その特徴量を識別するための情報のみを出力してもよい。 In addition, the recognition object detection unit 141 may extract the appearance features of the object at this point in preparation for object detection by the non-recognition object detection unit 142 described later. The appearance features of the object include information such as the color, pattern, and shape of the object, but the present invention is not limited to this. The recognition object detection unit 141 extracts these features as the appearance features of the object. At this time, the area used in the object detection by the recognition object detection unit 141 and the area used in the object detection by the non-recognition object detection unit 142 may not be the same. For example, if the object is a person, the head is detected in the object detection by the recognition object detection unit 141, and the clothing area is detected in the object detection by the non-recognition object detection unit 142. At this time, the recognition object detection unit 141 extracts the feature values of the appearance features of the object so as to include the clothing area. Then, the recognition object detection unit 141 may output the extracted feature values as template information together with information indicating the area used for extraction (extraction area information). Additionally, the recognition-type object detection unit 141 may store the feature amount itself within the recognition-type object detection unit 141 and output only the information for identifying the feature amount.

検出パラメータ更新部143は、個別座標変換部130から、個別座標系で表現された追跡情報を受信する。そして、検出パラメータ更新部143は、この追跡情報を用いて、オブジェクト検出に必要なパラメータ(検出パラメータと呼ぶ)を求める。この検出パラメータは、オブジェクト検出処理で必要となるパラメータ類である。検出パラメータには、例えば、オブジェクトの現フレームにおける予測位置(予測領域)、オブジェクト検出を適用する探索範囲、テンプレートマッチングに用いるテンプレートのサイズ、以前にトラッカーに対応付いたターゲットのテンプレートの特徴量(テンプレート情報)等が含まれる。なお、検出パラメータには、これら全ての情報が含まれていなくてもよく、非認識型オブジェクト検出部142によるオブジェクト検出に必要なパラメータが含まれていればよい。また、検出パラメータには、前フレームにおけるオブジェクトの追跡結果でトラッカーと対応づいたターゲットの情報が含まれてもよい。 The detection parameter update unit 143 receives tracking information expressed in the individual coordinate system from the individual coordinate transformation unit 130. The detection parameter update unit 143 then uses this tracking information to determine parameters (called detection parameters) necessary for object detection. These detection parameters are parameters required for object detection processing. The detection parameters include, for example, a predicted position (prediction area) of the object in the current frame, a search range to which object detection is applied, the size of the template used in template matching, and the feature amount (template information) of the template of the target previously associated with the tracker. Note that the detection parameters do not need to include all of this information, and only need to include parameters necessary for object detection by the non-recognition type object detection unit 142. The detection parameters may also include information on the target associated with the tracker in the object tracking result in the previous frame.

例えば、検出パラメータ更新部143は、前フレームで検出され、トラッカーに対応付けられたターゲット(オブジェクト)に対して、該オブジェクトの追跡情報に基づいて、現フレームにおけるオブジェクトが存在する位置を予測位置として求める。この予測処理は、第1の実施の形態に係る探索範囲設定部112における予測位置の予測処理と同様である。なお、検出パラメータ更新部143は、この予測位置を含む領域を予測領域として求めてもよい。 For example, for a target (object) detected in the previous frame and associated with a tracker, the detection parameter update unit 143 determines the position where the object exists in the current frame as a predicted position based on the tracking information of the object. This prediction process is similar to the prediction process of the predicted position in the search range setting unit 112 according to the first embodiment. Note that the detection parameter update unit 143 may determine an area including this predicted position as a predicted area.

また、例えば、検出パラメータ更新部143は、上記予測領域を中心として、テンプレートマッチングによるオブジェクト検出を適用する範囲を求め、この範囲を検出パラメータに含まれるオブジェクトの探索範囲として含めてもよい。 Also, for example, the detection parameter update unit 143 may determine a range in which object detection using template matching is applied, centered on the prediction area, and include this range as a search range for objects included in the detection parameters.

検出パラメータ更新部143は、上記検出パラメータを、追跡情報に含まれる各オブジェクトに対して求める。そして、検出パラメータ更新部143は、求めた検出パラメータを、オブジェクト検出処理に用いる検出パラメータとして更新する。そして、検出パラメータ更新部143は、この検出パラメータを非認識型オブジェクト検出部142に出力する。 The detection parameter update unit 143 obtains the above detection parameters for each object included in the tracking information. The detection parameter update unit 143 then updates the obtained detection parameters as detection parameters to be used in the object detection process. The detection parameter update unit 143 then outputs the detection parameters to the non-recognized object detection unit 142.

なお、検出パラメータ更新部143は、上述した第1の実施の形態に係る検出部100の探索範囲設定部112と同様に、個別座標系の座標値に変換された追跡情報を用いて、オブジェクトの探索範囲を求めてもよい。そして、検出パラメータ更新部143は、求めたオブジェクトの探索範囲を示す探索範囲情報を、認識型オブジェクト検出部141に出力してもよい。 The detection parameter update unit 143 may determine the search range of the object using tracking information converted into coordinate values in an individual coordinate system, similar to the search range setting unit 112 of the detection unit 100 according to the first embodiment described above. Then, the detection parameter update unit 143 may output search range information indicating the determined search range of the object to the recognition-type object detection unit 141.

非認識型オブジェクト検出部142は、検出パラメータ更新部143から、検出パラメータを受信する。そして、非認識型オブジェクト検出部142は、受信した検出パラメータに基づいて、非認識型オブジェクト検出部142に入力されるカメラ映像からオブジェクトを検出する。この非認識型オブジェクト検出部142は、認識型オブジェクト検出部141とは異なり、前のフレームにおいて検出されたオブジェクトの外見の類似性に基づいてオブジェクトの検出を行う。 The non-recognizable object detection unit 142 receives detection parameters from the detection parameter update unit 143. Then, based on the received detection parameters, the non-recognizable object detection unit 142 detects objects from the camera video input to the non-recognizable object detection unit 142. Unlike the recognition object detection unit 141, this non-recognizable object detection unit 142 detects objects based on the similarity of the appearance of an object detected in the previous frame.

即ち、非認識型オブジェクト検出部142は、前のフレームにおいて、オブジェクトが検出された際、その領域の画像特徴(または検出領域の部分画像そのものでもよい)をテンプレートとして記憶しておく。そして、非認識型オブジェクト検出部142は、この記憶したテンプレートと類似する領域が現フレームに存在するかどうかをテンプレートマッチングにより調べることによって、オブジェクト検出を行う。この際に用いる画像の特徴としては、例えば、色のパターンおよび分布に関する情報、エッジおよび輝度勾配の分布情報、あるいは、これらを組み合わせてできる特徴等を用いることができる。 That is, when an object is detected in the previous frame, the non-recognition type object detection unit 142 stores the image features of that area (or the partial image of the detected area itself) as a template. The non-recognition type object detection unit 142 then performs object detection by checking, by template matching, whether an area similar to this stored template exists in the current frame. The image features used in this case may be, for example, information on color patterns and distribution, distribution information on edges and brightness gradients, or features that combine these.

非認識型オブジェクト検出部142におけるオブジェクト検出を行う際に使用する検出パラメータは、検出パラメータ更新部143から出力される検出パラメータによって制御される。具体的には、非認識型オブジェクト検出部142は、検出パラメータ更新部143によって予測された、オブジェクトの予測位置(予測領域)およびその近辺に対してテンプレートマッチングによるオブジェクト検出を行う。即ち、非認識型オブジェクト検出部142は、予測されるオブジェクト存在範囲(予測領域)を中心として、テンプレートマッチングの探索範囲を設定し、その周辺に対してテンプレートマッチングを行う。また、この際、非認識型オブジェクト検出部142は、オブジェクトの位置の移動によってオブジェクトの見かけの大きさが変化することも考慮してもよい。この変化は、カメラパラメータを用いることによって算出可能である。そのため、非認識型オブジェクト検出部142は、オブジェクトの大きさの変化を計算し、テンプレートに反映させてからテンプレートマッチングを行うようにしてもよい。 The detection parameters used when detecting an object in the non-recognized object detection unit 142 are controlled by the detection parameters output from the detection parameter update unit 143. Specifically, the non-recognized object detection unit 142 performs object detection by template matching on the predicted position (prediction area) of the object predicted by the detection parameter update unit 143 and its vicinity. That is, the non-recognized object detection unit 142 sets a search range for template matching centered on the predicted object existence range (prediction area) and performs template matching on the periphery. In addition, at this time, the non-recognized object detection unit 142 may also take into consideration that the apparent size of the object changes due to the movement of the object's position. This change can be calculated by using the camera parameters. Therefore, the non-recognized object detection unit 142 may calculate the change in the size of the object and reflect it in the template before performing template matching.

また、非認識型オブジェクト検出部142がテンプレートマッチングを行うテンプレートの情報は、前のフレームにおけるオブジェクト検出処理において、認識型オブジェクト検出部141が抽出した特徴量であってもよい。 In addition, the template information used by the non-recognition-type object detection unit 142 to perform template matching may be features extracted by the recognition-type object detection unit 141 in the object detection process in the previous frame.

このように、非認識型オブジェクト検出部142は、統合追跡部200によって追跡された物体に対する追跡結果に基づいて、オブジェクト検出を行うため、上記追跡結果を用いない場合に比べ、検出の精度を向上させることができる。 In this way, the non-recognition type object detection unit 142 performs object detection based on the tracking results for the object tracked by the integrated tracking unit 200, and therefore the detection accuracy can be improved compared to when the tracking results are not used.

そして、非認識型オブジェクト検出部142は、オブジェクト検出の検出結果を第2の検出結果として、検出結果統合部144に出力する。 Then, the non-recognition type object detection unit 142 outputs the detection result of the object detection as a second detection result to the detection result integration unit 144.

検出結果統合部144は、認識型オブジェクト検出部141から第1の検出結果を受信する。また、検出結果統合部144は、非認識型オブジェクト検出部142から第2の検出結果を受信する。そして、検出結果統合部144は、第1の検出結果と、第2の検出結果とを統合する。そして、検出結果統合部144は、統合した結果をオブジェクト検出部140におけるオブジェクト検出の検出結果として、共通座標変換部120に出力する。 The detection result integration unit 144 receives a first detection result from the recognition-type object detection unit 141. The detection result integration unit 144 also receives a second detection result from the non-recognition-type object detection unit 142. The detection result integration unit 144 then integrates the first detection result and the second detection result. The detection result integration unit 144 then outputs the integrated result to the common coordinate transformation unit 120 as the detection result of the object detection in the object detection unit 140.

第1の検出結果および第2の検出結果の両方に含まれているオブジェクトと、どちらか一方のみに含まれているオブジェクトとが存在する場合がある。そのため、検出結果統合部144は、第1の検出結果と第2の検出結果とのそれぞれに含まれるオブジェクト同士の対応付けを行い、統合する。この対応付けには、例えば、オブジェクト領域の重なりの度合いを用いることができる。 There may be objects that are included in both the first and second detection results, and objects that are included in only one of them. Therefore, the detection result integration unit 144 associates and integrates the objects that are included in the first and second detection results. For example, the degree of overlap of the object regions can be used for this association.

即ち、検出結果統合部144は、オブジェクト領域同士の重なり比率(例えば、オブジェクト外接矩形の重なり比率)を算出し、これが所定の値より大きくなる場合に第1の検出結果に含まれるオブジェクトと、第2の検出結果に含まれるオブジェクトとを対応付ける。 That is, the detection result integration unit 144 calculates the overlap ratio between object regions (for example, the overlap ratio of object circumscribing rectangles), and if this is greater than a predetermined value, it associates the object included in the first detection result with the object included in the second detection result.

また、検出結果統合部144は、オブジェクト間の領域の重なり比率を重みとするグラフ問題として定式化し、オブジェクト間の対応付けを行ってもよい。例えば、検出結果統合部144は、重なり比率を単調非増加関数によってコストに変換したのち、ハンガリアン法等を用いて、最適な対応付けを計算することにより、オブジェクト間の対応付けを行う。 The detection result integration unit 144 may also formulate the problem as a graph problem in which the overlap ratio of the areas between the objects is used as a weight, and perform correspondence between the objects. For example, the detection result integration unit 144 converts the overlap ratio into a cost using a monotonically non-increasing function, and then performs correspondence between the objects by calculating the optimal correspondence using the Hungarian method or the like.

検出結果統合部144は、対応付けを行った結果、対応付けの際に用いた値(例えば、重なり比率またはコスト)が、所定の値より大きいものはこの時点でマージしてもよい。また、検出結果統合部144は、この時点ではマージせず、対応づくという情報を生成してもよい。そして、検出結果統合部144は、第1の検出結果と第2の検出結果とを合わせた検出結果に、該対応付くという情報を付随させた結果をオブジェクト検出部140の検出結果として出力し、統合追跡時に対応付けの情報を用いて追跡を行うようにしてもよい。 The detection result integration unit 144 may merge at this point those results for which the value used in the matching (e.g., overlap ratio or cost) is greater than a predetermined value. Alternatively, the detection result integration unit 144 may not merge at this point, but may generate information indicating that the results are matched. The detection result integration unit 144 may then output the detection result obtained by combining the first detection result and the second detection result with the information indicating that the results are matched as the detection result of the object detection unit 140, and may use the information regarding the match during integrated tracking.

また、非認識型オブジェクト検出部142は、前フレームに対するオブジェクトの追跡結果に基づいて、第2の検出結果を出力する。このため、この第2の検出結果の方が、第1の検出結果よりも遅れて生成される場合がある。このような場合には、検出結果統合部144は、第1の検出結果を、一旦、検出結果統合部144内のバッファ等の記憶手段または記憶部160に蓄えておく。そして、検出結果統合部144は、該第1の検出結果を生成する対象となるフレームに対応するフレームに対する第2の検出結果を受信した時点で、両結果を統合してもよい。 The non-recognition type object detection unit 142 also outputs a second detection result based on the object tracking result for the previous frame. For this reason, the second detection result may be generated later than the first detection result. In such a case, the detection result integration unit 144 temporarily stores the first detection result in a storage means such as a buffer within the detection result integration unit 144 or in the storage unit 160. Then, the detection result integration unit 144 may integrate both results when it receives the second detection result for the frame corresponding to the frame for which the first detection result is generated.

以上のように、本実施の形態に係る物体追跡装置10の検出部400は、認識型オブジェクト検出部141によるオブジェクト検出の結果(第1の検出結果)と、非認識型オブジェクト検出部142によるオブジェクト検出の結果(第2の検出結果)とを統合した結果を、検出結果として出力する。このとき、非認識型オブジェクト検出部142は、統合追跡部200によって追跡された物体に対する追跡結果に基づいて、テンプレートマッチングを行うことにより、オブジェクトを検出する。これにより、検出部400は、オブジェクトを識別することによるオブジェクト検出(認識型オブジェクト検出)のみを行う場合に比べ、よりオブジェクト検出の精度をより向上させることができる。 As described above, the detection unit 400 of the object tracking device 10 according to this embodiment outputs the integrated result of the object detection by the recognition object detection unit 141 (first detection result) and the object detection by the non-recognition object detection unit 142 (second detection result) as the detection result. At this time, the non-recognition object detection unit 142 detects the object by performing template matching based on the tracking result for the object tracked by the integrated tracking unit 200. This allows the detection unit 400 to further improve the accuracy of object detection compared to the case where only object detection by identifying the object (recognition object detection) is performed.

したがって、物体追跡装置10は、より高精度にオブジェクトの追跡を行うことができる。 Therefore, the object tracking device 10 can track objects with higher accuracy.

<第4の実施の形態>
次に、本発明の第4の実施の形態について、図面を参照して説明する。なお、説明の便宜上、前述した各実施の形態で説明した図面に含まれる部材と同じ機能を有する部材については、同じ符号を付し、その説明を省略する。
<Fourth embodiment>
Next, a fourth embodiment of the present invention will be described with reference to the drawings. For the sake of convenience, the same reference numerals are used to designate components having the same functions as those in the drawings described in the above-mentioned embodiments, and the description thereof will be omitted.

本実施の形態に係る物体追跡装置10は、図1に示した物体追跡装置10の統合追跡部200代わりに、統合追跡部500を備える構成である。この統合追跡部500の構成について、図17を参照して説明を行う。図17は、本実施の形態に係る物体追跡装置10の統合追跡部500の機能構成の一例を示す機能ブロック図である。図17に示す通り、統合追跡部500は、バッファ部510と、予測部210と、記憶部220と、対応付け部530と、更新部240と、を備えている。 The object tracking device 10 according to this embodiment is configured to include an integrated tracking unit 500 instead of the integrated tracking unit 200 of the object tracking device 10 shown in FIG. 1. The configuration of this integrated tracking unit 500 will be described with reference to FIG. 17. FIG. 17 is a functional block diagram showing an example of the functional configuration of the integrated tracking unit 500 of the object tracking device 10 according to this embodiment. As shown in FIG. 17, the integrated tracking unit 500 includes a buffer unit 510, a prediction unit 210, a memory unit 220, an association unit 530, and an update unit 240.

本実施の形態では、第1の実施の形態に係る物体追跡装置10の統合追跡部200の代わりに、統合追跡部500を備える構成を例に説明を行う。なお、本発明はこれに限定さえるものではなく、第2の実施の形態に係る物体追跡装置50の統合追跡部200の代わりに統合追跡部500を備える構成であってもよい。つまり、本実施の形態に係る統合追跡部500は、表示制御部300に表示対象となるデータを出力する構成であってもよい。 In this embodiment, an example of a configuration in which an integrated tracking unit 500 is provided instead of the integrated tracking unit 200 of the object tracking device 10 according to the first embodiment will be described. Note that the present invention is not limited to this, and the object tracking device 50 according to the second embodiment may be provided with an integrated tracking unit 500 instead of the integrated tracking unit 200. In other words, the integrated tracking unit 500 according to this embodiment may be configured to output data to be displayed to the display control unit 300.

また、本実施の形態に係る統合追跡部500に検出結果を出力する検出部は、第3の実施の形態において説明した検出部400であってもよい。 The detection unit that outputs the detection results to the integrated tracking unit 500 in this embodiment may be the detection unit 400 described in the third embodiment.

バッファ部510は、検出部100から出力される共通座標系で表現された検出結果を一時的に格納する手段である。そして、バッファ部510にバッファリングされたデータ(検出結果)のうち、検出が行われたカメラ映像に含まれる時間情報が所定期間内であるデータは、対応付け部530によって取得される。この所定期間は周期的な期間である。そして、対応付け部530は、ある周期で取得した1または複数の検出結果を用いて、オブジェクト追跡を行う。このように、本実施の形態における統合追跡部500は、各カメラ20からの映像のうち、複数のカメラの映像を用いてオブジェクト追跡を行うため、一括追跡部とも呼ぶ。 The buffer unit 510 is a means for temporarily storing the detection results expressed in a common coordinate system output from the detection unit 100. Among the data (detection results) buffered in the buffer unit 510, data in which the time information contained in the camera image in which the detection was performed is within a predetermined period is acquired by the association unit 530. This predetermined period is a periodic period. The association unit 530 performs object tracking using one or more detection results acquired in a certain period. In this way, the integrated tracking unit 500 in this embodiment is also called a collective tracking unit, since it performs object tracking using images from multiple cameras out of the images from each camera 20.

この統合追跡部500が行う、オブジェクト追跡(一括統合追跡とも呼ぶ。)について、図18を用いて説明する。図18は、本実施の形態に係る統合追跡部500が行うオブジェクトの一括追跡処理を説明するための図である。図18には、図7と同様に、カメラ数が3つの場合に、カメラA、カメラB、カメラCの夫々で画像を取得するタイミングの一例を示している。図18において、横軸は、時間軸を示しており、右側にいくほど、時間的に後であることを示している。図18に示す通り、カメラAは時間t1、t5およびt8で画像を取得している。同様に、カメラBは、時間t2、t4、t6およびt9で画像を取得し、カメラCは時間t3およびt7で画像を取得している。 The object tracking (also called collective integrated tracking) performed by the integrated tracking unit 500 will be described with reference to FIG. 18. FIG. 18 is a diagram for explaining the collective object tracking process performed by the integrated tracking unit 500 according to this embodiment. As with FIG. 7, FIG. 18 shows an example of the timing of image acquisition by each of cameras A, B, and C when there are three cameras. In FIG. 18, the horizontal axis indicates the time axis, and the further to the right, the later in time it is. As shown in FIG. 18, camera A acquires images at times t1, t5, and t8. Similarly, camera B acquires images at times t2, t4, t6, and t9, and camera C acquires images at times t3 and t7.

そして、これらの各タイミングで取得された画像は、順にオブジェクト検出が行われる。以下では、説明の便宜上、図18に示す時間は、オブジェクトの検出結果が出力された時間とほぼ同じであるとみなして説明を行う。つまり、時間t1は、カメラAによって撮影された映像のフレームに対する検出結果が検出部100から出力され、バッファ部510にバッファリングされた時間であるとする。 The images acquired at each of these timings are then subjected to object detection in sequence. For ease of explanation, the following description will be given assuming that the times shown in FIG. 18 are approximately the same as the times at which the object detection results are output. In other words, time t1 is the time at which the detection results for the frame of the video captured by camera A are output from detection unit 100 and buffered in buffer unit 510.

また、図18の最下部の時間軸は、周期的な期間の一例を示している。 The time axis at the bottom of Figure 18 also shows an example of a periodic period.

対応付け部530は、バッファ部510にバッファリングされた1または複数の検出結果のうち、物体の検出の対象となったカメラ映像に含まれる時間情報が所定期間内である検出結果を取得する。なお、上述したとおり、この所定期間は周期的な期間である。また、本実施の形態では、バッファリングされた時間と、カメラ映像の時間とは同じであるとみなしている。そのため、対応付け部530は、バッファ部510にバッファリングされた1または複数の検出結果を、所定の周期で取得するともいえる。 The matching unit 530 acquires, from among one or more detection results buffered in the buffer unit 510, a detection result in which the time information included in the camera video that was the subject of object detection is within a predetermined period. As described above, this predetermined period is a periodic period. In addition, in this embodiment, the buffered time and the camera video time are considered to be the same. Therefore, it can be said that the matching unit 530 acquires one or more detection results buffered in the buffer unit 510 at a predetermined period.

具体的には、対応付け部530は、まず、最初の期間T1でバッファリングされた検出結果を取得する。つまり、対応付け部530は、時間t1、t2、t3でバッファリングされた検出結果を取得する。時間t1でバッファリングされた検出結果は、カメラAによって撮影された映像のフレームに対する検出結果である。また、時間t2でバッファリングされた検出結果は、カメラBによって撮影された映像のフレームに対する検出結果であり、時間t3でバッファリングされた検出結果は、カメラCによって撮影された映像のフレームに対する検出結果である。したがって、対応付け部530は、バッファ部510に所定期間(この場合T1)内でバッファリングされた検出結果であって、複数のカメラ20の夫々で撮影された映像のフレームに対する、複数の検出結果を、バッファ部510から取得する。そして、対応付け部530は、取得した検出結果を用いて、オブジェクト追跡を行う。 Specifically, the matching unit 530 first acquires the detection results buffered in the first period T1. That is, the matching unit 530 acquires the detection results buffered at times t1, t2, and t3. The detection result buffered at time t1 is the detection result for the frame of the video captured by camera A. The detection result buffered at time t2 is the detection result for the frame of the video captured by camera B, and the detection result buffered at time t3 is the detection result for the frame of the video captured by camera C. Therefore, the matching unit 530 acquires from the buffer unit 510 a plurality of detection results for the frames of the video captured by each of the plurality of cameras 20, which are detection results buffered in the buffer unit 510 within a predetermined period (T1 in this case). The matching unit 530 then performs object tracking using the acquired detection results.

また、対応付け部530は、同様に、期間T2、T3、T4においても、この周期的な期間内でバッファリングされた検出結果を取得し、オブジェクト追跡を行う。 Similarly, during periods T2, T3, and T4, the matching unit 530 also acquires the detection results buffered within this periodic period and performs object tracking.

なお、本実施の形態では、対応付け部530がバッファ部510にバッファリングされたデータ(複数の検出結果)を、所定の周期でバッファ部510から取得する構成について説明するが、対応付け部530は、所定の周期でバッファ部510からこのデータを受信する構成であってもよい。つまり、バッファ部510は、このデータを、所定の周期で対応付け部530に出力する機能を有してもよい。 In the present embodiment, a configuration is described in which the association unit 530 acquires data (multiple detection results) buffered in the buffer unit 510 from the buffer unit 510 at a predetermined cycle, but the association unit 530 may be configured to receive this data from the buffer unit 510 at a predetermined cycle. In other words, the buffer unit 510 may have a function of outputting this data to the association unit 530 at a predetermined cycle.

図17に戻り、統合追跡部500の対応付け部530について更に説明する。 Returning to FIG. 17, we further explain the matching section 530 of the integrated tracking section 500.

対応付け部530は、取得した各検出結果に含まれるターゲットの位置から、ターゲット間の距離を求め、該距離が近いターゲット同士を互いに対応付ける。このとき、対応付け部530は、ターゲット間の距離を用いて、ハンガリアン法等の手法によって、対応付けを行う。また、対応付け部530は、ターゲット間の距離に加え、ターゲットの外見特徴の類似性も同時に用いてもよい。例えば、位置が近く、近似した色を有するターゲット同士は同一のオブジェクトである可能性が高い。よって、対応付け部530は、このような特徴を用いて対応付けを行ってもよい。なお、外見特徴の類似性を判定するための特徴は、色に限定されず、例えば、ターゲットの模様等であってもよい。 The matching unit 530 obtains the distance between the targets from the positions of the targets included in each of the obtained detection results, and matches targets that are close to each other. At this time, the matching unit 530 performs matching using a method such as the Hungarian method, using the distance between the targets. The matching unit 530 may also use the similarity of the appearance features of the targets in addition to the distance between the targets. For example, targets that are close to each other and have similar colors are likely to be the same object. Therefore, the matching unit 530 may perform matching using such features. Note that the features for determining the similarity of appearance features are not limited to color, and may be, for example, the pattern of the target.

そして、対応付け部530は、互いに対応付けされたターゲットに対する検出結果同士を統合する。つまり、対応付け部530は、ターゲット間の対応付けを行った後、対応付いたターゲットの夫々の検出結果を用いて、オブジェクトの位置を求める。この際、対応付け部530は、各ターゲットの尤度および/または予測位置の確度を評価し、この確度が最大となる位置を、オブジェクトの位置としてもよい。 Then, the matching unit 530 integrates the detection results for the targets that are matched with each other. In other words, after matching the targets, the matching unit 530 uses the detection results of each of the matched targets to determine the position of the object. At this time, the matching unit 530 may evaluate the likelihood and/or accuracy of the predicted position of each target, and determine the position with the maximum accuracy as the position of the object.

また、対応付け部530は、各ターゲットに対するカメラ20の角度(俯角または仰角)および該カメラ20からターゲットまでの距離等によって定まる予測位置の確度に基づいて、各ターゲットの位置に対し重みづけをしてもよい。そして、対応付け部530は、重みづけした位置から、例えば、平均値などの統計量を算出し、該算出した統計量によって示される位置を、オブジェクトの位置としてもよい。 The matching unit 530 may also weight the position of each target based on the accuracy of the predicted position determined by the angle (depression angle or elevation angle) of the camera 20 relative to each target and the distance from the camera 20 to the target. The matching unit 530 may then calculate statistics, such as an average value, from the weighted positions, and determine the position indicated by the calculated statistics as the position of the object.

そして、対応付け部530は、求めたオブジェクトの位置を、検出結果を取得した周期に対するターゲットの位置とする。対応付け部530は、このターゲットの位置を用いて、第1の実施の形態に係る対応付け部230と同様に、対応付けを行う。また、統合追跡部500による、対応付けの処理およびその後の処理については、第1の実施の形態において説明した統合追跡部200における処理と同様であるため、説明を省略する。 The matching unit 530 then sets the determined object position as the target position for the period in which the detection result was obtained. The matching unit 530 uses this target position to perform matching in the same way as the matching unit 230 in the first embodiment. Furthermore, the matching process and subsequent processes by the integrated tracking unit 500 are similar to the processes by the integrated tracking unit 200 described in the first embodiment, and therefore will not be described here.

また、対応付け部530は、ターゲット間の対応付けを行う前に、各ターゲットとトラッカーとの対応付けを行い、統合してもよい。つまり、対応付け部530は、同じトラッカーに対応付けされたターゲットが複数ある場合、これらのターゲットの間でマージ処理を行う。この場合、対応付け部530は、各ターゲットの尤度および/または予測位置の確度がより高いものを優先して、マージを行ってもよい。このように、対応付け部530は、これらの情報に基づいて、検出結果を評価し、同じトラッカーに対応付いたターゲットを統合してもよい。 The matching unit 530 may also match each target with a tracker and integrate them before matching the targets. In other words, when there are multiple targets associated with the same tracker, the matching unit 530 performs a merging process between these targets. In this case, the matching unit 530 may prioritize merging targets with higher likelihood and/or higher accuracy of predicted position. In this way, the matching unit 530 may evaluate the detection results based on this information and integrate targets associated with the same tracker.

以上のように、本実施の形態に係る物体追跡装置10は、所定の期間内に、各カメラ20で撮影されたカメラ映像に対する検出結果の全てを用いてオブジェクト追跡を行う。これにより、物体追跡装置10は、複数のカメラ20間で、オブジェクトの検索結果の優先付けを行い、オブジェクト追跡を行う処理を適用しやすくなる。 As described above, the object tracking device 10 according to this embodiment performs object tracking using all of the detection results for the camera images captured by each camera 20 within a predetermined period of time. This allows the object tracking device 10 to prioritize object search results between multiple cameras 20, making it easier to apply the object tracking process.

また、例えば、全てのカメラ20のフレームレートが安定して同じである場合、フレーム間隔に従って、所定期間を設定することにより、全カメラ20のフレームは、この所定期間に含まれる。したがって、本実施の形態に係る物体追跡装置10は、全カメラ20に対するフレームに対し、オブジェクト追跡を行うことができる。これにより、物体追跡装置10は、複数のカメラ20から同時に見えているオブジェクトに対し、同時に検出結果を評価できるようになるため、検出結果の信頼性を、追跡によりダイレクトに反映できるようになる。 Also, for example, if the frame rates of all the cameras 20 are stable and the same, by setting a predetermined period according to the frame interval, the frames of all the cameras 20 are included in this predetermined period. Therefore, the object tracking device 10 according to this embodiment can perform object tracking for frames for all the cameras 20. This allows the object tracking device 10 to simultaneously evaluate the detection results for objects that are simultaneously visible from multiple cameras 20, so that the reliability of the detection results can be directly reflected in the tracking.

<第5の実施の形態>
本発明の第5の実施の形態について説明する。本実施の形態では、本発明の課題を解決する最小の構成について説明を行う。
Fifth embodiment
A fifth embodiment of the present invention will be described below. In this embodiment, a minimum configuration for solving the problems of the present invention will be described.

本実施の形態に係る物体追跡装置10は、第1の実施の形態において説明した図1に示す物体追跡装置10と同様の構成であるため、図1を参照して説明を行う。 The object tracking device 10 according to this embodiment has a similar configuration to the object tracking device 10 shown in FIG. 1 described in the first embodiment, so the description will be given with reference to FIG. 1.

図1に示す通り、本実施の形態に係る物体追跡装置10は、複数の検出部(100-1~100-N)(Nは自然数)と、統合追跡部200とを備えている。なお、本実施の形態では、複数の検出部(100-1~100-N)の夫々を区別しない場合、または、総称する場合には、これらを検出部100と呼ぶ。 As shown in FIG. 1, the object tracking device 10 according to this embodiment includes multiple detection units (100-1 to 100-N) (N is a natural number) and an integrated tracking unit 200. In this embodiment, when the multiple detection units (100-1 to 100-N) are not differentiated from one another or are referred to collectively, they are referred to as detection units 100.

複数の検出部100の夫々は、センサから出力される出力情報から物体を検出する。なお、図1においては、センサをカメラとし、センサの出力情報をカメラ映像(映像データ)として記載しているが、センサはカメラに限定されるものではない。具体的には、検出部100は、統合追跡部200から出力される追跡情報に基づいて、物体を検出する。検出部100は、検出結果を統合追跡部200に出力する。 Each of the multiple detection units 100 detects an object from output information output from a sensor. Note that in FIG. 1, the sensor is described as a camera and the output information of the sensor is described as camera image (image data), but the sensor is not limited to a camera. Specifically, the detection unit 100 detects an object based on tracking information output from the integrated tracking unit 200. The detection unit 100 outputs the detection result to the integrated tracking unit 200.

統合追跡部200は、複数の検出部(100-1~100-N)の夫々によって出力された、複数の検出結果に基づいて、該検出結果によって示される1または複数の物体の夫々を追跡する。そして、統合追跡部200は、追跡結果として、共通座標系で表現された物体の追跡情報を生成する。そして、統合追跡部200は、複数の検出部(100-1~100-N)の夫々に出力する。 The integrated tracking unit 200 tracks each of the one or more objects indicated by the detection results based on the multiple detection results output by each of the multiple detection units (100-1 to 100-N). The integrated tracking unit 200 then generates tracking information of the object expressed in a common coordinate system as the tracking result. The integrated tracking unit 200 then outputs this to each of the multiple detection units (100-1 to 100-N).

このように、本実施の形態に係る物体追跡装置10の検出部100は、統合追跡部200によって追跡された物体に対する追跡結果に基づいて、センサから出力された出力情報から物体を検出する。 In this manner, the detection unit 100 of the object tracking device 10 according to this embodiment detects an object from the output information output from the sensor based on the tracking results for the object tracked by the integrated tracking unit 200.

このように、物体追跡装置10は、前のフレームに対する追跡結果を用いて、映像からオブジェクトを検出するため、該追跡結果を用いない場合に比べ、オブジェクトの検出精度を高めることができる。また、カメラ20の夫々で撮影された映像に対するオブジェクトの検出結果全てを用いてオブジェクト追跡を行うため、物体追跡装置10は、カメラ毎に独立にオブジェクト追跡を行う場合に比べ、追跡精度を向上できる。また、物体追跡装置10は、検出精度が高い検出結果の全てを用いてオブジェクト追跡を行うため、より高精度に物体を追跡することができる。 In this way, the object tracking device 10 detects an object from a video using the tracking results for the previous frame, and therefore can improve the object detection accuracy compared to when the tracking results are not used. Furthermore, since object tracking is performed using all of the object detection results for the video captured by each of the cameras 20, the object tracking device 10 can improve tracking accuracy compared to when object tracking is performed independently for each camera. Furthermore, since the object tracking device 10 performs object tracking using all of the detection results with high detection accuracy, it can track objects with higher accuracy.

なお、上述した各実施の形態では、物体追跡装置10は、検出部(100、400)と統合追跡部(200、500)とを含むことを例に説明したが、この検出部と統合追跡部とは夫々別個の装置で実現されるものであってもよい。つまり、検出部(100、400)は、物体検出装置として、統合追跡部(200、500)は、統合追跡装置として、夫々、別個の装置で実現されるものであってもよい。また、表示制御部300も、物体追跡装置50とは別個の表示制御装置で実現されるものであってもよい。この表示制御装置は、表示装置30内に内蔵されるものであってもよい。
<第6の実施の形態>
本発明の第6の実施の形態について説明する。本実施の形態に係る物体追跡装置10は、第1の実施の形態において説明した図1に示す物体追跡装置10と同様の構成であるため、図1を参照して説明を行う。なお、本実施の形態に係る物体追跡装置10は、第1の実施の形態に係る物体追跡装置10に、更に以下に説明する機能を追加した構成であるとするが、本発明はこれに限定されるものではない。本実施の形態に係る物体追跡装置10は、上述した第2から第5の実施の形態に係る物体追跡装置にも適用可能である。
In the above-described embodiments, the object tracking device 10 includes the detection unit (100, 400) and the integrated tracking unit (200, 500), but the detection unit and the integrated tracking unit may be realized by separate devices. In other words, the detection unit (100, 400) may be realized as an object detection device, and the integrated tracking unit (200, 500) may be realized as an integrated tracking device, each of which is a separate device. The display control unit 300 may also be realized by a display control device separate from the object tracking device 50. This display control device may be built into the display device 30.
Sixth embodiment
A sixth embodiment of the present invention will be described. The object tracking device 10 according to this embodiment has the same configuration as the object tracking device 10 shown in FIG. 1 described in the first embodiment, and therefore will be described with reference to FIG. 1. The object tracking device 10 according to this embodiment is configured by adding the functions described below to the object tracking device 10 according to the first embodiment, but the present invention is not limited to this. The object tracking device 10 according to this embodiment can also be applied to the object tracking devices according to the second to fifth embodiments described above.

本実施の形態では、統合追跡部200が、更に、オブジェクトの見え方に関する情報を取得し、取得した情報を追跡情報に含める。そして、検出部100が、統合追跡部200から出力された追跡情報に含まれる各オブジェクトの見え方に関する情報を用いて、オブジェクトの検出を制御する。 In this embodiment, the integrated tracking unit 200 further acquires information regarding the appearance of the objects and includes the acquired information in the tracking information. The detection unit 100 then controls the detection of the objects using information regarding the appearance of each object included in the tracking information output from the integrated tracking unit 200.

このオブジェクトの見え方に関する情報(以降、見え方情報)とは、各カメラ20の位置からオブジェクトを見たときに、各オブジェクトがどのように見えるかに関する情報であり、各トラッカーのオブジェクトの位置によって定まるものである。 This information about how the object appears (hereinafter, "appearance information") is information about how each object appears when viewed from the position of each camera 20, and is determined by the position of the object on each tracker.

例えば、あるカメラ20からあるオブジェクトと他のオブジェクトとを見たときに、あるオブジェクトが他のオブジェクトの前(カメラ20側)にある場合を考える。この場合、後ろ側のオブジェクト(他のオブジェクト)は、前側のオブジェクト(あるオブジェクト)に隠れてしまい、カメラ20から見えなくなる可能性が高くなる。このとき、統合追跡部200は、このようなオブジェクト同士の重なりを表す情報を、見え方情報として、他のオブジェクトに関するトラッカー(追跡結果)に含め、該追跡結果を出力する。 For example, consider a case where an object is in front of (on the side of camera 20) another object when the object is viewed from a camera 20. In this case, the object behind (the other object) is likely to be hidden by the object in front (the object), making it invisible to camera 20. In this case, the integrated tracking unit 200 includes information representing such overlapping of objects as visibility information in the tracker (tracking result) for the other object, and outputs the tracking result.

次に、本実施の形態に係る物体追跡装置10の各部の具体的な動作について説明する。 Next, we will explain the specific operation of each part of the object tracking device 10 according to this embodiment.

統合追跡部200は、例えば、図6に示した記憶部220などに、各カメラ20の配置に関する情報を格納している。カメラ20の配置に関する情報とは、例えば、各カメラ20がどの位置に配置されているのか、どの方向を撮影しているのか等を示す情報である。また、統合追跡部200は、カメラ20の配置に関する情報として、撮影空間の照明の位置や向き、照明の特性に関する情報、撮影空間のどの位置が明るいまたは暗いのかといった照明条件に関する情報を含んでもよい。また、統合追跡部200は、カメラ20の配置に関する情報として、撮影空間の方角情報も保持していてもよい。 The integrated tracking unit 200 stores information about the placement of each camera 20, for example, in the memory unit 220 shown in FIG. 6. Information about the placement of the cameras 20 is, for example, information indicating where each camera 20 is placed, and in what direction it is photographing. The integrated tracking unit 200 may also include, as information about the placement of the cameras 20, information about the position and direction of the lighting in the shooting space, information about the characteristics of the lighting, and information about lighting conditions such as which positions in the shooting space are bright or dark. The integrated tracking unit 200 may also hold directional information about the shooting space as information about the placement of the cameras 20.

統合追跡部200は、前述した各実施の形態に係る統合追跡部200と同様に、各トラッカーによって示されるオブジェクトの現フレーム上の動きを予測し、ターゲットとトラッカーとを対応付けることにより、トラッカーの位置を求める。 Similar to the integrated tracking unit 200 in each of the above-mentioned embodiments, the integrated tracking unit 200 predicts the movement of the object indicated by each tracker in the current frame and determines the position of the tracker by associating the target with the tracker.

そして、統合追跡部200は、求めたトラッカーの位置と、各トラッカーの動きの情報とから、各カメラ20によって撮影された撮影画像上での各トラッカーによって示されるオブジェクトの位置を予測する。 Then, the integrated tracking unit 200 predicts the position of the object indicated by each tracker on the captured image captured by each camera 20 based on the determined tracker position and the information on the movement of each tracker.

そして、統合追跡部200は、各カメラ20の配置に関する情報を参照し、予測した位置の各オブジェクトが、各カメラ20から見たときに、どのように見えるか(見え方)を予測する。つまり、統合追跡部200は、複数のカメラ20の夫々に対し、次に撮影したタイミングにおいて、上記各トラッカーによって示されるオブジェクト同士が、重なり合うかどうかを予測する。 Then, the integrated tracking unit 200 refers to information about the placement of each camera 20 and predicts how each object at the predicted position will look (appear) when viewed from each camera 20. In other words, the integrated tracking unit 200 predicts whether the objects indicated by the trackers above will overlap with each other at the next image capture timing for each of the multiple cameras 20.

そして、統合追跡部200は、予測した見え方に基づいて、あるカメラ20の撮影画像上において、オブジェクト同士が重なっていると判定した場合には、オブジェクトが重なって見えない可能性があることを示す情報(見え方情報)を生成する。 Then, when the integrated tracking unit 200 determines that objects overlap in an image captured by a certain camera 20 based on the predicted appearance, it generates information (appearance information) indicating that the objects may not be visible due to overlapping.

例えば、統合追跡部200は、あるカメラ20と予測したあるオブジェクトとを結ぶ線分の間に、予測した他のオブジェクトがあるかどうかを判定する。予測した他のオブジェクトが上記線分の間にある場合には、このあるオブジェクトが、他のオブジェクトと重なる可能性が高い。そのため、統合追跡部200は、隠される(重なる)オブジェクトの情報、および重なり合う度合(尤度)を、上記あるオブジェクトに対する見え方情報として求める。 For example, the integrated tracking unit 200 determines whether the predicted object is between a line segment connecting a camera 20 and a predicted object. If the predicted object is between the line segment, there is a high possibility that the object overlaps with the other object. Therefore, the integrated tracking unit 200 obtains information on the hidden (overlapping) object and the degree of overlap (likelihood) as visibility information for the object.

そして、統合追跡部200は、このあるオブジェクトの追跡結果に、この判定結果を見え方情報として含めてもよい。 The integrated tracking unit 200 may then include this determination result as visibility information in the tracking result for this object.

そして、統合追跡部200は、あるカメラ20によって撮影された撮影画像上から見えなくなる可能性が高いオブジェクトの追跡情報に、生成した見え方情報を含める。このとき、見え方情報には、オブジェクトが見えなくなる可能性が高いカメラ20を示す情報を含むことが好ましい。 Then, the integrated tracking unit 200 includes the generated visibility information in the tracking information for an object that is likely to become invisible in an image captured by a certain camera 20. At this time, it is preferable that the visibility information includes information indicating the camera 20 from which the object is likely to become invisible.

そして、統合追跡部200は、見え方情報を含んだ追跡情報を、各検出部100に出力する。なお、統合追跡部200は、見え方情報を含んだ追跡情報を、オブジェクトが重なって見えない可能性が高いカメラ20(あるカメラ20)に関連付けられた検出部100に出力してもよい。そして、統合追跡部200は、見え方情報を含まない追跡情報を他のカメラ20に関連付けられた物体追跡装置10に出力してもよい。 The integrated tracking unit 200 then outputs the tracking information including the appearance information to each detection unit 100. Note that the integrated tracking unit 200 may output the tracking information including the appearance information to a detection unit 100 associated with a camera 20 (a certain camera 20) where the object is likely to be overlapped and not visible. The integrated tracking unit 200 may then output tracking information not including the appearance information to an object tracking device 10 associated with another camera 20.

また、オブジェクトの位置に応じて照明の当たり方が変わり、該オブジェクトの色合いや明るさが変化することがわかっている場合には、統合追跡部200は、オブジェクトの位置に応じた見え方の変化を記述した情報を追跡情報に含めてもよい。 In addition, if it is known that the way the light hits an object changes depending on its position, causing the color and brightness of the object to change, the integrated tracking unit 200 may include information in the tracking information that describes the change in appearance depending on the object's position.

例えば、照明の当たり方がオブジェクトの位置によって定まる場合には、統合追跡部200は、その位置から照明の当たり方を予測し、明るくなる、暗くなる、色味が変化するといった情報を、トラッカーごとに追跡情報に含めてもよい。 For example, if the way the light hits an object is determined by the object's position, the integrated tracking unit 200 may predict the way the light hits the object from its position, and include information such as whether the light will get brighter, darker, or the color will change in the tracking information for each tracker.

また、オブジェクトが配置された空間における照明の位置がわかっている場合には、統合追跡部200は、照明およびオブジェクトの関係から、オブジェクトまたはこの環境に配置されている他の物体の影が、他のオブジェクトに重なるか否か判定する。そして、影が重なる可能性がある場合には、統合追跡部200は、影が重なるオブジェクトに対して、影が重なる可能性(尤度)を算出し、追跡情報に含めるようにする。 In addition, if the position of the lighting in the space in which the object is placed is known, the integrated tracking unit 200 determines, from the relationship between the lighting and the object, whether the shadow of the object or another object placed in this environment overlaps with another object. If there is a possibility of the shadows overlapping, the integrated tracking unit 200 calculates the possibility (likelihood) of the shadows overlapping for the objects with which the shadows overlap, and includes this in the tracking information.

また、太陽のように、移動する場合であっても、統合追跡部200は、時刻と現場の方角の情報とから太陽の位置を求め、影のできる方向を予測し、オブジェクトの見え方に与える影響を考慮するようにしてもよい。例えば、統合追跡部200は、時刻情報から太陽の現在位置を求め、方角情報と合わせて、どちらの方向に影ができるかを予測する。そして、統合追跡部200は、他のオブジェクトの影がかかる可能性がある場合に影が重なる可能性(尤度)を算出し、追跡情報に含めるようにすればよい。 Even in the case of a moving object like the sun, the integrated tracking unit 200 may determine the position of the sun from the time and information on the direction of the site, predict the direction in which a shadow will be cast, and take into account the impact on the appearance of the object. For example, the integrated tracking unit 200 may determine the current position of the sun from time information, and, in combination with the direction information, predict in which direction a shadow will be cast. Then, when there is a possibility that a shadow will be cast by another object, the integrated tracking unit 200 may calculate the possibility (likelihood) of the shadows overlapping, and include this in the tracking information.

次に、検出部100の動作について説明する。検出部100は、上述した各実施の形態と同様に、追跡情報に基づいて、オブジェクトを検出する。このとき、本実施の形態に係る物体追跡装置10の検出部100は、追跡情報に含まれる各オブジェクトの見え方に関する情報を用いて、オブジェクトの検出を制御する。具体的には、検出部100は、他のオブジェクトと重なって見えない可能性が高いオブジェクトに関しては、検出を行わないようにする。例えば、検出部100は、この見えない可能性が高いオブジェクトに対して、探索範囲を設定しないようにする。 Next, the operation of the detection unit 100 will be described. The detection unit 100 detects objects based on the tracking information, as in each of the above-mentioned embodiments. At this time, the detection unit 100 of the object tracking device 10 according to this embodiment controls the detection of objects using information related to the visibility of each object contained in the tracking information. Specifically, the detection unit 100 does not detect objects that are likely to be invisible because they overlap with other objects. For example, the detection unit 100 does not set a search range for these objects that are likely to be invisible.

なお、明るさや色合いが変化する情報が追跡情報に含まれている場合には、検出部100は、探索する際にその照明の効果を補正して検出をかけるようにしてもよい。たとえば、暗い領域では、検出部100は、その領域の画素値を明るめに補正してから、検出をかけるようにしてもよい。 If the tracking information includes information that changes in brightness or color, the detection unit 100 may perform detection by compensating for the effect of the lighting when searching. For example, in a dark area, the detection unit 100 may perform detection by compensating for the pixel values of that area to be brighter.

また、色合いが変化する場合には、検出部100は、テンプレートマッチングで用いるマッチングのパラメータ(つまり、上述した検出パラメータ)を更新する際に、その色合いの変化を考慮して、該パラメータの色の情報を補正してもよい。また、色合いの変化が大きい場合には、検出部100は、色の情報を用いないようにしてもよい。また、検出部100は、テンプレートの特徴の中で、色の情報の重みを下げ、エッジ等の他の特徴の重みを高めてマッチングを行うようにしてもよい。 In addition, if the color tone changes, the detection unit 100 may take the color tone change into account when updating the matching parameters used in template matching (i.e., the detection parameters described above) and correct the color information of the parameters. In addition, if the color tone change is large, the detection unit 100 may not use the color information. In addition, the detection unit 100 may perform matching by lowering the weight of color information among the template features and increasing the weight of other features such as edges.

また、検出部100で、オブジェクト検出処理に用いる検出パラメータを更新する際に、該オブジェクトが重なっている可能性が高いと判断される場合には、検出パラメータの更新を行わないようにしてもよい。 In addition, when the detection unit 100 updates the detection parameters used in the object detection process, if it determines that the objects are likely to overlap, the detection parameters may not be updated.

以上のように、検出部100は、追跡情報に含まれる見え方情報に基づいて、物体の検出を制御する。これにより、検出部100は、見えないオブジェクトを検出する処理や、テンプレートマッチング等のパラメータを更新する処理を削減することができる。これにより、検出部100は、誤検出や誤ったパラメータの更新の可能性を低減することができる。 As described above, the detection unit 100 controls object detection based on the visibility information included in the tracking information. This allows the detection unit 100 to reduce the processing of detecting invisible objects and updating parameters such as template matching. This allows the detection unit 100 to reduce the possibility of false detection and erroneous parameter updates.

同様に、検出部100は、照明条件が変わった可能性が高い場合には、その効果を補正してパラメータを更新するように制御してもよいし、パラメータの更新を行わないように制御してもよい。 Similarly, when it is highly likely that the lighting conditions have changed, the detection unit 100 may control the parameters to be updated by compensating for the effect of the change, or may control the parameters not to be updated.

また、複数の検出アルゴリズムが切り替えられるようになっている場合には、物体追跡装置10は、検出部100として、より重なりに強い検出器を用いるようにしてもよい。具体的には、物体追跡装置10は、通常は頭部全体を検知する検出器を用いるが、重なっている場合には、頭部全体ではなく、頭部の一部分のみを検知する検出器を用いるようにしてもよい。これにより、物体追跡装置10は、通常時は、シンプルな検出器を用い、重なっている可能性がある場合には、より詳細な検出器を用いることができる。これにより、物体追跡装置10は、効率性を維持したうえで、高精度な検出が可能になる。同様に、物体追跡装置10は、照明条件が変化した場合には、その照明条件に対して頑健性が高い検出器(特徴量)を用いて、検出を制御してもよい。 In addition, when multiple detection algorithms can be switched, the object tracking device 10 may use a detector that is more resistant to overlap as the detection unit 100. Specifically, the object tracking device 10 may normally use a detector that detects the entire head, but when there is overlap, a detector that detects only a part of the head rather than the entire head may be used. This allows the object tracking device 10 to normally use a simple detector, and when there is a possibility of overlap, to use a more detailed detector. This allows the object tracking device 10 to perform highly accurate detection while maintaining efficiency. Similarly, when the lighting conditions change, the object tracking device 10 may control detection using a detector (feature amount) that is highly robust against the lighting conditions.

以上のように本実施の形態に係る物体追跡装置10は、統合追跡部200が、他のカメラの情報も使ってオブジェクトの見え方の判定をする。そのため、統合追跡部200は、あるカメラ20からは、オブジェクト同士が重なって映る場合など、そのカメラ20だけでは判定が難しい場合でも高精度に見え方を判定することができる。そして、統合追跡部200はこの結果を、検出部100にフィードバックすることができる。これにより、検出部100は、オブジェクトの誤検出を低減できる。そして、統合追跡部200は、この検出結果を用いてオブジェクト追跡を行うため、オブジェクトの追跡精度を向上させることができる。 As described above, in the object tracking device 10 according to this embodiment, the integrated tracking unit 200 determines how an object appears using information from other cameras as well. Therefore, the integrated tracking unit 200 can determine how an object appears with high accuracy even when it is difficult to determine the appearance using a certain camera 20 alone, such as when objects overlap each other when viewed from that camera 20. The integrated tracking unit 200 can then feed back this result to the detection unit 100. This allows the detection unit 100 to reduce false detection of objects. The integrated tracking unit 200 then uses this detection result to track objects, thereby improving the tracking accuracy of the object.

<ハードウェアの構成例>
ここで、上述した各実施の形態に係る物体追跡装置(10、50)を実現可能なハードウェアの構成例について説明する。上述した物体追跡装置(10、50)は、専用の装置として実現してもよいが、コンピュータ(情報処理装置)を用いて実現してもよい。
<Hardware configuration example>
Here, an example of a hardware configuration capable of realizing the object tracking device (10, 50) according to each of the above-mentioned embodiments will be described. The above-mentioned object tracking device (10, 50) may be realized as a dedicated device, or may be realized using a computer (information processing device).

図19は、本発明の各実施の形態を実現可能なコンピュータ(情報処理装置)のハードウェア構成を例示する図である。 Figure 19 is a diagram illustrating an example of the hardware configuration of a computer (information processing device) capable of implementing each embodiment of the present invention.

図19に示した情報処理装置(コンピュータ)700のハードウェアは、CPU(Central Processing Unit)11、通信インタフェース(I/F)12、入出力ユーザインタフェース13、ROM(Read Only Memory)14、RAM(Random Access Memory)15、記憶装置17、及びコンピュータ読み取り可能な記憶媒体19のドライブ装置18を備え、これらがバス16を介して接続された構成を有する。入出力ユーザインタフェース13は、入力デバイスの一例であるキーボードや、出力デバイスとしてのディスプレイ等のマンマシンインタフェースである。通信インタフェース12は、上述した各実施の形態に係る装置(図1、図9)が、外部装置と、通信ネットワーク600を介して通信するための一般的な通信手段である。係るハードウェア構成において、CPU11は、各実施の形態に係る物体追跡装置(10、50)を実現する情報処理装置700について、全体の動作を司る。 The hardware of the information processing device (computer) 700 shown in FIG. 19 includes a CPU (Central Processing Unit) 11, a communication interface (I/F) 12, an input/output user interface 13, a ROM (Read Only Memory) 14, a RAM (Random Access Memory) 15, a storage device 17, and a drive device 18 for a computer-readable storage medium 19, which are connected via a bus 16. The input/output user interface 13 is a man-machine interface such as a keyboard, which is an example of an input device, and a display, which is an output device. The communication interface 12 is a general communication means for the devices according to the above-mentioned embodiments (FIGS. 1 and 9) to communicate with an external device via a communication network 600. In this hardware configuration, the CPU 11 controls the overall operation of the information processing device 700 that realizes the object tracking device (10, 50) according to each embodiment.

上述した各実施の形態を例に説明した本発明は、例えば、上記各実施の形態において説明した処理を実現可能なプログラム(コンピュータ・プログラム)を、図19に示す情報処理装置700に対して供給した後、そのプログラムを、CPU11に読み出して実行することによって達成される。なお、係るプログラムは、例えば、上記各実施の形態の説明において参照したフローチャート(図8)に記載した各種処理や、或いは、図1、図4~図6、図9、図15~図17に示したブロック図において当該装置内に示した各部(各ブロック)を実現可能なプログラムであってもよい。 The present invention described above using each of the embodiments as examples is achieved, for example, by supplying a program (computer program) capable of implementing the processes described in each of the above embodiments to the information processing device 700 shown in FIG. 19, and then reading and executing the program in the CPU 11. Note that such a program may be, for example, a program capable of implementing the various processes described in the flowchart (FIG. 8) referred to in the description of each of the above embodiments, or a program capable of implementing each unit (each block) shown in the device in the block diagrams shown in FIGS. 1, 4 to 6, 9, and 15 to 17.

また、情報処理装置700内に供給されたプログラムは、読み書き可能な一時記憶メモリ(15)またはハードディスクドライブ等の不揮発性の記憶装置(17)に格納されてもよい。即ち、記憶装置17において、プログラム群17Aは、例えば、上述した各実施の形態における物体追跡装置(10、50)内に示した各部の機能を実現可能なプログラムである。また、各種の記憶情報17Bは、例えば、上述した各実施の形態におけるオブジェクト追跡結果、カメラ映像、カメラパラメータ、各カメラ20で見える共通座標系の座標値の範囲等である。ただし、情報処理装置700へのプログラムの実装に際して、個々のプログラム・モジュールの構成単位は、ブロック図(図1、図4~図6、図9、図15~図17)に示した各ブロックの区分けには限定されず、当業者が実装に際して適宜選択してよい。 The programs supplied to the information processing device 700 may be stored in a readable/writable temporary memory (15) or a non-volatile storage device (17) such as a hard disk drive. That is, in the storage device 17, the program group 17A is, for example, a program capable of realizing the functions of each unit shown in the object tracking device (10, 50) in each of the above-mentioned embodiments. In addition, the various stored information 17B is, for example, the object tracking results, camera images, camera parameters, and the range of coordinate values of a common coordinate system visible by each camera 20 in each of the above-mentioned embodiments. However, when implementing the programs in the information processing device 700, the constituent units of the individual program modules are not limited to the division of each block shown in the block diagrams (FIGS. 1, 4 to 6, 9, 15 to 17), and may be appropriately selected by a person skilled in the art when implementing.

また、前記の場合において、当該装置内へのプログラムの供給方法は、CD(Compact Disk)-ROM、フラッシュメモリ等のコンピュータ読み取り可能な各種の記録媒体(19)を介して当該装置内にインストールする方法や、インターネット等の通信回線(600)を介して外部よりダウンロードする方法等のように、現在では一般的な手順を採用することができる。そして、このような場合において、本発明は、係るコンピュータプログラムを構成するコード(プログラム群17A)或いは係るコードが格納された記憶媒体(19)によって構成されると捉えることができる。 In the above case, the method of supplying the program to the device can be a currently common procedure, such as installing the program in the device via a computer-readable recording medium (19) such as a CD (Compact Disk)-ROM or flash memory, or downloading the program from an external source via a communication line (600) such as the Internet. In such a case, the present invention can be considered to be configured by the code (program group 17A) that constitutes the computer program, or the storage medium (19) in which the code is stored.

以上、本発明を、上述した模範的な実施の形態に適用した例として説明した。しかしながら、本発明の技術的範囲は、上述した各実施の形態に記載した範囲には限定されない。当業者には、係る実施の形態に対して多様な変更または改良を加えることが可能であることは明らかである。そのような場合、係る変更または改良を加えた新たな実施の形態も、本発明の技術的範囲に含まれ得る。そしてこのことは、特許請求の範囲に記載した事項から明らかである。 The present invention has been described above as an example of application to the exemplary embodiments described above. However, the technical scope of the present invention is not limited to the scope described in each of the above-mentioned embodiments. It is clear to those skilled in the art that various modifications and improvements can be made to such embodiments. In such cases, new embodiments incorporating such modifications or improvements may also be included in the technical scope of the present invention. This is clear from the matters described in the claims.

1 物体追跡システム
2 物体追跡システム
10 物体追跡装置
100 検出部
110 オブジェクト検出部
111 認識型オブジェクト検出部
112 探索範囲設定部
120 共通座標変換部
130 個別座標変換部
140 オブジェクト検出部
141 認識型オブジェクト検出部
142 非認識型オブジェクト検出部
143 検出パラメータ更新部
144 検出結果統合部
150 表示制御部
160 記憶部
200 統合追跡部
210 予測部
220 記憶部
230 対応付け部
240 更新部
300 表示制御部
400 検出部
500 統合追跡部
510 バッファ部
530 対応付け部
20 カメラ
30 表示装置
40 ネットワーク
50 物体追跡装置
1 Object tracking system 2 Object tracking system 10 Object tracking device 100 Detection unit 110 Object detection unit 111 Recognition type object detection unit 112 Search range setting unit 120 Common coordinate conversion unit 130 Individual coordinate conversion unit 140 Object detection unit 141 Recognition type object detection unit 142 Non-recognition type object detection unit 143 Detection parameter update unit 144 Detection result integration unit 150 Display control unit 160 Memory unit 200 Integrated tracking unit 210 Prediction unit 220 Memory unit 230 Correspondence unit 240 Update unit 300 Display control unit 400 Detection unit 500 Integrated tracking unit 510 Buffer unit 530 Correspondence unit 20 Camera 30 Display device 40 Network 50 Object tracking device

Claims (8)

空間内における物体の位置を予測し、
予測された前記物体の位置に基づいて、前記物体に関する第1の位置情報を取得し、
前記第1の位置情報とカメラから取得した第1の画像とに基づいて、前記物体に関する第2の位置情報を求める、
方法であって、
前記空間内における物体の位置は、前記第1の画像よりも前の時点において取得した第2の画像に基づいて予測され
予測された前記物体の位置は、3次元の位置情報で表される、
物体追跡方法。
Predict the location of objects in space;
obtaining first position information for the object based on the predicted position of the object;
determining second position information regarding the object based on the first position information and a first image acquired from a camera;
1. A method comprising:
a position of the object in the space is predicted based on a second image acquired at an earlier time than the first image ;
The predicted object position is represented by three-dimensional position information .
Methods for tracking objects.
前記第1の位置情報は、2次元の位置情報で表される、
請求項1に記載の物体追跡方法。
The first position information is represented by two-dimensional position information.
The method of claim 1 .
前記第2の位置情報は、前記第1の画像上の2次元座標で表される、
請求項1に記載の物体追跡方法。
The second position information is represented by two-dimensional coordinates on the first image.
The method of claim 1 .
一のカメラに固有の個別座標系で表される前記第2の位置情報を、前記一のカメラを含む複数のカメラに共通する3次元の共通座標系で表される第3の位置情報に変換する、
請求項3に記載の物体追跡方法。
converting the second position information expressed in an individual coordinate system specific to one camera into third position information expressed in a three-dimensional common coordinate system common to a plurality of cameras including the one camera;
The object tracking method according to claim 3 .
空間内における物体の位置を予測する手段と、
予測された前記物体の位置に基づいて、前記物体に関する第1の位置情報を取得する手段と、
前記第1の位置情報とカメラから取得した第1の画像とに基づいて、前記物体に関する第2の位置情報を求める手段と
を備え、
前記空間内における物体の位置は、前記第1の画像よりも前の時点において取得した第2の画像に基づいて予測され
予測された前記物体の位置は、3次元の位置情報で表される、
物体追跡装置。
A means for predicting the location of an object in space;
means for obtaining first position information for the object based on a predicted position of the object;
and determining second position information regarding the object based on the first position information and a first image acquired from a camera,
a position of the object in the space is predicted based on a second image acquired at an earlier time than the first image ;
The predicted object position is represented by three-dimensional position information .
Object tracking device.
前記第1の位置情報は、2次元の位置情報で表される、
請求項5に記載の物体追跡装置。
The first position information is represented by two-dimensional position information.
The object tracking device according to claim 5 .
前記第2の位置情報は、前記第1の画像上の2次元座標で表される、
請求項5に記載の物体追跡装置。
The second position information is represented by two-dimensional coordinates on the first image.
The object tracking device according to claim 5 .
一のカメラに固有の個別座標系で表される前記第2の位置情報を、前記一のカメラを含む複数のカメラに共通する3次元の共通座標系で表される第3の位置情報に変換する手段をさらに備える、
請求項7に記載の物体追跡装置。
a means for converting the second position information expressed in an individual coordinate system specific to one camera into third position information expressed in a three-dimensional common coordinate system common to a plurality of cameras including the one camera,
The object tracking device according to claim 7.
JP2023071553A 2014-09-26 2023-04-25 Object tracking method and object tracking device Active JP7567979B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2024170268A JP7726357B2 (en) 2014-09-26 2024-09-30 Information processing device, information processing method, information processing program, and information processing system

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2014196176 2014-09-26
JP2014196176 2014-09-26
JP2020036328A JP7004017B2 (en) 2014-09-26 2020-03-04 Object tracking system, object tracking method, program
JP2021210227A JP7272417B2 (en) 2014-09-26 2021-12-24 Object tracking system, object tracking device, and object tracking method

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2021210227A Division JP7272417B2 (en) 2014-09-26 2021-12-24 Object tracking system, object tracking device, and object tracking method

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2024170268A Division JP7726357B2 (en) 2014-09-26 2024-09-30 Information processing device, information processing method, information processing program, and information processing system

Publications (2)

Publication Number Publication Date
JP2023083565A JP2023083565A (en) 2023-06-15
JP7567979B2 true JP7567979B2 (en) 2024-10-16

Family

ID=55867113

Family Applications (6)

Application Number Title Priority Date Filing Date
JP2014224050A Active JP6488647B2 (en) 2014-09-26 2014-11-04 Object tracking device, object tracking system, object tracking method, display control device, object detection device, program, and recording medium
JP2019031566A Active JP6673508B2 (en) 2014-09-26 2019-02-25 Object tracking device, object tracking system, object tracking method, display control device, object detection device, program, and recording medium
JP2020036328A Active JP7004017B2 (en) 2014-09-26 2020-03-04 Object tracking system, object tracking method, program
JP2021210227A Active JP7272417B2 (en) 2014-09-26 2021-12-24 Object tracking system, object tracking device, and object tracking method
JP2023071553A Active JP7567979B2 (en) 2014-09-26 2023-04-25 Object tracking method and object tracking device
JP2024170268A Active JP7726357B2 (en) 2014-09-26 2024-09-30 Information processing device, information processing method, information processing program, and information processing system

Family Applications Before (4)

Application Number Title Priority Date Filing Date
JP2014224050A Active JP6488647B2 (en) 2014-09-26 2014-11-04 Object tracking device, object tracking system, object tracking method, display control device, object detection device, program, and recording medium
JP2019031566A Active JP6673508B2 (en) 2014-09-26 2019-02-25 Object tracking device, object tracking system, object tracking method, display control device, object detection device, program, and recording medium
JP2020036328A Active JP7004017B2 (en) 2014-09-26 2020-03-04 Object tracking system, object tracking method, program
JP2021210227A Active JP7272417B2 (en) 2014-09-26 2021-12-24 Object tracking system, object tracking device, and object tracking method

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2024170268A Active JP7726357B2 (en) 2014-09-26 2024-09-30 Information processing device, information processing method, information processing program, and information processing system

Country Status (1)

Country Link
JP (6) JP6488647B2 (en)

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6519805B2 (en) * 2016-05-13 2019-05-29 パナソニックIpマネジメント株式会社 Camera system and camera device
US10867394B2 (en) 2016-05-18 2020-12-15 Nec Corporation Object tracking device, object tracking method, and recording medium
JP6866621B2 (en) * 2016-12-02 2021-04-28 株式会社豊田中央研究所 Moving object state quantity estimation device and program
JP6903955B2 (en) * 2017-03-03 2021-07-14 株式会社豊田中央研究所 Moving object state quantity estimation device and program
JP6865110B2 (en) * 2017-05-31 2021-04-28 Kddi株式会社 Object tracking method and device
JP2018206285A (en) * 2017-06-09 2018-12-27 日本放送協会 Object tracking device and object trajectory generation system
KR102371616B1 (en) * 2017-11-07 2022-03-07 현대자동차주식회사 Apparatus and method for associating sensor data of vehicle
EP3743864A4 (en) * 2018-01-25 2021-10-20 BEET, Inc. PROCESS DIGITIZATION SYSTEM AND METHOD
JP6747461B2 (en) * 2018-01-30 2020-08-26 株式会社豊田中央研究所 Correlation device, object tracking device, and program
US10909377B2 (en) * 2018-04-18 2021-02-02 Baidu Usa Llc Tracking objects with multiple cues
TWI779029B (en) * 2018-05-04 2022-10-01 大猩猩科技股份有限公司 A distributed object tracking system
JP6779410B2 (en) 2018-05-17 2020-11-04 三菱電機株式会社 Video analyzer, video analysis method, and program
JP6871199B2 (en) * 2018-05-29 2021-05-12 大井電気株式会社 Target recognition device
RU2696548C1 (en) * 2018-08-29 2019-08-02 Александр Владимирович Абрамов Method of constructing a video surveillance system for searching and tracking objects
JP7455841B2 (en) * 2018-12-13 2024-03-26 プロフジー How to track objects in a scene
WO2020184539A1 (en) * 2019-03-13 2020-09-17 日本電気株式会社 Object tracking device, object tracking method, and recording medium
JP7262312B2 (en) * 2019-06-04 2023-04-21 三菱電機株式会社 Mobile identification device, mobile identification method and program
CN110781824B (en) * 2019-10-25 2023-03-14 阿波罗智联(北京)科技有限公司 Target detection and tracking method and device, electronic equipment and storage medium
JP7236377B2 (en) * 2019-12-26 2023-03-09 エヌ・ティ・ティ・コムウェア株式会社 Object detection device and object detection method
US12243299B2 (en) 2019-12-26 2025-03-04 Nec Corporation Object tracking apparatus, object tracking method and recording medium
JP7271413B2 (en) * 2019-12-26 2023-05-11 エヌ・ティ・ティ・コムウェア株式会社 Object detection device and object detection method
CN111242986B (en) * 2020-01-07 2023-11-24 阿波罗智能技术(北京)有限公司 Cross-camera obstacle tracking method, device, equipment, system and medium
KR102295183B1 (en) * 2020-08-15 2021-08-31 이노뎁 주식회사 object tracking method for CCTV video by use of CCTV projection model
KR102253989B1 (en) * 2020-08-19 2021-05-20 이노뎁 주식회사 object tracking method for CCTV video by use of Deep Learning object detector
US20230368542A1 (en) * 2020-10-30 2023-11-16 NEC Corporation 7-1, Shita-5-chome Object tracking device, object tracking method, and recording medium
JP7211601B2 (en) * 2020-10-30 2023-01-24 学校法人東京理科大学 Action trajectory estimation device, action trajectory estimation program, and action trajectory estimation method
US12499561B2 (en) 2020-10-30 2025-12-16 Nec Corporation Object tracking device, object tracking method, and recording medium
KR102538919B1 (en) * 2020-12-17 2023-06-01 주식회사 파인더스에이아이 A Hybrid Object Tracking System and Method therefor
JP7509044B2 (en) * 2021-01-18 2024-07-02 オムロン株式会社 Information processing device and information processing method
KR102614895B1 (en) * 2021-02-09 2023-12-19 주식회사 라온버드 Real-time object tracking system and method in moving camera video
WO2022195954A1 (en) 2021-03-17 2022-09-22 ソニーセミコンダクタソリューションズ株式会社 Sensing system
JP7635036B2 (en) * 2021-03-23 2025-02-25 株式会社Nttデータグループ MATCHING DEVICE, MATCHING METHOD, AND PROGRAM
JP7584359B2 (en) * 2021-06-09 2024-11-15 Kddi株式会社 Object tracking device and program
JP2023001996A (en) * 2021-06-22 2023-01-10 三菱電機株式会社 Supervisory control device
KR102446320B1 (en) * 2021-12-14 2022-09-23 주식회사 인텔리빅스 Map-based object tracking and event detection device based on a plurality of cameras and driving method of the device
JP7511540B2 (en) 2021-12-22 2024-07-05 三菱重工業株式会社 Object detection device, object detection method, and object detection program
JP7187655B1 (en) 2021-12-27 2022-12-12 株式会社a-LINK OBJECT TRACKING METHOD, PROGRAM, SYSTEM AND RECORDING MEDIUM
KR20230149457A (en) 2022-04-20 2023-10-27 한화비전 주식회사 System and method for tracking object
KR102950530B1 (en) 2022-11-29 2026-04-09 위드로봇 주식회사 Method and system for tracking moving object in multiple cameras with overlapping areas
JP7826952B2 (en) * 2023-01-11 2026-03-10 トヨタ自動車株式会社 Moving object search device
KR20240167260A (en) 2023-05-19 2024-11-26 한화비전 주식회사 Apparatus and method for managing image
JP7783580B1 (en) * 2024-09-18 2025-12-10 株式会社カラーチップス Mobile information processing device, system, program, and method

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004282535A (en) 2003-03-18 2004-10-07 Mitsubishi Electric Corp Angle of view adjustment device
JP2005259173A (en) 2005-05-23 2005-09-22 Omron Corp Human detection device, human detection method, and program
JP2008176504A (en) 2007-01-17 2008-07-31 Toshiba Corp Object detection apparatus and method
JP2009539155A (en) 2006-06-02 2009-11-12 イジュノシッヒ テクニッヒ ホッフシューラ チューリッヒ Method and system for generating a 3D representation of a dynamically changing 3D scene

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3257165B2 (en) * 1993-08-06 2002-02-18 株式会社日立製作所 Moving object monitoring device
JP3502468B2 (en) * 1995-03-07 2004-03-02 松下電器産業株式会社 Distributed monitoring equipment
JP3615868B2 (en) * 1996-05-24 2005-02-02 日本放送協会 Automatic camera system
US6480615B1 (en) * 1999-06-15 2002-11-12 University Of Washington Motion estimation within a sequence of data frames using optical flow with adaptive gradients
JP2004046647A (en) 2002-07-12 2004-02-12 Univ Waseda Moving object tracking method and apparatus based on moving image data
JP2004072628A (en) 2002-08-08 2004-03-04 Univ Waseda Moving object tracking system and method using multiple cameras
US6882959B2 (en) * 2003-05-02 2005-04-19 Microsoft Corporation System and process for tracking an object state using a particle filter sensor fusion technique
JP4559874B2 (en) * 2005-03-01 2010-10-13 ティーオーエー株式会社 Motion tracking device
JP2007064808A (en) * 2005-08-31 2007-03-15 Canon Inc Index position measuring method and apparatus
JP2007080060A (en) 2005-09-15 2007-03-29 Matsushita Electric Ind Co Ltd Object identification device
JP2008021034A (en) 2006-07-11 2008-01-31 Fujitsu Ten Ltd Image recognition device, image recognition method, pedestrian recognition device and vehicle controller
JP4725490B2 (en) * 2006-10-27 2011-07-13 パナソニック電工株式会社 Automatic tracking method
JP4874150B2 (en) * 2007-03-30 2012-02-15 セコム株式会社 Moving object tracking device
JP5147760B2 (en) * 2009-03-02 2013-02-20 セコム株式会社 Image monitoring device
JP4553071B1 (en) 2009-03-31 2010-09-29 コニカミノルタホールディングス株式会社 3D information display device and 3D information display method
JP2010268369A (en) 2009-05-18 2010-11-25 Konica Minolta Opto Inc Peripheral display device
JP5203319B2 (en) * 2009-08-25 2013-06-05 セコム株式会社 Abandonment monitoring device
JP5538781B2 (en) * 2009-09-02 2014-07-02 キヤノン株式会社 Image search apparatus and image search method
JP2012080251A (en) * 2010-09-30 2012-04-19 Casio Comput Co Ltd Image processor, image processing method, and program
JP5613016B2 (en) * 2010-10-29 2014-10-22 株式会社キーエンス Video tracking device, video tracking method, and video tracking program
JP2012133408A (en) 2010-12-17 2012-07-12 Sharp Corp Image processing device and program
JP5925557B2 (en) * 2012-03-30 2016-05-25 セコム株式会社 Image matching device
JP5956248B2 (en) 2012-05-21 2016-07-27 セコム株式会社 Image monitoring device
JP6016295B2 (en) * 2012-08-10 2016-10-26 株式会社日立国際電気 Monitoring system
JP5931662B2 (en) * 2012-09-14 2016-06-08 株式会社東芝 Road condition monitoring apparatus and road condition monitoring method
WO2014080613A1 (en) * 2012-11-22 2014-05-30 日本電気株式会社 Color correction device, method, and program
JP6181925B2 (en) * 2012-12-12 2017-08-16 キヤノン株式会社 Image processing apparatus, image processing apparatus control method, and program
JP6080572B2 (en) * 2013-01-31 2017-02-15 セコム株式会社 Traffic object detection device

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004282535A (en) 2003-03-18 2004-10-07 Mitsubishi Electric Corp Angle of view adjustment device
JP2005259173A (en) 2005-05-23 2005-09-22 Omron Corp Human detection device, human detection method, and program
JP2009539155A (en) 2006-06-02 2009-11-12 イジュノシッヒ テクニッヒ ホッフシューラ チューリッヒ Method and system for generating a 3D representation of a dynamically changing 3D scene
JP2008176504A (en) 2007-01-17 2008-07-31 Toshiba Corp Object detection apparatus and method

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
坂木和則 外4名,多視点テレビ放送を用いた映像内のオブジェクト位置の認識と追跡,電子情報通信学会論文誌,日本,社団法人電子情報通信学会 ,2004年02月01日,第J87-D-I巻 第2号,pp.175~187
小林貴訓,人物頭部の追跡技術,画像ラボ,日本,日本工業出版株式会社,2010年12月10日,第21巻 第12号,pp.9~14
池田聖 外1名,全方位型マルチカメラシステムを用いた高臨場感テレプレゼンスシステムの構築手法に関する研究,情報処理学会研究報告,日本,社団法人情報処理学会,2006年05月19日,第2006巻 第51号,pp.307~322
長瀬琢也 外1名,多視点映像を用いたサッカーにおける選手のプレー判定,映像情報メディア学会誌,日本,(社)映像情報メディア学会 ,2006年10月01日,第60巻 第10号,pp.1664~1671

Also Published As

Publication number Publication date
JP6673508B2 (en) 2020-03-25
JP2019114280A (en) 2019-07-11
JP2016071830A (en) 2016-05-09
JP7272417B2 (en) 2023-05-12
JP2023083565A (en) 2023-06-15
JP7004017B2 (en) 2022-01-21
JP2024177244A (en) 2024-12-19
JP2020107349A (en) 2020-07-09
JP7726357B2 (en) 2025-08-20
JP6488647B2 (en) 2019-03-27
JP2022036143A (en) 2022-03-04

Similar Documents

Publication Publication Date Title
JP7567979B2 (en) Object tracking method and object tracking device
US12380699B2 (en) Object tracking apparatus, object tracking system, object tracking method, display control device, object detection device, and computer-readable medium
US10198823B1 (en) Segmentation of object image data from background image data
US9965865B1 (en) Image data segmentation using depth data
US7986828B2 (en) People detection in video and image data
EP3951715B1 (en) Generation apparatus, generation method, and program
CN109325456B (en) Target identification method, target identification device, target identification equipment and storage medium
JP2016099941A (en) Object position estimation system and program thereof
US20230394792A1 (en) Information processing device, information processing method, and program recording medium
CN104049754A (en) Real time hand tracking, pose classification, and interface control
US10891740B2 (en) Moving object tracking apparatus, moving object tracking method, and computer program product
KR20190018274A (en) Method and apparatus for recognizing a subject existed in an image based on temporal movement or spatial movement of a feature point of the image
US20170147075A1 (en) Determination of hand dimensions for hand and gesture recognition with a computing interface
US20170344104A1 (en) Object tracking for device input
JP2020106970A (en) Person detection device and person detection method
US20250356682A1 (en) Machine-vision person tracking in service environment
US20240395056A1 (en) Driver surveillance apparatus, driver surveillance method, and non-transitory storage medium
KR102136245B1 (en) Apparatus, method, computer-readable storage medium and computer program for detecting and selecting target
Farazi et al. Real-time visual tracking and identification for a team of homogeneous humanoid robots

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230425

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240305

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240419

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240514

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240711

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240903

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240916

R150 Certificate of patent or registration of utility model

Ref document number: 7567979

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150