JP5289993B2 - TRACKING DEVICE AND TRACKING METHOD - Google Patents
TRACKING DEVICE AND TRACKING METHOD Download PDFInfo
- Publication number
- JP5289993B2 JP5289993B2 JP2009024190A JP2009024190A JP5289993B2 JP 5289993 B2 JP5289993 B2 JP 5289993B2 JP 2009024190 A JP2009024190 A JP 2009024190A JP 2009024190 A JP2009024190 A JP 2009024190A JP 5289993 B2 JP5289993 B2 JP 5289993B2
- Authority
- JP
- Japan
- Prior art keywords
- face
- detection
- unit
- motion detection
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 85
- 238000001514 detection method Methods 0.000 claims description 369
- 238000012545 processing Methods 0.000 claims description 57
- 238000011156 evaluation Methods 0.000 claims description 37
- 238000003384 imaging method Methods 0.000 claims description 31
- 210000000887 face Anatomy 0.000 description 56
- 238000010586 diagram Methods 0.000 description 9
- 230000015654 memory Effects 0.000 description 7
- 230000007423 decrease Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000000875 corresponding effect Effects 0.000 description 3
- 238000001454 recorded image Methods 0.000 description 2
- 230000003936 working memory Effects 0.000 description 2
- 208000029152 Small face Diseases 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000000994 depressogenic effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005401 electroluminescence Methods 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000013077 scoring method Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Landscapes
- Studio Devices (AREA)
Description
本発明は、連続する画像を順次処理して各画像中に出現した顔を追尾する追尾装置および追尾方法に関するものである。 The present invention relates to a tracking device and a tracking method for sequentially processing consecutive images and tracking a face appearing in each image.
従来から、画像中に映る人物等の顔を検出する顔検出技術が知られている。かかる技術は、例えばテンプレートマッチング法によって画像中の顔の位置を検出し、目や鼻、口等の顔の特徴点の位置を検出するものであり、顔の大きさや向き等を検出することができる。例えばデジタルカメラ等の撮像装置では、撮像素子に結像されている被写体像をリアルタイムに表示(ライブビュー)させて電子ファインダーとして用いているが、近年では、顔検出技術を適用してライブビュー画像中の顔を検出し、検出した顔を示す顔枠を表示するようにしたものが知られている。また、この顔検出の結果は、露出やフォーカスの制御にも利用されている。例えば特許文献1には、顔検出(顔認識)の結果をもとに焦点検出を行う技術が開示されている。 Conventionally, a face detection technique for detecting a face of a person or the like shown in an image is known. Such a technique detects the position of a face in an image by, for example, a template matching method, and detects the position of a facial feature point such as an eye, nose, or mouth, and can detect the size and orientation of the face. it can. For example, in an imaging apparatus such as a digital camera, an object image formed on an imaging element is displayed in real time (live view) and used as an electronic viewfinder. However, in recent years, a live view image is applied by applying face detection technology. A device that detects the inside face and displays a face frame indicating the detected face is known. The face detection result is also used for exposure and focus control. For example, Patent Literature 1 discloses a technique for performing focus detection based on the result of face detection (face recognition).
一方で、連続する画像間でパタンマッチングを行い、その移動量を算出することによって画像間の動きを検出する動き検出技術が知られている。 On the other hand, there is known a motion detection technique for detecting a motion between images by performing pattern matching between successive images and calculating a movement amount thereof.
従来の顔検出技術では、例えば顔が横や後ろを向いていると検出精度が低下する場合があった。このため、例えば顔の向きが変化すると顔検出の結果が不安定になる場合があり、顔検出結果に従ってライブビュー画像上に前述の顔枠を表示させると、顔枠の表示・非表示が繰り返されてちらつく等して見難い場合があった。 In the conventional face detection technology, for example, when the face is facing sideways or behind, the detection accuracy may be lowered. For this reason, for example, if the orientation of the face changes, the face detection result may become unstable. When the above-mentioned face frame is displayed on the live view image according to the face detection result, the display / non-display of the face frame is repeated. Sometimes it was difficult to see due to flickering.
これに対し、顔検出によって検出された顔について動き検出を行うようにすれば、顔の向き等が大きく変化して顔検出に失敗した場合であっても、その顔の動きを検出することができるので、顔を見失わずに追尾できる。しかしながら、画像中から複数の顔が検出された場合、全ての顔を対象として動き検出を行うと、処理負荷が増大するという問題があった。この問題は、デジタルカメラ等の処理能力に制限がある装置に適用する場合に特に問題であった。また、顔の検出や動き検出に時間を要してしまうと、動きのあるシーンにおいて検出不能に陥ったり、撮影チャンスを逃す問題が生じ、安定した顔の追尾を行うことができなかった。 On the other hand, if motion detection is performed on a face detected by face detection, the face motion can be detected even when face detection fails due to a significant change in the orientation of the face. You can track without losing your face. However, when a plurality of faces are detected from an image, there is a problem that processing load increases when motion detection is performed for all the faces. This problem is particularly problematic when applied to an apparatus having a limited processing capability such as a digital camera. In addition, if time is required for face detection and motion detection, there is a problem that detection is not possible in a moving scene, and there is a problem of missing a photographing opportunity, and stable face tracking cannot be performed.
本発明は、上記に鑑みてなされたものであって、処理の負荷を増大させることなく、連続する画像中に出現する顔を安定して追尾することができる追尾装置および追尾方法を提供することを目的とする。 The present invention has been made in view of the above, and provides a tracking device and a tracking method capable of stably tracking a face appearing in a continuous image without increasing the processing load. With the goal.
上述した課題を解決し、目的を達成するため、本発明にかかる追尾装置は、連続する画像中に出現した顔を追尾する追尾装置であって、前記連続する画像を順次処理して前記画像中の複数の顔を検出する顔検出部と、前記顔検出部によって検出された各顔を含む顔領域をそれぞれの顔に対して設定する顔領域設定部と、前記顔検出部による顔検出結果をもとに、前記検出された各顔の検出難易度を評価する難易度評価部と、前記各顔を含む顔領域の中から、前記各顔の検出難易度が所定条件を満たす顔領域を選択する顔領域選択部と、前記顔領域選択部による選択結果をもとに、前記各顔を含む顔領域それぞれに対して動き検出をする対象領域とするか否かを切り換えて設定する動き検出対象設定部と、隣接する画像間で、前記動き検出対象設定部によって設定された対象領域の動きを検出する動き検出部と、を備えることを特徴とする。 In order to solve the above-described problems and achieve the object, a tracking device according to the present invention is a tracking device that tracks a face that appears in a continuous image, and sequentially processes the continuous image to include the image in the image. A face detection section for detecting a plurality of faces, a face area setting section for setting a face area including each face detected by the face detection section for each face, and a face detection result by the face detection section. Based on the difficulty level evaluation unit that evaluates the detection difficulty level of each detected face and a face area that satisfies the predetermined condition of the detection difficulty level of each face from the face areas including each face And a motion detection target that is set by switching whether or not to make a motion detection target for each of the face regions including each face based on the selection result by the face region selection unit The motion detection target between the setting unit and adjacent images Characterized in that it comprises a motion detector for detecting a movement of the target region set by the tough, the.
また、本発明にかかる追尾装置は、上記の発明において、前記顔領域選択部は、前記検出難易度が高い所定数の顔を含む顔領域を選択し、前記動き検出対象設定部は、前記顔領域選択部によって選択された所定数の顔を含む顔領域を前記対象領域として設定することを特徴とする。 In the tracking device according to the present invention, in the above invention, the face area selection unit selects a face area including a predetermined number of faces with high detection difficulty, and the motion detection target setting unit includes the face A face area including a predetermined number of faces selected by the area selection unit is set as the target area.
また、本発明にかかる追尾装置は、上記の発明において、前記顔領域選択部は、前記検出難易度が低い所定数の顔を含む顔領域を選択し、前記動き検出対象設定部は、前記顔領域選択部によって選択された所定数の顔を含む顔領域を前記対象領域として設定しないことを特徴とする。 In the tracking device according to the present invention, in the above invention, the face area selection unit selects a face area including a predetermined number of faces with a low detection difficulty level, and the motion detection target setting unit includes the face A face area including a predetermined number of faces selected by the area selection unit is not set as the target area.
また、本発明にかかる追尾装置は、上記の発明において、前記顔検出部は、少なくとも顔の大きさ、顔の位置、顔の向きおよび顔の傾きのいずれか1つを前記顔検出結果として出力し、前記難易度評価部は、前記顔検出部によって検出された各顔の顔検出結果をもとに、少なくとも顔の大きさ、顔の位置、顔の向き、顔の傾き、顔の向き変化、顔の傾き変化、顔の移動速度および顔の移動方向のうちの1つまたは複数を評価パラメータとして前記各顔の検出難易度を評価することを特徴とする。 In the tracking device according to the present invention as set forth in the invention described above, the face detection unit outputs at least one of a face size, a face position, a face orientation, and a face tilt as the face detection result. The difficulty level evaluation unit, based on the face detection result of each face detected by the face detection unit, at least a face size, a face position, a face orientation, a face tilt, a face orientation change The degree of difficulty in detecting each face is evaluated using one or more of a change in face inclination, a face moving speed, and a face moving direction as evaluation parameters.
また、本発明にかかる追尾装置は、上記の発明において、前記難易度評価部は、前記検出された各顔が他の顔と重なる可能性を推定し、推定結果を前記評価パラメータとして前記各顔の検出難易度を評価することを特徴とする。 In the tracking device according to the present invention, in the above invention, the difficulty level evaluation unit estimates the possibility that each detected face overlaps with another face, and uses the estimation result as the evaluation parameter for each face. It is characterized by evaluating the degree of detection difficulty.
また、本発明にかかる追尾装置は、上記の発明において、前記難易度評価部は、前記各顔の顔検出結果から顔の移動速度および/または顔の移動方向を判定し、判定結果をもとに前記各顔が他の顔と重なる可能性を推定することを特徴とする。 In the tracking device according to the present invention as set forth in the invention described above, the difficulty level evaluation unit determines the moving speed and / or moving direction of the face from the face detection result of each face, and based on the determination result. Further, the possibility that each face overlaps with another face is estimated.
また、本発明にかかる追尾装置は、上記の発明において、前記難易度評価部は、前記評価パラメータ毎に予め設定される重み係数を用いて前記評価パラメータを重み付けする重み付け部を有し、該重み付け部によって重み付けされた前記評価パラメータをもとに前記各顔の検出難易度を評価することを特徴とする。 In the tracking device according to the present invention, in the above invention, the difficulty level evaluation unit includes a weighting unit that weights the evaluation parameter using a weighting factor set in advance for each evaluation parameter. The degree of detection difficulty of each face is evaluated based on the evaluation parameter weighted by the unit.
また、本発明にかかる追尾装置は、上記の発明において、前記顔検出部によって検出された各顔を含む顔領域と、前記動き検出部によって検出された前記対象領域の動きとをもとに、前記画像中の顔領域を確定する顔領域確定部を備えることを特徴とする。 Further, the tracking device according to the present invention is based on the face area including each face detected by the face detection unit and the movement of the target area detected by the motion detection unit in the above invention. The image processing apparatus includes a face area determination unit that determines a face area in the image.
また、本発明にかかる追尾装置は、上記の発明において、前記連続する画像を切り換えて表示部に表示処理する表示処理部を備え、該表示処理部は、前記確定された前記画像中の顔領域に従って、前記画像中の顔を示す顔枠を表示することを特徴とする。 Further, the tracking device according to the present invention includes a display processing unit that switches the continuous images and performs display processing on the display unit in the above invention, and the display processing unit includes the face area in the determined image. According to the above, a face frame indicating the face in the image is displayed.
また、本発明にかかる追尾装置は、上記の発明において、フレーム毎に被写体を撮像して前記連続する画像を順次生成する撮像部と、撮影指示を行う撮影指示部と、前記確定された前記画像中の顔領域の顔について前記顔検出部が検出した最新の顔検出結果を用い、前記撮像部の撮像条件を設定する撮像条件設定部と、を備えることを特徴とする。 In the tracking device according to the present invention, in the above-described invention, an imaging unit that captures a subject for each frame and sequentially generates the continuous image, a shooting instruction unit that performs a shooting instruction, and the determined image An imaging condition setting unit configured to set an imaging condition of the imaging unit using a latest face detection result detected by the face detection unit for a face in an inside face region.
また、本発明にかかる追尾方法は、連続する画像中に出現した顔を追尾する追尾方法であって、前記連続する画像を順次処理して前記画像中の複数の顔を検出する顔検出工程と、前記顔検出工程で検出された各顔を含む顔領域をそれぞれの顔に対して設定する顔領域設定工程と、前記顔検出工程での顔検出結果をもとに、前記検出された各顔の検出難易度を評価する難易度評価工程と、前記各顔を含む顔領域の中から、前記各顔の検出難易度が所定条件を満たす顔領域を選択する顔領域選択工程と、前記顔領域選択工程での選択結果をもとに、前記各顔を含む顔領域それぞれに対して動き検出をする対象領域とするか否かを切り換えて設定する動き検出対象設定工程と、隣接する画像間で、前記動き検出対象設定工程で設定された対象領域の動きを検出する動き検出部と、を含むことを特徴とする。 The tracking method according to the present invention is a tracking method for tracking a face that appears in a continuous image, and a face detection step for detecting a plurality of faces in the image by sequentially processing the continuous image; A face area setting step for setting a face area including each face detected in the face detection step for each face, and each detected face based on a face detection result in the face detection step A difficulty level evaluation step for evaluating the detection difficulty level, a face area selection step for selecting a face area where the detection difficulty level of each face satisfies a predetermined condition from the face areas including the faces, and the face area Based on the selection result in the selection step, between the motion detection target setting step of switching and setting whether or not to make a motion detection target region for each face region including each face, and between adjacent images , The target region set in the motion detection target setting step Characterized in that it comprises a motion detector for detecting gas, a.
本発明によれば、顔検出によって検出された各顔を含む顔領域それぞれに対し、顔検出結果をもとに評価した各顔の検出難易度に従って、動き検出をする対象領域とするか否かを切り換えて設定することができる。そして、対象領域とした顔領域の動き検出を行うことができる。したがって、処理の負荷を増大させることなく、連続する画像中に出現する顔を安定して追尾することができるという効果を奏する。 According to the present invention, for each face area including each face detected by face detection, whether or not to make a target area for motion detection according to the detection difficulty level of each face evaluated based on the face detection result. Can be set by switching. Then, the motion detection of the face area as the target area can be performed. Therefore, there is an effect that a face appearing in a continuous image can be tracked stably without increasing the processing load.
以下、図面を参照し、本発明の好適な実施の形態について詳細に説明する。本実施の形態では、本発明の追尾装置をデジタルカメラに適用した場合を例にとって説明する。なお、この実施の形態によって本発明が限定されるものではない。また、各図面の記載において、同一部分には同一の符号を付して示している。 DESCRIPTION OF EMBODIMENTS Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the drawings. In this embodiment, a case where the tracking device of the present invention is applied to a digital camera will be described as an example. Note that the present invention is not limited to the embodiments. Moreover, in description of each drawing, the same code | symbol is attached | subjected and shown to the same part.
(実施の形態)
図1は、デジタルカメラ1の背面図である。図1に示すように、デジタルカメラ1は、カメラ本体2の上面に配設された撮影タイミングを指示するためのレリーズスイッチ(シャッタースイッチ)3、カメラ本体2の背面に配設された電源スイッチ4やメニュースイッチ5、上下左右の各方向スイッチ(上スイッチ、下スイッチ、左スイッチおよび右スイッチ)を有する十字キー6、操作内容を確定する等のためのOKスイッチ7、撮影モードや再生モードといった各種モードを切り換えるモードダイヤル8、各種画面を表示する表示部24等を備えている。レリーズスイッチ3は、例えば二段階式の押下ボタンであり、半押しされるとファーストレリーズスイッチがONし、全押しされるとセカンドレリーズスイッチがONするようになっている。また、図示しないが、カメラ本体2の前面には、フラッシュや撮像レンズ等が配設されている。
(Embodiment)
FIG. 1 is a rear view of the digital camera 1. As shown in FIG. 1, the digital camera 1 includes a release switch (shutter switch) 3 for instructing photographing timing provided on the upper surface of the
このデジタルカメラ1において電源スイッチ4を押下し、電源をONすると、モードダイヤル8で撮影モードが選択されている場合であれば、デジタルカメラ1は撮影可能な状態となる。撮影モードでは、撮像レンズを通して入射する被写体像が1フレーム(例えば1/30秒)毎に出力され、ライブビュー画像として表示部24にリアルタイムに表示されるようになっており、ユーザは、ライブビュー画像を見ながらレリーズスイッチ3を押下して、静止画や動画の撮影を行う。一方、電源ON時、モードダイヤル8で再生モードが選択されていれば、デジタルカメラ1は再生モードとなる。この再生モードでは、ユーザは、デジタルカメラ1で撮影された静止画や動画を表示部24に表示(再生)して楽しむ。
When the
先ず、本実施の形態のデジタルカメラ1の機能の1つである顔検出機能の概要について説明する。本実施の形態のデジタルカメラ1は、画像中に映る人物等の顔を検出する顔検出部17(図8参照)を備えており、1フレーム毎に取り込まれるライブビュー画像を画像処理して顔検出を行う。そして、検出した顔を示す顔枠をライブビュー画像上に表示する処理を行う。 First, an outline of a face detection function that is one of the functions of the digital camera 1 of the present embodiment will be described. The digital camera 1 according to the present embodiment includes a face detection unit 17 (see FIG. 8) that detects the face of a person or the like shown in the image, and performs image processing on the live view image captured every frame. Perform detection. And the process which displays the face frame which shows the detected face on a live view image is performed.
図2は、表示部24に更新表示される4枚のライブビュー画像の一例を時系列に沿って示した図である。上記したように、顔検出技術は、テンプレートマッチング法によって画像中の顔の位置を検出し、目や鼻、口等の顔の特徴点の位置を検出するものであり、顔が横や後ろを向いている場合や、顔が大きく傾いている場合等において検出精度が低下する場合がある。例えば、図2(a)のフレームI11では、ライブビュー画像中に映る人物Pの顔が正面を向いているため顔検出に成功し、顔枠N11が表示されている。これに対し、図2(b)のように人物Pが動いたフレームI13では、顔が横を向いており、角度も大きく傾いているため顔検出に失敗し、顔枠が表示されていない。続く図2(c)のフレームI15でも人物Pの顔が検出できず、顔枠が表示されない状態が継続している。そして、図2(d)に示すフレームI17では、人物Pの顔検出に成功し、顔枠N14が表示されている。
FIG. 2 is a diagram showing an example of four live view images updated and displayed on the
このように、フレーム間で顔の向きや角度が変化すると、顔枠の表示・非表示が繰り返される場合がある。特に、人物が激しく動くような場合にこのような事態が生じ、顔枠がちらついて見難い。また、顔検出結果は、露出やフォーカスの制御に利用されるが、これらの制御が安定しないという問題もある。本実施の形態は、ライブビュー画像中の顔検出と併せて顔エリア(顔領域)の動き検出を行い、顔検出に失敗した場合であっても、顔を見失わずに追尾できるようにするものである。 As described above, when the face direction or angle changes between frames, the display / non-display of the face frame may be repeated. In particular, such a situation occurs when a person moves violently, and the face frame flickers and is difficult to see. The face detection result is used for exposure and focus control, but there is a problem that these controls are not stable. In this embodiment, motion detection of a face area (face area) is performed in conjunction with face detection in a live view image, and even if face detection fails, tracking can be performed without losing sight of the face. It is.
図3は、5人の人物の顔F1〜F5が映る3枚のライブビュー画像の一例を時系列に沿って模式的に示した図であり、図3では、各フレームI21,I23,I25においてそれぞれ顔検出で検出された顔を一点鎖線で囲んで示している。ここで、フレームI21,I23,I25は、ライブビュー画像に映る各顔の向きや傾き等が時系列に沿って変化する様子を示したものであり、連続するフレームのライブビュー画像を示したものではない。例えば図3(a)のフレームI21では、顔検出によって5人全ての顔F1〜F5が検出されている。一方、図3(b)のフレームI23では、向かって左上の顔F1について顔が大きく傾いたために顔検出に失敗している。また、図3(c)のフレームI25では、図3(b)と同様に顔F1について顔検出に失敗しているのに加えて、向かって左下及び右下の顔F2,F5についても顔が後ろを向いてしまったために顔検出に失敗している。 FIG. 3 is a diagram schematically showing an example of three live view images showing the faces F1 to F5 of five persons along a time series. In FIG. 3, in each frame I21, I23, and I25, FIG. Each face detected by face detection is shown surrounded by a one-dot chain line. Here, the frames I21, I23, and I25 show how the orientation and inclination of each face reflected in the live view image change in time series, and show the live view images of successive frames. is not. For example, in the frame I21 in FIG. 3A, all five faces F1 to F5 are detected by face detection. On the other hand, in the frame I23 in FIG. 3B, the face detection has failed because the face is greatly inclined with respect to the upper left face F1. In addition, in the frame I25 in FIG. 3C, in addition to the face detection failure for the face F1 as in FIG. 3B, the faces also appear on the lower left and lower right faces F2 and F5. Face detection failed due to facing backwards.
また、図4は、図3と同様の3枚のライブビュー画像の一例を示す図であり、図4では、各フレームI21,I23,I25においてそれぞれ顔検出で検出された顔を一点鎖線で囲んで示すとともに、各フレームI21,I23,I25においてそれぞれ動き検出で検出された顔エリアを二点鎖線で囲んで示している。詳細は後述するが、動き検出は、顔検出によって検出された顔を含む顔領域(顔エリア)を動き検出エリア(対象領域)として隣接するフレーム間でパタンマッチングを行い、その移動量を算出するものであり、フレーム間で動き検出エリアが対応付けられれば、顔の向きや傾きに関係なく顔を見失わずに追尾できる。例えば、図4に示す例では、(a)〜(c)に示す各フレームI21〜I25で、それぞれ5人全ての顔が検出できている。 FIG. 4 is a diagram showing an example of three live view images similar to FIG. 3. In FIG. 4, the faces detected by face detection in each of the frames I21, I23, and I25 are surrounded by a one-dot chain line. In addition, the face areas detected by motion detection in each of the frames I21, I23, and I25 are surrounded by a two-dot chain line. Although details will be described later, in motion detection, pattern matching is performed between adjacent frames using a face area (face area) including a face detected by face detection as a motion detection area (target area), and the amount of movement is calculated. If a motion detection area is associated between frames, tracking can be performed without losing sight of the face regardless of the orientation and inclination of the face. For example, in the example shown in FIG. 4, all five faces can be detected in each of the frames I21 to I25 shown in (a) to (c).
ここで、テンプレートマッチング法を適用した顔検出では、1枚の画像中に映る複数の顔(例えば数十個)を同時に検出できる。一方で、複数の顔エリアについて動き検出を実施する場合には、各顔エリアを動き検出エリアとし、それぞれ個別にパタンマッチングを行う必要があり、これらを同時に行うと処理負荷が増大する。このため、必要な処理速度を確保するためには、例えば動き検出をハードウェアで実現する場合であれば、回路規模が増大してしまうという問題があった。 Here, in face detection using the template matching method, a plurality of faces (for example, several tens) appearing in one image can be detected simultaneously. On the other hand, when motion detection is performed for a plurality of face areas, each face area must be set as a motion detection area, and pattern matching must be performed individually. If these are performed simultaneously, the processing load increases. For this reason, in order to ensure the necessary processing speed, for example, when motion detection is realized by hardware, there is a problem that the circuit scale increases.
そこで、本実施の形態では、予め同時に動き検出を実施可能な動き検出エリア数を定めておく。そして、顔検出結果をもとにその顔の優先度を採点し、動き検出エリア数よりも多い数の顔がライブビュー画像中に出現した場合には、採点の高い顔から順番に動き検出エリア数の顔エリアを選択して動き検出エリアとする。図5〜図7は、動き検出エリアの設定原理を説明する図であり、各図において、図3(a)〜(c)および図4(a)〜(c)でそれぞれ示した5人の人物の顔F1〜F5が映る3枚のライブビュー画像を示している。なお、ここでは、動き検出エリア数を「3」として説明するが、この動き検出エリア数は、実際のデジタルカメラ1の処理能力に応じて適宜定めることができる。 Therefore, in this embodiment, the number of motion detection areas in which motion detection can be simultaneously performed is determined in advance. Then, the priority of the face is scored based on the face detection result, and when the number of faces larger than the number of motion detection areas appears in the live view image, the motion detection areas are ordered in order from the face with the highest score. A number of face areas are selected as motion detection areas. 5 to 7 are diagrams for explaining the principle of setting the motion detection area. In each figure, the five persons shown in FIGS. 3 (a) to (c) and FIGS. 4 (a) to (c), respectively. Three live view images showing human faces F1 to F5 are shown. Although the number of motion detection areas is described as “3” here, the number of motion detection areas can be determined as appropriate according to the actual processing capability of the digital camera 1.
例えば、図5中に一点鎖線で囲んで示すように、顔検出によって顔F1〜F5が検出された場合、各顔F1〜F5について優先度を採点する。優先度の採点の詳細については後述するが、その顔についての顔検出結果をもとに、次のフレームで行う顔検出の検出難易度が高いと想定されるほど優先度が高くなるように採点を行う。すなわち、本実施の形態では、このようにして優先度を採点することで、顔検出によって検出された各顔の検出難易度を評価する。例えば、顔検出の結果、その顔の向きが正面から外れていたり、顔が傾いている場合、あるいは過去のフレームと比較して顔の向きや角度の変化が大きいといった場合には、次のフレームでその顔の顔検出に失敗する可能性が高いと考えられるので、このような顔について優先度を高く採点する。そして、採点した優先度をもとに、動き検出エリアとする顔エリアを選択する。 For example, when faces F1 to F5 are detected by face detection as shown by being surrounded by a one-dot chain line in FIG. 5, the priority is scored for each of the faces F1 to F5. Although details of scoring priority will be described later, scoring is performed so that the priority becomes higher as it is assumed that the detection difficulty of face detection performed in the next frame is higher based on the face detection result for the face. I do. That is, in the present embodiment, the priority of scoring is evaluated in this way, thereby evaluating the detection difficulty level of each face detected by face detection. For example, as a result of face detection, if the face orientation is off the front, the face is tilted, or the face orientation or angle changes significantly compared to the previous frame, the next frame Therefore, it is considered that there is a high possibility that the face detection of the face will fail. Then, a face area as a motion detection area is selected based on the scored priority.
例えば、図5に示す顔F1〜F5についてそれぞれ優先度を採点した結果、実線で囲んで示した3つの顔F1,F4,F5について優先度が高く採点された場合には、フレームI21中の各顔F1,F4,F5の顔エリアを動き検出エリアとする。そして、各動き検出エリアについて、例えば次のフレームとの間で動き検出を行うことにより、これらの各顔F1,F4,F5を追尾する。 For example, as a result of scoring the priorities for the faces F1 to F5 shown in FIG. 5, when the priorities are scoring high for the three faces F1, F4, and F5 surrounded by solid lines, The face areas of the faces F1, F4, and F5 are set as motion detection areas. Then, for each motion detection area, for example, by performing motion detection with the next frame, these faces F1, F4, and F5 are tracked.
このようにして各フレームで顔検出を行うとともに、動き検出エリアとした顔エリアについて動き検出を行った結果、例えばフレームI23では、図6(a)中に二点鎖線で囲んで示すように、顔F1,F4,F5の顔エリアが動き検出によってそれぞれ検出され、追尾されている。一方、顔検出は、顔F2〜F5については成功し、顔F1については失敗している。これによれば、結果的にフレームI23で顔検出に失敗した顔F1に対する顔枠の表示を、動き検出結果をもとに継続して行うことができる。 As a result of performing face detection in each frame in this way and performing motion detection on the face area as the motion detection area, for example, in frame I23, as shown by being surrounded by a two-dot chain line in FIG. Face areas of the faces F1, F4, and F5 are detected and tracked by motion detection, respectively. On the other hand, the face detection succeeds for the faces F2 to F5 and fails for the face F1. As a result, it is possible to continuously display the face frame for the face F1 whose face detection has failed in the frame I23 based on the motion detection result.
また、本実施の形態では、次のフレームとの間で行う動き検出で動き検出エリアとする顔エリアを例えばその都度選択する。このとき、例えば図6(a)の顔F1のように、動き検出で検出できたが顔検出に失敗した顔エリアについては必ず動き検出エリアとして選択する。そして、動き検出エリアとして選択した顔エリアの数が動き検出エリア数に満たない場合には、顔検出結果をもとに、各顔について採点した優先度が高い顔エリアをさらに選択する。 In the present embodiment, for example, a face area that is used as a motion detection area in motion detection performed with the next frame is selected each time. At this time, for example, a face area that could be detected by motion detection but failed to detect the face, such as the face F1 in FIG. 6A, is always selected as the motion detection area. If the number of face areas selected as the motion detection area is less than the number of motion detection areas, a face area with a high priority scored for each face is further selected based on the face detection result.
例えば、図6(a)の例では、動き検出で検出できたが顔検出に失敗した顔エリアは1つ(顔F1)であり、動き検出エリア数「3」に満たないため、顔検出に成功している顔F2〜F5のうちの2つの顔の顔エリアについて動き検出を行うことが可能である。例えば、フレームI23について行った顔検出結果をもとに各顔F2〜F5についてそれぞれ優先度を採点した結果、顔F5,F2,F4,F3の順に優先度が高く採点されたとする。ここで、前回動き検出エリアとして選択した顔の優先度が低く採点される場合がある。例えば、例示した顔F5,F2,F4,F3の順の優先度の採点結果では、前回動き検出エリアとして選択した顔F4よりも顔F2の優先度が高く採点されている。これは、フレームI23において、直前のフレームとの間で顔F4と比較して顔F2が大きく変化しているためである。この場合には、図6(b)中に実線で囲んで示す各顔F1,F2,F5の顔エリアを動き検出エリアとし、各動き検出エリアについて、次のフレームとの間で動き検出を行うことにより、これらの各顔F1,F2,F5を追尾する。 For example, in the example of FIG. 6A, there is one face area (face F1) that could be detected by motion detection but failed to detect the face, and the number of motion detection areas is less than “3”. Motion detection can be performed for the face areas of two of the successful faces F2 to F5. For example, it is assumed that the priority is scored in the order of the faces F5, F2, F4, and F3 as a result of scoring the priorities for the faces F2 to F5 based on the face detection results performed for the frame I23. Here, the priority of the face selected as the previous motion detection area may be scored low. For example, in the priority scoring results in the order of the faces F5, F2, F4, F3 illustrated, the priority of the face F2 is scored higher than the face F4 selected as the previous motion detection area. This is because in the frame I23, the face F2 has changed significantly compared to the face F4 from the previous frame. In this case, the face area of each of the faces F1, F2, and F5 indicated by a solid line in FIG. 6B is set as a motion detection area, and motion detection is performed between each motion detection area and the next frame. Thus, each of these faces F1, F2, and F5 is tracked.
この結果、例えば、図7中に二点鎖線で囲んで示すように、フレームI25では、動き検出によって顔F1,F2,F5の顔エリアがそれぞれ検出され、追尾されている。一方、顔検出は、顔F3,F4については成功し、顔F1,F2,F5については失敗している。これによれば、結果的にフレームI25で顔検出に失敗した各顔F1,F2,F5に対する顔枠の表示を、動き検出結果をもとに引き続き行える。このように、フレーム毎に顔検出によって検出された各顔の優先度を採点し、優先度の高い顔の顔エリアを動き検出エリアとして設定することで、動き検出エリアを適切に設定することができる。したがって、動き検出エリア数を所定数(動き検出エリア数)に制限して処理負荷の増大を許容範囲内に抑えつつ、顔検出し難い顔が出現した場合であっても安定した追尾が実現できる。 As a result, for example, as indicated by being surrounded by a two-dot chain line in FIG. 7, the face areas of the faces F1, F2, and F5 are detected and tracked by the motion detection in the frame I25. On the other hand, the face detection succeeds for the faces F3 and F4 and fails for the faces F1, F2, and F5. According to this, it is possible to continuously display the face frame for each of the faces F1, F2, and F5 whose face detection has failed in the frame I25, based on the motion detection result. In this way, it is possible to appropriately set the motion detection area by scoring the priority of each face detected by face detection for each frame and setting the face area of the face with high priority as the motion detection area. it can. Therefore, it is possible to realize stable tracking even when a face that is difficult to detect a face appears while limiting the number of motion detection areas to a predetermined number (number of motion detection areas) and suppressing an increase in processing load within an allowable range. .
次に、このデジタルカメラ1の構成について説明する。図8は、デジタルカメラ1の構成例を示す概略ブロック図である。図8に示すように、デジタルカメラ1は、撮像光学系11、撮像素子12、AFE(Analog Front End)13、フレームメモリ14、動き検出部15、画像処理部16、顔検出部17、顔領域選択部および動き検出対象設定部としての顔エリア選択部18、記録媒体I/F19、記録媒体保持部20、記録媒体21、ビデオエンコーダ22、表示ドライバ23、表示部24、ビデオ信号出力端子25、操作部26、RAM27、ROM28、表示処理部および撮像条件設定部としてのコントローラ29等を備える。
Next, the configuration of the digital camera 1 will be described. FIG. 8 is a schematic block diagram illustrating a configuration example of the digital camera 1. As shown in FIG. 8, the digital camera 1 includes an imaging
撮像光学系11は、撮像レンズ、絞り、シャッター等を含み、入射される被写体像を撮像素子12に結像する。撮像素子12は、例えばCCD(Charge Coupled Device)やCMOS(Complementary Metal Oxide Semiconductor)等の固体撮像素子であり、被写体からの光束を撮像光学系11を介して受光し、光電変換することによってフレーム単位の画像データ(アナログ電気信号)を得るものである。AFE13は、撮像素子12によって得られる画像データに対してCDS(Correlated Double Sampling)やAGC(Automatic Gain Control)等のアナログ信号処理を施した後、A/D変換処理を施してデジタル電気信号に変換する。AFE13によってデジタル化された画像データは、フレームメモリ14および動き検出部15に出力されるとともに、RAM27に一時的に記録される。
The imaging
フレームメモリ14は、動き検出部15による作業用メモリとして用いられる。このフレームメモリ14は、2フレーム分の画像データを格納するための領域を備え、ライブビュー画像の表示時において、現フレームのライブビュー画像(現フレーム画像)の画像データと、直前に取り込まれた直前フレームのライブビュー画像(直前フレーム画像)の画像データとが記録される。
The
動き検出部15は、AFE13からの画像データをもとに、フレーム間の動きを検出するためのものであり、例えば1フレーム毎に撮像素子12から取り込まれてAFE13から出力される画像間で動き検出エリアの動きベクトルを求めることによって、フレーム間での動き検出エリアの動きを検出する。具体的には、動き検出部15は、顔エリア選択部18によって選択される顔エリアを動き検出エリアとする。そして、動き検出部15は、AFE13から随時入力されてフレームメモリ14に記録される直前フレーム画像と現フレーム画像との間でパタンマッチングを行い、各動き検出エリアについてそれぞれその移動量を表す動きベクトルを算出する。
The
図9は、直前フレーム画像に設定される動き検出エリアの一例を示す図であり、直前フレーム画像の画角範囲Evに対し、顔エリア選択部18によって選択された顔エリアを動き検出エリアEa1として設定した様子を示している。また、図10は、直前フレーム画像に設定される動き検出エリアの他の例を示す図であり、図9と比較してサイズの大きい顔エリアを動き検出エリアEa2として設定した様子を示している。なお、図9および図10中では1つの動き検出エリアを示しているが、実際には、顔エリア選択部18は予め定められた動き検出エリア数の顔エリアを選択するようになっており、動き検出部15は、各顔エリアを動き検出エリアとして設定する。
FIG. 9 is a diagram illustrating an example of the motion detection area set in the immediately preceding frame image, and the face area selected by the face
そして、動き検出部15は、図9,図10に示したように直前フレーム画像に設定した動き検出エリアEa1,Ea2について、現フレーム画像との間でパタンマッチングを行う。ここで、パタンマッチングは、精度を高めるため、動き検出エリア内に複数のマクロブロックを設定し、マクロブロック毎にその動きベクトルを求めることにより行う。例えば、図9に示す例では、動き検出エリアEa1内に4個のマクロブロックBを設定している。一方、図10に示す例では、動き検出エリアEa2内に25個のマクロブロックBを設定しており、動き検出エリアのサイズに応じた数のマクロブロックBが設定されるようになっている。なお、動き検出エリア内に設定するマクロブロックの数は同数であってもよく、また、マクロブロックのサイズについても適宜設定することができる。
Then, the
顔検出部17は、図8に示すように、AFE13によってデジタル化されてRAM27に記録された画像データを処理して顔を検出し、顔検出結果をRAM27に一時的に記録する。例えば、顔検出部17は、テンプレートマッチング法によってライブビュー画像中の顔の位置を検出し、目や鼻、口等の顔の特徴点の位置を検出することによって、顔の大きさや向き、角度等を検出する。この顔検出部17による顔検出によって、例えばライブビュー画像中の顔の有無、顔の位置、顔の大きさ、顔の向き、顔の角度(傾き)等が顔検出結果として得られる。なお、顔検出結果は、検出した各顔についてそれぞれ少なくとも最新の顔検出結果を保持しておくようになっている。
As shown in FIG. 8, the
顔エリア選択部18は、動き検出エリア数の顔エリアを選択し、選択結果をもとに次のフレームとの間で動き検出を行う動き検出エリアを切り換えて設定する。本実施の形態では、顔エリア選択部18は、顔検出部17が検出した各顔についてコントローラ29の優先度採点部293が採点した優先度をもとに、優先度が高い顔の顔エリアを優先的に選択し、選択した各顔の顔エリアをそれぞれ動き検出エリアとして設定する。
The face
画像処理部16は、RAM27に一旦記録された画像データを読み出し、この画像データに対して各種の画像処理を施すとともに、記録用、あるいは表示用等に適した画像データに変換する処理を行う。例えば、撮影画像の画像データを記録する際、あるいは記録されている画像データを表示する際等に、JPEG(Joint Photographic Experts Group)方式等に基づく画像データの圧縮処理や伸張処理を行う。この画像処理部16で画像処理された画像データは、記録媒体I/F19に出力されて記録媒体21に記録され、あるいはビデオエンコーダ22に出力されて表示部24に表示される。
The image processing unit 16 reads the image data once recorded in the
ビデオエンコーダ22は、表示用に変換された画像データを表示ドライバ23に送出する。例えば撮影モードでは、1フレーム毎に撮像素子12から取り込まれて画像処理部16によって画像処理された画像をフレーム単位で表示部24に切換表示させ、ライブビュー画像の表示を行う。一方、再生モードでは、記録媒体21から読み出されて画像処理部16よって画像処理された撮影画像を表示部24に表示させる。また、このビデオエンコーダ22は、ビデオ信号出力端子25に接続された外部機器に対し、必要に応じて表示用の画像データを出力する。表示部24は、撮影画像やライブビュー画像の他、デジタルカメラ1の各種設定情報等を表示するためのものであり、LCD(Liquid Crystal Display)やELディスプレイ(Electroluminescence Display)等の表示装置で実現される。
The video encoder 22 sends the image data converted for display to the
記録媒体I/F19は、記録媒体保持部20によって挿脱自在に保持される記録媒体21に対して、記録用に変換された画像データ等の書き込みや、記録された画像データの読み出し等を行う。記録媒体21は、例えばxD−ピクチャーカード(登録商標)やコンパクトフラッシュ(登録商標)カード等のメモリカードである。
The recording medium I / F 19 performs writing of image data converted for recording, reading of recorded image data, and the like with respect to the
操作部26は、撮影タイミングの指示、撮影モードや再生モード等のモードの設定操作、撮影条件の設定操作等、ユーザによる各種操作を受け付けて操作信号をコントローラ29に通知するためのものであり、各種機能が割り当てられたボタンスイッチ、ダイヤル、各種センサ等で実現される。この操作部26は、図1のレリーズスイッチ3、電源スイッチ4、メニュースイッチ5、十字スイッチ6、OKスイッチ7およびモードダイヤル8を含む。
The
ROM28は、デジタルカメラ1を動作させ、このデジタルカメラ1が備える種々の機能を実現するための各種のカメラプログラムや、このカメラプログラムの実行中に使用されるデータ等を予め記録する。RAM27は、画像処理部16やコントローラ29の作業用メモリとして用いられる。例えば、AFE13からの画像データ等が一時的に記録され、表示部24に表示するライブビュー画像の画像データを生成する際の作業用や撮影画像を記録媒体21に記録する際の作業用等に用いられる。
The
コントローラ29は、操作部26からの操作信号等に応じてROM28からカメラプログラムを読み出して実行し、デジタルカメラ1を構成する各部の動作制御やメモリ制御を行ってデジタルカメラ1全体の動作を統括的に制御する。また、AF(自動焦点)、AE(自動露出)、AWB(自動ホワイトバランス)等の処理を行う。このコントローラ29は、撮影開始指示部291と、難易度評価部としての優先度採点部293、顔領域設定部としての動き検出候補設定部295と、顔領域確定部としての顔エリア確定部297とを含む。撮影開始指示部291は、撮影処理の開始タイミングを指示する。優先度採点部293は、顔検出結果をもとに検出された顔の優先度を採点する。本実施の形態では、優先度採点部293は、顔の大きさ、顔の位置、顔の向き、顔の向き変化、顔の重なり、顔の角度および顔の角度変化を評価パラメータとし、先ず各評価パラメータの採点値を求める。そして、優先度採点部293は、各評価パラメータに予め設定された重み係数を用いて求めた各評価パラメータの採点値をそれぞれ重み付けして合算し、優先度とする。なお、評価パラメータとしては、例示したものに限定されない。例えば、顔検出結果をもとに顔の移動速度や顔の移動速度を判定し、これらの値を評価パラメータとして用いることとしてもよい。動き検出候補設定部295は、顔検出結果に基づく顔エリアと動き検出結果に基づく顔エリアとをもとに次回の動き検出候補を設定する。顔エリア確定部297は、現フレームのライブビュー画像中における顔エリアを確定する。
The
次に、デジタルカメラ1が行う処理手順について説明する。図11は、デジタルカメラ1が行う基本処理の手順を示すフローチャートである。電源投入時、デジタルカメラ1は、モードダイヤル8によって選択されているモードに応じた処理を行う。すなわち、図11に示すように、現在選択されているモードが撮影モードの場合には(ステップa1:Yes)、コントローラ29は、撮像素子12に結像されている被写体像の画像(ライブビュー画像)を取り込み(ステップa3)、顔エリア検出処理に移る(ステップa5)。顔エリア検出処理では、ステップa3で取り込んだ現フレームのライブビュー画像中の顔エリアを顔検出と動き検出とによって検出し、このライブビュー画像中における顔エリアを確定する。
Next, a processing procedure performed by the digital camera 1 will be described. FIG. 11 is a flowchart illustrating a procedure of basic processing performed by the digital camera 1. When the power is turned on, the digital camera 1 performs processing according to the mode selected by the
顔エリア検出処理を終えると、続いてコントローラ29は、ライブビュー画像を表示部24に表示する処理を行う(ステップa7)。このとき、ステップa5で確定した顔エリアに顔を示す顔枠を表示したライブビュー画像が表示部24に表示される。また、コントローラ29は、ステップa5で確定された顔エリアがあれば(ステップa9:Yes)、この確定した顔エリアをもとに撮像条件を設定してAF、AE、AWB等の処理を行う(ステップa11)。具体的には、コントローラ29は、ステップa5で確定された顔エリアの顔について得られている最新の顔検出結果を用いて撮像条件を設定する。すなわち、確定された顔エリアのうち、顔検出結果に基づく顔エリア(今回顔検出に成功した顔の顔エリア)についてはその顔検出結果を用い、動き検出結果に基づく顔エリア(今回顔検出に失敗した顔の顔エリア)についてはその顔について前回成功したときの顔検出結果を用い、撮像条件を設定する。一方、コントローラ29は、ステップa5で確定された顔エリアがない場合には(ステップa9:No)、通常範囲(例えば画面全体)でAF、AE、AWB等の処理を行う(ステップa13)。
When the face area detection process is completed, the
そして、レリーズスイッチ3が一段階押下され、ファーストレリーズスイッチがONされるまでの間(ステップa15:No)、ステップa3に戻って1フレーム毎に処理を繰り返す。 Then, until the release switch 3 is pressed down one step and the first release switch is turned on (step a15: No), the process returns to step a3 and the process is repeated for each frame.
レリーズスイッチ3が一段階押下され、ファーストレリーズスイッチがONされた場合には(ステップa15:Yes)、続いてコントローラ29は、ステップa3と同様にして、撮像素子12に結像されている被写体の画像を取り込む(ステップa17)。その後、顔検出処理に移る(ステップa19)。顔エリア検出処理では、ステップa17で取り込んだ現フレームのライブビュー画像中の顔エリアを顔検出と動き検出とによって検出し、このライブビュー画像中における顔エリアを確定する。
When the release switch 3 is pressed down one step and the first release switch is turned on (step a15: Yes), the
そして、顔検出処理の後、続いてコントローラ29は、ライブビュー画像を表示部24に表示する処理を行う(ステップa21)。このとき、ステップa19で確定した顔エリアに顔を示す顔枠を表示したライブビュー画像が表示部24に表示される。また、コントローラ29は、ステップa19で確定された顔エリアがあれば(ステップa23:Yes)、この確定した顔エリアをもとに撮像条件を設定してAF、AE、AWB等の処理を行う(ステップa25)。具体的には、コントローラ29は、ステップa11と同様に、ステップa19で確定された顔エリアの顔について得られている最新の顔検出結果を用いて撮像条件を設定する。一方、コントローラ29は、ステップa19で確定された顔エリアがない場合には(ステップa23:No)、通常範囲でAF、AE、AWB等の処理を行う(ステップa27)。
Then, after the face detection process, the
そして、レリーズスイッチ3が二段階押下され、セカンドレリーズスイッチがONされるまでの間(ステップa29:No)、ステップa17に戻って1フレーム毎に処理を繰り返す。 Then, until the release switch 3 is pressed in two stages and the second release switch is turned on (step a29: No), the process returns to step a17 and the process is repeated for each frame.
レリーズスイッチ3が二段階押下され、セカンドレリーズスイッチがONされた場合には(ステップa29:Yes)、撮影処理に移る(ステップa31)。具体的には、撮影開始指示部291が、セカンドレリーズスイッチがONされたタイミングを撮影タイミングとして撮影処理の開始を指示する。これによって撮影処理が開始され、撮影画像の画像データを生成する。生成した撮影画像の画像データは、記録媒体21に記録される。なお、この撮影処理が開始されると、ライブビュー画像の表示が一旦停止される。このライブビュー画像の表示は、露光の後、画像データの転送処理や画像処理を終えると復帰するようになっている。
If the release switch 3 is depressed in two stages and the second release switch is turned on (step a29: Yes), the process proceeds to the photographing process (step a31). Specifically, the imaging
続いてステップa33に移り、コントローラ29は、撮影モードの終了判定を行う。撮影モードを終了する場合には(ステップa33:Yes)、ステップa43に移る。撮影モードを終了しない場合には(ステップa33:No)、ステップa3に戻る。
Subsequently, the process proceeds to step a33, and the
一方、現在選択されているモードが撮影モードでなく(ステップa1:No)、再生モードの場合には(ステップa35:Yes)、コントローラ29は、過去に撮影されて記録媒体21に記録されている静止画や動画の画像データを例えばサムネイル形式で一覧表示する処理を行い、ユーザ操作に従って一覧の中から再生画像を選択する(ステップa37)。そして、コントローラ29は、選択した再生画像を表示部24に表示する処理を行う(ステップa39)。
On the other hand, when the currently selected mode is not the shooting mode (step a1: No) and in the playback mode (step a35: Yes), the
続いてステップa41に移り、コントローラ29は、再生モードの終了判定を行う。再生モードを終了する場合には(ステップa41:Yes)、ステップa43に移る。再生モードを終了しない場合には(ステップa41:No)、ステップa37に戻る。
Subsequently, the process proceeds to step a41, and the
そして、ステップa43では、コントローラ29は、基本処理を終了するか否かを判定する。例えば、電源スイッチ4が押下されて電源OFFが指示された場合に、本処理を終える(ステップa43:Yes)。一方、終了しない場合には(ステップa43:No)、ステップa1に戻る。
In step a43, the
次に、図11のステップa5およびステップa19で行う顔エリア検出処理について説明する。図12は、顔エリア検出処理の詳細な処理手順を示すフローチャートである。顔エリア検出処理では、先ずコントローラ29が、動き検出候補の有無を判定する。ここで、図12中のステップb15で、動き検出候補が設定される。このため、撮影モードが選択されて最初に行う顔エリア検出処理では動き検出候補はなく(ステップb1:No)、ステップb9に移る。すなわち、顔検出部17が現フレーム画像中の顔検出を行い(ステップb9)、顔検出結果をRAM27に記録する(ステップb11)。
Next, the face area detection process performed in step a5 and step a19 in FIG. 11 will be described. FIG. 12 is a flowchart showing a detailed processing procedure of the face area detection processing. In the face area detection process, first, the
続いて、優先度採点部293が、優先度採点処理を実行する(ステップb13)。図13は、優先度採点処理の詳細な処理手順を示すフローチャートである。この優先度採点処理は、図12のステップb9で検出された全ての顔についてそれぞれ行われ、優先度採点部293は、各顔の優先度をその顔についての顔検出結果をもとに採点する。
Subsequently, the
すなわち、優先度採点部293は、図12のステップb9の顔検出結果をもとに、先ず顔の大きさを採点する(ステップc1)。サイズの大きい顔は、サイズの小さい顔に比べて重要度が高い。そこで、例えば優先度採点部293は、顔が大きいほど採点値を大きく設定する。
That is, the
続いて優先度採点部293は、顔の位置を採点する(ステップc3)。顔の位置が画角範囲の中心に近いほど重要度が高い。一方、顔の位置が画角範囲の端部に位置している場合、その顔は次のフレームでフレームアウトする可能性があるため、重要度は低い。そこで、例えば優先度採点部293は、顔の位置が画角範囲の中心に近いほど採点値を大きく設定する。
Subsequently, the
続いて優先度採点部293は、顔の向きを採点する(ステップc5)。顔が正面向きから外れた方向を向いている場合、次のフレームでもその顔が正面向きから外れた方向を向いている可能性が高く、顔検出に失敗する確率が高い。そこで、例えば優先度採点部293は、顔が正面を向いている場合の採点値を小さくし、顔の向きが正面から外れるほど採点値を大きく設定する。
Subsequently, the
続いて優先度採点部293は、顔の向き変化を採点する(ステップc7)。ここで、RAM27内には、直近の数フレーム分についての結果を保持しておくようになっている。優先度採点部293は、RAM27内に保持されている過去数フレーム分の顔検出結果を参照して顔の向きの変化を算出し、算出した向き変化を採点する。すなわち、過去数フレームにおいて顔の向きが変化していれば、次のフレームでもその顔の向きが変化する可能性が高い。そして、向き変化が大きいほど次のフレームで大きく顔の向きが変化する可能性が高いため、顔検出に失敗する可能性も高い。そこで、例えば優先度採点部293は、顔の向き変化が大きいほど採点値を大きく設定する。
Subsequently, the
続いて優先度採点部293は、次のフレームで顔同士が重なる場合を推定する(ステップc9)。図14は、顔の重なり推定を説明する図であり、3人の人物の顔F11〜F13が映る3枚のライブビュー画像の一例を時系列に沿って模式的に示している。ここで、顔F11,F12に着目すると、図14(a)のフレームI31と図14(b)のフレームI33との間で顔F11,F12が接近し、図14(c)のフレームI35で各顔F11,F12が重なっている。重なり推定では、このような状態を推定する。すなわち、優先度採点部293は、過去数フレーム分の顔検出結果を参照する。そして、優先度採点部293は、各顔の位置、向き、大きさをもとに移動方向(向きが変化する方向)やその移動速度(移動量)を判定し、顔の重なりを推定する。例えば、図14(a)のフレームI31では、各顔F11〜F13の位置が離れており、次のフレームでは各顔F11〜F13は重ならないと推定する。一方、図14(b)のフレームI33では、顔F11,F12が接近しており、その移動方向や移動速度をもとに、この顔F11,F12について次のフレームI35で重なると例えば推定する。
Subsequently, the
そして、図13に示すように、続いて優先度採点部293は、重なり推定の結果をもとに、顔の重なりを採点する(ステップc11)。具体的には、優先度採点部293は、顔が重なると推定された各顔についての顔検出結果をもとに、重なったときに後ろに隠れる顔について採点値を小さく設定する。推定の通りにその顔が次のフレームで他の顔と重なり、他の顔の後ろに隠れてしまった場合、顔枠の表示が必要なく、その顔についての露出やフォーカスの制御も必要ないため、重要度が低いためである。ここで、顔同士が重なった際、どちらが後方に隠れるのかについては、顔の大きさで判定できる。すなわち、サイズの大きい顔は手前側に存在し、顔が重なった場合、サイズの大きい顔の後方にサイズの小さい顔が隠れると考えられる。例えば図14(c)のフレームI35では、サイズの大きい顔F11の後方にサイズの小さい顔F12が隠れている。このような顔の採点値を他の顔の採点値よりも小さく設定する。
Then, as shown in FIG. 13, the
続いて優先度採点部293は、顔の角度を採点する(ステップc13)。ライブビュー画像の縦方向に対して顔が傾いている場合、次のフレームでもその顔が傾いている可能性が高く、顔検出に失敗する確率が高い。そこで、例えば優先度採点部293は、顔が傾いていない場合の採点値を小さくし、顔が角度が大きいほど採点値を大きく設定する。
Subsequently, the
続いて優先度採点部293は、顔の角度変化を採点する(ステップc15)。優先度採点部293は、過去数フレーム分の顔検出結果を参照して顔の角度の変化を算出し、算出した角度変化を採点する。すなわち、過去数フレームにおいて顔の角度が変化していれば、次のフレームでもその顔の角度が変化する可能性が高い。そして、角度変化が大きいほど次のフレームで大きく顔の角度が変化する可能性が高いため、顔検出に失敗する可能性も高い。そこで、例えば優先度採点部293は、顔の角度変化が大きいほど採点値を大きく設定する。
Subsequently, the
続いて、優先度採点部293は、各採点値に対する重み付けを行う(ステップc17)。ここで行う重み付けは、例えば、顔の大きさ、顔の位置、顔の向き、顔の向き変化、顔の重なり、顔の角度および顔の角度変化の各評価パラメータについて予め重み係数を設定しておき、各採点値に重み係数を乗じて行う。重み係数は、評価パラメータの重要度に応じて適宜設定しておくことができる。例えば、顔検出部17の検出精度が低下する要因となる評価パラメータである顔の向きや顔の角度の重み係数を大きく設定しておけば、これらの採点値が高い顔の優先度を高くすることができる。
Subsequently, the
そして、優先度採点部293は、重み付けした各採点値の総和を優先度として算出する(ステップc19)。その後、図12のステップb13にリターンし、ステップb15に移る。なお、上記した優先度採点処理は一例であって、採点方法や評価パラメータはこれに限定されず、顔検出の仕様等に応じて適宜設定できる。
And the
続く図12のステップb15では、動き検出候補設定部295が、動き検出候補設定処理を実行する。図15は、動き検出候補設定処理の詳細な処理手順を示すフローチャートである。
In the subsequent step b15 of FIG. 12, the motion detection
動き検出候補設定処理では、動き検出候補設定部295は先ず、動き検出結果をもとに顔エリアを設定する(ステップd1)。上記のように、撮影モードが選択されて最初に行う顔エリア検出処理では、図12のステップb15の動き検出が未だ行われていない。このため、ステップd1でも顔エリアは設定されない。一方、後述するように2回目以降の顔エリア検出処理において、ステップb1で動き検出候補があると判定されてステップb5で動き検出を行った場合には、動き検出候補設定部295は、このステップd1において、動き検出の結果算出された各動き検出エリアの動きベクトルをもとに現フレーム中における各動き検出エリアの位置をそれぞれ算出し、動き検出結果に基づく顔エリアとして設定する。続いて、動き検出候補設定部295は、顔検出の結果検出された顔の領域を顔検出結果に基づく顔エリアとして設定する(ステップd3)。
In the motion detection candidate setting process, the motion detection
そして、動き検出候補設定部295は、現フレーム中の動き検出結果に基づく顔エリアと、顔検出結果に基づく顔エリアとを次回の動き検出候補として設定する(ステップd5)。
Then, the motion detection
続いて動き検出候補設定部295は、次回の動き検出候補とした動き検出に基づく顔エリアの位置と、顔検出結果に基づく顔エリアの位置とを比較する。そして、動き検出候補設定部295は、顔検出結果に基づくいずれかの顔エリア位置が、動き検出結果に基づくいずれかの顔エリアの位置と一致している場合、すなわち動き検出結果に基づく顔エリアと顔検出結果に基づく顔エリアとが重複している場合には(ステップd7:Yes)、これらの顔エリアのうち、動き検出結果に基づく顔エリアを次回の動き検出候補から除外する(ステップd9)。その後、図12のステップb15にリターンし、ステップb17に移る。
Subsequently, the motion detection
そして、ステップb17では、ステップb15の動き検出候補設定処理の結果設定した次回の動き検出候補を現フレーム中の顔エリアとして確定する。その後、図11のステップa5にリターンし、ステップa7に移る。あるいはステップa19にリターンし、ステップa21に移る。そしてこの結果、ステップa7やステップa21において表示されるライブビュー画像上で、この顔エリア検出処理で検出された顔エリアに顔枠が表示される。また、検出された顔エリアが露出やフォーカスの制御に用いられる。 In step b17, the next motion detection candidate set as a result of the motion detection candidate setting process in step b15 is determined as the face area in the current frame. Thereafter, the process returns to step a5 in FIG. 11 and proceeds to step a7. Or it returns to step a19 and moves to step a21. As a result, a face frame is displayed in the face area detected by the face area detection process on the live view image displayed in step a7 or step a21. The detected face area is used for exposure and focus control.
また、撮影モードが選択された後、2回目以降に行う顔エリア検出処理では、図12に示すように、前回の顔エリア検出処理においてステップb15で次回の動き検出候補が設定されていれば(ステップb1:Yes)、ステップb3に移り、顔エリア選択部18が顔エリア選択処理を実行する。図16は、顔エリア選択処理の詳細な処理手順を示すフローチャートである。
Further, in the face area detection process performed after the shooting mode is selected for the second and subsequent times, as shown in FIG. 12, if the next motion detection candidate is set in step b15 in the previous face area detection process ( Step b1: Yes), the process moves to step b3, and the face
顔エリア選択処理では、顔エリア選択部18は先ず、設定されている動き検出候補の数を予め設定される動き検出エリア数Nと比較する。そして、顔エリア選択部18は、動き検出候補の数が動き検出エリア数N以下であれば(ステップe1:No)、全ての動き検出候補を選択する(ステップe3)。そして、図12のステップb3にリターンし、その後ステップb5に移る。
In the face area selection process, the face
また、顔エリア選択部18は、動き検出候補の数が動き検出エリア数Nより多い場合には(ステップe1:Yes)、ステップe5に移る。そして、顔エリア選択部18は、動き検出結果に基づく顔エリアの数Lが「0」であれば(ステップe5:Yes)、ステップe7に移る。すなわち、動き検出結果に基づく顔エリアの数Lが「0」ということは、設定されている動き検出候補は全て顔検出結果に基づく顔エリアである。ステップe7では、顔エリア選択部18は、この顔検出結果に基づく顔エリアの中から、その顔について採点した優先度が高いものから順にN個の顔の顔エリアを選択する。そして、図12のステップb3にリターンし、その後ステップb5に移る。
If the number of motion detection candidates is greater than the number N of motion detection areas (step e1: Yes), the face
また、顔エリア選択部18は、動き検出結果に基づく顔エリアの数Lが「0」でない場合には(ステップe5:No)、ステップe9に移る。そして、顔エリア選択部18は、顔検出結果に基づく顔エリアの数が「0」であれば(ステップe9:Yes)、ステップe11に移る。すなわち、顔検出結果に基づく顔エリアの数が「0」ということは、設定されている動き検出候補は全て動き検出結果に基づく顔エリアであって、かつその数はN個である。ステップe11では、顔エリア選択部18は、この動き検出結果に基づく顔エリアを全て選択する。そして、図12のステップb3にリターンし、その後ステップb5に移る。
If the number L of face areas based on the motion detection result is not “0” (step e5: No), the face
また、顔エリア選択部18は、顔検出結果に基づく顔エリアの数が「0」でない場合には(ステップe9:No)、ステップe13に移る。そして、顔エリア選択部18は、動き検出結果に基づく顔エリアを全て選択するとともに、N個に満たない場合には、顔検出結果に基づく顔エリアのうちの優先度の高いものから順番に選んだN−L個を選択する。そして、図12のステップb3にリターンし、その後ステップb5に移る。
If the number of face areas based on the face detection result is not “0” (step e9: No), the face
そして、ステップb5では、動き検出部15が、ステップb3の顔エリア選択処理で選択した各顔エリアをそれぞれ動き検出エリアとして現フレーム画像中の動き検出を行い、その後動き検出結果をRAM27に記録する(ステップb7)。その後、ステップb9に移る。
In step b5, the
以上説明したように、本実施の形態によれば、顔検出によってライブビュー画像中の顔を検出するとともに、顔検出結果に従って各顔の優先度を採点することができる。例えば人物の動きが激しく場合等、次のフレームで行う顔検出の検出難易度が高いと想定される顔について優先度を高く設定することができる。そして、顔検出の結果、ライブビュー画像中から動き検出が可能な数(動き検出エリア数)よりも多い顔が検出された場合には、優先度の高い顔を含む顔エリアを選択して動き検出を行うことができる。すなわち、顔検出の検出難易度が高いと想定される顔を優先的に選択し、動き検出によってその顔エリアの動きを検出することができるので、処理の負荷を増大させることなく、連続する画像中に出現する顔を見失わずに安定して追尾できる。 As described above, according to the present embodiment, a face in a live view image can be detected by face detection, and the priority of each face can be scored according to the face detection result. For example, when the movement of a person is intense, the priority can be set high for a face that is assumed to have a high detection difficulty level in the next frame. As a result of face detection, if more faces than the number of motion detection possible (number of motion detection areas) are detected in the live view image, a face area including a face with high priority is selected and moved. Detection can be performed. That is, it is possible to preferentially select a face that is assumed to have a high degree of detection difficulty for face detection, and to detect the movement of the face area by motion detection, so that a continuous image is not increased without increasing the processing load. It is possible to track stably without losing sight of the face that appears inside.
そして、本実施の形態では、ライブビュー画像上の最終的に確定した顔エリアに、顔を示す顔枠を表示させることができる。したがって、安定した見易い顔枠の表示が実現でき、顔枠の表示・非表示が繰り返されてちらつく等の不具合を防止することができる。 In the present embodiment, a face frame indicating a face can be displayed in the finally determined face area on the live view image. Therefore, stable and easy-to-view face frame display can be realized, and problems such as flickering by repeatedly displaying and hiding the face frame can be prevented.
なお、上記した実施の形態では、予め設定される動き検出エリア数の顔エリアを動き検出エリアとして選択し、選択した動き検出エリアについて動き検出を行うこととした。そして、顔検出結果に基づく顔エリアを動き検出エリアとして選択する際には、顔検出結果をもとに各顔について採点した優先度が高いものから順番に、動き検出エリアとする顔エリアを選択することとした。これに対し、顔検出によって検出された各顔のうち、優先度の低い顔の顔エリアを選択し、選択した顔エリアについて動き検出を行わない設定を行う構成としてもよい。 In the embodiment described above, a face area having a preset number of motion detection areas is selected as the motion detection area, and motion detection is performed for the selected motion detection area. When selecting a face area based on the face detection result as a motion detection area, select the face area as the motion detection area in order from the highest priority scored for each face based on the face detection result. It was decided to. On the other hand, a configuration may be adopted in which a face area of a face with a low priority is selected from the faces detected by face detection, and a setting is made so that motion detection is not performed for the selected face area.
また、上記した実施の形態では、動き検出で検出できたが顔検出に失敗した顔エリアについては必ず動き検出エリアとして選択することとした。これに対し、動き検出結果の信頼度を加味して動き検出エリアを設定するようにしてもよい。すなわち、例えば、動き検出エリアに設定したマクロブロックB(図9,図10を参照)の数に対してマッチング失敗数が多い場合や、得られたマクロブロックB毎の動きベクトルの方向に統一性がない場合、動き検出結果の信頼性が低いと考えられる。このような場合には、該当する顔エリアを次回の動き検出エリアから外すようにしてもよい。図7を参照して説明すれば、例えば、顔F2の顔エリアを動き検出エリアとして行った動き検出結果の信頼度が低かったとする。この場合には、次のフレームとの間で行う動き検出の対象から顔F2の顔エリアを外す。そして、顔検出結果に基づく顔エリアである顔F3および顔F4の顔エリアのうち、優先度の高い顔を選択して動き検出エリアとしてもよい。図示の例では、例えば顔F4が動き検出エリアとして選択されることとなる。 In the above-described embodiment, a face area that can be detected by motion detection but fails to detect a face is always selected as a motion detection area. On the other hand, the motion detection area may be set in consideration of the reliability of the motion detection result. That is, for example, when the number of matching failures is larger than the number of macroblocks B (see FIGS. 9 and 10) set in the motion detection area, or the direction of the motion vector for each obtained macroblock B is uniform. If there is no, it is considered that the reliability of the motion detection result is low. In such a case, the corresponding face area may be removed from the next motion detection area. If it demonstrates with reference to FIG. 7, suppose that the reliability of the motion detection result performed, for example using the face area of the face F2 as a motion detection area was low. In this case, the face area of the face F2 is removed from the target of motion detection performed with the next frame. And it is good also as a motion detection area by selecting a face with high priority among the face areas of the face F3 and the face F4 which are face areas based on a face detection result. In the illustrated example, for example, the face F4 is selected as the motion detection area.
また、上記した実施の形態では、顔検出および動き検出を1フレーム毎に行うこととしたが、所定のフレーム間隔で行うこととしてもよい。また、顔検出および動き検出を行うフレーム間隔は適宜個別に設定できる。例えば、動き検出を1フレーム毎に行い、顔検出については数フレーム毎に行うといったことも可能である。 In the above-described embodiment, the face detection and the motion detection are performed for each frame, but may be performed at a predetermined frame interval. Also, the frame intervals for performing face detection and motion detection can be set individually as appropriate. For example, motion detection can be performed every frame, and face detection can be performed every few frames.
また、顔エリア選択部18や画像処理部16、コントローラ29を構成する撮影開始指示部291や優先度採点部293、動き検出候補設定部295は、ハードウェアで実現する構成としてもよいし、所定のプログラムを実行することによってソフトウェアとして実現することとしてもよい。ソフトウェアとして実現する場合には、例えば、図12や図13、図15、図16等に示した処理の一部または全部を実現するためのプログラムをROM28に記録しておく。そして、コントローラ29がこのプログラムを読み出して実行することによって、顔エリア選択部18や画像処理部16、撮影開始指示部291、優先度採点部293、動き検出候補設定部295の構成を実現するようにしてもよい。
In addition, the face
また、上記した実施の形態では、本発明の追尾装置をデジタルカメラに適用した例について説明したが、適用対象はデジタルカメラに限定されず、携帯電話機に付属のカメラやPC付属のカメラに適用してもよい。また、パソコン等を用いて人物等の顔が映る動画を再生する場合に適用することもできる。 In the above-described embodiment, the example in which the tracking device of the present invention is applied to a digital camera has been described. However, the application target is not limited to a digital camera, and is applied to a camera attached to a mobile phone or a camera attached to a PC. May be. Further, the present invention can also be applied to the case where a moving image showing a person's face is reproduced using a personal computer or the like.
1 デジタルカメラ
2 カメラ本体
11 撮像光学系
12 撮像素子
13 AFE
14 フレームメモリ
15 動き検出部
16 画像処理部
17 顔検出部
18 顔エリア選択部
19 記録媒体I/F
20 記録媒体保持部
21 記録媒体
22 ビデオエンコーダ
23 表示ドライバ
24 表示部
25 ビデオ信号出力端子
26 操作部
3 レリーズスイッチ
4 電源スイッチ
5 メニュースイッチ
6 十字キー
7 OKスイッチ
8 モードダイヤル
27 RAM
28 ROM
29 コントローラ
291 撮影開始指示部
293 優先度採点部
295 動き検出候補設定部
297 顔エリア確定部
DESCRIPTION OF SYMBOLS 1
14
DESCRIPTION OF
28 ROM
29
Claims (9)
前記連続する画像を順次処理して前記画像中の複数の顔を検出する顔検出部と、
前記顔検出部によって検出された各顔を含む顔領域をそれぞれの顔に対して設定する顔領域設定部と、
前記顔検出部による顔検出結果をもとに、前記顔検出部によって検出された各顔の検出難易度を評価する難易度評価部と、
前記難易度評価部による評価結果をもとに、前記顔領域設定部が設定した前記各顔を含む顔領域の中から、前記各顔の検出難易度が高い順に所定数の前記顔領域を選択する顔領域選択部と、
前記顔領域選択部によって選択された前記顔領域に対して動き検出をする対象領域として設定する動き検出対象設定部と、
隣接する画像間で、前記動き検出対象設定部によって設定された前記対象領域の動きを検出する動き検出部と、
を備えることを特徴とする追尾装置。 A tracking device that tracks faces appearing in successive images,
A face detector that sequentially processes the successive images to detect a plurality of faces in the images;
A face area setting unit that sets a face area including each face detected by the face detection unit for each face;
Based on the face detection result by the face detection unit, a difficulty level evaluation unit that evaluates the detection difficulty level of each face detected by the face detection unit,
Based on the evaluation result by the difficulty level evaluation unit, a predetermined number of the face regions are selected from the face regions including the faces set by the face region setting unit in descending order of difficulty of detection of the faces. A face area selection unit to be
A motion detection target setting unit that sets a target region for motion detection with respect to the face region selected by the face region selection unit;
A motion detection unit that detects a motion of the target region set by the motion detection target setting unit between adjacent images;
A tracking device comprising:
前記難易度評価部は、前記顔検出部によって検出された各顔の前記顔検出結果をもとに、少なくとも顔の大きさ、顔の位置、顔の向き、顔の傾き、顔の向き変化、顔の傾き変化、顔の移動速度および顔の移動方向のうちの1つまたは複数を評価パラメータとして前記各顔の検出難易度を評価することを特徴とする請求項1に記載の追尾装置。 The face detection unit outputs at least one of a face size, a face position, a face orientation, and a face tilt as the face detection result;
The difficulty level evaluation unit, based on the face detection result of each face detected by the face detection unit, at least the size of the face, the position of the face, the direction of the face, the inclination of the face, the change of the face direction, The tracking device according to claim 1, wherein the degree of difficulty in detecting each face is evaluated using one or more of a change in face inclination, a face moving speed, and a face moving direction as evaluation parameters.
前記表示処理部は、前記顔領域確定部によって確定された前記画像中の顔領域に従って、前記画像中に顔を示す顔枠を表示することを特徴とする請求項6に記載の追尾装置。 A display processing unit for switching the continuous images and performing display processing on the display unit;
The tracking apparatus according to claim 6, wherein the display processing unit displays a face frame indicating a face in the image according to the face region in the image determined by the face region determination unit.
撮影指示を行う撮影指示部と、
前記顔領域確定部によって確定された前記画像中の顔領域の顔について前記顔検出部が検出した最新の顔検出結果を用い、前記撮像部の撮像条件を設定する撮像条件設定部と、
を備えることを特徴とする請求項6に記載の追尾装置。 An imaging unit that sequentially images the subject for each frame and sequentially generates the continuous images;
A shooting instruction section for giving shooting instructions;
An imaging condition setting unit that sets an imaging condition of the imaging unit using the latest face detection result detected by the face detection unit for the face of the face region in the image determined by the face region determination unit;
The tracking device according to claim 6, further comprising:
前記連続する画像を順次処理して前記画像中の複数の顔を検出する顔検出工程と、
前記顔検出工程で検出された各顔を含む顔領域をそれぞれの顔に対して設定する顔領域設定工程と、
前記顔検出工程での顔検出結果をもとに、前記顔検出工程で検出された各顔の検出難易度を評価する難易度評価工程と、
前記難易度評価工程による評価結果をもとに、前記顔領域設定工程で設定した前記各顔を含む顔領域の中から、前記各顔の検出難易度が高い順に所定数の前記顔領域を選択する顔領域選択工程と、
前記顔領域選択工程によって選択された前記顔領域に対して動き検出をする対象領域として設定する動き検出対象設定工程と、
隣接する画像間で、前記動き検出対象設定工程で設定された前記対象領域の動きを検出する動き検出工程と、
を含むことを特徴とする追尾方法。 A tracking method for tracking a face that appears in successive images,
A face detection step of sequentially processing the continuous images to detect a plurality of faces in the images;
A face area setting step for setting a face area including each face detected in the face detection step for each face;
Based on the face detection result in the face detection step, a difficulty level evaluation step for evaluating the detection difficulty level of each face detected in the face detection step;
Based on the evaluation result of the difficulty level evaluation step, a predetermined number of the face regions are selected from the face regions including the faces set in the face region setting step in descending order of difficulty of detection of the faces. A face area selection step to be performed;
A motion detection target setting step for setting as a target region for motion detection for the face region selected by the face region selection step;
A motion detection step of detecting a motion of the target region set in the motion detection target setting step between adjacent images;
The tracking method characterized by including.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2009024190A JP5289993B2 (en) | 2009-02-04 | 2009-02-04 | TRACKING DEVICE AND TRACKING METHOD |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2009024190A JP5289993B2 (en) | 2009-02-04 | 2009-02-04 | TRACKING DEVICE AND TRACKING METHOD |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JP2010183291A JP2010183291A (en) | 2010-08-19 |
| JP2010183291A5 JP2010183291A5 (en) | 2012-03-08 |
| JP5289993B2 true JP5289993B2 (en) | 2013-09-11 |
Family
ID=42764487
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2009024190A Expired - Fee Related JP5289993B2 (en) | 2009-02-04 | 2009-02-04 | TRACKING DEVICE AND TRACKING METHOD |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP5289993B2 (en) |
Families Citing this family (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP5484184B2 (en) * | 2010-04-30 | 2014-05-07 | キヤノン株式会社 | Image processing apparatus, image processing method, and program |
| KR101817657B1 (en) | 2011-12-21 | 2018-01-11 | 삼성전자주식회사 | Digital photographing apparatus splay apparatus and control method thereof |
| JP5867157B2 (en) * | 2012-02-23 | 2016-02-24 | リコーイメージング株式会社 | Imaging device, subject tracking method, and subject tracking program |
| JP2015040939A (en) * | 2013-08-21 | 2015-03-02 | キヤノン株式会社 | Image-capturing device, control method therefor, and control program |
| JP5968379B2 (en) | 2013-10-29 | 2016-08-10 | キヤノン株式会社 | Image processing apparatus and control method thereof |
| CN106228112B (en) * | 2016-07-08 | 2019-10-29 | 深圳市优必选科技有限公司 | Face detection tracking method, robot head rotation control method and robot |
| JP6899049B2 (en) * | 2016-10-20 | 2021-07-07 | 株式会社ニコン | Imaging device |
| JP7085651B2 (en) * | 2019-01-29 | 2022-06-16 | 富士フイルム株式会社 | Image pickup device control device, image pickup device, image pickup device control method, image pickup device control program |
Family Cites Families (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP4506779B2 (en) * | 2007-05-09 | 2010-07-21 | カシオ計算機株式会社 | Imaging apparatus and program |
-
2009
- 2009-02-04 JP JP2009024190A patent/JP5289993B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2010183291A (en) | 2010-08-19 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5289993B2 (en) | TRACKING DEVICE AND TRACKING METHOD | |
| JP5538865B2 (en) | Imaging apparatus and control method thereof | |
| JP5218508B2 (en) | Imaging device | |
| JP6106921B2 (en) | Imaging apparatus, imaging method, and imaging program | |
| JP4623193B2 (en) | Imaging apparatus, imaging method, and program | |
| JP4429241B2 (en) | Image processing apparatus and method | |
| JP5251215B2 (en) | Digital camera | |
| JP5623915B2 (en) | Imaging device | |
| JP5065060B2 (en) | Imaging apparatus and control method thereof | |
| CN102469244B (en) | Image capturing apparatus capable of continuously capturing object | |
| JP2010147808A (en) | Imaging apparatus and image processing method in same | |
| JP2010041435A (en) | Image device and control method thereof | |
| JP2009278432A (en) | Imaging apparatus, and imaging method in imaging apparatus | |
| JP6172973B2 (en) | Image processing device | |
| JP5111293B2 (en) | Imaging apparatus and control method thereof | |
| JP2010068222A (en) | Face detection controller, face detection control program and face detection control method | |
| JP5424827B2 (en) | Image processing device | |
| JP2005079731A (en) | Captured image projection device, image processing method and program for captured image projection device | |
| JP2020115679A (en) | Object detection device, detection control method, and program | |
| JP5451364B2 (en) | Subject tracking device and control method thereof | |
| JP2009278351A (en) | Imaging apparatus | |
| JP2024033747A (en) | Imaging device, imaging device control method, program | |
| JP2013192184A (en) | Subject tracking display controller, subject tracking display control method, and program | |
| JP5024033B2 (en) | Object tracking device, object tracking program, and object tracking method | |
| JP5323243B2 (en) | Image processing apparatus and control method thereof |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120124 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120124 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121221 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130108 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130228 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130514 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130605 |
|
| R151 | Written notification of patent or utility model registration |
Ref document number: 5289993 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
| S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| LAPS | Cancellation because of no payment of annual fees |