Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP7318352B2 - Image processing device, monitoring device, control system, image processing method, and program - Google Patents
[go: Go Back, main page]

JP7318352B2 - Image processing device, monitoring device, control system, image processing method, and program - Google Patents

Image processing device, monitoring device, control system, image processing method, and program Download PDF

Info

Publication number
JP7318352B2
JP7318352B2 JP2019116544A JP2019116544A JP7318352B2 JP 7318352 B2 JP7318352 B2 JP 7318352B2 JP 2019116544 A JP2019116544 A JP 2019116544A JP 2019116544 A JP2019116544 A JP 2019116544A JP 7318352 B2 JP7318352 B2 JP 7318352B2
Authority
JP
Japan
Prior art keywords
face
specific individual
image processing
unit
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019116544A
Other languages
Japanese (ja)
Other versions
JP2021002281A (en
Inventor
知禎 相澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp filed Critical Omron Corp
Priority to JP2019116544A priority Critical patent/JP7318352B2/en
Priority to PCT/JP2020/019848 priority patent/WO2020261820A1/en
Publication of JP2021002281A publication Critical patent/JP2021002281A/en
Application granted granted Critical
Publication of JP7318352B2 publication Critical patent/JP7318352B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/16Anti-collision systems

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Collating Specific Patterns (AREA)
  • Traffic Control Systems (AREA)

Description

本発明は、画像処理装置、モニタリング装置、制御システム、画像処理方法、及びプログラムに関する。 The present invention relates to an image processing device, a monitoring device, a control system, an image processing method, and a program.

下記の特許文献1には、サービスを提供する対象(人物)の状況に応じて、適切なサービスに切り替え可能なサービス提供装置として利用されるロボット装置が開示されている。 Patent Literature 1 below discloses a robot device used as a service providing device capable of switching to an appropriate service according to the situation of a target (person) to whom the service is provided.

前記ロボット装置には、第1カメラと、第2カメラと、CPUを含む情報処理装置とが装備され、前記CPUには、顔検出部、属性判定部、人物検出部、人物位置算出部、及び移動ベクトル検出部などが装備されている。 The robot device is equipped with a first camera, a second camera, and an information processing device including a CPU. The CPU includes a face detection unit, an attribute determination unit, a person detection unit, a person position calculation unit, and It is equipped with a movement vector detection unit.

前記ロボット装置によれば、サービスの提供対象が、互いに意思疎通を行うなどの関係が成立している人物の集合である場合は、密なやり取りに基づいた情報を提供する第1サービスを行うことを決定する。一方、サービスの提供対象が、互いに意思疎通を行うなどの関係が成立しているか否かが不明な人物の集合である場合は、やり取りを行わずに、一方的に情報を提供する第2サービスを行うことを決定する。これにより、サービスの提供対象の状況に応じて、適切なサービスを行うことができるとしている。 According to the above-described robot device, when the target of service provision is a group of persons who have established relationships such as mutual communication, the first service of providing information based on close exchanges is provided. to decide. On the other hand, if the target of service provision is a group of people whose relationship such as mutual communication is unknown, the second service provides information unilaterally without any interaction. decide to do As a result, appropriate services can be provided according to the situation of the service provider.

[発明が解決しようとする課題]
前記ロボット装置では、前記顔検出部が、前記第1カメラを用いて人物の顔検出を行う構成になっており、該顔検出には、公知の技術を利用することができるとしている。
しかしながら、従来の顔検出技術では、ケガなどにより、目、鼻、口などの顔器官の一部が欠損、若しくは大きく変形している場合、顔に大きなホクロやイボ、若しくはタトゥーなどの身体装飾が施されている場合、又は遺伝性の疾患などの病気により、前記顔器官の配置が平均的な位置からずれている場合など、このような特定個人(換言すれば、年齢差、性別、及び人種などの違いにかかわらずに共通する一般的な人の顔特徴とは異なっている特徴を有する特定の個人)に対する顔検出の精度が低下してしまうという課題があった。
[Problems to be solved by the invention]
In the robot device, the face detection unit is configured to detect a person's face using the first camera, and known technology can be used for the face detection.
However, in the conventional face detection technology, when a part of the facial organs such as eyes, nose, mouth, etc. is missing or greatly deformed due to injury, etc., there is a large mole, wart, or body decoration such as a tattoo on the face. Such a specific individual (in other words, age difference, gender, and person There is a problem that the accuracy of face detection for a specific individual having features different from the facial features of general people common regardless of species etc. is lowered.

特開2014-14899号公報JP 2014-14899 A

課題を解決するための手段及びその効果Means to solve the problem and its effect

本発明は上記課題に鑑みなされたものであって、上記のような特定個人に対する顔センシングの精度を向上させることができる画像処理装置、モニタリング装置、制御システム、画像処理方法、及びプログラムを提供することを目的としている。 The present invention has been made in view of the above problems, and provides an image processing device, a monitoring device, a control system, an image processing method, and a program that can improve the accuracy of face sensing for a specific individual as described above. It is intended to

上記目的を達成するために本開示に係る画像処理装置(1)は、撮像部から入力される画像を処理する画像処理装置であって、
前記画像から顔を検出するための学習を行った学習済みの顔特徴量として、特定個人の顔特徴量と、通常の顔特徴量とが記憶される顔特徴量記憶部と、
前記画像から顔を検出するための特徴量を抽出しながら顔領域を検出する顔検出部と、
検出された前記顔領域の前記特徴量と、前記特定個人の顔特徴量とを用いて、前記顔領域の顔が前記特定個人の顔であるか否かを判定する特定個人判定部と、
該特定個人判定部により前記特定個人の顔であると判定された場合、特定個人用の顔画像処理を行う第1顔画像処理部と、
前記特定個人判定部により前記特定個人の顔ではないと判定された場合、通常の顔画像処理を行う第2顔画像処理部とを備えていることを特徴としている。
To achieve the above object, an image processing device (1) according to the present disclosure is an image processing device that processes an image input from an imaging unit,
a facial feature amount storage unit that stores a specific individual's facial feature amount and a normal facial feature amount as learned facial feature amounts that have been trained to detect a face from the image;
a face detection unit that detects a face area while extracting a feature amount for detecting a face from the image;
a specific individual determination unit that determines whether or not the face in the face region is the face of the specific individual using the detected feature quantity of the face region and the face feature quantity of the specific individual;
a first face image processing unit that performs face image processing for a specific individual when the specific individual determining unit determines that the face is the face of the specific individual;
and a second face image processing unit that performs normal face image processing when the specific individual determining unit determines that the face is not that of the specific individual.

上記画像処理装置(1)によれば、前記顔特徴量記憶部に前記学習済みの顔特徴量として、前記特定個人の顔特徴量と、前記通常の顔特徴量(換言すれば、前記特定個人以外の人である場合に用いる顔特徴量)とが記憶され、前記特定個人判定部により、前記顔検出部で検出された前記顔領域の前記特徴量と、前記特定個人の顔特徴量とを用いて、前記顔領域の顔が前記特定個人の顔であるか否かが判定される。前記特定個人の顔特徴量を用いることにより、前記特定個人の顔であるか否かを精度良く判定することができる。
また、前記特定個人の顔であると判定された場合、前記第1顔画像処理部により前記特定個人の顔画像処理を精度良く実施することができる。一方、前記特定個人の顔ではない、換言すれば、通常の顔(前記特定個人以外の人の顔)であると判定された場合、前記第2顔画像処理部により前記通常の顔画像処理を精度良く実施することができる。したがって、前記特定個人であっても、特定個人以外の通常の人であっても、それぞれの顔のセンシングを精度良く実施することができる。
According to the image processing apparatus (1), the facial feature amount of the specific individual and the normal facial feature amount (in other words, the specific individual and the specific individual determination unit stores the feature amount of the face region detected by the face detection unit and the facial feature amount of the specific individual. is used to determine whether or not the face in the face area is the face of the specific individual. By using the face feature amount of the specific individual, it is possible to accurately determine whether or not it is the face of the specific individual.
Further, when it is determined to be the face of the specific individual, the face image processing of the specific individual can be accurately performed by the first face image processing section. On the other hand, when it is determined that the face is not the face of the specific individual, in other words, the face is a normal face (the face of a person other than the specific individual), the normal face image processing is performed by the second face image processing unit. It can be executed with high accuracy. Therefore, whether it is the specific individual or a normal person other than the specific individual, the sensing of each face can be performed with high accuracy.

また本開示に係る画像処理装置(2)は、上記画像処理装置(1)において、前記特定個人判定部が、前記顔領域から抽出された前記特徴量と前記特定個人の顔特徴量との相関を示す指標を算出し、算出した前記指標に基づいて、前記顔領域の顔が前記特定個人の顔であるか否かを判定するものであることを特徴としている。 Further, in the image processing device (2) according to the present disclosure, in the image processing device (1), the specific individual determining unit determines a correlation between the feature quantity extracted from the face region and the face feature quantity of the specific individual. is calculated, and whether or not the face in the face area is the face of the specific individual is determined based on the calculated index.

上記画像処理装置(2)によれば、前記顔領域から抽出された前記特徴量と前記特定個人の顔特徴量との相関を示す指標を算出し、算出した前記指標に基づいて、前記顔領域の顔が前記特定個人の顔であるか否かが判定される。これにより、前記指標に基づいて前記顔領域の顔が前記特定個人の顔であるか否かを効率良く判定することができる。前記指標は、その値が大きいほど関係性が高くなることを示す指標値、例えば、相関係数であってもよいし、二乗誤差の逆数であってもよいし、その他、前記顔領域から抽出された前記特徴量と前記特定個人の顔特徴量との関係の類似度を示す指標値などであってもよい。 According to the image processing device (2), an index indicating a correlation between the feature quantity extracted from the face region and the face feature quantity of the specific individual is calculated, and the face region is calculated based on the calculated index. is the face of the specific individual. Thereby, it is possible to efficiently determine whether or not the face in the face area is the face of the specific individual based on the index. The index may be an index value indicating that the higher the value, the higher the relationship, such as a correlation coefficient, the reciprocal of a squared error, or an index extracted from the face region. It may be an index value or the like indicating the degree of similarity of the relationship between the feature amount obtained and the facial feature amount of the specific individual.

また本開示に係る画像処理装置(3)は、上記画像処理装置(2)において、前記特定個人判定部が、前記指標が所定の閾値より大きい場合、前記顔領域の顔が前記特定個人の顔であると判定し、前記指標が前記所定の閾値以下の場合、前記顔領域の顔が前記特定個人の顔ではないと判定するものであることを特徴としている。 Further, in the image processing device (3) according to the present disclosure, in the image processing device (2), when the index is larger than a predetermined threshold, the face in the face region is the face of the specific individual. and if the index is equal to or less than the predetermined threshold value, it is determined that the face in the face area is not the face of the specific individual.

上記画像処理装置(3)によれば、前記指標が所定の閾値より大きい場合、前記顔領域の顔が前記特定個人の顔であると判定され、前記指標が前記所定の閾値以下の場合、前記顔領域の顔が前記特定個人の顔ではないと判定される。前記指標と前記所定の閾値とを比較する処理により、前記判定の処理効率を更に高めることができる。 According to the image processing device (3), if the index is greater than a predetermined threshold, the face in the face region is determined to be the face of the specific individual, and if the index is equal to or less than the predetermined threshold, the It is determined that the face in the face area is not the face of the specific individual. The processing efficiency of the determination can be further improved by the processing of comparing the index and the predetermined threshold value.

また本開示に係る画像処理装置(4)は、上記画像処理装置(1)~(3)のいずれかにおいて、前記特定個人判定部が、前記画像の1フレームに対する判定の結果に基づいて、前記顔領域の顔が前記特定個人の顔であるか否かを判定するものであることを特徴としている。 Further, the image processing device (4) according to the present disclosure is any one of the above image processing devices (1) to (3), wherein the specific individual determination unit determines, based on the determination result for one frame of the image, the It is characterized by determining whether or not the face in the face area is the face of the specific individual.

上記画像処理装置(4)によれば、前記画像の1フレームに対する判定の結果に基づいて、前記顔領域の顔が前記特定個人の顔であるか否かが判定されるので、該判定の高速化を図ることができる。 According to the image processing device (4), it is determined whether or not the face in the face area is the face of the specific individual based on the result of determination for one frame of the image. can be improved.

また本開示に係る画像処理装置(5)は、上記画像処理装置(1)~(3)のいずれかにおいて、前記特定個人判定部が、前記画像の複数フレームに対する判定の結果に基づいて、前記顔領域の顔が前記特定個人の顔であるか否かを判定するものであることを特徴としている。 Further, the image processing device (5) according to the present disclosure is any one of the image processing devices (1) to (3), wherein the specific individual determination unit determines the It is characterized by determining whether or not the face in the face area is the face of the specific individual.

上記画像処理装置(5)によれば、前記画像の複数フレームに対する判定の結果に基づいて、前記顔領域の顔が前記特定個人の顔であるか否かが判定されるので、該判定の精度を高めることができる。 According to the image processing device (5), it is determined whether or not the face in the face region is the face of the specific individual based on the results of determination for a plurality of frames of the image. can increase

また本開示に係る画像処理装置(6)は、上記画像処理装置(1)~(5)のいずれかにおいて、前記顔画像処理には、顔検出処理、顔向き推定処理、視線方向推定処理、及び目開閉検出処理のうちの少なくともいずれかが含まれていることを特徴としている。 Further, the image processing device (6) according to the present disclosure, in any one of the image processing devices (1) to (5), includes face detection processing, face direction estimation processing, gaze direction estimation processing, and eye open/close detection processing.

上記画像処理装置(6)によれば、前記顔画像処理には、顔検出処理、顔向き推定処理、視線方向推定処理、及び目開閉検出処理のうちの少なくともいずれかが含まれているので、前記特定個人、又は前記特定個人以外の(通常の)人のさまざまな顔の挙動を推定したり、検出したりする処理を精度良く行うことができる。 According to the image processing device (6), the face image processing includes at least one of face detection processing, face direction estimation processing, line-of-sight direction estimation processing, and eye open/close detection processing. It is possible to accurately perform processing for estimating and detecting various facial behaviors of the specific individual or a (normal) person other than the specific individual.

また本開示に係るモニタリング装置(1)は、上記画像処理装置(1)~(6)のいずれかと、該画像処理装置に入力する画像を撮像する撮像部と、前記画像処理装置による画像処理に基づく情報を出力する出力部とを備えていることを特徴としている。 Further, the monitoring device (1) according to the present disclosure includes any of the image processing devices (1) to (6), an imaging unit that captures an image to be input to the image processing device, and image processing by the image processing device. and an output unit for outputting information based on the information.

上記モニタリング装置(1)によれば、前記通常の人の顔だけでなく、前記特定個人の顔を精度良くモニタリングすることができ、また、前記出力部から前記画像処理に基づく情報が出力可能なため、該情報を利用するモニタリングシステムなどを容易に構築することが可能となる。 According to the monitoring device (1), not only the face of the ordinary person but also the face of the specific individual can be monitored with high accuracy, and information based on the image processing can be output from the output unit. Therefore, it is possible to easily construct a monitoring system using the information.

また本開示に係る制御システム(1)は、上記モニタリング装置(1)と、該モニタリング装置と通信可能に接続され、該モニタリング装置から出力される前記情報に基づいて、所定の処理を実行する1以上の制御装置とを備えていることを特徴としている。 Further, a control system (1) according to the present disclosure is communicably connected to the monitoring device (1) and the monitoring device, and executes a predetermined process based on the information output from the monitoring device. It is characterized by comprising the above control device.

上記制御システム(1)によれば、前記モニタリング装置から出力される前記情報に基づいて、1以上の前記制御装置で所定の処理を実行させることが可能となる。したがって、前記通常の人のモニタリング結果だけでなく、前記特定個人のモニタリング結果を利用することができるシステムを構築することができる。 According to the above control system (1), it is possible to cause one or more of the control devices to execute a predetermined process based on the information output from the monitoring device. Therefore, it is possible to construct a system that can use not only the monitoring results of the ordinary person but also the monitoring results of the specific individual.

また本開示に係る制御システム(2)は、上記制御システム(1)において、
前記モニタリング装置が、車両のドライバをモニタリングするための装置であり、
前記制御装置が、前記車両に搭載される電子制御ユニットを含むことを特徴としている。
Further, the control system (2) according to the present disclosure is the above control system (1),
the monitoring device is a device for monitoring a driver of a vehicle;
The control device is characterized by including an electronic control unit mounted on the vehicle.

上記制御システム(2)によれば、前記車両のドライバが前記特定個人である場合であっても、前記特定個人の顔を精度良くモニタリングすることができ、そのモニタリングの結果に基づいて、前記電子制御ユニットに所定の制御を適切に実行させることが可能となる。これにより、前記特定個人であっても安心して運転することができる安全性の高い車載システムを構築することが可能となる。 According to the control system (2), even if the driver of the vehicle is the specific individual, the face of the specific individual can be monitored with high accuracy, and based on the monitoring results, the electronic It is possible to cause the control unit to appropriately execute predetermined control. As a result, it is possible to construct a highly safe vehicle-mounted system that allows even the specific individual to drive with peace of mind.

また本開示に係る画像処理方法は、撮像部から入力される画像を処理する画像処理方法であって、
前記画像から顔の特徴量を抽出しながら顔領域を検出する顔検出ステップと、
該顔検出ステップにより検出された前記顔領域の前記特徴量と、特定個人の顔を検出するための学習を行った学習済みの前記特定個人の顔特徴量とを用いて、前記顔領域の顔が前記特定個人の顔であるか否かを判定する特定個人判定ステップと、
該特定個人判定ステップにより前記特定個人の顔であると判定された場合、特定個人用の顔画像処理を行う第1顔画像処理ステップと、
前記特定個人判定ステップにより前記特定個人の顔ではないと判定された場合、通常の顔画像処理を行う第2顔画像処理ステップとを含むことを特徴としている。
Further, an image processing method according to the present disclosure is an image processing method for processing an image input from an imaging unit,
a face detection step of detecting a face region while extracting face feature amounts from the image;
using the feature quantity of the face region detected by the face detection step and the learned face feature quantity of the specific individual that has undergone learning to detect the face of the specific individual; a specific individual determination step of determining whether or not is the face of the specific individual;
a first face image processing step of performing face image processing for a specific individual when the face is determined to be that of the specific individual by the specific individual determination step;
and a second face image processing step of performing normal face image processing when it is determined by the specific individual determination step that the face is not that of the specific individual.

上記画像処理方法によれば、前記特定個人判定ステップにより、前記顔検出ステップで検出された前記顔領域の前記特徴量と、前記特定個人の顔特徴量とを用いて、前記顔領域の顔が前記特定個人の顔であるか否かが判定される。前記特定個人の顔特徴量を用いることにより、前記特定個人の顔であるか否かを精度良く判定することができる。
また、前記特定個人の顔であると判定された場合、前記第1顔画像処理ステップにより前記特定個人の顔画像処理を精度良く実施することができる。一方、前記特定個人の顔ではない、換言すれば、前記特定個人ではない通常の顔であると判定された場合、前記第2顔画像処理ステップにより前記通常の顔画像処理を精度良く実施することができる。したがって、前記特定個人であっても、特定個人以外の通常の人であっても、それぞれの顔のセンシングを精度良く実施することができる。
According to the above image processing method, in the specific individual determination step, the face in the face region is determined using the feature quantity of the face region detected in the face detection step and the face feature quantity of the specific individual. It is determined whether or not it is the face of the specific individual. By using the face feature amount of the specific individual, it is possible to accurately determine whether or not it is the face of the specific individual.
Further, when it is determined that the face is the face of the specific individual, the face image processing of the specific individual can be performed with high accuracy by the first face image processing step. On the other hand, when it is determined that the face is not the face of the specific individual, in other words, the face is a normal face that is not the specific individual, the normal face image processing is performed with high accuracy by the second face image processing step. can be done. Therefore, whether it is the specific individual or a normal person other than the specific individual, the sensing of each face can be performed with high accuracy.

また本開示に係るプログラムは、撮像部から入力される画像の処理を少なくとも1以上のコンピュータに実行させるためのプログラムであって、
前記少なくとも1以上のコンピュータに、
前記画像から顔の特徴量を抽出しながら顔領域を検出する顔検出ステップと、
該顔検出ステップにより検出された前記顔領域の前記特徴量と、特定個人の顔を検出するための学習を行った学習済みの前記特定個人の顔特徴量とを用いて、前記顔領域の顔が前記特定個人の顔であるか否かを判定する特定個人判定ステップと、
該特定個人判定ステップにより前記特定個人の顔であると判定された場合、特定個人用の顔画像処理を行う第1顔画像処理ステップと、
前記特定個人判定ステップにより前記特定個人の顔ではないと判定された場合、通常の顔画像処理を行う第2顔画像処理ステップとを実行させることを特徴としている。
A program according to the present disclosure is a program for causing at least one or more computers to process an image input from an imaging unit,
to said at least one computer;
a face detection step of detecting a face region while extracting face feature amounts from the image;
using the feature quantity of the face region detected by the face detection step and the learned face feature quantity of the specific individual that has undergone learning to detect the face of the specific individual; a specific individual determination step of determining whether or not is the face of the specific individual;
a first face image processing step of performing face image processing for a specific individual when the face is determined to be that of the specific individual by the specific individual determination step;
and a second face image processing step of performing normal face image processing when it is determined by the specific individual determining step that the face is not that of the specific individual.

上記プログラムによれば、前記少なくとも1以上のコンピュータに、前記顔領域の前記特徴量と、前記特定個人の顔特徴量とを用いて、前記顔領域の顔が前記特定個人の顔であるか否かを判定させることができ、前記特定個人の顔であるか否かを精度良く判定させることができる。
また、前記特定個人の顔であると判定された場合、前記特定個人の顔画像処理を精度良く実施させることができる。一方、前記特定個人の顔ではない、換言すれば、前記特定個人ではない通常の顔であると判定された場合、前記通常の顔画像処理を精度良く実施させることができる。したがって、前記特定個人であっても、特定個人以外の通常の人であっても、それぞれの顔のセンシングを精度良く実施することができる装置やシステムを構築することができる。なお、上記プログラムは、記憶媒体に保存されたプログラムであってもよいし、通信ネットワークを介して転送可能なプログラムであってもよいし、通信ネットワークを介して実行されるプログラムであってもよい。
According to the above program, the at least one computer uses the feature quantity of the face region and the face feature quantity of the specific individual to determine whether the face in the face region is the face of the specific individual. Therefore, it is possible to accurately determine whether or not the face is the face of the specific individual.
Further, when it is determined that the face is the face of the specific individual, the face image processing of the specific individual can be performed with high accuracy. On the other hand, when it is determined that the face is not the face of the specific individual, in other words, it is determined to be a normal face that is not the specific individual, the normal face image processing can be performed with high accuracy. Therefore, it is possible to construct a device or system capable of accurately sensing the face of each of the specific individual and a normal person other than the specific individual. The program may be a program stored in a storage medium, a program that can be transferred via a communication network, or a program that is executed via a communication network. .

本発明の実施の形態に係るドライバモニタリング装置を含む車載システムの一例を示す模式図である。1 is a schematic diagram showing an example of an in-vehicle system including a driver monitoring device according to an embodiment of the present invention; FIG. 実施の形態に係るドライバモニタリング装置を含む車載システムのハードウェア構成の一例を示すブロック図である。1 is a block diagram showing an example hardware configuration of an in-vehicle system including a driver monitoring device according to an embodiment; FIG. 実施の形態に係るドライバモニタリング装置の画像処理部の機能構成例を示すブロック図である。2 is a block diagram showing an example functional configuration of an image processing unit of the driver monitoring device according to the embodiment; FIG. 実施の形態に係るドライバモニタリング装置の画像処理部が行う処理動作の一例を示すフローチャートである。4 is a flowchart showing an example of processing operations performed by an image processing unit of the driver monitoring device according to the embodiment; 実施の形態に係るドライバモニタリング装置の画像処理部が行う特定個人判定処理動作の一例を示すフローチャートである。7 is a flowchart showing an example of a specific individual determination processing operation performed by an image processing unit of the driver monitoring device according to the embodiment; 実施の形態に係るドライバモニタリング装置の画像処理部が行う特定個人判定処理動作の別の一例を示すフローチャートである。9 is a flowchart showing another example of the specific individual determination processing operation performed by the image processing unit of the driver monitoring device according to the embodiment;

以下、本発明に係る画像処理装置、モニタリング装置、制御システム、画像処理方法、及びプログラムの実施の形態を図面に基づいて説明する。
本発明に係る画像処理装置は、例えば、カメラを用いて人などの対象物をモニタリングする装置やシステムに広く適用可能である。本発明に係る画像処理装置は、例えば、車両などの各種移動体のドライバ(操縦者)をモニタリングする装置やシステムの他、工場内の機械や装置などの各種設備を操作したり、監視したり、所定の作業をしたりする人などをモニタリングする装置やシステムなどにも適用可能である。
Embodiments of an image processing device, a monitoring device, a control system, an image processing method, and a program according to the present invention will be described below with reference to the drawings.
INDUSTRIAL APPLICABILITY The image processing apparatus according to the present invention can be widely applied to, for example, apparatuses and systems for monitoring objects such as people using cameras. The image processing device according to the present invention is, for example, a device or system for monitoring a driver (operator) of various moving bodies such as a vehicle, or operates or monitors various facilities such as machines and devices in a factory. It can also be applied to a device or system for monitoring a person who performs a predetermined work or the like.

[適用例]
図1は、実施の形態に係るドライバモニタリング装置を含む車載システムの一例を示す模式図である。本適用例では、本発明に係る画像処理装置をドライバモニタリング装置10に適用した例について説明する。
[Application example]
FIG. 1 is a schematic diagram showing an example of an in-vehicle system including a driver monitoring device according to an embodiment. In this application example, an example in which an image processing device according to the present invention is applied to a driver monitoring device 10 will be described.

車載システム1は、車両2のドライバ3の状態(例えば、顔の挙動など)をモニタリングするドライバモニタリング装置10、車両2の走行、操舵、又は制動などの制御を行う1以上のECU(Electronic Control Unit)40、及び車両各部の状態、又は車両周囲の状態などを検出する1以上のセンサ41を含んで構成され、これらが通信バス43を介して接続されている。車載システム1は、例えば、CAN(Controller Area Network)プロトコルに従って通信する車載ネットワークシステムとして構成されている。なお、車載システム1の通信規格には、CAN以外の他の通信規格が採用されてもよい。ドライバモニタリング装置10が、本発明の「モニタリング装置」の一例であり、車載システム1が、本発明の「制御システム」の一例である。 The in-vehicle system 1 includes a driver monitoring device 10 that monitors the state of the driver 3 of the vehicle 2 (for example, behavior of the face), and one or more ECUs (Electronic Control Units) that control driving, steering, or braking of the vehicle 2. ) 40 and one or more sensors 41 for detecting the state of each part of the vehicle or the state of the surroundings of the vehicle, which are connected via a communication bus 43 . The in-vehicle system 1 is configured as an in-vehicle network system that communicates according to CAN (Controller Area Network) protocol, for example. In addition, other communication standards than CAN may be adopted as the communication standard of the in-vehicle system 1 . The driver monitoring device 10 is an example of the "monitoring device" of the present invention, and the in-vehicle system 1 is an example of the "control system" of the present invention.

ドライバモニタリング装置10は、ドライバ3の顔を撮像するためのカメラ11と、カメラ11から入力される画像を処理する画像処理部12と、画像処理部12による画像処理に基づく情報を、通信バス43を介して所定のECU40に出力する処理などを行う通信部16とを含んで構成されている。画像処理部12が、本発明の「画像処理装置」の一例である。カメラ11が、本発明の「撮像部」の一例である。 The driver monitoring device 10 includes a camera 11 for capturing an image of the face of the driver 3, an image processing unit 12 for processing an image input from the camera 11, and information based on image processing by the image processing unit 12 via a communication bus 43. and a communication unit 16 that performs processing for outputting to a predetermined ECU 40 via the communication unit 16 . The image processing unit 12 is an example of the "image processing device" of the present invention. The camera 11 is an example of the "imaging section" of the present invention.

ドライバモニタリング装置10は、カメラ11で撮像された画像からドライバ3の顔を検出し、検出されたドライバ3の顔の向き、視線の方向、又は目の開閉状態などの顔の挙動を検出する。ドライバモニタリング装置10は、これら顔の挙動の検出結果に基づいて、ドライバ3の状態、例えば、前方注視、脇見、居眠り、後ろ向き、突っ伏しなどの状態を判定してもよい。また、ドライバモニタリング装置10が、これらドライバ3の状態判定に基づく信号をECU40に出力し、ECU40が、前記信号に基づいてドライバ3への注意や警告処理、又は車両2の動作制御(例えば、減速制御、又は路肩への誘導制御など)などを実行するように構成してもよい。 The driver monitoring device 10 detects the face of the driver 3 from the image captured by the camera 11, and detects the behavior of the detected face of the driver 3, such as the direction of the face, the direction of the line of sight, or the state of opening and closing the eyes. The driver monitoring device 10 may determine the state of the driver 3, such as looking ahead, looking aside, dozing off, looking backwards, lying down, etc., based on these facial behavior detection results. In addition, the driver monitoring device 10 outputs a signal based on the state determination of the driver 3 to the ECU 40, and the ECU 40 performs attention or warning processing to the driver 3 or operation control (for example, deceleration control) of the vehicle 2 based on the signal. control, or guidance control to the road shoulder, etc.).

ドライバモニタリング装置10では、特定個人に対する顔センシングの精度を向上させることを目的の一つとしている。 One of the purposes of the driver monitoring device 10 is to improve the accuracy of face sensing for a specific individual.

従来のドライバモニタリング装置では、車両2のドライバ3が、例えば、ケガなどにより、目、鼻、口などの顔器官の一部が欠損、若しくは大きく変形していたり、顔に大きなホクロやイボ、若しくはタトゥーなどの身体装飾が施されていたり、又は遺伝性の疾患などの病気により、前記顔器官の配置が平均的な位置からずれていたりした場合、カメラで撮像された画像から顔を検出する精度が低下してしまうという課題があった。 In the conventional driver monitoring device, the driver 3 of the vehicle 2 has, for example, a part of facial organs such as eyes, nose, mouth, etc. missing or greatly deformed due to injury, or a large mole or wart on the face. Accuracy of detecting a face from an image captured by a camera when the arrangement of the facial organs deviates from the average position due to body decorations such as tattoos or diseases such as genetic diseases. There was a problem that the

また、顔検出精度が低下すると、顔向き推定処理など、顔検出後の処理も適切に行われないこととなるため、ドライバ3の脇見や居眠りなどの状態判定も適切に行うことができなくなり、また、前記状態判定に基づいてECU40が実行すべき各種の制御も適切に行うことができなくなる虞があるという課題があった。 In addition, when the face detection accuracy decreases, the processing after the face detection such as the face direction estimation processing is not performed properly. Moreover, there is a problem that various controls that should be executed by the ECU 40 based on the state determination may not be performed appropriately.

係る課題を解決すべく、実施の形態に係るドライバモニタリング装置10では、特定個人、換言すれば、年齢差、性別、及び人種などの違い(個人差)にかかわらずに共通する一般的な人(普通の人)の顔特徴とは異なる特徴を有している特定の個人に対する顔検出の精度を向上させるために、以下の構成を採用した。 In order to solve such a problem, the driver monitoring device 10 according to the embodiment can detect a specific individual, in other words, a common general person regardless of differences in age, gender, race, etc. (individual differences). In order to improve the accuracy of face detection for a specific individual who has features different from those of a (ordinary person), the following configuration was adopted.

画像処理部12には、画像から顔を検出するための学習を行った学習済みの顔特徴量として、特定個人の顔特徴量と、通常の顔特徴量(換言すれば、特定個人以外の人である場合に用いる顔特徴量)とが記憶されている。 The image processing unit 12 stores a specific individual's facial feature amount and a normal facial feature amount (in other words, a person other than a specific individual) as learned facial feature amounts that have been trained to detect a face from an image. ) are stored.

画像処理部12が、カメラ11の入力画像から顔を検出するための特徴量を抽出しながら顔領域を検出する顔検出処理を行う。そして、画像処理部12が、検出された前記顔領域の特徴量と、前記特定個人の顔特徴量とを用いて、前記顔領域の顔が前記特定個人の顔であるか否かを判定する特定個人判定処理を行う。 The image processing unit 12 performs face detection processing for detecting a face area while extracting a feature amount for detecting a face from an input image of the camera 11 . Then, the image processing unit 12 uses the detected feature quantity of the face region and the face feature quantity of the specific individual to determine whether or not the face in the face region is the face of the specific individual. Specific individual determination processing is performed.

前記特定個人判定処理では、前記顔領域から抽出された特徴量と前記特定個人の顔特徴量との関係を示す指標、例えば、相関を示す指標として、相関係数を算出し、算出した前記相関係数に基づいて、前記顔領域の顔が前記特定個人の顔であるか否かを判定してもよい。
例えば、前記相関係数が所定の閾値より大きい場合、前記顔領域の顔が前記特定個人の顔であると判定し、前記相関係数が前記所定の閾値以下の場合、前記顔領域の顔が前記特定個人の顔ではないと判定してもよい。なお、前記特定個人判定処理では、前記相関係数以外の指標を用いてもよい。
In the specific individual determination process, a correlation coefficient is calculated as an index indicating the relationship between the feature amount extracted from the facial region and the facial feature amount of the specific individual, for example, as an index indicating correlation, and the calculated correlation coefficient is calculated. Whether or not the face in the face area is the face of the specific individual may be determined based on the relational coefficient.
For example, when the correlation coefficient is greater than a predetermined threshold, the face in the face region is determined to be the face of the specific individual, and when the correlation coefficient is less than or equal to the predetermined threshold, the face in the face region is determined to be the face of the specific individual. It may be determined that the face is not the face of the specific individual. In addition, in the specific individual determination process, an index other than the correlation coefficient may be used.

また、前記特定個人判定処理では、カメラ11からの入力画像の1フレームに対する判定の結果に基づいて、前記顔領域の顔が前記特定個人の顔であるか否かを判定してもよいし、カメラ11からの入力画像の複数フレームに対する判定の結果に基づいて、前記顔領域の顔が前記特定個人の顔であるか否かを判定してもよい。 Further, in the specific individual determination process, it may be determined whether or not the face in the face region is the face of the specific individual based on the determination result for one frame of the input image from the camera 11, Whether or not the face in the face area is the face of the specific individual may be determined based on the results of determination for a plurality of frames of the input image from the camera 11 .

このように、ドライバモニタリング装置10では、画像処理部12に、学習済みの特定個人の顔特徴量を予め記憶しておき、特定個人の顔特徴量を用いることにより、前記特定個人の顔であるか否かを精度良く判定することが可能となる。 In this way, in the driver monitoring device 10, the learned face feature amount of the specific individual is stored in advance in the image processing unit 12, and by using the face feature amount of the specific individual, the face of the specific individual is obtained. It is possible to accurately determine whether or not.

また、前記特定個人判定処理により前記特定個人の顔であると判定された場合、画像処理部12は、特定個人用の顔画像処理を実行するので、前記特定個人の顔画像処理を精度良く実施することが可能となる。
一方、前記特定個人の顔ではない、換言すれば、通常の顔(換言すれば、特定個人以外の顔)であると判定された場合、画像処理部12は、通常の顔画像処理を実行するので、前記通常の顔画像処理を精度良く実施することができる。したがって、ドライバ3が、特定個人であっても、特定個人以外の通常の人であっても、それぞれの顔のセンシングを精度良く実施することができる。
Further, when it is determined by the specific individual determination process that the face is that of the specific individual, the image processing unit 12 executes face image processing for the specific individual, so that the specific individual's face image processing is accurately performed. It becomes possible to
On the other hand, if it is determined that the face is not the face of the specific individual, in other words, the face is a normal face (in other words, a face other than the specific individual), the image processing unit 12 performs normal face image processing. Therefore, the normal face image processing can be performed with high accuracy. Therefore, regardless of whether the driver 3 is a specific individual or a normal person other than the specific individual, it is possible to accurately sense each face.

[ハードウェア構成例]
図2は、実施の形態に係るドライバモニタリング装置10を含む車載システム1のハードウェア構成の一例を示すブロック図である。
[Hardware configuration example]
FIG. 2 is a block diagram showing an example of the hardware configuration of the in-vehicle system 1 including the driver monitoring device 10 according to the embodiment.

車載システム1は、車両2のドライバ3の状態をモニタリングするドライバモニタリング装置10、1以上のECU40、及び1以上のセンサ41を含んで構成され、これらが通信バス43を介して接続されている。また、ECU40には、1以上のアクチュエータ42が接続されている。 The in-vehicle system 1 includes a driver monitoring device 10 that monitors the state of the driver 3 of the vehicle 2 , one or more ECUs 40 , and one or more sensors 41 , which are connected via a communication bus 43 . One or more actuators 42 are connected to the ECU 40 .

ドライバモニタリング装置10は、カメラ11と、カメラ11から入力される画像を処理する画像処理部12と、外部のECU40などとデータや信号のやり取りを行うための通信部16とを含んで構成されている。 The driver monitoring device 10 includes a camera 11, an image processing unit 12 that processes an image input from the camera 11, and a communication unit 16 that exchanges data and signals with an external ECU 40 or the like. there is

カメラ11は、運転席に着座しているドライバ3の顔を含む画像を撮像する装置であり、例えば、レンズ部、撮像素子部、光照射部、インターフェース部、これら各部を制御するカメラ制御部などを含んで構成され得る。前記撮像素子部は、CCD(Charge Coupled Device)、CMOS(Complementary Metal Oxide Semiconductor)などの撮像素子、フィルタ、マイクロレンズなどを含んで構成され得る。前記撮像素子部は、可視領域の光を受けて撮像画像を形成できる素子でもよいし、近赤外領域の光を受けて撮像画像を形成できる素子でもよい。前記光照射部は、LED(Light Emitting Diode)などの発光素子を含んで構成され、昼夜を問わずドライバの顔を撮像できるように近赤外線LEDなどを含んでもよい。カメラ11は、所定のフレームレート(例えば、毎秒数十フレーム)で画像を撮像し、撮像された画像のデータが画像処理部12に入力される。カメラ11は、一体式の他、外付け式のものであってもよい。 The camera 11 is a device that captures an image including the face of the driver 3 sitting in the driver's seat, and includes, for example, a lens unit, an imaging device unit, a light irradiation unit, an interface unit, and a camera control unit that controls these units. can be configured to include The imaging element section may include an imaging element such as a CCD (Charge Coupled Device) or a CMOS (Complementary Metal Oxide Semiconductor), a filter, a microlens, and the like. The imaging device section may be a device capable of receiving light in the visible region to form a captured image, or may be a device capable of receiving light in the near-infrared region to form a captured image. The light irradiation section includes a light-emitting element such as an LED (Light Emitting Diode), and may include a near-infrared LED or the like so that the driver's face can be imaged day or night. The camera 11 captures an image at a predetermined frame rate (for example, several tens of frames per second), and data of the captured image is input to the image processing section 12 . The camera 11 may be an integrated type or an external type.

画像処理部12は、1以上のCPU(Central Processing Unit)13、ROM(Read Only Memory)14、及びRAM(Random Access Memory)15を含む画像処理装置として構成されている。ROM14は、プログラム記憶部141と顔特徴量記憶部142とを含み、RAM15は、カメラ11からの入力画像を記憶する画像メモリ151を含んで構成されている。なお、ドライバモニタリング装置10に、別の記憶部を設け、その記憶部をプログラム記憶部141、顔特徴量記憶部142、及び画像メモリ151として用いてもよい。前記別の記憶部は、半導体メモリでもよいし、ディスクドライブなどで読み込み可能な記憶媒体でもよい。 The image processing unit 12 is configured as an image processing device including one or more CPU (Central Processing Unit) 13 , ROM (Read Only Memory) 14 , and RAM (Random Access Memory) 15 . The ROM 14 includes a program storage unit 141 and a face feature amount storage unit 142 , and the RAM 15 includes an image memory 151 for storing an input image from the camera 11 . It should be noted that the driver monitoring device 10 may be provided with another storage unit, and the storage unit may be used as the program storage unit 141 , the facial feature amount storage unit 142 and the image memory 151 . The separate storage unit may be a semiconductor memory or a storage medium readable by a disk drive or the like.

CPU13は、ハードウェアプロセッサの一例であり、ROM14のプログラム記憶部141に記憶されているプログラム、顔特徴量記憶部142に記憶されている顔特徴量などのデータを読み込み、解釈し実行することで、カメラ11から入力された画像の処理、例えば、顔検出処理などの顔画像処理を行う。また、CPU13は、該顔画像処理により得られた結果(例えば、処理データ、判定信号、又は制御信号など)を、通信部16を介してECU40などに出力する処理などを行う。 The CPU 13 is an example of a hardware processor, and reads programs stored in the program storage unit 141 of the ROM 14 and data such as facial feature amounts stored in the facial feature amount storage unit 142, interprets and executes them. , the image input from the camera 11 is processed, for example, face image processing such as face detection processing is performed. In addition, the CPU 13 performs processing of outputting the result (for example, processing data, determination signal, control signal, etc.) obtained by the face image processing to the ECU 40 or the like via the communication unit 16 .

顔特徴量記憶部142には、画像から顔を検出するための学習(例えば、機械学習)を行った学習済みの顔特徴量として、図3に示す特定個人の顔特徴量142aと、通常の顔特徴量142bとが記憶されている。
学習済みの顔特徴量には、画像から顔を検出するのに有効な各種の特徴量を用いることができる。例えば、顔の局所的な領域の明暗差(さまざまな大きさの2つの矩形領域の平均輝度の差)に着目した特徴量(Haar-like特徴量)を用いてもよい。又は、顔の局所的な領域の輝度の分布の組み合わせに着目した特徴量(LBP (Local Binary Pattern) 特徴量)を用いてもよいし、顔の局所的な領域の輝度の勾配方向の分布の組み合わせに着目した特徴量(HOG (Histogram of Oriented Gradients) 特徴量)などを用いてもよい。
The face feature quantity storage unit 142 stores a specific individual face feature quantity 142a shown in FIG. A facial feature amount 142b is stored.
Various feature amounts effective for detecting a face from an image can be used as the learned face feature amount. For example, a feature amount (Haar-like feature amount) focused on the brightness difference in a local area of the face (difference in average luminance between two rectangular areas of various sizes) may be used. Alternatively, a feature value (LBP (Local Binary Pattern) feature value) focusing on a combination of luminance distributions in local regions of the face may be used, or a distribution of luminance gradient directions in local regions of the face may be used. A feature amount focused on a combination (HOG (Histogram of Oriented Gradients) feature amount) may be used.

顔特徴量記憶部142に記憶される顔特徴量は、例えば、各種の機械学習による手法を用いて、顔検出に有効な特徴量として抽出されたものである。機械学習とは、データ(学習データ)に内在するパターンをコンピュータにより見つけ出す処理である。例えば、統計的な学習手法の一例としてAdaBoostを用いてもよい。AdaBoostは、判別能力の低い判別器(弱判別器)を多数選び出し、これら多数の弱判別器の中からエラー率が小さい弱判別器を選択し、重みなどのパラメータを調整し、階層的な構造にすることで、強判別器を構築することのできる学習アルゴリズムである。なお、判別器は、識別器、分類器、又は学習器と称されてもよい。 The face feature quantity stored in the face feature quantity storage unit 142 is extracted as a feature quantity effective for face detection using various machine learning techniques, for example. Machine learning is a process of finding patterns inherent in data (learning data) by a computer. For example, AdaBoost may be used as an example of a statistical learning method. AdaBoost selects a large number of classifiers with low discrimination ability (weak classifiers), selects weak classifiers with a small error rate from among these many weak classifiers, adjusts parameters such as weights, and creates a hierarchical structure. It is a learning algorithm that can construct a strong discriminator by Note that the discriminator may also be called a discriminator, a classifier, or a learner.

強判別器は、例えば、顔の検出に有効な1つの特徴量を1つの弱判別器によって判別する構成とし、AdaBoostにより多数の弱判別器とその組み合わせを選び出し、これらを用いて、階層的な構造を構築したものとしてもよい。なお、1つの弱判別器は、例えば、顔の場合は1、非顔の場合は0という情報を出力してもよい。また、学習手法には、顔らしさを0または1ではなく、0から1の実数で出力可能なReal AdaBoostという学習手法を用いてもよい。また、これら学習手法には、入力層、中間層、及び出力層を有するニューラルネットワークを用いてもよい。 The strong classifier is configured, for example, to classify one feature quantity effective for face detection by one weak classifier, select a large number of weak classifiers and their combinations by AdaBoost, and use these to perform hierarchical classification. It is good also as what constructed the structure. Note that one weak discriminator may output information such as 1 for a face and 0 for a non-face, for example. Also, as a learning method, a learning method called Real AdaBoost, which can output a real number between 0 and 1 instead of 0 or 1, may be used. Moreover, a neural network having an input layer, an intermediate layer, and an output layer may be used for these learning methods.

このような学習アルゴリズムが搭載された学習装置に、さまざまな条件で撮像された多数の顔画像と多数の顔以外の画像(非顔画像)とを学習データとして与え、学習を繰り返し、重みなどのパラメータを調整して最適化を図ることにより、顔を高精度に検出可能な階層構造を有する強判別器を構築することが可能となる。そして、このような強判別器を構成する各階層の弱判別器で用いられる1以上の特徴量を、学習済みの顔特徴量として用いることができる。 A large number of face images captured under various conditions and a large number of non-face images (non-face images) are given as learning data to a learning device equipped with such a learning algorithm. By adjusting parameters for optimization, it is possible to construct a strong discriminator having a hierarchical structure capable of detecting faces with high accuracy. One or more feature amounts used in the weak classifiers of each layer constituting such a strong classifier can be used as learned face feature amounts.

特定個人の顔特徴量142aは、例えば、予め所定の場所で、特定個人の顔画像をさまざまな条件(さまざまな顔の向き、視線の方向、又は目の開閉状態などの条件)で個別に撮像し、これら多数の撮像画像を教師データとして、上記学習装置に入力し、学習処理によって調整された、特定個人の顔の特徴を示すパラメータである。特定個人の顔特徴量142aは、例えば、学習処理によって得られた、顔の局所的な領域の明暗差の組み合わせパターンなどでもよい。顔特徴量記憶部142に記憶される特定個人の顔特徴量142aは、1人の特定個人の顔特徴量だけでもよいし、複数の特定個人が車両2を運転する場合などに対応できるように、複数人の特定個人の顔特徴量が記憶されてもよい。 For example, the specific individual's face feature quantity 142a is obtained by individually capturing a specific individual's face image at a predetermined location in advance under various conditions (various conditions such as face orientation, line-of-sight direction, and eye open/closed state). Then, these many captured images are input to the learning device as training data, and adjusted by learning processing, and are parameters indicating the facial features of a specific individual. The face feature amount 142a of the specific individual may be, for example, a combination pattern of light and dark differences in local regions of the face obtained by learning processing. The face feature quantity 142a of the specific individual stored in the face feature quantity storage unit 142 may be the face feature quantity of only one specific individual, or may correspond to the case where a plurality of specific individuals drive the vehicle 2. , facial features of a plurality of specific individuals may be stored.

通常の顔特徴量142bは、通常の人の顔画像をさまざまな条件(さまざまな顔の向き、視線の方向、又は目の開閉状態などの条件)で撮像した画像を教師データとして、上記学習装置に入力し、学習処理によって調整された、通常の人の顔の特徴を示すパラメータである。通常の顔特徴量142bは、例えば、学習処理によって得られた、顔の局所的な領域の明暗差の組み合わせパターンなどでもよい。また、通常の顔特徴量142bは、所定の顔特徴量データベースに登録されている情報を用いてもよい。 The normal face feature amount 142b is obtained by using images of normal people's faces captured under various conditions (various conditions such as face orientation, line of sight direction, and eye open/closed state) as teacher data. , and adjusted by the learning process, representing the features of a normal human face. The normal face feature quantity 142b may be, for example, a combination pattern of light and dark differences in local areas of the face obtained by learning processing. Information registered in a predetermined facial feature amount database may be used as the normal facial feature amount 142b.

顔特徴量記憶部142に記憶される学習済みの顔特徴量は、例えば、クラウド上のサーバなどからインターネット、携帯電話網などの通信ネットワークを介して取り込んで、顔特徴量記憶部142に記憶される構成としてもよい。 The learned facial feature amounts stored in the facial feature amount storage unit 142 are stored in the facial feature amount storage unit 142 by, for example, fetching them from a server on the cloud via a communication network such as the Internet or a mobile phone network. It may be configured to be

ECU40は、1以上のプロセッサ、メモリ、及び通信モジュールなどを含むコンピュータ装置で構成されている。そして、ECU40に搭載されたプロセッサが、メモリに記憶されたプログラムを読み込み、解釈し実行することで、アクチュエータ42などに対する所定の制御が実行されるようになっている。 The ECU 40 is composed of a computer device including one or more processors, memories, communication modules, and the like. A processor installed in the ECU 40 reads, interprets, and executes the program stored in the memory, thereby performing predetermined control on the actuator 42 and the like.

ECU40は、例えば、走行系ECU、運転支援系ECU、ボディ系ECU、及び情報系ECUのうちの少なくともいずれかを含んで構成されている。 The ECU 40 includes, for example, at least one of a driving system ECU, a driving support system ECU, a body system ECU, and an information system ECU.

前記走行系ECUには、例えば、駆動系ECU、シャーシ系ECUなどが含まれている。前記駆動系ECUには、例えば、エンジン制御、モータ制御、燃料電池制御、EV(Electric Vehicle)制御、又はトランスミッション制御等の「走る」機能に関する制御ユニットが含まれている。前記シャーシ系ECUには、例えば、ブレーキ制御、又はステアリング制御等の「止まる、曲がる」機能に関する制御ユニットが含まれている。 The travel system ECU includes, for example, a drive system ECU, a chassis system ECU, and the like. The drive system ECU includes, for example, a control unit related to a "running" function such as engine control, motor control, fuel cell control, EV (Electric Vehicle) control, or transmission control. The chassis system ECU includes, for example, a control unit for "stop, turn" functions such as brake control or steering control.

前記運転支援系ECUは、例えば、自動ブレーキ支援機能、車線維持支援機能(LKA/Lane Keep Assistともいう)、定速走行・車間距離支援機能(ACC/Adaptive Cruise Controlともいう)、前方衝突警告機能、車線逸脱警報機能、死角モニタリング機能、交通標識認識機能等、走行系ECUなどとの連携により自動的に安全性の向上、又は快適な運転を実現する機能(運転支援機能、又は自動運転機能)に関する制御ユニットを少なくとも1つ以上含んで構成され得る。 The driving support system ECU has, for example, an automatic braking support function, a lane keeping support function (also referred to as LKA/Lane Keep Assist), a constant speed driving/vehicle distance support function (also referred to as ACC/Adaptive Cruise Control), and a forward collision warning function. , Lane departure warning function, blind spot monitoring function, traffic sign recognition function, etc. Functions that automatically improve safety or realize comfortable driving in cooperation with driving system ECU etc. (driving support function or automatic driving function) may be configured to include at least one or more control units for

前記運転支援系ECUには、例えば、米国自動車技術会(SAE)が提示している自動運転レベルにおけるレベル1(ドライバ支援)、レベル2(部分的自動運転)、及びレベル3(条件付自動運転)の少なくともいずれかの機能が装備されてもよい。さらに、自動運転レベルのレベル4(高度自動運転)、又はレベル5(完全自動運転)の機能が装備されてもよいし、レベル1、2のみ、又はレベル2、3のみの機能が装備されてもよい。また、車載システム1を自動運転システムとして構成してもよい。 The driving support system ECU includes, for example, level 1 (driver support), level 2 (partially automated driving), and level 3 (conditional automated driving) in the automated driving levels presented by the Society of Automotive Engineers (SAE). ) may be equipped with at least one of the functions of Furthermore, the function of level 4 (highly automated driving) or level 5 (fully automated driving) of the automatic driving level may be equipped, or only the functions of levels 1 and 2 or only levels 2 and 3 are equipped. good too. Also, the in-vehicle system 1 may be configured as an automatic driving system.

前記ボディ系ECUは、例えば、ドアロック、スマートキー、パワーウインドウ、エアコン、ライト、メーターパネル、又はウインカ等の車体の機能に関する制御ユニットを少なくとも1つ以上含んで構成され得る。 The body system ECU may include at least one or more control units related to vehicle body functions such as door locks, smart keys, power windows, air conditioners, lights, meter panels, and blinkers.

前記情報系ECUは、例えば、インフォテイメント装置、テレマティクス装置、又はITS(Intelligent Transport Systems)関連装置を含んで構成され得る。前記インフォテイメント装置には、例えば、ユーザインターフェースとして機能するHMI(Human Machine Interface)装置の他、カーナビゲーション装置、オーディオ機器などが含まれてもよい。前記テレマティクス装置には、外部と通信するための通信ユニットなどが含まれてもよい。前記ITS関連装置には、ETC(Electronic Toll Collection System)、又はITSスポットなどの路側機との路車間通信、若しくは車々間通信などを行うための通信ユニットなどが含まれてもよい。 The information system ECU may include, for example, an infotainment device, a telematics device, or an ITS (Intelligent Transport Systems) related device. The infotainment device may include, for example, an HMI (Human Machine Interface) device that functions as a user interface, a car navigation device, an audio device, and the like. The telematics device may include a communication unit or the like for communicating with the outside. The ITS-related device may include an ETC (Electronic Toll Collection System), a communication unit for performing road-to-vehicle communication with a roadside device such as an ITS spot, or vehicle-to-vehicle communication.

センサ41には、ECU40でアクチュエータ42の動作制御を行うために必要となるセンシングデータを取得する各種の車載センサが含まれ得る。例えば、車速センサ、シフトポジションセンサ、アクセル開度センサ、ブレーキペダルセンサ、ステアリングセンサなどの他、車外撮像用カメラ、ミリ波等のレーダー(Radar)、ライダー(LIDER)、超音波センサなどの周辺監視センサなどが含まれてもよい。 The sensor 41 may include various in-vehicle sensors that acquire sensing data necessary for the ECU 40 to control the operation of the actuator 42 . For example, in addition to vehicle speed sensors, shift position sensors, accelerator opening sensors, brake pedal sensors, steering sensors, etc., peripheral monitoring such as cameras for imaging outside the vehicle, radar such as millimeter waves, LIDER, and ultrasonic sensors Sensors and the like may also be included.

アクチュエータ42は、ECU40からの制御信号に基づいて、車両2の走行、操舵、又は制動などに関わる動作を実行する装置であり、例えば、エンジン、モータ、トランスミッション、油圧又は電動シリンダー等が含まれる。 The actuator 42 is a device that executes operations related to running, steering, braking, etc. of the vehicle 2 based on control signals from the ECU 40, and includes, for example, an engine, a motor, a transmission, a hydraulic or electric cylinder, and the like.

[機能構成例]
図3は、実施の形態に係るドライバモニタリング装置10の画像処理部12の機能構成例を示すブロック図である。
画像処理部12は、画像入力部21、顔検出部22、特定個人判定部25、第1顔画像処理部26、第2顔画像処理部30、出力部34、及び顔特徴量記憶部142を含んで構成されている。
[Example of functional configuration]
FIG. 3 is a block diagram showing a functional configuration example of the image processing section 12 of the driver monitoring device 10 according to the embodiment.
The image processing unit 12 includes an image input unit 21, a face detection unit 22, a specific individual determination unit 25, a first face image processing unit 26, a second face image processing unit 30, an output unit 34, and a face feature amount storage unit 142. is composed of

画像入力部21は、カメラ11で撮像されたドライバ3の顔を含む画像を取り込む処理を行う。 The image input unit 21 performs processing for capturing an image including the face of the driver 3 captured by the camera 11 .

顔検出部22は、特定個人の顔検出部23と、通常の顔検出部24とを含んで構成され、入力画像から顔を検出するための特徴量を抽出しながら顔領域を検出する処理を行う。
特定個人の顔検出部23は、顔特徴量記憶部142から読み込んだ特定個人の顔特徴量142aを用いて、入力画像から顔領域を検出する処理を行う。
通常の顔検出部24は、顔特徴量記憶部142から読み込んだ通常の顔特徴量142bを用いて、入力画像から顔領域を検出する処理を行う。
The face detection unit 22 includes a specific individual face detection unit 23 and a normal face detection unit 24, and performs processing for detecting a face area while extracting a feature amount for detecting a face from an input image. conduct.
The specific individual's face detection unit 23 uses the specific individual's face feature amount 142 a read from the face feature amount storage unit 142 to perform processing for detecting a face area from the input image.
The normal face detection unit 24 uses the normal face feature amount 142b read from the face feature amount storage unit 142 to perform processing for detecting a face area from the input image.

画像から顔領域を検出する手法は特に限定されないが、高速で高精度に顔領域を検出する手法が採用される。顔検出部22は、例えば、入力画像に対して所定の探索領域(探索窓)を走査させながら、それぞれの探索領域で顔を検出するための特徴量を抽出する。顔検出部22は、例えば、顔の局所的な領域の明暗差(輝度差)、エッジ強度、又はこれら局所的領域間の関連性などを特徴量として抽出してよい。そして、顔検出部22は、探索領域から抽出した特徴量と、顔特徴量記憶部142から読み込んだ通常の顔特徴量142b、又は特定個人の顔特徴量142aを用いて、階層的な構造(顔をおおまかにとらえる階層から顔の細部をとらえる階層構造)の検出器で顔か非顔かを判断し、画像中から顔領域を検出する処理を行う。 A method for detecting a face region from an image is not particularly limited, but a method for detecting a face region at high speed and with high accuracy is adopted. For example, the face detection unit 22 extracts a feature amount for detecting a face in each search area while scanning a predetermined search area (search window) with respect to the input image. The face detection unit 22 may extract, for example, the difference in brightness (luminance difference) of local regions of the face, the edge strength, or the relationship between these local regions as feature quantities. Then, the face detection unit 22 uses the feature amount extracted from the search area, the normal face feature amount 142b read from the face feature amount storage unit 142, or the specific individual face feature amount 142a, to create a hierarchical structure ( A hierarchical structure that captures the details of the face from the hierarchy that captures the face roughly) judges whether it is a face or a non-face, and performs processing to detect a face area from the image.

特定個人判定部25は、顔検出部22で検出された顔領域の特徴量と、顔特徴量記憶部142から読み込んだ特定個人の顔特徴量142aとを用いて、検出された顔領域の顔が特定個人の顔であるか否かを判定する処理を行う。 The specific individual determination unit 25 uses the feature amount of the face area detected by the face detection unit 22 and the face feature amount 142a of the specific individual read from the face feature amount storage unit 142 to determine the face in the detected face area. is the face of a specific individual.

特定個人判定部25は、顔領域から抽出された特徴量と特定個人の顔特徴量142aとの関係を示す指標、例えば、相関を示す指標として、相関係数を算出し、算出した相関係数に基づいて、顔領域の顔が特定個人の顔であるか否かを判定してもよい。例えば、顔領域内における1以上の局所的な領域のHaar-like特徴(輝度差)などの特徴量の相関を求めてもよい。そして、相関係数が所定の閾値より大きい場合、検出した顔領域の顔が特定個人の顔であると判定し、相関係数が所定の閾値以下の場合、検出した顔領域の顔が特定個人の顔ではないと判定してもよい。 The specific individual determining unit 25 calculates a correlation coefficient as an index indicating the relationship between the feature quantity extracted from the face region and the face feature quantity 142a of the specific individual, for example, as an index indicating correlation, and calculates the calculated correlation coefficient. , it may be determined whether the face in the face area is the face of a specific individual. For example, the correlation of feature amounts such as Haar-like features (luminance differences) of one or more local areas within the face area may be obtained. If the correlation coefficient is greater than a predetermined threshold, the face in the detected face region is determined to be the face of a specific individual. may be determined not to be the face of

また、特定個人判定部25は、特定個人の顔であるか否かを判定するために、特定個人の顔特徴量142aをパラメータに用いて機械学習を行った学習済みの学習器を備え、該学習済みの学習器に、顔領域から抽出された特徴量を入力し、前記学習済みの学習器の演算処理、例えば、特徴量の相関分析処理を行うことで、特定個人の顔であるか否かの判定情報を当該学習器から取得する構成としてもよい。前記学習済みの学習器は、非線形判別器を含んで構成してもよいし、線形判別器を含んで構成してもよい。例えば、前記学習済みの学習器は、サポートベクターマシンを含んで構成してもよいし、ニューラルネットワークを含んで構成してもよい。
また、特定個人判定部25では、カメラ11からの入力画像の1フレームに対する判定の結果に基づいて、検出した顔領域の顔が特定個人の顔であるか否かを判定してもよいし、カメラ11からの入力画像の複数フレームに対する判定の結果に基づいて、検出した顔領域の顔が特定個人の顔であるか否かを判定してもよい。
In addition, the specific individual determination unit 25 includes a learned learner that has performed machine learning using the specific individual's face feature amount 142a as a parameter in order to determine whether or not the face is that of a specific individual. A feature amount extracted from a face region is input to a learned learning device, and arithmetic processing of the learned learning device, for example, correlation analysis processing of the feature value is performed to determine whether or not the face is a specific individual face. The determination information may be acquired from the learning device. The learned learner may include a nonlinear discriminator or may include a linear discriminator. For example, the learned learner may include a support vector machine or a neural network.
Further, the specific individual determination unit 25 may determine whether or not the face in the detected face area is the face of a specific individual based on the determination result for one frame of the input image from the camera 11, It may be determined whether or not the face in the detected face area is the face of a specific individual, based on the determination results for a plurality of frames of the input image from the camera 11 .

第1顔画像処理部26は、特定個人判定部25により特定個人の顔であると判定された場合、特定個人用の顔画像処理を行う。第1顔画像処理部26は、特定個人の顔向き推定部27と、特定個人の目開閉検出部28と、特定個人の視線方向推定部29とを含んで構成されているが、さらに別の顔挙動を推定したり、検出したりする構成を含んでもよい。また、第1顔画像処理部26は、特定個人の顔特徴量142aを用いて、特定個人用の顔画像処理のいずれかの処理を行ってもよい。また、顔特徴量記憶部142に、特定個人用の顔画像処理を行うための機械学習を行った学習済みの特徴量を記憶しておき、該学習済みの特徴量を用いて、特定個人用の顔画像処理のいずれかの処理を行ってもよい。 The first face image processing unit 26 performs face image processing for a specific individual when the specific individual determining unit 25 determines that the face is that of a specific individual. The first face image processing unit 26 includes a specific individual's face orientation estimation unit 27, a specific individual's eye open/closed detection unit 28, and a specific individual's gaze direction estimation unit 29. A configuration for estimating or detecting facial behavior may also be included. Further, the first face image processing unit 26 may perform any one of face image processing for a specific individual using the face feature amount 142a of the specific individual. In addition, the facial feature amount storage unit 142 stores the learned feature amount that has undergone machine learning for performing face image processing for a specific individual, and uses the learned feature amount to perform facial image processing for the specific individual. Any one of the face image processing may be performed.

特定個人の顔向き推定部27は、特定個人の顔の向きを推定する処理を行う。特定個人の顔向き推定部27は、例えば、特定個人の顔検出部23で検出された顔領域から目、鼻、口、眉などの顔器官の位置や形状を検出し、検出した顔器官の位置や形状に基づいて、顔の向きを推定する処理を行う。 The specific individual's face direction estimating unit 27 performs processing for estimating the face direction of the specific individual. The specific individual's face direction estimation unit 27 detects, for example, the positions and shapes of facial features such as eyes, nose, mouth, and eyebrows from the face region detected by the specific individual's face detection unit 23, and detects the detected facial features. Based on the position and shape, the process of estimating the direction of the face is performed.

画像中の顔領域から顔器官を検出する手法は特に限定されないが、高速で高精度に顔器官を検出できる手法を採用することが好ましい。例えば、3次元顔形状モデルを作成し、これを2次元画像上の顔の領域にフィッティングさせ、顔の各器官の位置と形状を検出する手法が採用され得る。画像中の人の顔に3次元顔形状モデルをフィッティングさせる技術として、例えば、特開2007-249280号公報に記載された技術を適用することができるが、これに限定されるものではない。 A method for detecting facial features from a facial region in an image is not particularly limited, but it is preferable to employ a method that can detect facial features at high speed and with high accuracy. For example, a method of creating a three-dimensional face shape model, fitting it to a face region on a two-dimensional image, and detecting the position and shape of each organ of the face can be adopted. As a technique for fitting a 3D face shape model to a human face in an image, for example, the technique described in Japanese Patent Application Laid-Open No. 2007-249280 can be applied, but it is not limited to this.

また、特定個人の顔向き推定部27は、特定個人の顔の向きの推定データとして、例えば、上記3次元顔形状モデルのパラメータに含まれている、上下回転(X軸回り)のピッチ角、左右回転(Y軸回り)のヨー角、及び全体回転(Z軸回り)のロール角を出力してもよい。 Further, the specific individual's face orientation estimation unit 27 uses, as estimation data of the specific individual's face orientation, for example, the pitch angle of vertical rotation (around the X axis), which is included in the parameters of the three-dimensional face shape model, A yaw angle for left-right rotation (around the Y-axis) and a roll angle for overall rotation (around the Z-axis) may be output.

特定個人の目開閉検出部28は、特定個人の目の開閉状態を検出する処理を行う。特定個人の目開閉検出部28は、例えば、特定個人の顔向き推定部27で求めた顔器官の位置や形状、特に目の特徴点(瞼、瞳孔)の位置や形状に基づいて、目の開閉状態、例えば、目を開けているか、閉じているかを検出する。目の開閉状態は、例えば、さまざまな目の開閉状態における目の画像の特徴量(瞼の位置、瞳孔(黒目)の形状、又は、白目部分と黒目部分の領域サイズなど)を予め学習器を用いて学習し、これら学習済みの特徴量データとの類似度を評価することで検出してもよい。 The specific individual's eye open/close detection unit 28 performs processing for detecting the open/closed state of the eye of the specific individual. The specific individual's eye open/close detection unit 28, for example, based on the position and shape of the facial organs obtained by the specific individual's face direction estimation unit 27, particularly the position and shape of the eye feature points (eyelid, pupil), Detects the open/closed state, for example, whether the eyes are open or closed. The open/closed state of the eyes can be determined by, for example, using a learner in advance for the feature values of eye images (eyelid position, shape of pupil (black eye), size of white and black eye portions, etc.) in various eye open/closed states. It may also be detected by learning using and evaluating the degree of similarity with these learned feature amount data.

特定個人の視線方向推定部29は、特定個人の視線の方向を推定する処理を行う。特定個人の視線方向推定部29は、例えば、ドライバ3の顔の向き、及びドライバ3の顔器官の位置や形状、特に目の特徴点(目尻、目頭、瞳孔)の位置や形状に基づいて、視線の方向を推定する。視線の方向とは、ドライバ3が見ている方向のことであり、例えば、顔の向きと目の向きとの組み合わせによって求められる。 The specific individual's line-of-sight direction estimating unit 29 performs processing for estimating the direction of the specific individual's line of sight. The sight line direction estimating unit 29 of the specific individual, for example, based on the orientation of the face of the driver 3 and the position and shape of the facial organs of the driver 3, especially the position and shape of the characteristic points of the eyes (outer corners, inner corners, pupils), Estimate the direction of the line of sight. The line-of-sight direction is the direction in which the driver 3 is looking, and is determined by, for example, a combination of the direction of the face and the direction of the eyes.

また、視線の方向は、例えば、さまざまな顔の向きと目の向きとの組み合わせにおける目の画像の特徴量(目尻、目頭、瞳孔の相対位置、又は白目部分と黒目部分の相対位置、濃淡、テクスチャーなど)とを予め学習器を用いて学習し、これら学習した特徴量データとの類似度を評価することで検出してもよい。また、特定個人の視線方向推定部29は、前記3次元顔形状モデルのフィッティング結果などを用いて、顔の大きさや向きと目の位置などから眼球の大きさと中心位置とを推定するとともに、瞳孔の位置を検出し、眼球の中心と瞳孔の中心とを結ぶベクトルを視線方向として検出してもよい。 In addition, the direction of the line of sight is, for example, the feature amount of the image of the eyes (the relative positions of the outer corner, the inner corner, and the pupil, or the relative positions of the white and black portions of the eye, shading, light and shade, etc.) in various combinations of face orientation and eye orientation. texture, etc.) may be learned in advance using a learning device, and the degree of similarity with the learned feature amount data may be evaluated for detection. In addition, the sight line direction estimation unit 29 of the specific individual estimates the size and center position of the eyeball from the size and orientation of the face, the position of the eyes, etc. using the fitting result of the three-dimensional face shape model, etc. , and a vector connecting the center of the eyeball and the center of the pupil may be detected as the line-of-sight direction.

第2顔画像処理部30は、特定個人判定部25により特定個人の顔ではないと判定された場合、通常の顔画像処理を行う。第2顔画像処理部30は、通常の顔向き推定部31と、通常の目開閉検出部32と、通常の視線方向推定部33とを含んで構成されているが、さらに別の顔挙動を推定したり、検出したりする構成を含んでもよい。また、第2顔画像処理部30は、通常の顔特徴量142bを用いて、通常の顔画像処理のいずれかの処理を行ってもよい。また、顔特徴量記憶部142に、通常の顔画像処理を行うための機械学習を行った学習済みの特徴量を記憶しておき、該学習済みの特徴量を用いて、通常の顔画像処理のいずれかの処理を行ってもよい。なお、通常の顔向き推定部31と、通常の目開閉検出部32と、通常の視線方向推定部33とで行われる処理は、特定個人の顔向き推定部27と、特定個人の目開閉検出部28と、特定個人の視線方向推定部29と基本的に同様であるので、ここではその説明を省略する。 When the specific individual determination unit 25 determines that the face is not that of a specific individual, the second face image processing unit 30 performs normal face image processing. The second face image processing unit 30 includes a normal face orientation estimation unit 31, a normal eye open/close detection unit 32, and a normal gaze direction estimation unit 33. It may also include an estimating or detecting configuration. Further, the second face image processing section 30 may perform any of normal face image processing using the normal face feature amount 142b. In addition, a learned feature amount obtained by performing machine learning for performing normal face image processing is stored in the face feature amount storage unit 142, and normal face image processing is performed using the learned feature amount. Either processing may be performed. The processing performed by the normal face orientation estimation unit 31, the normal eye open/closed detection unit 32, and the normal gaze direction estimation unit 33 is performed by the specific individual's face orientation estimation unit 27 and the specific individual's eye open/closed detection. Since the unit 28 is basically the same as the specific individual's line-of-sight direction estimation unit 29, the description thereof will be omitted here.

出力部34は、画像処理部12による画像処理に基づく情報をECU40などに出力する処理を行う。画像処理に基づく情報は、例えば、ドライバ3の顔の向き、視線の方向、又は目の開閉状態などの顔の挙動に関する情報でもよいし、顔の挙動の検出結果に基づいて判定されたドライバ3の状態(例えば、前方注視、脇見、居眠り、後ろ向き、突っ伏しなどの状態)に関する情報でもよい。また、画像処理に基づく情報は、ドライバ3の状態判定に基づく、所定の制御信号(注意や警告処理を行うための制御信号、又は車両2の動作制御を行うための制御信号など)でもよい。 The output unit 34 performs processing for outputting information based on image processing by the image processing unit 12 to the ECU 40 or the like. The information based on the image processing may be, for example, information related to facial behavior such as the direction of the face of the driver 3, the direction of the line of sight, or the state of opening and closing the eyes, or the driver 3 determined based on the detection result of the facial behavior. (for example, states such as looking ahead, looking aside, dozing off, looking backward, lying down, etc.). Information based on image processing may be a predetermined control signal (a control signal for performing attention or warning processing, or a control signal for controlling the operation of the vehicle 2, etc.) based on the state determination of the driver 3.

[処理動作例]
図4は、実施の形態に係るドライバモニタリング装置10における画像処理部12のCPU13が行う処理動作の一例を示すフローチャートである。カメラ11では、例えば、毎秒数十フレームの画像が撮像され、各フレーム、又は一定間隔のフレーム毎に本処理が行われる。
[Processing operation example]
FIG. 4 is a flowchart showing an example of processing operations performed by the CPU 13 of the image processing unit 12 in the driver monitoring device 10 according to the embodiment. The camera 11 captures, for example, several tens of frames per second, and this process is performed for each frame or for each frame at regular intervals.

まず、ステップS1では、CPU13は、画像入力部21として動作し、カメラ11で撮像された画像(ドライバ3の顔を含む画像)を読み込む処理を行い、ステップS2に処理を進める。 First, in step S1, the CPU 13 operates as the image input unit 21, reads an image captured by the camera 11 (an image including the face of the driver 3), and proceeds to step S2.

ステップS2では、CPU13は、通常の顔検出部24として動作し、入力画像に対して通常の顔検出処理を行い、ステップS3に処理を進める。CPU13は、例えば、入力画像に対して所定の探索領域(探索窓)を走査させながら、それぞれの探索領域で顔を検出するための特徴量を抽出する。そして、CPU13は、探索領域から抽出した特徴量と、顔特徴量記憶部142から読み込んだ通常の顔特徴量142bとを用いて、顔か非顔かを判断し、画像中から顔領域を検出する処理を行う。 In step S2, the CPU 13 operates as a normal face detection unit 24, performs normal face detection processing on the input image, and proceeds to step S3. For example, the CPU 13 extracts a feature amount for detecting a face in each search area while scanning a predetermined search area (search window) with respect to the input image. Then, the CPU 13 uses the feature amount extracted from the search area and the normal face feature amount 142b read from the face feature amount storage unit 142 to determine whether it is a face or a non-face, and detects a face area from the image. process.

ステップS3では、CPU13は、特定個人の顔検出部23として動作し、入力画像に対して特定個人の顔検出処理を行い、ステップS4に処理を進める。CPU13は、例えば、入力画像に対して所定の探索領域(探索窓)を走査させながら、それぞれの探索領域で顔を検出するための特徴量を抽出する。そして、CPU13は、探索領域から抽出した特徴量と、顔特徴量記憶部142から読み込んだ特定個人の顔特徴量142aとを用いて、顔か非顔かを判断し、画像中から顔領域を検出する処理を行う。なお、ステップS2とS3の処理は、1つのステップ内で並列的に行ってもよいし、組み合わせて行ってもよい。 In step S3, the CPU 13 operates as the specific individual's face detection unit 23, performs specific individual's face detection processing on the input image, and proceeds to step S4. For example, the CPU 13 extracts a feature amount for detecting a face in each search area while scanning a predetermined search area (search window) with respect to the input image. Then, the CPU 13 uses the feature amount extracted from the search area and the face feature amount 142a of the specific individual read from the face feature amount storage unit 142 to determine whether it is a face or a non-face, and extracts the face area from the image. Perform detection processing. The processes of steps S2 and S3 may be performed in parallel within one step, or may be performed in combination.

ステップS4では、CPU13は、特定個人判定部25として動作し、ステップS2、3で検出された顔領域の特徴量と、顔特徴量記憶部142から読み込んだ特定個人の顔特徴量142aとを用いて、顔領域の顔が特定個人の顔であるか否かを判定する処理を行い、ステップS5に処理を進める。 In step S4, the CPU 13 operates as the specific individual determining unit 25, and uses the feature amount of the face area detected in steps S2 and S3 and the facial feature amount 142a of the specific individual read from the facial feature amount storage unit 142. Then, a process of determining whether or not the face in the face area is the face of a specific individual is performed, and the process proceeds to step S5.

ステップS5では、CPU13は、ステップS4での判定処理の結果が、特定個人の顔であるか否かを判断し、特定個人の顔であると判断すれば、ステップS6に処理を進める。 In step S5, the CPU 13 determines whether or not the result of the determination processing in step S4 is the face of a specific individual.

ステップS6では、CPU13は、特定個人の顔向き推定部27として動作し、例えば、ステップS3で検出した顔領域から目、鼻、口、眉などの顔器官の位置や形状を検出し、検出した顔器官の位置や形状に基づいて、顔の向きを推定し、ステップS7に処理を進める。 In step S6, the CPU 13 operates as the specific individual's face orientation estimating unit 27, for example, detects the position and shape of facial organs such as eyes, nose, mouth, and eyebrows from the face area detected in step S3. The orientation of the face is estimated based on the position and shape of the facial features, and the process proceeds to step S7.

ステップS7では、CPU13は、特定個人の目開閉検出部28として動作し、例えば、ステップS6で求めた顔器官の位置や形状、特に目の特徴点(瞼、瞳孔)の位置や形状に基づいて、目の開閉状態、例えば、目を開けているか、閉じているかを検出し、ステップS8に処理を進める。 In step S7, the CPU 13 operates as the eye open/close detection unit 28 of the specific individual, and, for example, based on the position and shape of the facial features obtained in step S6, particularly the position and shape of the characteristic points of the eyes (eyelids, pupils). , the open/closed state of the eyes, for example, whether the eyes are open or closed, is detected, and the process proceeds to step S8.

ステップS8では、CPU13は、特定個人の視線方向推定部29として動作し、例えば、ステップS6で求めた顔の向き、顔器官の位置や形状、特に目の特徴点(目尻、目頭、瞳孔)の位置や形状に基づいて、視線の方向を推定し、その後処理を終える。 In step S8, the CPU 13 operates as the gaze direction estimating unit 29 of the specific individual, for example, the direction of the face obtained in step S6, the position and shape of the facial organs, especially the characteristic points of the eyes (outer corners, inner corners, pupils). Based on the position and shape, the direction of the line of sight is estimated, and then the process ends.

一方ステップS5において、CPU13は、特定個人の顔ではない、換言すれば、通常の顔であると判断すれば、ステップS9に処理を進める。
ステップS9では、CPU13は、通常の顔向き推定部31として動作し、例えば、ステップS2で検出した顔領域から目、鼻、口、眉などの顔器官の位置や形状を検出し、検出した顔器官の位置や形状に基づいて、顔の向きを推定し、ステップS10に処理を進める。
On the other hand, if the CPU 13 determines in step S5 that the face is not that of a specific individual, in other words, that it is a normal face, the process proceeds to step S9.
In step S9, the CPU 13 operates as a normal face direction estimating unit 31, for example, detects the positions and shapes of facial organs such as eyes, nose, mouth, and eyebrows from the face area detected in step S2, and detects the detected face. The orientation of the face is estimated based on the position and shape of the organ, and the process proceeds to step S10.

ステップS10では、CPU13は、通常の目開閉検出部32として動作し、例えば、ステップS9で求めた顔器官の位置や形状、特に目の特徴点(瞼、瞳孔)の位置や形状に基づいて、目の開閉状態、例えば、目を開けているか、閉じているかを検出し、ステップS11に処理を進める。 In step S10, the CPU 13 operates as a normal eye open/close detection unit 32. For example, based on the position and shape of the facial features obtained in step S9, particularly the position and shape of the characteristic points of the eyes (eyelids, pupils), The open/closed state of the eyes, for example, whether the eyes are open or closed is detected, and the process proceeds to step S11.

ステップS11では、CPU13は、通常の視線方向推定部33として動作し、例えば、ステップS9で求めた顔の向き、顔器官の位置や形状、特に目の特徴点(目尻、目頭、瞳孔)の位置や形状に基づいて、視線の方向を推定し、その後処理を終える。 In step S11, the CPU 13 operates as a normal gaze direction estimator 33. For example, the direction of the face obtained in step S9, the positions and shapes of facial organs, especially the positions of characteristic points of the eyes (outer corners, inner corners, pupils) of the eyes. Based on the shape and shape, the direction of the line of sight is estimated, and then the process ends.

図5は、実施の形態に係るドライバモニタリング装置10における画像処理部12のCPU13が行う特定個人判定処理動作の一例を示すフローチャートである。本処理動作は、図4に示すステップS4における特定個人判定処理動作の一例であり、入力画像1枚(1フレーム)で判定する場合の処理動作例である。 FIG. 5 is a flowchart showing an example of specific individual determination processing operation performed by the CPU 13 of the image processing unit 12 in the driver monitoring device 10 according to the embodiment. This processing operation is an example of the specific individual determination processing operation in step S4 shown in FIG. 4, and is an example of the processing operation in the case of determination with one input image (one frame).

まず、ステップS21では、CPU13は、図4に示すステップS2、S3の顔検出処理で検出された顔領域から抽出された特徴量を読み込み、次のステップS22では、顔特徴量記憶部142から学習済みの特定個人の顔特徴量142aを読み込み、ステップS23に処理を進める。 First, in step S21, the CPU 13 reads the feature amount extracted from the face area detected by the face detection processing in steps S2 and S3 shown in FIG. The specific individual's face feature quantity 142a that has already been read is read, and the process proceeds to step S23.

ステップS23では、CPU13は、ステップS21で読み込んだ顔領域から抽出された特徴量と、ステップS22で読み込んだ特定個人の顔特徴量142aとの相関係数を算出する処理を行い、ステップS24に処理を進める。 In step S23, the CPU 13 performs a process of calculating a correlation coefficient between the feature amount extracted from the face area read in step S21 and the face feature amount 142a of the specific individual read in step S22, and proceeds to step S24. proceed.

ステップS24では、CPU13は、算出した相関係数が、特定個人か否かを判定するための所定の閾値より大きいか否かを判断し、相関係数が所定の閾値よりも大きい、換言すれば、顔領域から抽出された特徴量と、特定個人の顔特徴量142aとの相関性が高い(換言すれば、類似度が高い)と判断すれば、ステップS25に処理を進める。
ステップS25では、CPU13は、顔領域に検出された顔が特定個人の顔であると判定し、その後処理を終える。
In step S24, the CPU 13 determines whether the calculated correlation coefficient is greater than a predetermined threshold value for determining whether or not the individual is a specific individual. If it is determined that the feature quantity extracted from the face region and the face feature quantity 142a of the specific individual are highly correlated (in other words, the similarity is high), the process proceeds to step S25.
In step S25, the CPU 13 determines that the face detected in the face area is the face of a specific individual, and then terminates the process.

一方ステップS24において、相関係数が所定の閾値以下である、換言すれば、顔領域から抽出された特徴量と、特定個人の顔特徴量142aとの相関性が低い(換言すれば、類似度が低い)と判断すれば、ステップS26に処理を進める。
ステップS26では、CPU13は、特定個人の顔ではない、換言すれば、通常の顔であると判定し、その後処理を終える。
On the other hand, in step S24, the correlation coefficient is equal to or less than a predetermined threshold value, in other words, the correlation between the feature quantity extracted from the face region and the face feature quantity 142a of the specific individual is low (in other words, the similarity is low), the process proceeds to step S26.
In step S26, the CPU 13 determines that the face is not that of a specific individual, in other words, that it is a normal face, and then terminates the process.

図6は、実施の形態に係るドライバモニタリング装置10における画像処理部12のCPU13が行う特定個人判定処理動作の一例を示すフローチャートである。
本処理動作は、図4に示すステップS4における特定個人判定処理動作の別の一例であり、複数の入力画像(複数フレーム)で判定する場合の処理動作例である。
FIG. 6 is a flowchart showing an example of specific individual determination processing operation performed by the CPU 13 of the image processing unit 12 in the driver monitoring device 10 according to the embodiment.
This processing operation is another example of the specific individual determination processing operation in step S4 shown in FIG. 4, and is an example of the processing operation in the case of determination using a plurality of input images (a plurality of frames).

まず、ステップS31では、CPU13は、特定個人の顔が検出された画像のカウンタ(numSp)を0にセットし、ステップS32では、判定する入力画像のカウンタ(i)を0にセットしてステップS33に処理を進める。 First, in step S31, the CPU 13 sets the counter (numSp) of the image in which the face of the specific individual is detected to 0, sets the counter (i) of the input image to be judged to 0 in step S32, and sets the counter (i) of the input image to be determined to 0 in step S33. proceed to

ステップS33では、CPU13は、入力画像1枚(1フレーム)に対する特定個人の判定処理(例えば、図5に示したステップS21~S26の処理)を行い、ステップS34に処理を進める。 In step S33, the CPU 13 performs specific individual determination processing (for example, the processing of steps S21 to S26 shown in FIG. 5) for one input image (one frame), and proceeds to step S34.

ステップS34では、CPU13は、ステップS33の判定処理の結果が、特定個人の顔であったか否かを判断し、特定個人の顔であったと判断すれば、ステップS35に処理を進める。 In step S34, the CPU 13 determines whether or not the result of the determination processing in step S33 is the face of a specific individual.

ステップS35では、CPU13は、特定個人の顔画像のカウンタ(numSp)に1を加算して、ステップS36に処理を進め、ステップS36では、入力画像のカウンタ(i)に1を加算して、ステップS37に処理を進める。 In step S35, the CPU 13 adds 1 to the counter (numSp) of the face image of the specific individual, and advances the process to step S36. The process proceeds to S37.

一方ステップS34において、CPU13は、特定個人の顔ではなかったと判断すれば、ステップS36に処理を進め、ステップS36では、入力画像のカウンタ(i)に1を加算して、ステップS37に処理を進める。すなわち、この場合、特定個人の顔画像のカウンタ(numSp)に1は加算されない。 On the other hand, if the CPU 13 determines in step S34 that the face is not that of a specific individual, the process proceeds to step S36. In step S36, 1 is added to the counter (i) of the input image, and the process proceeds to step S37. . That is, in this case, 1 is not added to the face image counter (numSp) of the specific individual.

ステップS37では、CPU13は、入力画像のカウンタ(i)が、所定の画像枚数N未満か否かを判断し、カウンタ(i)が、N未満である(換言すれば、所定の画像枚数(N枚)の判定を終えていない)と判定すれば、ステップS33に戻り、次の入力画像での特定個人の判定処理を繰り返す。 In step S37, the CPU 13 determines whether or not the input image counter (i) is less than a predetermined number of images N. If the counter (i) is less than N (in other words, the predetermined number of images (N If it is determined that the determination of the image has not been completed, the process returns to step S33, and the process of determining the specific individual in the next input image is repeated.

一方ステップS37において、CPU13は、入力画像のカウンタ(i)が、N未満ではない(換言すれば、所定の画像枚数(N枚)の判定を終えた)と判定すれば、ステップS38に処理を進める。 On the other hand, in step S37, if the CPU 13 determines that the counter (i) of the input image is not less than N (in other words, the predetermined number of images (N) has been determined), the process proceeds to step S38. proceed.

ステップS38では、CPU13は、特定個人の顔画像のカウンタ(numSp)が、特定個人であると判定するための所定の閾値より大きいか否かを判断する。所定の閾値は、例えば、判定に使用する入力画像の数をN枚(Nフレーム)とした場合、N/2に設定してもよいし、N/2よりも大きい値に設定してもよい。 In step S38, the CPU 13 determines whether or not the face image counter (numSp) of the specific individual is greater than a predetermined threshold for determining that the individual is a specific individual. For example, when the number of input images used for determination is N (N frames), the predetermined threshold may be set to N/2, or may be set to a value larger than N/2. .

ステップS38において、CPU13は、特定個人の顔画像のカウンタ(numSp)が、所定の閾値より大きいと判断すれば、ステップS39に処理を進め、ステップS39では、特定個人の顔であると判定し、特定個人の判定処理を終え、その後、特定個人用の顔画像処理を行う。 In step S38, if the CPU 13 determines that the counter (numSp) of the face image of the specific individual is larger than the predetermined threshold value, the process proceeds to step S39. After finishing the determination processing for the specific individual, face image processing for the specific individual is performed.

一方ステップS38において、CPU13は、特定個人顔画像のカウンタ(numSp)が、所定の閾値以下であると判断すれば、ステップS40に処理を進め、ステップS40では、特定個人の顔ではない(換言すれば、通常の顔である)と判定し、特定個人の判定処理を終え、その後、通常の顔画像処理を行う。 On the other hand, if the CPU 13 determines in step S38 that the counter (numSp) of the specific individual's face image is equal to or less than the predetermined threshold value, the process proceeds to step S40. For example, it is a normal face), the specific individual determination process is completed, and then normal face image processing is performed.

上記した実施の形態に係るドライバモニタリング装置10によれば、顔特徴量記憶部142に学習済みの顔特徴量として、特定個人の顔特徴量142aと、通常の顔特徴量142bとが記憶され、特定個人判定部25により、顔検出部22で検出された顔領域の特徴量と、特定個人の顔特徴量142aとを用いて、顔領域の顔が特定個人の顔であるか否かが判定される。したがって、特定個人の顔特徴量142aを用いることにより、特定個人の顔であるか否かを精度良く判定することができるとともに、該判定処理にかかる負荷を低減することができる。 According to the driver monitoring device 10 according to the above-described embodiment, the facial feature amount storage unit 142 stores the facial feature amount 142a of the specific individual and the normal facial feature amount 142b as the learned facial feature amount, The specific individual determination unit 25 determines whether or not the face in the face region is the face of the specific individual by using the feature amount of the face region detected by the face detection unit 22 and the face feature amount 142a of the specific individual. be done. Therefore, by using the face feature amount 142a of a specific individual, it is possible to accurately determine whether or not it is the face of a specific individual, and reduce the load on the determination process.

また、特定個人判定部25により特定個人の顔であると判定された場合、第1顔画像処理部26により特定個人の顔画像処理を精度良く実施することができる。一方、特定個人判定部25により特定個人の顔ではない、換言すれば、通常の顔(特定個人以外の人の顔)であると判定された場合、第2顔画像処理部30により通常の顔画像処理を精度良く実施することができる。したがって、ドライバ3が、特定個人であっても、特定個人以外の通常の人であっても、それぞれの顔のセンシングを精度良く実施することができる。 Further, when the specific individual determination unit 25 determines that the face is that of a specific individual, the first face image processing unit 26 can perform the specific individual's face image processing with high accuracy. On the other hand, when the specific individual determining unit 25 determines that the face is not that of a specific individual, in other words, that it is a normal face (face of a person other than the specific individual), the second face image processing unit 30 determines that the face is a normal face. Image processing can be performed with high accuracy. Therefore, regardless of whether the driver 3 is a specific individual or a normal person other than the specific individual, it is possible to accurately sense each face.

また、特定個人判定部25が、顔領域から抽出された特徴量と特定個人の顔特徴量142aとの相関を示す指標として、相関係数を算出し、算出した前記相関係数に基づいて、前記顔領域の顔が前記特定個人の顔であるか否かを判定する。これにより、前記相関係数に基づいて前記顔領域の顔が前記特定個人の顔であるか否かを効率良く判定することができ、また、前記相関係数と所定の閾値とを比較する処理により、前記判定の処理効率を更に高めることができる。 Further, the specific individual determination unit 25 calculates a correlation coefficient as an index indicating the correlation between the feature amount extracted from the face region and the specific individual's facial feature amount 142a, and based on the calculated correlation coefficient, It is determined whether or not the face in the face area is the face of the specific individual. Thereby, it is possible to efficiently determine whether or not the face in the face region is the face of the specific individual based on the correlation coefficient. Thus, the processing efficiency of the determination can be further improved.

また、車載システム1が、ドライバモニタリング装置10と、ドライバモニタリング装置10から出力されるモニタリングの結果に基づいて、所定の処理を実行する1以上のECU40とを備えている。したがって、前記モニタリングの結果に基づいて、ECU40に所定の制御を適切に実行させることが可能となる。これにより、特定個人であっても安心して運転することができる安全性の高い車載システムを構築することが可能となる。 The in-vehicle system 1 also includes a driver monitoring device 10 and one or more ECUs 40 that execute predetermined processing based on the monitoring results output from the driver monitoring device 10 . Therefore, it is possible to cause the ECU 40 to appropriately perform predetermined control based on the monitoring result. As a result, it is possible to construct a highly safe vehicle-mounted system that allows even specific individuals to drive with peace of mind.

以上、本発明の実施の形態を詳細に説明したが、前述までの説明はあらゆる点において本発明の例示に過ぎない。本発明の範囲を逸脱することなく、種々の改良や変更を行うことができることは言うまでもない。
上記実施の形態では、本発明に係る画像処理装置をドライバモニタリング装置10に適用した場合について説明したが、適用例はこれに限定されない。例えば、工場内の機械や装置などの各種設備を操作したり、監視したり、所定の作業をしたりする人などをモニタリングする装置やシステムなどにおいて、モニタリング対象者に上記した特定個人が含まれる場合に、本発明に係る画像処理装置を適用可能である。
Although the embodiments of the present invention have been described in detail above, the above description is merely an example of the present invention in every respect. It goes without saying that various modifications and changes can be made without departing from the scope of the invention.
In the above embodiment, the case where the image processing device according to the present invention is applied to the driver monitoring device 10 has been described, but application examples are not limited to this. For example, in a device or system that monitors people who operate or monitor various facilities such as machines and devices in a factory, or perform predetermined work, the above-mentioned specific individuals are included in the monitoring targets. In this case, the image processing apparatus according to the present invention can be applied.

[付記]
本発明の実施の形態は、以下の付記の様にも記載され得るが、これらに限定されない。
(付記1)
撮像部(11)から入力される画像を処理する画像処理装置(12)であって、
前記画像から顔を検出するための学習を行った学習済みの顔特徴量として、特定個人の顔特徴量(142a)と、通常の顔特徴量(142b)とが記憶される顔特徴量記憶部(142)と、
前記画像から顔を検出するための特徴量を抽出しながら顔領域を検出する顔検出部(22)と、
検出された前記顔領域の前記特徴量と、前記特定個人の顔特徴量(142a)とを用いて、前記顔領域の顔が前記特定個人の顔であるか否かを判定する特定個人判定部(25)と、
該特定個人判定部(25)により前記特定個人の顔であると判定された場合、特定個人用の顔画像処理を行う第1顔画像処理部(26)と、
前記特定個人判定部(25)により前記特定個人の顔ではないと判定された場合、通常の顔画像処理を行う第2顔画像処理部(30)とを備えていることを特徴とする画像処理装置。
[Appendix]
Embodiments of the present invention can also be described in the following appendices, but are not limited thereto.
(Appendix 1)
An image processing device (12) for processing an image input from an imaging unit (11),
A facial feature amount storage unit that stores a specific individual's facial feature amount (142a) and a normal facial feature amount (142b) as learned facial feature amounts that have been trained to detect a face from the image. (142) and
a face detection unit (22) for detecting a face region while extracting a feature amount for detecting a face from the image;
A specific individual determination unit that determines whether or not the face in the face area is the face of the specific individual by using the feature amount of the detected face area and the face feature amount of the specific individual (142a). (25) and
a first face image processing unit (26) that performs face image processing for a specific individual when the specific individual determining unit (25) determines that the face is that of the specific individual;
and a second face image processing unit (30) for performing normal face image processing when the specific individual determining unit (25) determines that the face is not that of the specific individual. Device.

(付記2)
撮像部(11)と、記憶部(14)と、
少なくとも1以上のプロセッサ(13)とを備えた装置を用い、
前記撮像部(11)から入力される画像を処理する画像処理方法であって、
前記記憶部(14)が、
前記画像から顔を検出するための学習を行った学習済みの顔特徴量として、特定個人の顔特徴量(142a)と、通常の顔特徴量(142b)とが記憶される顔特徴量記憶部(142)を備え、
前記プロセッサ(13)が、
前記画像から顔の特徴量を抽出しながら顔領域を検出する顔検出ステップ(S2、S3)と、
該顔検出ステップ(S2、S3)により検出された前記顔領域の前記特徴量と、前記顔特徴量記憶部(142)から読み込んだ前記特定個人の顔特徴量(142a)とを用いて、前記顔領域の顔が前記特定個人の顔であるか否かを判定する特定個人判定ステップ(S4)と、
該特定個人判定ステップ(S4)により前記特定個人の顔であると判定された場合、特定個人用の顔画像処理を行う第1顔画像処理ステップ(S6、S7、S8)と、
前記特定個人判定ステップ(S4)により前記特定個人の顔ではないと判定された場合、通常の顔画像処理を行う第2顔画像処理ステップ(S9、S10、S11)とを含むことを特徴とする画像処理方法。
(Appendix 2)
an imaging unit (11), a storage unit (14),
using a device comprising at least one or more processors (13),
An image processing method for processing an image input from the imaging unit (11),
The storage unit (14) is
A facial feature amount storage unit that stores a specific individual's facial feature amount (142a) and a normal facial feature amount (142b) as learned facial feature amounts that have been trained to detect a face from the image. (142),
the processor (13)
a face detection step (S2, S3) of detecting a face region while extracting a face feature amount from the image;
Using the feature amount of the face area detected by the face detection step (S2, S3) and the face feature amount (142a) of the specific individual read from the face feature amount storage unit (142), the a specific individual determination step (S4) for determining whether or not the face in the face area is the face of the specific individual;
a first face image processing step (S6, S7, S8) for performing face image processing for a specific individual when the specific individual determining step (S4) determines that the face is that of the specific individual;
and a second face image processing step (S9, S10, S11) of performing normal face image processing when it is determined by the specific individual determination step (S4) that the face is not that of the specific individual. Image processing method.

1 車載システム
2 車両
3 ドライバ
10 ドライバモニタリング装置
11 カメラ
12 画像処理部
13 CPU
14 ROM
141 プログラム記憶部
142 顔特徴量記憶部
142a 特定個人の顔特徴量
142b 通常の顔特徴量
15 RAM
151 画像メモリ
16 通信部
21 画像入力部
22 顔検出部
23 特定個人の顔検出部
24 通常の顔検出部
25 特定個人判定部
26 第1顔画像処理部
27 特定個人の顔向き推定部
28 特定個人の目開閉検出部
29 特定個人の視線方向推定部
30 第2顔画像処理部
31 通常の顔向き推定部
32 通常の目開閉検出部
33 通常の視線方向推定部
34 出力部
40 ECU
41 センサ
42 アクチュエータ
43 通信バス
1 in-vehicle system 2 vehicle 3 driver 10 driver monitoring device 11 camera 12 image processing unit 13 CPU
14 ROMs
141 program storage unit 142 facial feature amount storage unit 142a specific individual facial feature amount 142b normal facial feature amount 15 RAM
151 image memory 16 communication unit 21 image input unit 22 face detection unit 23 specific individual face detection unit 24 normal face detection unit 25 specific individual determination unit 26 first face image processing unit 27 specific individual face direction estimation unit 28 specific individual Eye open/close detection unit 29 Specific individual gaze direction estimation unit 30 Second face image processing unit 31 Normal face direction estimation unit 32 Normal eye open/close detection unit 33 Normal gaze direction estimation unit 34 Output unit 40 ECU
41 sensor 42 actuator 43 communication bus

Claims (11)

撮像部から入力される画像を処理する画像処理装置であって、
前記画像から顔を検出するための学習を行った学習済みの顔特徴量として、一般的な人の顔特徴とは異なる顔特徴を有する特定個人の顔特徴量と、前記特定個人以外の一般的な人である場合に用いる通常の顔特徴量とが記憶される顔特徴量記憶部と、
前記画像から顔を検出するための特徴量を抽出しながら顔領域を検出する顔検出部と、
検出された前記顔領域の前記特徴量と、前記特定個人の顔特徴量とを用いて、前記顔領域の顔が前記特定個人の顔であるか否かを判定する特定個人判定部と、
該特定個人判定部により前記特定個人の顔であると判定された場合、特定個人用の顔画像処理を行う第1顔画像処理部と、
前記特定個人判定部により前記特定個人の顔ではないと判定された場合、前記特定個人以外の一般的な人である場合に用いる通常の顔画像処理を行う第2顔画像処理部とを備え
前記特定個人には、顔器官の一部が欠損若しくは変形している人、又は前記顔器官の配置が平均的な位置からずれている人が含まれることを特徴とする画像処理装置。
An image processing device that processes an image input from an imaging unit,
As the learned face feature quantity that has been trained to detect a face from the image, the face feature quantity of a specific individual having face features different from the face features of a general person , and the face feature quantity of a specific individual other than the specific individual a facial feature amount storage unit that stores normal facial feature amounts used when the person is a person ;
a face detection unit that detects a face area while extracting a feature amount for detecting a face from the image;
a specific individual determination unit that determines whether or not the face in the face region is the face of the specific individual using the detected feature quantity of the face region and the face feature quantity of the specific individual;
a first face image processing unit that performs face image processing for a specific individual when the specific individual determining unit determines that the face is the face of the specific individual;
A second face image processing unit that performs normal face image processing used when it is a general person other than the specific individual when it is determined by the specific individual determination unit that the face is not the specific individual ,
The image processing apparatus, wherein the specific individual includes a person whose facial features are partially missing or deformed, or a person whose facial features are displaced from an average position.
前記特定個人判定部が、
前記顔領域から抽出された前記特徴量と前記特定個人の顔特徴量との相関を示す指標を算出し、
算出した前記指標に基づいて、前記顔領域の顔が前記特定個人の顔であるか否かを判定するものであることを特徴とする請求項1記載の画像処理装置。
The specific individual determination unit
calculating an index indicating a correlation between the feature quantity extracted from the face region and the face feature quantity of the specific individual;
2. The image processing apparatus according to claim 1, wherein whether or not the face in the face area is the face of the specific individual is determined based on the calculated index.
前記特定個人判定部が、
前記指標が所定の閾値より大きい場合、前記顔領域の顔が前記特定個人の顔であると判定し、
前記指標が前記所定の閾値以下の場合、前記顔領域の顔が前記特定個人の顔ではないと判定するものであることを特徴とする請求項2記載の画像処理装置。
The specific individual determination unit
determining that the face in the face region is the face of the specific individual when the index is greater than a predetermined threshold;
3. The image processing apparatus according to claim 2, wherein when said index is equal to or less than said predetermined threshold value, it is determined that the face in said face area is not the face of said specific individual.
前記特定個人判定部が、
前記画像の1フレームに対する判定の結果に基づいて、前記顔領域の顔が前記特定個人の顔であるか否かを判定するものであることを特徴とする請求項1~3のいずれかの項に記載の画像処理装置。
The specific individual determination unit
4. The method according to any one of claims 1 to 3, wherein it is determined whether or not the face in the face area is the face of the specific individual based on the determination result for one frame of the image. The image processing device according to .
前記特定個人判定部が、
前記画像の複数フレームに対する判定の結果に基づいて、前記顔領域の顔が前記特定個人の顔であるか否かを判定するものであることを特徴とする請求項1~3のいずれかの項に記載の画像処理装置。
The specific individual determination unit
4. The method according to any one of claims 1 to 3, wherein it is determined whether or not the face in the face area is the face of the specific individual based on determination results for a plurality of frames of the image. The image processing device according to .
前記顔画像処理には、顔検出処理、顔向き推定処理、視線方向推定処理、及び目開閉検出処理のうちの少なくともいずれかが含まれていることを特徴とする請求項1~5のいずれかの項に記載の画像処理装置。 6. The face image processing includes at least one of face detection processing, face direction estimation processing, line-of-sight direction estimation processing, and eye open/close detection processing. The image processing device according to the item. 請求項1~6のいずれかの項に記載の画像処理装置と、
該画像処理装置に入力する画像を撮像する撮像部と、
前記画像処理装置による画像処理に基づく情報を出力する出力部とを備えていることを特徴とするモニタリング装置。
The image processing device according to any one of claims 1 to 6,
an imaging unit that captures an image to be input to the image processing device;
and an output unit for outputting information based on image processing by the image processing device.
請求項7記載のモニタリング装置と、
該モニタリング装置と通信可能に接続され、該モニタリング装置から出力される前記情報に基づいて、所定の処理を実行する1以上の制御装置とを備えていることを特徴とする制御システム。
a monitoring device according to claim 7;
A control system comprising one or more control devices communicably connected to the monitoring device and executing predetermined processing based on the information output from the monitoring device.
前記モニタリング装置が、車両のドライバをモニタリングするための装置であり、
前記制御装置が、前記車両に搭載される電子制御ユニットを含むことを特徴とする請求項8記載の制御システム。
the monitoring device is a device for monitoring a driver of a vehicle;
9. The control system of claim 8, wherein said controller includes an electronic control unit mounted on said vehicle.
撮像部から入力される画像を処理する画像処理方法であって、
前記画像から顔の特徴量を抽出しながら顔領域を検出する顔検出ステップと、
該顔検出ステップにより検出された前記顔領域の前記特徴量と、一般的な人の顔特徴とは異なる顔特徴を有する特定個人の顔を検出するための学習を行った学習済みの前記特定個人の顔特徴量とを用いて、前記顔領域の顔が前記特定個人の顔であるか否かを判定する特定個人判定ステップと、
該特定個人判定ステップにより前記特定個人の顔であると判定された場合、特定個人用の顔画像処理を行う第1顔画像処理ステップと、
前記特定個人判定ステップにより前記特定個人の顔ではないと判定された場合、前記特定個人以外の一般的な人である場合に用いる通常の顔画像処理を行う第2顔画像処理ステップとを含み、
前記特定個人には、顔器官の一部が欠損若しくは変形している人、又は前記顔器官の配置が平均的な位置からずれている人が含まれることを特徴とする画像処理方法。
An image processing method for processing an image input from an imaging unit,
a face detection step of detecting a face region while extracting face feature amounts from the image;
The learned specific individual who has undergone learning to detect the face of a specific individual having facial features different from the facial features of a general person, and the feature amount of the facial region detected by the face detection step. a specific individual determination step of determining whether or not the face in the face region is the face of the specific individual using the facial feature amount of
a first face image processing step of performing face image processing for a specific individual when the face is determined to be that of the specific individual by the specific individual determination step;
and a second face image processing step of performing normal face image processing used in the case of a general person other than the specific individual when it is determined by the specific individual determination step that the face is not that of the specific individual. ,
An image processing method, wherein the specific individual includes a person whose facial organs are partially missing or deformed, or a person whose facial organs are displaced from an average position.
撮像部から入力される画像の処理を少なくとも1以上のコンピュータに実行させるためのプログラムであって、
前記少なくとも1以上のコンピュータに、
前記画像から顔の特徴量を抽出しながら顔領域を検出する顔検出ステップと、
該顔検出ステップにより検出された前記顔領域の前記特徴量と、一般的な人の顔特徴とは異なる顔特徴を有する特定個人の顔を検出するための学習を行った学習済みの前記特定個人の顔特徴量とを用いて、前記顔領域の顔が前記特定個人の顔であるか否かを判定する特定個人判定ステップと、
該特定個人判定ステップにより前記特定個人の顔であると判定された場合、特定個人用の顔画像処理を行う第1顔画像処理ステップと、
前記特定個人判定ステップにより前記特定個人の顔ではないと判定された場合、前記特定個人以外の一般的な人である場合に用いる通常の顔画像処理を行う第2顔画像処理ステップとを実行させ、
前記特定個人には、顔器官の一部が欠損若しくは変形している人、又は前記顔器官の配置が平均的な位置からずれている人が含まれることを特徴とするプログラム。
A program for causing at least one or more computers to process an image input from an imaging unit,
to said at least one computer;
a face detection step of detecting a face region while extracting face feature amounts from the image;
The learned specific individual who has undergone learning to detect the face of a specific individual having facial features different from the facial features of a general person, and the feature amount of the facial region detected by the face detection step. a specific individual determination step of determining whether or not the face in the face region is the face of the specific individual using the facial feature amount of
a first face image processing step of performing face image processing for a specific individual when the face is determined to be that of the specific individual by the specific individual determination step;
and a second face image processing step of performing normal face image processing used in the case of a general person other than the specific individual when it is determined by the specific individual determining step that the face is not that of the specific individual. ,
A program, wherein the specific individual includes a person whose facial organs are partially missing or deformed, or a person whose facial organs are displaced from an average position.
JP2019116544A 2019-06-24 2019-06-24 Image processing device, monitoring device, control system, image processing method, and program Active JP7318352B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019116544A JP7318352B2 (en) 2019-06-24 2019-06-24 Image processing device, monitoring device, control system, image processing method, and program
PCT/JP2020/019848 WO2020261820A1 (en) 2019-06-24 2020-05-20 Image processing device, monitoring device, control system, image processing method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019116544A JP7318352B2 (en) 2019-06-24 2019-06-24 Image processing device, monitoring device, control system, image processing method, and program

Publications (2)

Publication Number Publication Date
JP2021002281A JP2021002281A (en) 2021-01-07
JP7318352B2 true JP7318352B2 (en) 2023-08-01

Family

ID=73995278

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019116544A Active JP7318352B2 (en) 2019-06-24 2019-06-24 Image processing device, monitoring device, control system, image processing method, and program

Country Status (2)

Country Link
JP (1) JP7318352B2 (en)
WO (1) WO2020261820A1 (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010198313A (en) 2009-02-25 2010-09-09 Denso Corp Device for specifying degree of eye opening

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010198313A (en) 2009-02-25 2010-09-09 Denso Corp Device for specifying degree of eye opening

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
岩井 儀雄 Yoshio Iwai,画像処理による顔検出と顔認識 A Survey on Face Detection and Face Recognition,情報処理学会研究報告 Vol.2005 No.38 IPSJ SIG Technical Reports,日本,社団法人情報処理学会 Information Processing Society of Japan,2005年05月13日,第2005巻,p.343-p.368

Also Published As

Publication number Publication date
WO2020261820A1 (en) 2020-12-30
JP2021002281A (en) 2021-01-07

Similar Documents

Publication Publication Date Title
Bila et al. Vehicles of the future: A survey of research on safety issues
Mbouna et al. Visual analysis of eye state and head pose for driver alertness monitoring
Trivedi et al. Looking-in and looking-out of a vehicle: Computer-vision-based enhanced vehicle safety
CN105769120B (en) Fatigue driving detection method and device
CN103839379B (en) Automobile and driver fatigue early warning detecting method and system for automobile
CN110678873A (en) Attention detection method based on cascade neural network, computer device and computer readable storage medium
CN111434553B (en) Brake system, method and device, and fatigue driving model training method and device
CN109740477A (en) Study in Driver Fatigue State Surveillance System and its fatigue detection method
CN114821695A (en) Material spectrometry
Amanatiadis et al. ViPED: On-road vehicle passenger detection for autonomous vehicles
Song The application of computer vision in responding to the emergencies of autonomous driving
CN114821697A (en) Material spectrum
Rani et al. Development of an Automated Tool for Driver Drowsiness Detection
CN114821696A (en) Material spectrometry
Panicker et al. Open-eye detection using iris–sclera pattern analysis for driver drowsiness detection
CN116012822B (en) Fatigue driving identification method and device and electronic equipment
US12323420B2 (en) Biometric service evaluation architecture for a vehicle
WO2021024905A1 (en) Image processing device, monitoring device, control system, image processing method, computer program, and recording medium
Llorca et al. Stereo-based pedestrian detection in crosswalks for pedestrian behavioural modelling assessment
JP2021009503A (en) Personal data acquisition system, personal data acquisition method, face sensing parameter adjustment method for image processing equipment, and computer program
JP7318352B2 (en) Image processing device, monitoring device, control system, image processing method, and program
CN114821694A (en) Material spectrometry
TW202326624A (en) Embedded deep learning multi-scale object detection model using real-time distant region locating device and method thereof
Öztürk et al. Drowsiness detection system based on machine learning using eye state
CN119116989A (en) A human-computer interaction enhancement method and system based on intelligent driving

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220407

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230117

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230315

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230620

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230703

R150 Certificate of patent or registration of utility model

Ref document number: 7318352

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150