JP7006782B2 - 情報処理装置、制御方法、及びプログラム - Google Patents
情報処理装置、制御方法、及びプログラム Download PDFInfo
- Publication number
- JP7006782B2 JP7006782B2 JP2020522543A JP2020522543A JP7006782B2 JP 7006782 B2 JP7006782 B2 JP 7006782B2 JP 2020522543 A JP2020522543 A JP 2020522543A JP 2020522543 A JP2020522543 A JP 2020522543A JP 7006782 B2 JP7006782 B2 JP 7006782B2
- Authority
- JP
- Japan
- Prior art keywords
- distribution
- partial
- target object
- image data
- size
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Probability & Statistics with Applications (AREA)
- Human Computer Interaction (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
- Length Measuring Devices By Optical Means (AREA)
Description
<概要>
図1は、本実施形態の情報処理装置2000が行う処理を概念的に示す図である。情報処理装置2000は、画像データ10を取得し、画像データ10から対象物体を検出する。対象物体の検出とは、画像データ10の中から、対象物体が含まれる画像領域(例えば外接矩形)の位置と大きさを特定することを意味する。ここで、任意の物体が対象物体として扱われるようにしてもよいし、特定の種類の物体のみ(例えば人のみ)が対象物体として扱われるようにしてもよい。
本実施形態の情報処理装置2000によれば、前述したように、部分領域ごとに算出した確度データを積算することで PHD を算出し、そこから1つの対象物体を表す部分分布を抽出するという方法で、対象物体が検出される。この方法によれば、対象物体同士の重なりが大きい場合であっても、これらを高い精度で区別し、それぞれ別の対象物体として検出することができる。以下、その理由を、図2を参照して説明する。
図3は、実施形態1の情報処理装置2000の機能構成を例示する図である。情報処理装置2000は、生成部2020、抽出部2040、及び出力部2060を有する。生成部2020は、画像データ10を取得し、その画像データ10に含まれる複数の部分領域12それぞれについて確度データを生成する。抽出部2040は、各部分領域12について生成された確度データの総和を算出することで PHD を算出する。抽出部2040は、算出した PHDから、それぞれが1つの対象物体に対応する1つ以上の部分分布を抽出する。出力部2060は、抽出した部分分布ごとに、その部分分布の統計値に基づいて、その部分分布が表す対象物体の位置及び大きさを出力する。
情報処理装置2000の各機能構成部は、各機能構成部を実現するハードウエア(例:ハードワイヤードされた電子回路など)で実現されてもよいし、ハードウエアとソフトウエアとの組み合わせ(例:電子回路とそれを制御するプログラムの組み合わせなど)で実現されてもよい。以下、情報処理装置2000の各機能構成部がハードウエアとソフトウエアとの組み合わせで実現される場合について、さらに説明する。
図5は、実施形態1の情報処理装置2000によって実行される処理の流れを例示するフローチャートである。生成部2020は、画像データ10を取得する(S102)。生成部2020は、画像データ10に含まれる複数の部分領域12ごとに確度データを生成する(S104)。抽出部2040は、各確度データが表す確度を積算して PHD を算出する(S106)。抽出部2040は、PHD から1つ以上の部分分布を抽出する(S108)。出力部2060は、各部分分布ごとに、部分分布に対応する対象物体の位置及び大きさを出力する(S110)。
生成部2020は画像データ10を取得する(S102)。画像データ10としては、任意の画像データを利用できる。例えば画像データ10は、カメラによって生成された撮像画像である。このカメラは、スチルカメラであってもよいしビデオカメラであってもよい。なお、「カメラによって生成された撮像画像」は、カメラによって生成された撮像画像そのものであってもよいし、カメラによって生成された撮像画像に何らかの加工が加えられたものであってもよい。
部分領域12は、画像データ10に含まれる部分的な画像領域である。部分領域12は、その位置及び大きさの少なくとも一方について、他の部分領域12と互いに異なる。
生成部2020は、画像データ10に含まれる複数の部分領域12ごとに確度データを表すパラメータを生成し、確度データを生成する(S104)。例えば確度データを表すパラメータは、ニューラルネットワークを利用して生成される。図7は、確度データを表すパラメータ生成に用いるニューラルネットワークを例示する図である。ニューラルネットワーク20は、画像データ10が入力されたことに応じ、画像データ10に含まれる各部分領域12について、その位置及び大きさの画像領域に対象物体が存在する確からしさ Li を出力する。Li は、i番目の部分領域12について出力される確からしさである。
抽出部2040は、PHD から1つ以上の部分分布を抽出する。部分分布は、その内部に1つの対象物体を含む部分領域について、その部分領域の位置及び大きさに対する対象物体の存在確率を表す確率分布である。部分分布は確率分布であり、その積分値は1である。
出力部2060は、抽出した部分分布ごとに、その部分分布が表す対象物体の位置及び大きさを出力する(S110)。具体的には、出力部2060は、部分分布の統計値によって、対象物体の位置及び大きさを特定する。例えば出力部2060は、部分分布の平均を、対象物体の位置及び大きさとする。その他にも例えば、出力部2060は、部分分布の最大値に対応する位置及び大きさを、対象物体の位置及び大きさとしてもよい。そして、出力部2060は、特定した位置及び大きさを部分分布ごとに出力する。
前述したように、ニューラルネットワーク20は事前に学習させておく必要がある。ここで、ニューラルネットワーク20の学習は、情報処理装置2000によって行われてもよいし、情報処理装置2000以外の装置によって行われてもよい。ここでは、情報処理装置2000がニューラルネットワーク20の学習を行うと仮定して説明を行う。図12は、ニューラルネットワーク20の学習を行う機能を有する情報処理装置2000を例示するブロック図である。情報処理装置2000の学習は、学習部2080によって実行される。
実施形態2の情報処理装置2000は、複数種類の対象物体を区別して扱う。そのために、実施形態2の生成部2020は、それぞれ異なる種類の対象物体ごとに、確度データを生成する。そのため、1つの部分領域12について、対象物体の種類ごとに確度データが生成される。
実施形態2の情報処理装置2000を実現する計算機のハードウエア構成は、実施形態1と同様に、例えば図4によって表される。ただし、本実施形態の情報処理装置2000を実現する計算機1000のストレージデバイス1080には、本実施形態の情報処理装置2000の機能を実現するプログラムモジュールがさらに記憶される。
本実施形態の情報処理装置2000によれば、対象物体をその種類ごとに検出することができる。よって、互いに異なる種類の対象物体の位置を、その種類も含めて把握することができるようになる。
Claims (8)
- 画像データを取得し、その画像データに含まれる複数の部分領域それぞれについて、位置と大きさに対する対象物体の存在の確からしさを表す確度データを生成する生成部と、
各前記部分領域について生成された確度データの総和を算出することで、位置と大きさに対する前記対象物体の存在の確からしさの分布を算出し、前記算出した分布から、それぞれが1つの前記対象物体に対応する1つ以上の部分分布を抽出する抽出部と、
前記抽出した部分分布ごとに、その部分分布の統計値に基づいて、その部分分布に対応する対象物体の位置及び大きさを出力する出力部と、を有する情報処理装置。 - 前記生成部は、画像データに含まれる複数の部分領域それぞれについて前記確度データを出力するニューラルネットワークを含み、そのニューラルネットワークに前記取得した画像データを入力することで、その画像データに含まれる複数の部分領域それぞれについて前記確度データを生成する、請求項1に記載の情報処理装置。
- 前記確度データは、部分領域の位置及び大きさに対してその位置及び大きさの部分領域に物体が存在する確からしさを示す分布を、所定のモデルに従った分布で表し、
前記ニューラルネットワークは、前記部分領域ごとに、その部分領域に対象物体が存在する確からしさと前記所定のモデルのパラメータ値を出力する、請求項2に記載の情報処理装置。 - 前記抽出部は、
前記確度データの総和で表される分布の積分値に基づいて、前記画像データに含まれる物体の個数を算出し、
前記確度データの総和で表される分布から、前記個数の前記部分分布を抽出する、請求項1乃至3いずれか一項に記載の情報処理装置。 - 前記抽出部は、前記確度データの総和で表される分布から、それぞれ積分値が1である前記部分分布を抽出する、請求項1乃至4いずれか一項に記載の情報処理装置。
- 前記生成部は、それぞれ異なる種類の前記対象物体ごとに前記確度データを生成し、
前記抽出部は、それぞれ異なる種類の前記対象物体ごとに、前記対象物体の存在の確からしさの分布の算出、及びその分布からの前記部分分布の抽出を行い、
前記出力部は、各前記部分分布に対応する対象物体の位置及び大きさを、その部分分布に対応する前記対象物体の種類と共に出力する、請求項1乃至5いずれか一項に記載の情報処理装置。 - コンピュータによって実行される制御方法であって、
画像データを取得し、その画像データに含まれる複数の部分領域それぞれについて、位置と大きさに対する対象物体の存在の確からしさを表す確度データを生成する生成ステップと、
各前記部分領域について生成された確度データの総和を算出することで、位置と大きさに対する前記対象物体の存在の確からしさの分布を算出し、前記算出した分布から、それぞれが1つの前記対象物体に対応する1つ以上の部分分布を抽出する抽出ステップと、
前記抽出した部分分布ごとに、その部分分布の統計値に基づいて、その部分分布に対応する対象物体の位置及び大きさを出力する出力ステップと、を有する制御方法。 - 請求項7に記載の制御方法の各ステップをコンピュータに実行させるプログラム。
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| PCT/JP2018/021207 WO2019229979A1 (ja) | 2018-06-01 | 2018-06-01 | 情報処理装置、制御方法、及びプログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPWO2019229979A1 JPWO2019229979A1 (ja) | 2021-05-13 |
| JP7006782B2 true JP7006782B2 (ja) | 2022-01-24 |
Family
ID=68696866
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2020522543A Expired - Fee Related JP7006782B2 (ja) | 2018-06-01 | 2018-06-01 | 情報処理装置、制御方法、及びプログラム |
Country Status (3)
| Country | Link |
|---|---|
| US (2) | US12039451B2 (ja) |
| JP (1) | JP7006782B2 (ja) |
| WO (1) | WO2019229979A1 (ja) |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US11455502B2 (en) * | 2019-05-31 | 2022-09-27 | Rakuten Group, Inc. | Learning device, classification device, learning method, classification method, learning program, and classification program |
| JP7490359B2 (ja) * | 2019-12-24 | 2024-05-27 | キヤノン株式会社 | 情報処理装置、情報処理方法及びプログラム |
| WO2024024048A1 (ja) * | 2022-07-28 | 2024-02-01 | 日本電信電話株式会社 | 物体検出装置、物体検出方法、及び物体検出プログラム |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2012159958A (ja) | 2011-01-31 | 2012-08-23 | Secom Co Ltd | 移動物体追跡装置 |
| WO2015008432A1 (ja) | 2013-07-17 | 2015-01-22 | 日本電気株式会社 | 物体追跡装置、物体追跡方法および物体追跡プログラム |
| WO2016114134A1 (ja) | 2015-01-14 | 2016-07-21 | 日本電気株式会社 | 移動状況推定装置、移動状況推定方法およびプログラム記録媒体 |
Family Cites Families (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP5841390B2 (ja) * | 2011-09-30 | 2016-01-13 | セコム株式会社 | 移動物体追跡装置 |
| KR20150051711A (ko) * | 2013-11-05 | 2015-05-13 | 한국전자통신연구원 | 유해 콘텐츠 영상 차단을 위한 피부 영역 추출 장치 및 방법 |
| JP2016162072A (ja) * | 2015-02-27 | 2016-09-05 | 株式会社東芝 | 特徴量抽出装置 |
| US9858496B2 (en) * | 2016-01-20 | 2018-01-02 | Microsoft Technology Licensing, Llc | Object detection and classification in images |
-
2018
- 2018-06-01 WO PCT/JP2018/021207 patent/WO2019229979A1/ja not_active Ceased
- 2018-06-01 JP JP2020522543A patent/JP7006782B2/ja not_active Expired - Fee Related
- 2018-06-01 US US17/059,678 patent/US12039451B2/en active Active
-
2023
- 2023-07-28 US US18/227,699 patent/US20230368033A1/en active Pending
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2012159958A (ja) | 2011-01-31 | 2012-08-23 | Secom Co Ltd | 移動物体追跡装置 |
| WO2015008432A1 (ja) | 2013-07-17 | 2015-01-22 | 日本電気株式会社 | 物体追跡装置、物体追跡方法および物体追跡プログラム |
| WO2016114134A1 (ja) | 2015-01-14 | 2016-07-21 | 日本電気株式会社 | 移動状況推定装置、移動状況推定方法およびプログラム記録媒体 |
Also Published As
| Publication number | Publication date |
|---|---|
| US20210209396A1 (en) | 2021-07-08 |
| JPWO2019229979A1 (ja) | 2021-05-13 |
| WO2019229979A1 (ja) | 2019-12-05 |
| US12039451B2 (en) | 2024-07-16 |
| US20230368033A1 (en) | 2023-11-16 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| RU2770752C1 (ru) | Способ и устройство для обучения модели распознавания лица и устройство для определения ключевой точки лица | |
| CN109815770B (zh) | 二维码检测方法、装置及系统 | |
| US10891329B2 (en) | Image recognition method and image recognition apparatus | |
| US11288548B2 (en) | Target detection method and apparatus, and computer device | |
| KR100647322B1 (ko) | 객체의 모양모델 생성장치 및 방법과 이를 이용한 객체의특징점 자동탐색장치 및 방법 | |
| US20230368033A1 (en) | Information processing device, control method, and program | |
| US10325184B2 (en) | Depth-value classification using forests | |
| CN109389105B (zh) | 一种基于多任务的虹膜检测和视角分类方法 | |
| JP4300098B2 (ja) | オブジェクト識別方法とその装置、プログラム及び記録媒体 | |
| WO2017198749A1 (en) | Image processing apparatus and method | |
| US11176425B2 (en) | Joint detection and description systems and methods | |
| CN108229305A (zh) | 用于确定目标对象的外接框的方法、装置和电子设备 | |
| KR20200049451A (ko) | 콘볼루션 신경망 시스템 및 그것의 동작 방법 | |
| CN113065379A (zh) | 融合图像质量的图像检测方法、装置、电子设备 | |
| CN111353325B (zh) | 关键点检测模型训练方法及装置 | |
| JP2023504319A (ja) | 人体と人手を関連付ける方法、装置、機器及び記憶媒体 | |
| KR20180107988A (ko) | 객체 탐지 장치 및 방법 | |
| CN107958202B (zh) | 人体检测设备、人体检测设备的控制方法和存储介质 | |
| CN107368832A (zh) | 基于图像的目标检测及分类方法 | |
| US20230010199A1 (en) | Foreground extraction apparatus, foreground extraction method, and recording medium | |
| TWI667054B (zh) | 飛行器飛行控制方法、裝置、飛行器及系統 | |
| JP2010113562A (ja) | 物体検知追跡装置,物体検知追跡方法および物体検知追跡プログラム | |
| EP3076370B1 (en) | Method and system for selecting optimum values for parameter set for disparity calculation | |
| EP4174796A1 (en) | Inference program, learning program, inference method, and learning method | |
| JP7349288B2 (ja) | 対象物認識装置、対象物認識方法、及び対象物認識プログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201112 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201112 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211207 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211220 |
|
| R151 | Written notification of patent or utility model registration |
Ref document number: 7006782 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
| LAPS | Cancellation because of no payment of annual fees |