Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP7743882B2 - 画像処理装置、画像処理方法、およびプログラム - Google Patents
[go: Go Back, main page]

JP7743882B2 - 画像処理装置、画像処理方法、およびプログラム - Google Patents

画像処理装置、画像処理方法、およびプログラム

Info

Publication number
JP7743882B2
JP7743882B2 JP2023580044A JP2023580044A JP7743882B2 JP 7743882 B2 JP7743882 B2 JP 7743882B2 JP 2023580044 A JP2023580044 A JP 2023580044A JP 2023580044 A JP2023580044 A JP 2023580044A JP 7743882 B2 JP7743882 B2 JP 7743882B2
Authority
JP
Japan
Prior art keywords
human body
image
posture
movement
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2023580044A
Other languages
English (en)
Other versions
JPWO2023152974A1 (ja
Inventor
諒 川合
登 吉田
健全 劉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2023152974A1 publication Critical patent/JPWO2023152974A1/ja
Application granted granted Critical
Publication of JP7743882B2 publication Critical patent/JP7743882B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • G06T7/74Determining position or orientation of objects or cameras using feature-based methods involving reference images or patches
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Description

本発明は、画像処理装置、画像処理方法、およびプログラムに関する。
本発明に関連する技術が特許文献1乃至3及び非特許文献1に開示されている。
特許文献1には、画像に含まれる人体の複数のキーポイント各々の特徴量を算出し、算出した特徴量に基づき姿勢が似た人体や動きが似た人体を含む画像を検索したり、当該姿勢や動きが似たもの同士でまとめて分類したりする技術が開示されている。また、非特許文献1には、人物の骨格推定に関連する技術が開示されている。
特許文献2には、所定区域を撮像した複数の画像、及び所定区域の状況の変化を示す情報を取得すると、所定区域の状況の変化を示す情報に基づいて複数の画像を分類し、分類結果に従って、複数の画像の少なくとも一部を用いて画像から所定区域の状況を判定する識別器の学習を行う技術が開示されている。
特許文献3には、入力画像に基づいて人物における対象の状態変化を検出し、対象の状態変化が複数人で生じたことの検出に応じて異常状態を判定する技術が開示されている。
国際公開第2021/084677号 特開2021-87031号 国際公開第2015/198767号
Zhe Cao, Tomas Simon, Shih-En Wei, Yaser Sheikh, "Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields", The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2017, P. 7291-7299
上述した特許文献1に開示の技術によれば、所望の姿勢や所望の動きの人体を含む画像を事前にテンプレート画像として登録しておくことで、処理対象の画像の中から所望の姿勢や所望の動きの人体を検出することができる。本発明者は、このような特許文献1に開示の技術を検討した結果、登録済のテンプレート画像が示す姿勢や動きと異なる所望の姿勢や所望の動きの人体を含む画像を新たにテンプレート画像として追加登録する際に、そのような画像を探す作業の作業性に改善の余地があることを新たに見出した。
上述した特許文献1乃至3及び非特許文献1はいずれも、テンプレート画像に関する課題及びその解決手段を開示していないため、上記課題を解決できないという問題点があった。
本発明の目的の一例は、上述した課題を鑑み、登録済みのテンプレート画像が示す姿勢や動きと異なる所望の姿勢や所望の動きの人体を含む画像をテンプレート画像として登録する作業の作業性の問題を解決する画像処理装置、画像処理方法、およびプログラムを提供することにある。
本発明の一態様によれば、
画像に含まれる人体のキーポイントを検出する処理を行う骨格構造検出手段と、
検出された前記キーポイントに基づき、前記画像から検出された人体の姿勢又は動きと、予め登録されたテンプレート画像が示す人体の姿勢又は動きとの類似度を算出する類似度算出手段と、
いずれの前記テンプレート画像が示す人体の姿勢又は動きとの前記類似度も第1の閾値未満である人体が写る前記画像内の箇所を特定する特定手段と、
前記テンプレート画像が示す人体の姿勢又は動きに基づいて前記画像から検出された人体の姿勢又は動きを判定する判定装置に追加登録する前記テンプレート画像の候補として、前記特定された箇所を示す情報、又は前記画像から前記特定された箇所を切り出した部分画像を出力する出力手段と、
を有する画像処理装置が提供される。
また、本発明の一態様によれば、
コンピュータが、
画像に含まれる人体のキーポイントを検出する処理を行い、
検出された前記キーポイントに基づき、前記画像から検出された人体の姿勢又は動きと、予め登録されたテンプレート画像が示す人体の姿勢又は動きとの類似度を算出し、
いずれの前記テンプレート画像が示す人体の姿勢又は動きとの前記類似度も第1の閾値未満である人体が写る前記画像内の箇所を特定し、
前記テンプレート画像が示す人体の姿勢又は動きに基づいて前記画像から検出された人体の姿勢又は動きを判定する判定装置に追加登録する前記テンプレート画像の候補として、前記特定された箇所を示す情報、又は前記画像から前記特定された箇所を切り出した部分画像を出力する、
画像処理方法が提供される。
また、本発明の一態様によれば、
コンピュータを、
画像に含まれる人体のキーポイントを検出する処理を行う骨格構造検出手段、
検出された前記キーポイントに基づき、前記画像から検出された人体の姿勢又は動きと、予め登録されたテンプレート画像が示す人体の姿勢又は動きとの類似度を算出する類似度算出手段、
いずれの前記テンプレート画像が示す人体の姿勢又は動きとの前記類似度も第1の閾値未満である人体が写る前記画像内の箇所を特定する特定手段、
前記テンプレート画像が示す人体の姿勢又は動きに基づいて前記画像から検出された人体の姿勢又は動きを判定する判定装置に追加登録する前記テンプレート画像の候補として、前記特定された箇所を示す情報、又は前記画像から前記特定された箇所を切り出した部分画像を出力する出力手段、
として機能させるプログラムが提供される。
本発明の一態様によれば、登録済みのテンプレート画像が示す姿勢や動きと異なる所望の姿勢や所望の動きの人体を含む画像をテンプレート画像として登録する作業の作業性の問題を解決する画像処理装置、画像処理方法、およびプログラムが得られる。
上述した目的、およびその他の目的、特徴および利点は、以下に述べる公的な実施の形態、およびそれに付随する以下の図面によってさらに明らかになる。
画像処理装置の機能ブロック図の一例を示す図である。 画像処理装置の処理内容を説明するための図である。 画像処理装置のハードウエア構成の一例を示す図である。 画像処理装置により検出される人体モデルの骨格構造の一例を示す図である。 画像処理装置により検出された人体モデルの骨格構造の一例を示す図である。 画像処理装置により検出された人体モデルの骨格構造の一例を示す図である。 画像処理装置により検出された人体モデルの骨格構造の一例を示す図である。 画像処理装置により算出されるキーポイントの特徴量の一例を示す図である。 画像処理装置により算出されるキーポイントの特徴量の一例を示す図である。 画像処理装置により算出されるキーポイントの特徴量の一例を示す図である。 画像処理装置により出力される情報の一例を模式的に示す図である。 画像処理装置の処理の流れの一例を示すフローチャートである。 画像処理装置の処理内容を説明するための図である。 画像処理装置の処理の流れの一例を示すフローチャートである。 画像処理装置の機能ブロック図の一例を示す図である。 画像処理装置により出力される情報の一例を模式的に示す図である。
以下、本発明の実施の形態について、図面を用いて説明する。尚、すべての図面において、同様な構成要素には同様の符号を付し、適宜説明を省略する。
<第1の実施形態>
図1は、第1の実施形態に係る画像処理装置10の概要を示す機能ブロック図である。図1に示すように、画像処理装置10は、骨格構造検出部11と、類似度算出部12と、特定部13と、出力部14とを備える。
骨格構造検出部11は、画像に含まれる人体のキーポイントを検出する処理を行う。類似度算出部12は、検出されたキーポイントに基づき、画像から検出された人体の姿勢又は動きと、予め登録されたテンプレート画像が示す人体の姿勢又は動きとの類似度を算出する。特定部13は、いずれのテンプレート画像が示す人体の姿勢又は動きとの類似度も第1の閾値未満である人体が写る画像内の箇所を特定する。出力部14は、テンプレート画像が示す人体の姿勢又は動きに基づいて画像から検出された人体の姿勢又は動きを判定する判定装置に追加登録するテンプレート画像の候補として、特定部13により特定された箇所を示す情報、又は画像から特定された箇所を切り出した部分画像を出力する。
この画像処理装置10によれば、登録済みのテンプレート画像が示す姿勢や動きと異なる所望の姿勢や所望の動きの人体を含む画像をテンプレート画像として登録する作業の作業性の問題を解決することができる。
<第2の実施形態>
「概要」
画像処理装置10は、テンプレート画像の元となる画像(以下、単に「画像」という)に含まれる人体の姿勢又は動きと、予め登録されたテンプレート画像が示す人体の姿勢又は動きとの類似度を算出した後、いずれのテンプレート画像が示す人体の姿勢又は動きとの類似度も第1の閾値未満である人体が写る画像内の箇所を特定する。そして、画像処理装置10は、特定された箇所を示す情報、又は画像から特定された箇所を切り出した部分画像を、判定装置用に追加登録するテンプレート画像の候補として出力する。ちなみに、判定装置は、登録されたテンプレート画像を利用した検出処理等を行うが、上記類似度が第1の閾値以上である場合に、画像から検出された人体の姿勢又は動きとテンプレート画像が示す人体の姿勢又は動きとが同じ、あるいは同じ種類の姿勢又は動きであると判定する。
このような画像処理装置10によれば、画像から検出された人体の集合の中の、いずれのテンプレート画像が示す人体の姿勢又は動きとも同じ、あるいは同じ種類の姿勢又は動きと判定されない人体が写る画像内の箇所を特定し、特定した箇所に関する情報を出力することができる。図2を用いてより詳細に説明する。第2の実施形態では、図2に示すように、画像から検出された人体の集合は、(1)いずれかのテンプレート画像が示す人体の姿勢又は動きと同じ、あるいは同じ種類の姿勢又は動きと判定される人体の集合と、(2)その他の人体の集合とに分類される。(2)その他の人体の集合は、いずれのテンプレート画像が示す人体の姿勢又は動きとも同じ、あるいは同じ種類の姿勢又は動きと判定されない人体の集合である。本実施形態では、(2)その他の人体の集合に含まれる人体が写る画像内の箇所を特定し、特定した箇所に関する情報を出力する。
「ハードウエア構成」
次に、画像処理装置10のハードウエア構成の一例を説明する。画像処理装置10の各機能部は、任意のコンピュータのCPU(Central Processing Unit)、メモリ、メモリにロードされるプログラム、そのプログラムを格納するハードディスク等の記憶ユニット(あらかじめ装置を出荷する段階から格納されているプログラムのほか、CD(Compact Disc)等の記憶媒体やインターネット上のサーバ等からダウンロードされたプログラムをも格納できる)、ネットワーク接続用インターフェイスを中心にハードウエアとソフトウエアの任意の組合せによって実現される。そして、その実現方法、装置にはいろいろな変形例があることは、当業者には理解されるところである。
図3は、画像処理装置10のハードウエア構成を例示するブロック図である。図3に示すように、画像処理装置10は、プロセッサ1A、メモリ2A、入出力インターフェイス3A、周辺回路4A、バス5Aを有する。周辺回路4Aには、様々なモジュールが含まれる。画像処理装置10は周辺回路4Aを有さなくてもよい。なお、画像処理装置10は物理的及び/又は論理的に分かれた複数の装置で構成されてもよい。この場合、複数の装置各々が上記ハードウエア構成を備えることができる。
バス5Aは、プロセッサ1A、メモリ2A、周辺回路4A及び入出力インターフェイス3Aが相互にデータを送受信するためのデータ伝送路である。プロセッサ1Aは、例えばCPU、GPU(Graphics Processing Unit)などの演算処理装置である。メモリ2Aは、例えばRAM(Random Access Memory)やROM(Read Only Memory)などのメモリである。入出力インターフェイス3Aは、入力装置、外部装置、外部サーバ、外部センサ、カメラ等から情報を取得するためのインターフェイスや、出力装置、外部装置、外部サーバ等に情報を出力するためのインターフェイスなどを含む。入力装置は、例えばキーボード、マウス、マイク、物理ボタン、タッチパネル等である。出力装置は、例えばディスプレイ、スピーカ、プリンター、メーラ等である。プロセッサ1Aは、各モジュールに指令を出し、それらの演算結果をもとに演算を行うことができる。
「機能構成」
図1は、第2の実施形態に係る画像処理装置10の概要を示す機能ブロック図である。図1に示すように、画像処理装置10は、骨格構造検出部11と、類似度算出部12と、特定部13と、出力部14とを有する。
骨格構造検出部11は、画像に含まれる人体のキーポイントを検出する処理を行う。
「画像」は、テンプレート画像の元となる画像である。テンプレート画像は、上述した特許文献1に開示の技術において事前に登録される画像であって、所望の姿勢や所望の動き(ユーザが検出したい姿勢や動き)の人体を含む画像である。画像は、複数のフレーム画像で構成される動画像であってもよいし、1枚で構成される静止画像であってもよい。
骨格構造検出部11は、画像に含まれる人体のN(Nは2以上の整数)個のキーポイントを検出する。動画像が処理対象の場合、骨格構造検出部11は、フレーム画像毎にキーポイントを検出する処理を行う。骨格構造検出部11による当該処理は、特許文献1に開示されている技術を用いて実現される。詳細は省略するが、特許文献1に開示されている技術では、非特許文献1に開示されたOpenPose等の骨格推定技術を利用して骨格構造の検出を行う。当該技術で検出される骨格構造は、関節等の特徴的な点である「キーポイント」と、キーポイント間のリンクを示す「ボーン(ボーンリンク)」とから構成される。
図4は、骨格構造検出部11により検出される人体モデル300の骨格構造を示しており、図5乃至図7は、骨格構造の検出例を示している。骨格構造検出部11は、OpenPose等の骨格推定技術を用いて、2次元の画像から図4のような人体モデル(2次元骨格モデル)300の骨格構造を検出する。人体モデル300は、人物の関節等のキーポイントと、各キーポイントを結ぶボーンから構成された2次元モデルである。
骨格構造検出部11は、例えば、画像の中からキーポイントとなり得る特徴点を抽出し、キーポイントの画像を機械学習した情報を参照して、人体のN個のキーポイントを検出する。検出するN個のキーポイントは予め定められる。検出するキーポイントの数(すなわち、Nの数)や、人体のどの部分を検出するキーポイントとするかは様々であり、あらゆるバリエーションを採用できる。
以下では、図4に示すように、頭A1、首A2、右肩A31、左肩A32、右肘A41、左肘A42、右手A51、左手A52、右腰A61、左腰A62、右膝A71、左膝A72、右足A81、左足A82が、検出対象のN個のキーポイント(N=14)として定められているものとする。なお、図3に示す人体モデル300では、これらのキーポイントを連結した人物の骨として、頭A1と首A2を結ぶボーンB1、首A2と右肩A31及び左肩A32をそれぞれ結ぶボーンB21及びボーンB22、右肩A31及び左肩A32と右肘A41及び左肘A42をそれぞれ結ぶボーンB31及びボーンB32、右肘A41及び左肘A42と右手A51及び左手A52をそれぞれ結ぶボーンB41及びボーンB42、首A2と右腰A61及び左腰A62をそれぞれ結ぶボーンB51及びボーンB52、右腰A61及び左腰A62と右膝A71及び左膝A72をそれぞれ結ぶボーンB61及びボーンB62、右膝A71及び左膝A72と右足A81及び左足A82をそれぞれ結ぶボーンB71及びボーンB72がさらに定められている。
図5は、直立した状態の人物を検出する例である。図5では、直立した人物が正面から撮像されており、正面から見たボーンB1、ボーンB51及びボーンB52、ボーンB61及びボーンB62、ボーンB71及びボーンB72がそれぞれ重ならずに検出され、右足のボーンB61及びボーンB71は左足のボーンB62及びボーンB72よりも多少折れ曲がっている。
図6は、しゃがみ込んでいる状態の人物を検出する例である。図6では、しゃがみ込んでいる人物が右側から撮像されており、右側から見たボーンB1、ボーンB51及びボーンB52、ボーンB61及びボーンB62、ボーンB71及びボーンB72がそれぞれ検出され、右足のボーンB61及びボーンB71と左足のボーンB62及びボーンB72は大きく折れ曲がり、かつ、重なっている。
図7は、寝込んでいる状態の人物を検出する例である。図7では、寝込んでいる人物が左斜め前から撮像されており、左斜め前から見たボーンB1、ボーンB51及びボーンB52、ボーンB61及びボーンB62、ボーンB71及びボーンB72がそれぞれ検出され、右足のボーンB61及びボーンB71と左足のボーンB62及びボーンB72は折れ曲がり、かつ、重なっている。
図1に戻り、類似度算出部12は、骨格構造検出部11により検出されたキーポイントに基づき、画像から検出された人体の姿勢又は動きと、予め登録されたテンプレート画像が示す人体の姿勢又は動きとの類似度を算出する。
上記人体の姿勢又は動きの類似度の算出の仕方は様々であり、あらゆる技術を採用できる。例えば、特許文献1に開示の技術を採用してもよい。また、テンプレート画像が示す人体の姿勢又は動きと、画像内から検出した人体の姿勢又は動きとの類似度を算出し、類似度が第1の閾値以上である人体をテンプレート画像が示す人体と同じ、あるいは同じ種類の姿勢又は動きの人体として検出する判定装置と同じ手法を採用してもよい。以下、一例を説明するがこれに限定されない。
一例として、類似度算出部12は、検出されたキーポイントで示される骨格構造の特徴量を算出し、画像から検出された人体の骨格構造の特徴量と、テンプレート画像が示す人体の骨格構造の特徴量との類似度を算出することで、2つの人体の姿勢の類似度を算出してもよい。
骨格構造の特徴量は、人物の骨格の特徴を示しており、人物の骨格に基づいて人物の状態(姿勢や動き)を分類するための要素となる。通常、この特徴量は、複数のパラメータを含んでいる。そして特徴量は、骨格構造の全体の特徴量でもよいし、骨格構造の一部の特徴量でもよく、骨格構造の各部のように複数の特徴量を含んでもよい。特徴量の算出方法は、機械学習や正規化等の任意の方法でよく、正規化として最小値や最大値を求めてもよい。一例として、特徴量は、骨格構造を機械学習することで得られた特徴量や、骨格構造の頭部から足部までの画像上の大きさ、画像上の骨格構造を含む骨格領域の上下方向における複数のキーポイントの相対的な位置関係、当該骨格領域の左右方向における複数のキーポイントの相対的な位置関係等である。骨格構造の大きさは、画像上の骨格構造を含む骨格領域の上下方向の高さや面積等である。上下方向(高さ方向または縦方向)は、画像における上下の方向(Y軸方向)であり、例えば、地面(基準面)に対し垂直な方向である。また、左右方向(横方向)は、画像における左右の方向(X軸方向)であり、例えば、地面に対し平行な方向である。
なお、ユーザが望む分類を行うためには、判定処理に対しロバスト性を有する特徴量を用いることが好ましい。例えば、ユーザが、人物の向きや体型に依存しない判定を望む場合、人物の向きや体型にロバストな特徴量を使用してもよい。同じ姿勢で様々な方向に向いている人物の骨格や同じ姿勢で様々な体型の人物の骨格を学習することや、骨格の上下方向のみの特徴を抽出することで、人物の向きや体型に依存しない特徴量を得ることができる。骨格構造の特徴量を算出する処理の一例は、特許文献1に開示されている。
図8は、類似度算出部12が求めた複数のキーポイント各々の特徴量の例を示している。複数のキーポイントの特徴量の集合が、骨格構造の特徴量となる。なお、ここで例示するキーポイントの特徴量はあくまで一例であり、これに限定されない。
この例では、キーポイントの特徴量は、画像上の骨格構造を含む骨格領域の上下方向における複数のキーポイントの相対的な位置関係を示す。首のキーポイントA2を基準点とするため、キーポイントA2の特徴量は0.0となり、首と同じ高さの右肩のキーポイントA31及び左肩のキーポイントA32の特徴量も0.0である。首よりも高い頭のキーポイントA1の特徴量は-0.2である。首よりも低い右手のキーポイントA51及び左手のキーポイントA52の特徴量は0.4であり、右足のキーポイントA81及び左足のキーポイントA82の特徴量は0.9である。この状態から人物が左手を挙げると、図9のように左手が基準点よりも高くなるため、左手のキーポイントA52の特徴量は-0.4となる。一方で、Y軸の座標のみを用いて正規化を行っているため、図10のように、図8に比べて骨格構造の幅が変わっても特徴量は変わらない。すなわち、当該例の特徴量(正規化値)は、骨格構造(キーポイント)の高さ方向(Y方向)の特徴を示しており、骨格構造の横方向(X方向)の変化に影響を受けない。
このような特徴量で示される姿勢の類似度の算出の仕方は様々である。例えば、キーポイント毎に特徴量の類似度を算出した後、複数のキーポイントの特徴量の類似度に基づき、姿勢の類似度を算出してもよい。例えば、複数のキーポイントの特徴量の類似度の平均値、最大値、最小値、最頻値、中央値、加重平均値、加重和等が、姿勢の類似度として算出されてもよい。加重平均値や加重和を算出する場合、各キーポイントの重みはユーザが設定できてもよいし、予め定められていてもよい。
また、動きは、複数の姿勢の時間変化としてあらわされる。このため類似度算出部12は、例えば、互いに対応する複数のフレーム画像の組み合わせ毎に、上記手法で姿勢の類似度を算出した後、複数のフレーム画像の組み合わせ毎に算出した姿勢の類似度の統計値(平均値、最大値、最小値、最頻値、中央値、加重平均値、加重和等)を、動きの類似度として算出してもよい。
図1に戻り、特定部13は、判定装置用に追加登録するテンプレート画像の候補として、いずれのテンプレート画像が示す人体の姿勢又は動きとの類似度も第1の閾値未満である人体が写る画像内の箇所を特定する。具体的には、特定部13は、画像から検出された人体の姿勢又は動きと、複数のテンプレート画像各々が示す人体の姿勢又は動きとの類似度を、第1の閾値と比較する。そして、特定部13は、当該比較の結果に基づき、いずれのテンプレート画像が示す人体の姿勢又は動きとの類似度も第1の閾値未満である人体が写る画像内の箇所を特定する。
なお、判定装置は、テンプレート画像が示す人体の姿勢又は動きに基づいて画像から検出された人体の姿勢又は動きを判定する。具体的には、判定装置は、上記類似度が第1の閾値以上である場合に、画像から検出された人体の姿勢又は動きとテンプレート画像が示す人体の姿勢又は動きとが同じ、あるいは同じ種類の姿勢又は動作であると判定する。すなわち、特定部13は、画像から検出された人体の集合の中の、いずれのテンプレート画像が示す人体の姿勢又は動きとも同じ、あるいは同じ種類の姿勢又は動きと判定装置により判定されない人体が写る画像内の箇所を特定することとなる。
画像が静止画像である場合、「特定部13により特定される箇所」は、1枚の静止画像内の一部領域となる。この場合、静止画像毎に、例えば静止画像に設定された座標系の座標で上記箇所が示される。一方、画像が動画像である場合、「特定部13により特定される箇所」は、動画像を構成する複数のフレーム画像の中の一部のフレーム画像各々内の一部領域となる。この場合、動画像ごとに、例えば複数のフレーム画像の中の一部のフレーム画像を示す情報(フレーム識別情報、冒頭からの経過時間等)と、フレーム画像に設定された座標系の座標とで、上記箇所が示される。
出力部14は、判定装置に追加登録するテンプレート画像の候補として、特定部13により特定された箇所を示す情報、又は画像から特定部13により特定された箇所を切り出した部分画像を出力する。なお、出力部14が部分画像を出力する場合、画像処理装置10は、画像から、特定部13により特定された箇所を切り出して部分画像を生成する処理部を有することができる。そして、出力部14は、処理部が生成した部分画像を出力することができる。
上述した「特定部13により特定された箇所」、すなわちいずれのテンプレート画像が示す人体の姿勢又は動きとの類似度も第1の閾値未満である人体が写る画像内の箇所が、テンプレート画像の候補となる。ユーザは、上記情報又は上記部分画像に基づき、上記箇所を閲覧等し、その中から、所望の姿勢や所望の動きの人体を含む箇所をテンプレート画像として選別することができる。
図11に、出力部14が出力した情報の一例を模式的に示す。図11に示す例では、検出された複数の人体を互いに識別するための人体識別情報と、各人体の属性情報とが互いに紐付けて表示されている。そして、属性情報の一例として、画像内箇所を示す情報(上述した人体が写る箇所を示す情報)、画像の撮影日時が表示されている。属性情報は、その他、画像を撮影したカメラの設置位置(撮影位置)を示す情報(例:102号バス車内後方、〇〇公園入口等)や、画像解析で算出される人物の属性情報(例:性別、年齢層、体型等)を含んでもよい。
次に、図12のフローチャートを用いて、画像処理装置10の処理の流れの一例を説明する。
画像処理装置10は、画像に含まれる人体のキーポイントを検出する処理を行うと(S10)、検出されたキーポイントに基づき、画像から検出された人体の姿勢又は動きと、予め登録されたテンプレート画像が示す人体の姿勢又は動きとの類似度を算出する(S11)。
次いで、画像処理装置10は、判定装置用に追加登録するテンプレート画像の候補として、いずれのテンプレート画像が示す人体の姿勢又は動きとの類似度も第1の閾値未満である人体が写る画像内の箇所を特定する(S12)。具体的には、画像処理装置10は、画像から検出された人体の姿勢又は動きと、複数のテンプレート画像各々が示す人体の姿勢又は動きとの類似度を、第1の閾値と比較する。そして、画像処理装置10は、当該比較の結果に基づき、いずれのテンプレート画像が示す人体の姿勢又は動きとの類似度も第1の閾値未満である人体が写る画像内の箇所を特定する。なお、判定装置は、上記類似度が第1の閾値以上である場合に、画像から検出された人体の姿勢又は動きとテンプレート画像が示す人体の姿勢又は動きとが同じ、あるいは同じ種類の姿勢又は動きであると判定する。
そして、画像処理装置10は、S12で特定された箇所を示す情報、又は画像からS12で特定された箇所を切り出した部分画像を出力する(S13)。
「作用効果」
第2の実施形態の画像処理装置10によれば、第1の実施形態と同様の作用効果が実現される。また、第2の実施形態の画像処理装置10によれば、画像から検出された人体の集合の中の、いずれのテンプレート画像が示す人体の姿勢又は動きとも同じ、あるいは同じ種類の姿勢又は動きと判定装置により判定されない人体が写る画像内の箇所に関する情報を出力することができる。
図2を用いてより詳細に説明する。第2の実施形態では、図2に示すように、画像から検出された人体の集合は、(1)いずれかのテンプレート画像が示す人体の姿勢又は動きと同じ、あるいは同じ種類の姿勢又は動きと判定装置により判定される人体の集合と、(2)その他の人体の集合とに分類される。(2)その他の人体の集合は、いずれのテンプレート画像が示す人体の姿勢又は動きとも同じ、あるいは同じ種類の姿勢又は動き姿勢又は動きと判定装置により判定されない人体の集合である。第2の実施形態の画像処理装置10によれば、(2)その他の人体の集合に含まれる人体が写る画像内の箇所を特定し、特定した箇所に関する情報を出力することができる。ユーザは、上記特定した箇所を閲覧等し、その中から、所望の姿勢や所望の動きの人体を含む箇所をテンプレート画像として選別することができる。結果、登録済みのテンプレート画像が示す姿勢や動きと異なる所望の姿勢や所望の動きの人体を含む画像をテンプレート画像として登録する作業の作業性の問題が解決される。
<第3の実施形態>
第3の実施形態の画像処理装置10は、第2の実施形態の画像処理装置10により特定される画像内の箇所の中の一部を、判定装置用に追加登録するテンプレート画像の候補として特定する。
第3の実施形態では、図13に示すように、画像から検出された人体の集合は、(1)いずれかのテンプレート画像が示す人体の姿勢又は動きと同じ、あるいは同じ種類の姿勢又は動きと判定される人体の集合と、(2―1)いずれのテンプレート画像が示す人体の姿勢又は動きとも同じ、あるいは同じ種類の姿勢又は動きと判定されないが、似ている姿勢又は動きの人体の集合と、(2-2)その他の人体の集合とに分類される。すなわち、第3の実施形態では、第2の実施形態における(2)その他の人体の集合(図2参照)が、(2―1)いずれのテンプレート画像が示す人体の姿勢又は動きとも同じ、あるいは同じ種類の姿勢又は動きと判定されないが、似ている姿勢又は動きの人体の集合と、(2-2)その他の人体の集合とに分類されている。
(2-2)その他の人体の集合は、いずれのテンプレート画像が示す人体の姿勢又は動きとも同じ、あるいは同じ種類の姿勢又は動きと判定されず、かつ、似ていない姿勢又は動きの人体の集合である。本実施形態では、(2-2)その他の人体の集合に含まれる人体が写る画像内の箇所を特定し、特定した箇所に関する情報を出力する。以下、詳細に説明する。
特定部13は、判定装置用に追加登録するテンプレート画像の候補として、いずれのテンプレート画像が示す人体の姿勢又は動きとの類似度も第1の閾値未満である人体(図13の(2-1)及び(2-2)の集合に属する人体)の中の、いずれのテンプレート画像が示す人体の姿勢又は動きとも第1の類似条件を満たさない人体(図13の(2-2)の集合に属する人体)が写る画像内の箇所を特定する。
特定部13は、第2の実施形態で説明した手法で、画像から検出した人体の中から、図13の(2-1)及び(2-2)の集合に属する人体を特定する。次いで、特定部13は、特定した人体毎に、いずれかのテンプレート画像が示す人体の姿勢又は動きと第1の類似条件を満たすか判定する。そして、特定部13は、判定の結果に基づき、図13の(2-2)の集合に属する人体を特定するとともに、特定したその人体が写る画像内の箇所を特定する。第1の類似条件を満たす人体は、図13の(2-1)の集合に属する人体となり、第1の類似条件を満たさない人体は、図13の(2-2)の集合に属する人体となる。
第1の類似条件は、
・「テンプレート画像が示す人体の姿勢又は動きとの類似度が第2の閾値以上かつ第1の閾値未満であること」、
・「各人体から検出される複数のキーポイント(N個のキーポイント)の中の一部のキーポイントに基づき算出されたテンプレート画像が示す人体の姿勢又は動きとの類似度が第3の閾値以上であること」、
・「各人体から検出される複数のキーポイント各々に付与された重み付け値を考慮して算出されたテンプレート画像が示す人体の姿勢又は動きとの類似度が第4の閾値以上であること」、及び、
・「動画像であるテンプレート画像に含まれる複数のフレーム画像の中の所定割合以上のフレーム画像各々が示す人体の姿勢との類似度が第5の閾値以上である姿勢の人体各々を示す複数のフレーム画像を含むこと」、
の中の少なくとも1つを含む。
上記例示した条件の中の複数を含む場合、第1の類似条件は、複数の条件を「or」等の論理演算子で繋いだ内容とすることができる。以下、上記例示した条件各々について説明する。
「テンプレート画像が示す人体の姿勢又は動きとの類似度が第2の閾値以上かつ第1の閾値未満であること」
この条件の「類似度」は、第2の実施形態で説明した類似度算出部12による算出方法と同じ方法で算出された値である。そして、第2の閾値は第1の閾値より小さい値である。
第2の閾値を適切に設定することで、いずれのテンプレート画像が示す人体の姿勢又は動きとも同じ、あるいは同じ種類の姿勢又は動きと判定されないが、似ている姿勢又は動きの人体(図13の(2-1)の集合に属する人体)を検出することができる。そして、第2の実施形態で説明した手法で特定した図13の(2-1)及び(2-2)の集合に属する人体の中から、図13の(2-1)の集合に属する人体を取り除くことで、図13の(2-2)の集合に属する人体を特定することができる。
「各人体から検出される複数のキーポイント(N個のキーポイント)の中の一部のキーポイントに基づき算出されたテンプレート画像が示す人体の姿勢又は動きとの類似度が第3の閾値以上であること」
この条件の「類似度」は、検出対象の複数のキーポイント(N個のキーポイント)の中の一部のキーポイントに基づき算出された値である。複数のキーポイント(N個のキーポイント)の中の一部のキーポイントの特徴量のみを用いる点を除き、第2の実施形態で説明した類似度算出部12による算出方法と同じ方法を採用して、この条件の類似度を算出することができる。
いずれのキーポイントを利用するかは設計的事項であるが、例えばユーザが指定できてもよい。ユーザは、重視したい身体部分(例:上半身)のキーポイントを指定し、重視しない身体部分(例:下半身)のキーポイントを指定から外すことができる。
第3の閾値を適切に設定することで、いずれのテンプレート画像が示す人体の姿勢又は動きとも同じ、あるいは同じ種類の姿勢又は動きと判定されないが、身体の一部が同じ又は似ている姿勢又は動きの人体(図13の(2-1)の集合に属する人体)を検出することができる。そして、第2の実施形態で説明した手法で特定した図13の(2-1)及び(2-2)の集合に属する人体の中から、図13の(2-1)の集合に属する人体を取り除くことで、図13の(2-2)の集合に属する人体を特定することができる。
「各人体から検出される複数のキーポイント各々に付与された重み付け値を考慮して算出されたテンプレート画像が示す人体の姿勢又は動きとの類似度が第4の閾値以上であること」
この条件の「類似度」は、検出対象の複数のキーポイント(N個のキーポイント)に重みを付与して算出された値である。例えば、第2の実施形態で説明した類似度算出部12による算出方法と同じ方法を採用してキーポイント毎に特徴量の類似度を算出した後、上記重み付け値を用いて、複数のキーポイントの特徴量の類似度の加重平均値又は加重和を姿勢の類似度として算出する。各キーポイントの重みはユーザが設定できてもよいし、予め定められていてもよい。
第4の閾値を適切に設定することで、いずれのテンプレート画像が示す人体の姿勢又は動きとも同じ、あるいは同じ種類の姿勢又は動きと判定されないが、身体の一部に重みを置いた場合に同じ又は似ている姿勢又は動きの人体(図13の(2-1)の集合に属する人体)を検出することができる。そして、第2の実施形態で説明した手法で特定した図13の(2-1)及び(2-2)の集合に属する人体の中から、図13の(2-1)の集合に属する人体を取り除くことで、図13の(2-2)の集合に属する人体を特定することができる。
「動画像であるテンプレート画像に含まれる複数のフレーム画像の中の所定割合以上のフレーム画像各々が示す人体の姿勢との類似度が第5の閾値以上である姿勢の人体各々を示す複数のフレーム画像を含むこと」
当該条件は、画像及びテンプレート画像は動画像であり、動画像に含まれる複数のテンプレート画像各々が示す人体の姿勢の時間変化により人体の動きが示されている場合に利用される。
例えば、テンプレート画像はM個のフレーム画像で構成されるが、そのM個のフレーム画像の中の所定割合以上(例:7割以上)のフレーム画像各々が示す人体の姿勢と所定レベル以上類似する(類似度が第5の閾値以上)姿勢の人体各々を含む複数のフレーム画像が当該条件を満たすこととなる。互いに対応する複数のフレーム画像の組み合わせ毎に姿勢の類似度を算出する手法は、第2の実施形態で説明した手法を採用できる。
第5の閾値、及び所定割合を適切に設定することで、いずれのテンプレート画像が示す人体の動きとも同じ、あるいは同じ種類の姿勢又は動きと判定されないが、テンプレート画像(動画像)の中の一部時間帯における人体の動きと同じ又は似ている動きの人体(図13の(2-1)の集合に属する人体)を検出することができる。そして、第2の実施形態で説明した手法で特定した図13の(2-1)及び(2-2)の集合に属する人体の中から、図13の(2-1)の集合に属する人体を取り除くことで、図13の(2-2)の集合に属する人体を特定することができる。
次に、図14のフローチャートを用いて、画像処理装置10の処理の流れの一例を説明する。
画像処理装置10は、画像に含まれる人体のキーポイントを検出する処理を行うと(S20)、検出されたキーポイントに基づき、画像から検出された人体の姿勢又は動きと、予め登録されたテンプレート画像が示す人体の姿勢又は動きとの類似度を算出する(S21)。
次いで、画像処理装置10は、検出された人体の中から、いずれのテンプレート画像が示す人体の姿勢又は動きとの類似度も第1の閾値未満である人体を特定する(S22)。具体的には、画像処理装置10は、画像から検出された人体の姿勢又は動きと、複数のテンプレート画像各々が示す人体の姿勢又は動きとの類似度と、第1の閾値とを比較する。そして、画像処理装置10は、当該比較の結果に基づき、いずれのテンプレート画像が示す人体の姿勢又は動きとの類似度も第1の閾値未満である人体を特定する。
次いで、画像処理装置10は、判定装置用に追加登録するテンプレート画像の候補として、S22で特定した人体の中のいずれのテンプレート画像が示す人体の姿勢又は動きとも第1の類似条件を満たさない人体が写る画像内の箇所を特定する(S23)。具体的には、画像処理装置10は、S22で特定した人体毎に、いずれかのテンプレート画像が示す人体の姿勢又は動きと第1の類似条件を満たすか判定する。そして、画像処理装置10は、判定の結果に基づき、S22で特定した人体の中のいずれのテンプレート画像が示す人体の姿勢又は動きとも第1の類似条件を満たさない人体が写る画像内の箇所を特定する。
そして、画像処理装置10は、S23で特定された箇所を示す情報、又は画像からS23で特定された箇所を切り出した部分画像を出力する(S24)。
第3の実施形態の画像処理装置10のその他の構成は、第1及び第2の実施形態の画像処理装置10の構成と同様である。
第3の実施形態の画像処理装置10によれば、第1及び第2の実施形態と同様の作用効果が実現される。また、第3の実施形態の画像処理装置10によれば、画像から検出された人体の集合の中の、いずれのテンプレート画像が示す人体の姿勢又は動きとも同じ、あるいは同じ種類の姿勢又は動きと判定装置により判定されず、かつ、いずれのテンプレート画像が示す人体の姿勢又は動きとも似ていない人体が写る画像内の箇所に関する情報を出力することができる。
図13を用いてより詳細に説明する。第3の実施形態では、図13に示すように、画像から検出された人体の集合は、(1)いずれかのテンプレート画像が示す人体の姿勢又は動きと同じ、あるいは同じ種類の姿勢又は動きと判定される人体の集合と、(2―1)いずれのテンプレート画像が示す人体の姿勢又は動きとも同じ、あるいは同じ種類の姿勢又は動きと判定されないが、似ている姿勢又は動きの人体の集合と、(2-2)その他の人体の集合とに分類される。(2-2)その他の人体の集合は、いずれのテンプレート画像が示す人体の姿勢又は動きとも同じ、あるいは同じ種類の姿勢又は動きと判定装置により判定されず、かつ、いずれのテンプレート画像が示す人体の姿勢又は動きとも似ていない人体の集合である。第3の実施形態の画像処理装置10によれば、(2-2)その他の人体の集合に含まれる人体が写る画像内の箇所を特定し、特定した箇所に関する情報を出力することができる。ユーザは、上記特定した箇所を閲覧等し、その中から、所望の姿勢や所望の動きの人体を含む箇所をテンプレート画像として選別することができる。結果、登録済みのテンプレート画像が示す姿勢や動きと異なる所望の姿勢や所望の動きの人体を含む画像をテンプレート画像として登録する作業の作業性の問題が解決される。
<第4の実施形態>
本実施形態の画像処理装置10は、第1乃至第3の実施形態のいずれかの手法で特定した画像内の箇所に写る複数の人体を、姿勢又は動きの類似度に基づきグループ分けし、その結果を出力する機能を有する。以下、詳細に説明する。
図15に、本実施形態の画像処理装置10の機能ブロック図の一例を示す。図示するように、画像処理装置10は、骨格構造検出部11と、類似度算出部12と、特定部13と、出力部14と、グループ化部15とを有する。
グループ化部15は、特定部13により特定された画像内の箇所に写る複数の人体を、姿勢又は動きの類似度に基づきグループ分けする。グループ化部15は、姿勢又は動きが似ているもの同士をまとめてグループを作成する。当該グループ分けは、特許文献1に開示の分類の技術を利用して実現することができる。
出力部14は、グループ化部15によるグループ分けの結果をさらに出力する。図16に、出力部14が出力する情報の一例を示す。図示する例では、特定部13により特定された画像内の箇所に写る複数の人体は、3つのグループに分類されている。例えば、図16に示すように、表示ウインドウW1に、姿勢毎(グループ毎)の姿勢領域WA1乃至WA3を表示し、姿勢領域WA1乃至WA3にそれぞれの姿勢に該当する人体を表示する。
第4の実施形態の画像処理装置10のその他の構成は、第1乃至第3の実施形態の画像処理装置10の構成と同様である。
第4の実施形態の画像処理装置10によれば、第1乃至第3の実施形態と同様の作用効果が実現される。また、第4の実施形態の画像処理装置10によれば、特定した画像内の箇所に写る複数の人体を、姿勢又は動きの類似度に基づきグループ分けし、その結果を出力することができる。ユーザは、その情報に基づき、テンプレート画像の候補の中に、どのような姿勢や動きの人体が含まれているのか、容易に把握することができる。結果、登録済みのテンプレート画像が示す姿勢や動きと異なる所望の姿勢や所望の動きの人体を含む画像をテンプレート画像として登録する作業の作業性の問題が解決される。
以上、図面を参照して本発明の実施形態について述べたが、これらは本発明の例示であり、上記以外の様々な構成を採用することもできる。
また、上述の説明で用いた複数のフローチャートでは、複数の工程(処理)が順番に記載されているが、各実施形態で実行される工程の実行順序は、その記載の順番に制限されない。各実施形態では、図示される工程の順番を内容的に支障のない範囲で変更することができる。また、上述の各実施形態は、内容が相反しない範囲で組み合わせることができる。
上記の実施形態の一部または全部は、以下の付記のようにも記載されうるが、以下に限られない。
1. 画像に含まれる人体のキーポイントを検出する処理を行う骨格構造検出手段と、
検出された前記キーポイントに基づき、前記画像から検出された人体の姿勢又は動きと、予め登録されたテンプレート画像が示す人体の姿勢又は動きとの類似度を算出する類似度算出手段と、
いずれの前記テンプレート画像が示す人体の姿勢又は動きとの前記類似度も第1の閾値未満である人体が写る前記画像内の箇所を特定する特定手段と、
前記テンプレート画像が示す人体の姿勢又は動きに基づいて前記画像から検出された人体の姿勢又は動きを判定する判定装置に追加登録する前記テンプレート画像の候補として、前記特定された箇所を示す情報、又は前記画像から前記特定された箇所を切り出した部分画像を出力する出力手段と、
を有する画像処理装置。
2. 前記特定手段は、いずれの前記テンプレート画像が示す人体の姿勢又は動きとの前記類似度も前記第1の閾値未満である人体の中の、いずれの前記テンプレート画像が示す人体の姿勢又は動きとも第1の類似条件を満たさない人体が写る前記画像内の箇所を特定する1に記載の画像処理装置。
3. 前記第1の類似条件は、前記類似度が第2の閾値以上かつ前記第1の閾値未満であること、を含む2に記載の画像処理装置。
4. 前記第1の類似条件は、各人体から検出される複数の前記キーポイントの中の一部の前記キーポイントに基づき算出された前記テンプレート画像が示す人体の姿勢又は動きとの前記類似度が第3の閾値以上であること、を含む2又は3に記載の画像処理装置。
5. 前記第1の類似条件は、各人体から検出される複数の前記キーポイント各々に付与された重み付け値を考慮して算出された前記テンプレート画像が示す人体の姿勢又は動きとの前記類似度が第4の閾値以上であること、を含む2から4のいずれかに記載の画像処理装置。
6. 前記画像及び前記テンプレート画像は動画像であり、前記動画像に含まれる複数のテンプレート画像各々が示す人体の姿勢の時間変化により人体の動きが示されており、
前記第1の類似条件は、前記テンプレート画像に含まれる複数のフレーム画像の中の所定割合以上の前記フレーム画像各々が示す人体の姿勢との類似度が第5の閾値以上である姿勢の人体各々を示す複数のフレーム画像を含むこと、である2から5のいずれかに記載の画像処理装置。
7. 前記特定された箇所に写る複数の人体を、姿勢又は動きの類似度に基づきグループ分けするグループ化手段をさらに有し、
前記出力手段は、前記グループ分けの結果をさらに出力する、
1から6のいずれかに記載の画像処理装置。
8. コンピュータが、
画像に含まれる人体のキーポイントを検出する処理を行い、
検出された前記キーポイントに基づき、前記画像から検出された人体の姿勢又は動きと、予め登録されたテンプレート画像が示す人体の姿勢又は動きとの類似度を算出し、
いずれの前記テンプレート画像が示す人体の姿勢又は動きとの前記類似度も第1の閾値未満である人体が写る前記画像内の箇所を特定し、
前記テンプレート画像が示す人体の姿勢又は動きに基づいて前記画像から検出された人体の姿勢又は動きを判定する判定装置に追加登録する前記テンプレート画像の候補として、前記特定された箇所を示す情報、又は前記画像から前記特定された箇所を切り出した部分画像を出力する、
画像処理方法。
9. コンピュータを、
画像に含まれる人体のキーポイントを検出する処理を行う骨格構造検出手段、
検出された前記キーポイントに基づき、前記画像から検出された人体の姿勢又は動きと、予め登録されたテンプレート画像が示す人体の姿勢又は動きとの類似度を算出する類似度算出手段、
いずれの前記テンプレート画像が示す人体の姿勢又は動きとの前記類似度も第1の閾値未満である人体が写る前記画像内の箇所を特定する特定手段、
前記テンプレート画像が示す人体の姿勢又は動きに基づいて前記画像から検出された人体の姿勢又は動きを判定する判定装置に追加登録する前記テンプレート画像の候補として、前記特定された箇所を示す情報、又は前記画像から前記特定された箇所を切り出した部分画像を出力する出力手段、
として機能させるプログラム。
10 画像処理装置
11 骨格構造検出部
12 類似度算出部
13 特定部
14 出力部
15 グループ化部
1A プロセッサ
2A メモリ
3A 入出力I/F
4A 周辺回路
5A バス

Claims (6)

  1. 画像に含まれる人体のキーポイントを検出する処理を行う骨格構造検出手段と、
    検出された前記キーポイントに基づき、前記画像から検出された人体の姿勢又は動きと、予め登録されたテンプレート画像が示す人体の姿勢又は動きとの類似度を算出する類似度算出手段と、
    いずれの前記テンプレート画像が示す人体の姿勢又は動きとの前記類似度も第1の閾値未満である人体の中の、いずれの前記テンプレート画像が示す人体の姿勢又は動きとも第1の類似条件を満たさない人体が写る前記画像内の箇所を特定する特定手段と、
    加登録する前記テンプレート画像の候補として、前記特定された箇所に関する情報を出力する出力手段と、
    を有し、
    前記第1の類似条件は、
    前記類似度が第2の閾値以上かつ前記第1の閾値未満であること、
    各人体から検出される複数の前記キーポイントの中の一部の前記キーポイントに基づき算出された前記テンプレート画像が示す人体の姿勢又は動きとの前記類似度が第3の閾値以上であること、
    各人体から検出される複数の前記キーポイント各々に付与された重み付け値を考慮して算出された前記テンプレート画像が示す人体の姿勢又は動きとの前記類似度が第4の閾値以上であること、及び、
    前記テンプレート画像に含まれる複数のフレーム画像の中の所定割合以上の前記フレーム画像各々が示す人体の姿勢との類似度が第5の閾値以上である姿勢の人体各々を示す複数のフレーム画像を含むこと、
    の中の少なくとも1つを含む画像処理装置。
  2. 前記出力手段は、前記テンプレート画像が示す人体の姿勢又は動きに基づいて前記画像から検出された人体の姿勢又は動きを判定する判定装置に追加登録する前記テンプレート画像の候補として、前記特定された箇所に関する情報を出力する、請求項1に記載の画像処理装置。
  3. 前記出力手段は、前記特定された箇所に関する情報として、前記特定された箇所を示す情報又は前記画像から前記特定された箇所を切り出した部分画像を出力する、請求項1又は2に記載の画像処理装置。
  4. 前記特定された箇所に写る複数の人体を、姿勢又は動きの類似度に基づきグループ分けするグループ化手段をさらに有し、
    前記出力手段は、前記グループ分けの結果をさらに出力する、
    請求項1からのいずれか1項に記載の画像処理装置。
  5. コンピュータが、
    画像に含まれる人体のキーポイントを検出する処理を行い、
    検出された前記キーポイントに基づき、前記画像から検出された人体の姿勢又は動きと、予め登録されたテンプレート画像が示す人体の姿勢又は動きとの類似度を算出し、
    いずれの前記テンプレート画像が示す人体の姿勢又は動きとの前記類似度も第1の閾値未満である人体の中の、いずれの前記テンプレート画像が示す人体の姿勢又は動きとも第1の類似条件を満たさない人体が写る前記画像内の箇所を特定し、
    加登録する前記テンプレート画像の候補として、前記特定された箇所に関する情報を出力し、
    前記第1の類似条件は、
    前記類似度が第2の閾値以上かつ前記第1の閾値未満であること、
    各人体から検出される複数の前記キーポイントの中の一部の前記キーポイントに基づき算出された前記テンプレート画像が示す人体の姿勢又は動きとの前記類似度が第3の閾値以上であること、
    各人体から検出される複数の前記キーポイント各々に付与された重み付け値を考慮して算出された前記テンプレート画像が示す人体の姿勢又は動きとの前記類似度が第4の閾値以上であること、及び、
    前記テンプレート画像に含まれる複数のフレーム画像の中の所定割合以上の前記フレーム画像各々が示す人体の姿勢との類似度が第5の閾値以上である姿勢の人体各々を示す複数のフレーム画像を含むこと、
    の中の少なくとも1つを含む画像処理方法。
  6. コンピュータを、
    画像に含まれる人体のキーポイントを検出する処理を行う骨格構造検出手段、
    検出された前記キーポイントに基づき、前記画像から検出された人体の姿勢又は動きと、予め登録されたテンプレート画像が示す人体の姿勢又は動きとの類似度を算出する類似度算出手段、
    いずれの前記テンプレート画像が示す人体の姿勢又は動きとの前記類似度も第1の閾値未満である人体の中の、いずれの前記テンプレート画像が示す人体の姿勢又は動きとも第1の類似条件を満たさない人体が写る前記画像内の箇所を特定する特定手段、
    加登録する前記テンプレート画像の候補として、前記特定された箇所に関する情報を出力する出力手段、
    として機能させ
    前記第1の類似条件は、
    前記類似度が第2の閾値以上かつ前記第1の閾値未満であること、
    各人体から検出される複数の前記キーポイントの中の一部の前記キーポイントに基づき算出された前記テンプレート画像が示す人体の姿勢又は動きとの前記類似度が第3の閾値以上であること、
    各人体から検出される複数の前記キーポイント各々に付与された重み付け値を考慮して算出された前記テンプレート画像が示す人体の姿勢又は動きとの前記類似度が第4の閾値以上であること、及び、
    前記テンプレート画像に含まれる複数のフレーム画像の中の所定割合以上の前記フレーム画像各々が示す人体の姿勢との類似度が第5の閾値以上である姿勢の人体各々を示す複数のフレーム画像を含むこと、
    の中の少なくとも1つを含むプログラム。
JP2023580044A 2022-02-14 2022-02-14 画像処理装置、画像処理方法、およびプログラム Active JP7743882B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2022/005689 WO2023152974A1 (ja) 2022-02-14 2022-02-14 画像処理装置、画像処理方法、およびプログラム

Publications (2)

Publication Number Publication Date
JPWO2023152974A1 JPWO2023152974A1 (ja) 2023-08-17
JP7743882B2 true JP7743882B2 (ja) 2025-09-25

Family

ID=87563985

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023580044A Active JP7743882B2 (ja) 2022-02-14 2022-02-14 画像処理装置、画像処理方法、およびプログラム

Country Status (3)

Country Link
US (1) US20250157078A1 (ja)
JP (1) JP7743882B2 (ja)
WO (1) WO2023152974A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20250098744A (ko) * 2023-12-22 2025-07-01 주식회사 모아이스 사용자의 동작을 분석하기 위한 방법 및 시스템

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013097610A (ja) 2011-11-01 2013-05-20 Canon Inc 情報処理装置、及びその制御方法
JP2013229394A (ja) 2012-04-24 2013-11-07 Hitachi High-Technologies Corp パターンマッチング方法及び装置
WO2015186436A1 (ja) 2014-06-06 2015-12-10 コニカミノルタ株式会社 画像処理装置、画像処理方法、および、画像処理プログラム
JP2016081286A (ja) 2014-10-16 2016-05-16 株式会社東芝 端末操作支援装置および端末操作支援方法
JP2021520016A (ja) 2018-11-01 2021-08-12 ベイジン センスタイム テクノロジー デベロップメント カンパニー, リミテッド データベース更新方法及び装置、電子機器、並びにコンピュータ記憶媒体
JP2021530815A (ja) 2018-07-27 2021-11-11 マジック リープ, インコーポレイテッドMagic Leap, Inc. 仮想キャラクタの姿勢空間変形のための姿勢空間次元低減

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013097610A (ja) 2011-11-01 2013-05-20 Canon Inc 情報処理装置、及びその制御方法
JP2013229394A (ja) 2012-04-24 2013-11-07 Hitachi High-Technologies Corp パターンマッチング方法及び装置
WO2015186436A1 (ja) 2014-06-06 2015-12-10 コニカミノルタ株式会社 画像処理装置、画像処理方法、および、画像処理プログラム
JP2016081286A (ja) 2014-10-16 2016-05-16 株式会社東芝 端末操作支援装置および端末操作支援方法
JP2021530815A (ja) 2018-07-27 2021-11-11 マジック リープ, インコーポレイテッドMagic Leap, Inc. 仮想キャラクタの姿勢空間変形のための姿勢空間次元低減
JP2021520016A (ja) 2018-11-01 2021-08-12 ベイジン センスタイム テクノロジー デベロップメント カンパニー, リミテッド データベース更新方法及び装置、電子機器、並びにコンピュータ記憶媒体

Also Published As

Publication number Publication date
WO2023152974A1 (ja) 2023-08-17
JPWO2023152974A1 (ja) 2023-08-17
US20250157078A1 (en) 2025-05-15

Similar Documents

Publication Publication Date Title
JP7409499B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP7416252B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP7775918B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP7726291B2 (ja) 画像処理装置、画像処理方法、およびプログラム
JP7743882B2 (ja) 画像処理装置、画像処理方法、およびプログラム
JP7806807B2 (ja) 検索装置、検索方法、およびプログラム
JP7697545B2 (ja) 画像処理装置、画像処理方法、およびプログラム
JP7658380B2 (ja) 画像選択装置、画像選択方法、及びプログラム
JP7435781B2 (ja) 画像選択装置、画像選択方法、及びプログラム
JP7435754B2 (ja) 画像選択装置、画像選択方法、及びプログラム
JP7485040B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP7364077B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP7491380B2 (ja) 画像選択装置、画像選択方法、及びプログラム
WO2022249278A1 (ja) 画像処理装置、画像処理方法、およびプログラム
JP7375921B2 (ja) 画像分類装置、画像分類方法、およびプログラム
JP7589744B2 (ja) 画像選択装置、画像選択方法、及びプログラム
JP7726290B2 (ja) 画像処理装置、画像処理方法、およびプログラム
JP7501621B2 (ja) 画像選択装置、画像選択方法、およびプログラム
JP7708225B2 (ja) 画像処理装置、画像処理方法、およびプログラム
WO2022249331A1 (ja) 画像処理装置、画像処理方法、およびプログラム
JP7687434B2 (ja) 行動分類装置、行動分類方法、およびプログラム
JP7708226B2 (ja) 画像処理装置、画像処理方法、およびプログラム
JP7302741B2 (ja) 画像選択装置、画像選択方法、およびプログラム
JP7468642B2 (ja) 画像処理装置、画像処理方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240731

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20250318

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20250430

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20250520

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20250624

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20250812

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20250825

R150 Certificate of patent or registration of utility model

Ref document number: 7743882

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150