JP7729466B2 - 画像分類装置、画像分類方法、及び、プログラム - Google Patents
画像分類装置、画像分類方法、及び、プログラムInfo
- Publication number
- JP7729466B2 JP7729466B2 JP2024507433A JP2024507433A JP7729466B2 JP 7729466 B2 JP7729466 B2 JP 7729466B2 JP 2024507433 A JP2024507433 A JP 2024507433A JP 2024507433 A JP2024507433 A JP 2024507433A JP 7729466 B2 JP7729466 B2 JP 7729466B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- target subject
- condition
- image classification
- images
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K29/00—Other apparatus for animal husbandry
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/215—Motion-based segmentation
Landscapes
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Environmental Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Animal Husbandry (AREA)
- Biodiversity & Conservation Biology (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
対象被写体が写っている画像を取得する画像取得手段と、
前記対象被写体の所定の状態が撮影されたと推定される条件である所定の状態の発生条件を満たしているか否かを判定する条件判定手段と、
対象被写体が写っている画像と、所定の状態の発生条件を満たしているか否かの判定結果と、前記対象被写体の所定の状態と、の関係が機械学習されたモデルを用いて、前記画像取得手段により取得された前記画像と前記条件判定手段により判定された判定結果から、前記対象被写体の所定の状態が写っている画像を分類する画像分類手段と、
前記画像及び前記分類の結果を出力する出力手段と、
を備え、
前記条件判定手段は、前記対象被写体の撮影者の心拍数に基づいて、前記所定の状態の発生条件を満たしているか否かを判定する。
対象被写体が写っている画像を取得する画像取得処理を行い、
前記対象被写体の所定の状態が撮影されたと推定される条件である所定の状態の発生条件を満たしているか否かを判定する条件判定処理を行い、
対象被写体が写っている画像と、所定の状態の発生条件を満たしているか否かの判定結果と、前記対象被写体の所定の状態と、の関係が機械学習されたモデルを用いて、前記画像取得処理により取得された前記画像と前記条件判定処理により判定された判定結果から、前記対象被写体の所定の状態が写っている画像を分類する画像分類処理を行い、
前記画像及び前記分類の結果を出力する出力処理を行い、
前記条件判定処理は、前記対象被写体の撮影者の心拍数に基づいて、前記所定の状態の発生条件を満たしているか否かを判定する。
対象被写体が写っている画像を取得する画像取得処理を行い、
前記対象被写体の所定の状態が撮影されたと推定される条件である所定の状態の発生条件を満たしているか否かを判定する条件判定処理を行い、
対象被写体が写っている画像と、所定の状態の発生条件を満たしているか否かの判定結果と、前記対象被写体の所定の状態と、の関係が機械学習されたモデルを用いて、前記画像取得処理により取得された前記画像と前記条件判定処理により判定された判定結果から、前記対象被写体の所定の状態が写っている画像を分類する画像分類処理を行い、
前記画像及び前記分類の結果を出力する出力処理を行い、
前記条件判定処理は、前記対象被写体の撮影者の心拍数に基づいて、前記所定の状態の発生条件を満たしているか否かを判定する処理をコンピュータに実行させる。
[全体構成]
図1は、本開示に係る画像分類装置を適用した画像分類システムの全体構成を示す。画像分類システム1は、サーバ200と、飼い主の使用するユーザ端末300とを含む。サーバ200は画像分類装置の一例である。サーバ200と飼い主のユーザ端末300とは無線通信可能である。
図2(A)は、サーバ200の構成を示すブロック図である。サーバ200は、主に、通信部211と、プロセッサ212と、メモリ213と、記録媒体214と、データベース(DB)215と、を備える。
図2(B)は、飼い主が使用するユーザ端末300の内部構成を示すブロック図である。ユーザ端末300は、例えば、スマートグラスやスマートフォンなどの端末装置である。ユーザ端末300は、通信部311と、プロセッサ312と、メモリ313と、表示部314と、カメラ315と、マイク316と、を備える。
図3は、サーバ200の機能構成を示すブロック図である。サーバ200は、機能的には、画像取得部411と、画像分類部412と、を含む。
次に、画像分類部412が用いる画像分類モデルの学習について説明する。画像分類モデルは、いわゆる教師あり学習によって生成される。図4は、画像分類モデルの学習方法を示すブロック図であり、学習データ511と、学習装置512と、を含む。
画像分類部412は、画像分類モデルを用いて、画像がGOODショットであるか否かを推定する。具体的に、画像分類モデルは、入力された画像がGOODショットであるか否かを推定し、その画像がGOODショットである確率を示すスコア(「GOODショットスコア」と呼ぶ。)と、その画像がBADショットである確率を示すスコア(「BADショットスコア」と呼ぶ。)を算出する。画像分類モデルは、例えば、GOODショットスコアとBADショットスコアの合計が「1」となるように各スコアを算出する。そして、画像分類モデルは、GOODショットスコアと、BADショットスコアを予め決められた所定の閾値THと比較し、閾値THより大きいスコアを有する方を分類結果として採用する。例えば、ある画像について、画像分類モデルは、GOODショットスコア「0.8」、BADショットスコア「0.2」を算出し、予め決められた閾値THと比較する。閾値THを「0.5」とすると、画像分類モデルは、その画像をGOODショットであると推定する。
次に、上記のような画像分類を行う画像分類処理について説明する。図5は、サーバ200において行われる画像分類処理のフローチャートである。この処理は、図2に示すプロセッサ212が予め用意されたプログラムを実行し、図3に示す各要素として動作することにより実現される。
次に、第1実施形態の変形例を説明する。以下の変形例は、適宜組み合わせて第1実施形態に適用することができる。
(変形例1)
上記の第1実施形態では、サーバ200は、撮影動画から抽出された抽出画像に基づいて画像を分類している。サーバ200は、上記に加え、所定の状態発生条件を満たしたか否かを判定し、判定結果を用いて画像を分類してもよい。所定の状態発生条件とは、GOODショットが撮影されたと推定される条件であり、以下、「GOODショットの発生条件」とも呼ぶ。GOODショットの発生条件は、例えば、撮影者の生体情報や行動情報などに基づいて決定される。
上記の第1実施形態により分類されたGOODショットを基に、画像分類モデルの再学習用の教師データを作成してもよい。具体的に、ペットの飼い主は、サーバ200が分類したGOODショットの要否を判断する。サーバ200は、ペットの飼い主が必要と判断した画像はGOODショットであるとする。一方、サーバ200は、ペットの飼い主が不要と判断した画像はBADショットであるとし、ラベルの変更を行う。そして、サーバ200は、上記のGOODショットの画像データ及びBADショットの画像データを学習データとし、画像分類モデルの再学習を行う。これにより、サーバ200は、より飼い主の好みに合ったGOODショットを分類することが可能となる。
上記の第1実施形態では、ユーザ端末300はカメラを常時録画モードにし、撮影動画をサーバ200へ送信している。その代わりに、ユーザ端末300は、カメラに被写体が映ったタイミングで録画を開始し、カメラに被写体が映らなくなったタイミングで録画を終了し、録画開始から録画終了までの撮影動画をサーバ200へ送信してもよい。具体的に、ユーザ端末300は、カメラに映っている画像を所定のタイミング毎にキャプチャし、サーバ200へ送信する。サーバ200は、予め作成した画像認識モデルなどに基づいて、ペットがユーザ端末300のカメラに映ったか否かを判定する。ペットがユーザ端末300のカメラに映った場合は、サーバ200は、ユーザ端末300を録画モードにし、録画を開始する。その後、ペットがユーザ端末300のカメラに映らなくなった場合は、サーバ200は、ユーザ端末300の録画モードを終了する。これにより、ユーザ端末300からサーバ200へ送信する撮影動画のデータ量を削減することができる。
上記の第1実施形態では、サーバ200は、ペットを被写体とした撮影動画に基づいて、GOODショットを分類しているが、被写体はペットに限らず、例えば、子供など、シャッターチャンスを逃す機会の多い別の被写体であってもよい。
上記の第1実施形態では、基本的にユーザ端末300により取得された情報がそのままサーバ200へ送信され、サーバ200が受信した情報に基づいてGOODショットを分類している。その代わりに、GOODショットを分類するための処理をユーザ端末300が行い、その処理結果をサーバ200へ送信することとしてもよい。もしくは、サーバ200を使用せず、GOODショットを分類するための処理及び処理結果の保存をユーザ端末300で行うこととしてもよい。これにより、ユーザ端末300からサーバ200への通信負荷、及び、サーバ200における処理負荷を軽減することができる。これらの場合、ユーザ端末300は画像分類装置の一例である。
図7は、第2実施形態の画像分類装置50の機能構成を示すブロック図である。第2実施形態の画像分類装置50は、画像取得手段51と、画像分類手段52と、出力手段53とを備える。
対象被写体が写っている画像を取得する画像取得手段と、
対象被写体が写っている画像と前記対象被写体の所定の状態との関係が機械学習されたモデルを用いて、前記画像から、前記対象被写体の所定の状態が写っている画像を分類する画像分類手段と、
前記画像及び前記分類の結果を出力する出力手段と、
を備える画像分類装置。
前記画像分類手段は、前記対象被写体の所定の部位が写っている画像を分類する付記1に記載の画像分類装置。
前記画像分類手段は、前記対象被写体が所定の動作を行っている画像を分類する付記1又は2に記載の画像分類装置。
前記所定の状態の発生条件を満たしているか否かを判定する条件判定手段を備え、
前記画像分類手段は、前記画像及び前記発生条件の判定結果に基づいて、前記画像を分類する付記1乃至3のいずれか一項に記載の画像分類装置。
前記条件判定手段は、前記対象被写体の撮影者の視線方向に基づいて、前記発生条件を満たしているか否かを判定する付記4に記載の画像分類装置。
前記条件判定手段は、前記対象被写体の撮影者の心拍数に基づいて、前記発生条件を満たしているか否かを判定する付記4又は5に記載の画像分類装置。
前記条件判定手段は、前記対象被写体の撮影者の音声に基づいて、前記発生条件を満たしているか否かを判定する付記4乃至6のいずれか一項に記載の画像分類装置。
前記条件判定手段は、撮影者の音声を検出し、前記対象被写体が撮影者の音声に反応して行動したことを前記発生条件とする付記4乃至7のいずれか一項に記載の画像分類装置。
前記画像取得手段は、前記対象被写体が端末装置のカメラに写った場合に、対象被写体が写っている画像の取得を開始し、前記対象被写体が前記端末装置のカメラに写らなくなった場合に、対象被写体が写っている画像の取得を終了する付記1乃至8のいずれか一項に記載の画像分類装置。
前記出力手段が出力した結果のうち、ユーザにより要否判断がされた画像を学習データとして用いて前記モデルの再学習を行う学習手段を備える付記1乃至9のいずれか一項に記載の画像分類装置。
対象被写体が写っている画像を取得し、
対象被写体が写っている画像と前記対象被写体の所定の状態との関係が機械学習されたモデルを用いて、前記画像から、前記対象被写体の所定の状態が写っている画像を分類し、
前記画像及び前記分類の結果を出力する画像分類方法。
対象被写体が写っている画像を取得し、
対象被写体が写っている画像と前記対象被写体の所定の状態との関係が機械学習されたモデルを用いて、前記画像から、前記対象被写体の所定の状態が写っている画像を分類し、
前記画像及び前記分類の結果を出力する処理をコンピュータに実行させるプログラムを記録した記録媒体。
215 データベース(DB)
300 ユーザ端末
411 画像取得部
412 画像分類部
413 条件判定部
511 学習データ
512 学習装置
Claims (8)
- 対象被写体が写っている画像を取得する画像取得手段と、
前記対象被写体の所定の状態が撮影されたと推定される条件である所定の状態の発生条件を満たしているか否かを判定する条件判定手段と、
対象被写体が写っている画像と、所定の状態の発生条件を満たしているか否かの判定結果と、前記対象被写体の所定の状態と、の関係が機械学習されたモデルを用いて、前記画像取得手段により取得された前記画像と前記条件判定手段により判定された判定結果から、前記対象被写体の所定の状態が写っている画像を分類する画像分類手段と、
前記画像及び前記分類の結果を出力する出力手段と、
を備え、
前記条件判定手段は、前記対象被写体の撮影者の心拍数に基づいて、前記所定の状態の発生条件を満たしているか否かを判定する画像分類装置。 - 前記画像分類手段は、前記対象被写体の所定の部位が写っている画像を分類する請求項1に記載の画像分類装置。
- 前記画像分類手段は、前記対象被写体が所定の動作を行っている画像を分類する請求項1又は2に記載の画像分類装置。
- 前記条件判定手段は、前記対象被写体の撮影者の視線方向に基づいて、前記発生条件を満たしているか否かを判定する請求項1乃至3のいずれか一項に記載の画像分類装置。
- 前記条件判定手段は、前記対象被写体の撮影者の音声に基づいて、前記発生条件を満たしているか否かを判定する請求項1乃至4のいずれか一項に記載の画像分類装置。
- 前記条件判定手段は、撮影者の音声を検出し、前記対象被写体が撮影者の音声に反応して行動したことを前記発生条件とする請求項1乃至5のいずれか一項に記載の画像分類装置。
- コンピュータにより実行される画像分類方法であって、
対象被写体が写っている画像を取得する画像取得処理を行い、
前記対象被写体の所定の状態が撮影されたと推定される条件である所定の状態の発生条件を満たしているか否かを判定する条件判定処理を行い、
対象被写体が写っている画像と、所定の状態の発生条件を満たしているか否かの判定結果と、前記対象被写体の所定の状態と、の関係が機械学習されたモデルを用いて、前記画像取得処理により取得された前記画像と前記条件判定処理により判定された判定結果から、前記対象被写体の所定の状態が写っている画像を分類する画像分類処理を行い、
前記画像及び前記分類の結果を出力する出力処理を行い、
前記条件判定処理は、前記対象被写体の撮影者の心拍数に基づいて、前記所定の状態の発生条件を満たしているか否かを判定する画像分類方法。 - 対象被写体が写っている画像を取得する画像取得処理を行い、
前記対象被写体の所定の状態が撮影されたと推定される条件である所定の状態の発生条件を満たしているか否かを判定する条件判定処理を行い、
対象被写体が写っている画像と、所定の状態の発生条件を満たしているか否かの判定結果と、前記対象被写体の所定の状態と、の関係が機械学習されたモデルを用いて、前記画像取得処理により取得された前記画像と前記条件判定処理により判定された判定結果から、前記対象被写体の所定の状態が写っている画像を分類する画像分類処理を行い、
前記画像及び前記分類の結果を出力する出力処理を行い、
前記条件判定処理は、前記対象被写体の撮影者の心拍数に基づいて、前記所定の状態の発生条件を満たしているか否かを判定する処理をコンピュータに実行させるプログラム。
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| PCT/JP2022/012704 WO2023175931A1 (ja) | 2022-03-18 | 2022-03-18 | 画像分類装置、画像分類方法、及び、記録媒体 |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JPWO2023175931A1 JPWO2023175931A1 (ja) | 2023-09-21 |
| JPWO2023175931A5 JPWO2023175931A5 (ja) | 2024-11-14 |
| JP7729466B2 true JP7729466B2 (ja) | 2025-08-26 |
Family
ID=88022966
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2024507433A Active JP7729466B2 (ja) | 2022-03-18 | 2022-03-18 | 画像分類装置、画像分類方法、及び、プログラム |
Country Status (2)
| Country | Link |
|---|---|
| JP (1) | JP7729466B2 (ja) |
| WO (1) | WO2023175931A1 (ja) |
Citations (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2009059257A (ja) | 2007-09-03 | 2009-03-19 | Sony Corp | 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム |
| JP2009259122A (ja) | 2008-04-18 | 2009-11-05 | Canon Inc | 画像処理装置、画像処理方法および画像処理プログラム |
| WO2017212958A1 (ja) | 2016-06-10 | 2017-12-14 | ソニー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
| JP2019047234A (ja) | 2017-08-31 | 2019-03-22 | ソニーセミコンダクタソリューションズ株式会社 | 情報処理装置、情報処理方法、およびプログラム |
| JP2020170916A (ja) | 2019-04-02 | 2020-10-15 | パナソニックIpマネジメント株式会社 | 情報処理装置、及び、情報処理方法 |
| JP2021064825A (ja) | 2019-10-10 | 2021-04-22 | Kddi株式会社 | 撮像装置、学習装置、制御方法、学習方法、及びコンピュータプログラム |
| WO2022050093A1 (ja) | 2020-09-01 | 2022-03-10 | パナソニックIpマネジメント株式会社 | ペット状況推定システム、ペットカメラ、サーバ、ペット状況推定方法、及びプログラム |
Family Cites Families (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH11205773A (ja) * | 1998-01-20 | 1999-07-30 | Fujitsu General Ltd | 監視映像記録方式 |
-
2022
- 2022-03-18 JP JP2024507433A patent/JP7729466B2/ja active Active
- 2022-03-18 WO PCT/JP2022/012704 patent/WO2023175931A1/ja not_active Ceased
Patent Citations (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2009059257A (ja) | 2007-09-03 | 2009-03-19 | Sony Corp | 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム |
| JP2009259122A (ja) | 2008-04-18 | 2009-11-05 | Canon Inc | 画像処理装置、画像処理方法および画像処理プログラム |
| WO2017212958A1 (ja) | 2016-06-10 | 2017-12-14 | ソニー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
| JP2019047234A (ja) | 2017-08-31 | 2019-03-22 | ソニーセミコンダクタソリューションズ株式会社 | 情報処理装置、情報処理方法、およびプログラム |
| JP2020170916A (ja) | 2019-04-02 | 2020-10-15 | パナソニックIpマネジメント株式会社 | 情報処理装置、及び、情報処理方法 |
| JP2021064825A (ja) | 2019-10-10 | 2021-04-22 | Kddi株式会社 | 撮像装置、学習装置、制御方法、学習方法、及びコンピュータプログラム |
| WO2022050093A1 (ja) | 2020-09-01 | 2022-03-10 | パナソニックIpマネジメント株式会社 | ペット状況推定システム、ペットカメラ、サーバ、ペット状況推定方法、及びプログラム |
Also Published As
| Publication number | Publication date |
|---|---|
| JPWO2023175931A1 (ja) | 2023-09-21 |
| WO2023175931A1 (ja) | 2023-09-21 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US20240215882A1 (en) | Systems and Methods for Using Mobile and Wearable Video Capture and Feedback Plat-Forms for Therapy of Mental Disorders | |
| US9875445B2 (en) | Dynamic hybrid models for multimodal analysis | |
| WO2024253769A1 (en) | Ai highlight detection using cascaded filtering of captured content | |
| CN121285841A (zh) | 在共享视频上训练的ai亮点检测 | |
| JP7729466B2 (ja) | 画像分類装置、画像分類方法、及び、プログラム | |
| US20230113158A1 (en) | Methods and systems for personalized coloring template | |
| JP2026512673A (ja) | 年齢推定のためのシステムおよび方法 | |
| CN120260080B (zh) | 宠物姿态及表情跟踪方法、装置、电子设备及存储介质 | |
| JP2026051501A (ja) | システム | |
| JP2026033421A (ja) | システム | |
| JP2026038747A (ja) | システム | |
| JP2025048974A (ja) | システム | |
| JP2026029812A (ja) | システム | |
| JP2026018474A (ja) | システム | |
| JP2026029718A (ja) | システム | |
| JP2026024860A (ja) | システム | |
| JP2026018573A (ja) | システム | |
| JP2026033409A (ja) | システム | |
| JP2026051195A (ja) | システム | |
| JP2026038638A (ja) | システム | |
| CN121255016A (zh) | 电子表多模态ai交互控制健身器械方法及系统 | |
| JP2026024532A (ja) | システム | |
| JP2026033192A (ja) | システム | |
| JP2026044891A (ja) | システム | |
| JP2026044666A (ja) | システム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240909 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240909 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20250513 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250626 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250715 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250728 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7729466 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |