Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP7729466B2 - 画像分類装置、画像分類方法、及び、プログラム - Google Patents
[go: Go Back, main page]

JP7729466B2 - 画像分類装置、画像分類方法、及び、プログラム - Google Patents

画像分類装置、画像分類方法、及び、プログラム

Info

Publication number
JP7729466B2
JP7729466B2 JP2024507433A JP2024507433A JP7729466B2 JP 7729466 B2 JP7729466 B2 JP 7729466B2 JP 2024507433 A JP2024507433 A JP 2024507433A JP 2024507433 A JP2024507433 A JP 2024507433A JP 7729466 B2 JP7729466 B2 JP 7729466B2
Authority
JP
Japan
Prior art keywords
image
target subject
condition
image classification
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2024507433A
Other languages
English (en)
Other versions
JPWO2023175931A1 (ja
JPWO2023175931A5 (ja
Inventor
尊裕 中川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2023175931A1 publication Critical patent/JPWO2023175931A1/ja
Publication of JPWO2023175931A5 publication Critical patent/JPWO2023175931A5/ja
Application granted granted Critical
Publication of JP7729466B2 publication Critical patent/JP7729466B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K29/00Other apparatus for animal husbandry
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/215Motion-based segmentation

Landscapes

  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Environmental Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Animal Husbandry (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本開示は、撮影した画像を分類する技術に関する。
愛玩動物(以下、「ペット」と呼ぶ。)などを被写体とする写真や動画は膨大な量になることがあり、膨大な量の写真や動画の中には、ペットが後ろを向いているなど、ペットの飼い主の好みに合わない写真や動画が含まれていることがある。ペットの飼い主が、このような膨大な写真や動画の中から、好みの写真や動画を分類していくことは手間である。例えば、特許文献1では、被写体を撮像した複数の画像データから被写体の動作を識別し、分類する装置を記載している。
特開2005-267604号公報
しかし、特許文献1によっても、ペットの飼い主が好む写真や動画を分類することは難しい。
本開示の1つの目的は、複数の画像からユーザが好む画像を分類することができる画像分類装置を提供することにある。
上記の課題を解決するため、本開示の一つの観点では、画像分類装置は、
対象被写体が写っている画像を取得する画像取得手段と、
前記対象被写体の所定の状態が撮影されたと推定される条件である所定の状態の発生条件を満たしているか否かを判定する条件判定手段と、
対象被写体が写っている画像と、所定の状態の発生条件を満たしているか否かの判定結果と、前記対象被写体の所定の状態との関係が機械学習されたモデルを用いて、前記画像取得手段により取得された前記画像と前記条件判定手段により判定された判定結果から、前記対象被写体の所定の状態が写っている画像を分類する画像分類手段と、
前記画像及び前記分類の結果を出力する出力手段と、
を備え、
前記条件判定手段は、前記対象被写体の撮影者の心拍数に基づいて、前記所定の状態の発生条件を満たしているか否かを判定する。
本発明の他の観点では、コンピュータにより実行される画像分類方法は、
対象被写体が写っている画像を取得する画像取得処理を行い
前記対象被写体の所定の状態が撮影されたと推定される条件である所定の状態の発生条件を満たしているか否かを判定する条件判定処理を行い、
対象被写体が写っている画像と、所定の状態の発生条件を満たしているか否かの判定結果と、前記対象被写体の所定の状態との関係が機械学習されたモデルを用いて、前記画像取得処理により取得された前記画像と前記条件判定処理により判定された判定結果から、前記対象被写体の所定の状態が写っている画像を分類する画像分類処理を行い
前記画像及び前記分類の結果を出力する出力処理を行い
前記条件判定処理は、前記対象被写体の撮影者の心拍数に基づいて、前記所定の状態の発生条件を満たしているか否かを判定する。
本発明のさらに他の観点では、プログラムは、
対象被写体が写っている画像を取得する画像取得処理を行い
前記対象被写体の所定の状態が撮影されたと推定される条件である所定の状態の発生条件を満たしているか否かを判定する条件判定処理を行い、
対象被写体が写っている画像と、所定の状態の発生条件を満たしているか否かの判定結果と、前記対象被写体の所定の状態との関係が機械学習されたモデルを用いて、前記画像取得処理により取得された前記画像と前記条件判定処理により判定された判定結果から、前記対象被写体の所定の状態が写っている画像を分類する画像分類処理を行い
前記画像及び前記分類の結果を出力する出力処理を行い
前記条件判定処理は、前記対象被写体の撮影者の心拍数に基づいて、前記所定の状態の発生条件を満たしているか否かを判定する処理をコンピュータに実行させる。
本開示によれば、複数の画像からユーザが好む画像を分類することが可能となる。
第1実施形態に係る画像分類システムの全体構成を示す。 サーバ及びユーザ端末の構成を示すブロック図である。 サーバの機能構成を示すブロック図である。 学習装置の機能構成を示すブロック図である。 画像分類システムのフローチャートである。 第1実施形態の変形例1の機能構成を示すブロック図である。 第2実施形態の情報処理装置の機能構成を示すブロック図である。 第2実施形態の情報処理装置による処理のフローチャートである。
<第1実施形態>
[全体構成]
図1は、本開示に係る画像分類装置を適用した画像分類システムの全体構成を示す。画像分類システム1は、サーバ200と、飼い主の使用するユーザ端末300とを含む。サーバ200は画像分類装置の一例である。サーバ200と飼い主のユーザ端末300とは無線通信可能である。
基本的な動作として、サーバ200は、飼い主のユーザ端末300から送信された動画を基に、ペットの所定の状態が写っている画像を取得する。具体的に、飼い主は、ペットPと遊ぶときなどに、ユーザ端末300を常時録画モードにし、動画を撮影する。そして、ユーザ端末300は撮影した動画(以下、「撮影動画」とも呼ぶ。)をサーバ200へ送信する。サーバ200は、ユーザ端末300の撮影動画からフレーム毎に静止画を抽出し、AI(Artificial Intelligence)の画像解析によって、ペットの所定の状態が写っている画像か否かを分類する。ここで、ペットの所定の状態が写っている画像(以下、「GOODショット」とも呼ぶ。)とは、例えば、ペットの顔が写っている画像、ペットがジャンプしている画像、ペットが遊んでいる画像など、ペットの飼い主が良いと感じるペットの画像である。そして、サーバ200は、ユーザ端末300の撮影動画から抽出した静止画(以下、「抽出画像」とも呼ぶ。)に、GOODショットか否かの分類結果を付し、飼い主と対応付けてデータベースへ保存する。その後、飼い主は、ユーザ端末300もしくは、ユーザ端末300以外の端末からサーバ200へアクセスし、GOODショットのみをスライドショーなどで確認する。これにより、飼い主は、ペットのシャッターチャンスを逃すことなく、ペットの画像を取得することが可能になる。また、飼い主は、スマートグラスをユーザ端末300として用いることで、ペットと触れ合いながら、GOODショットを取得することが可能になる。なお、スマートグラスの代わりに、AR(Augmented Reality)グラスやMR(Mixed Reality)グラス、VR(Virtual Reality)グラスなど、他のメガネ型のウェアラブル端末を用いてもよい。
なお、GOODショットとして分類される画像は静止画に限らず、動画でもよい。この場合、サーバ200は、ユーザ端末300の撮影動画から所定の時間間隔で動画を抽出する。そして、サーバ200は、動画にGOODショットが含まれているか否かを分類し、抽出した動画(同様に「抽出画像」とも呼ぶ。)にGOODショットか否かの分類結果を付して保存する。
[サーバ]
図2(A)は、サーバ200の構成を示すブロック図である。サーバ200は、主に、通信部211と、プロセッサ212と、メモリ213と、記録媒体214と、データベース(DB)215と、を備える。
通信部211は、外部装置との間でデータの送受信を行う。具体的に、通信部211は、飼い主のユーザ端末300との間で情報を送受信する。
プロセッサ212は、CPU(Central Processing Unit)などのコンピュータであり、予め用意されたプログラムを実行することにより、サーバ200の全体を制御する。なお、プロセッサ212は、GPU(Graphics Processing Unit)、FPGA(Field-Programmable Gate Array)、DSP(Demand-Side Platform)、ASIC(Application Specific Integrated Circuit)などであってもよい。
メモリ213は、ROM(Read Only Memory)、RAM(Random Access Memory)などにより構成される。メモリ213は、プロセッサ212による各種の処理の実行中に作業メモリとしても使用される。また、メモリ213は、プロセッサ212の制御に基づき、ユーザ端末300が撮影した一連の動画を一時的に記憶する。この動画は、例えば、飼い主の識別情報、及び、タイムスタンプの情報等と関連付けられてメモリ213に記憶される。
記録媒体214は、ディスク状記録媒体、半導体メモリなどの不揮発性で非一時的な記録媒体であり、サーバ200に対して着脱可能に構成される。記録媒体214は、プロセッサ212が実行する各種のプログラムを記録している。
データベース(DB)215は、GOODショットか否かの分類結果が付された抽出画像を記憶する。DB215は、サーバ200に接続又は内蔵されたハードディスクなどの外部記憶装置を含んでもよく、着脱自在なフラッシュメモリなどの記憶媒体を含んでもよい。なお、DB215をサーバ200に備える代わりに、外部のサーバなどにDB215を設け、通信により当該サーバへGOODショットか否かの分類結果が付された抽出画像を記憶するようにしてもよい。
なお、サーバ200は、管理者などが指示や入力を行うためのキーボード、マウスなどの入力部、及び、液晶ディスプレイなどの表示部を備えていてもよい。
[ユーザ端末]
図2(B)は、飼い主が使用するユーザ端末300の内部構成を示すブロック図である。ユーザ端末300は、例えば、スマートグラスやスマートフォンなどの端末装置である。ユーザ端末300は、通信部311と、プロセッサ312と、メモリ313と、表示部314と、カメラ315と、マイク316と、を備える。
通信部311は、外部装置との間でデータの送受信を行う。具体的に、通信部311は、サーバ200との間で情報を送受信する。
プロセッサ312は、CPUなどのコンピュータであり、予め用意されたプログラムを実行することにより、ユーザ端末300の全体を制御する。なお、プロセッサ312は、GPU、FPGA、DSP、ASICなどであってもよい。プロセッサ312は、予め用意されたプログラムを実行することにより、カメラ315により撮影した動画をサーバ200へ送信する。
メモリ313は、ROM、RAMなどにより構成される。メモリ313は、プロセッサ312により実行される各種のプログラムを記憶する。また、メモリ313は、プロセッサ312による各種の処理の実行中に作業メモリとしても使用される。カメラ315により撮影された動画は、メモリ313に記憶された後、サーバ200へ送信される。表示部314は、例えば液晶表示装置などであり、カメラ315により撮影された動画や、サーバ200に保存されているGOODショットの抽出画像などを表示する。
カメラ315には、ユーザの視界を撮影するカメラ(「アウトカメラ」とも呼ぶ。)や、ユーザの眼球を撮影するカメラ(「アイカメラ」とも呼ぶ。)が含まれる。アウトカメラは、ユーザ端末300の外側に搭載される。アウトカメラは、ペットなどの被写体を含むユーザの視界を撮影し、サーバ200へ送信する。これにより、サーバ200は、ペットなどの被写体の画像を取得することができる。アイカメラは、ユーザの眼球を撮影するようユーザ端末300の内側に搭載される。アイカメラは、ユーザの眼球を撮影し、プロセッサ312へ送信する。プロセッサ312は、アイカメラが撮影したユーザの眼球の画像を基に、ユーザの視線の動きなどを検出する。これにより、ユーザ端末300は、ユーザの視線方向などの情報を取得することができる。
マイク316は、ユーザの声や周辺の音を集音し、サーバ200へ送信する。サーバ200は、例えば、ユーザの声やペットの鳴き声に基づいて、ユーザが所定の言葉を発したことや、ユーザがペットに指示したことや号令をかけたことを推定することができる。
[機能構成]
図3は、サーバ200の機能構成を示すブロック図である。サーバ200は、機能的には、画像取得部411と、画像分類部412と、を含む。
サーバ200には、ユーザ端末300の撮影動画が入力される。ユーザ端末300の撮影動画は、画像取得部411に入力される。画像取得部411は、ユーザ端末300の撮影動画から静止画又は動画を抽出画像として抽出する。画像取得部411は、抽出画像を画像分類部412へ出力する。
画像分類部412は、予め用意された画像認識モデルなどを用いて、画像取得部411から取得した抽出画像がGOODショットであるか否かを分類する。この画像認識モデルは、画像がGOODショットであるか否かを分類するように予め学習された機械学習モデルであり、以下、「画像分類モデル」とも呼ぶ。画像分類部412は、画像分類モデルによって抽出画像がGOODショットであると分類された場合は、抽出画像にGOODショットであることを示す付加情報を付する。一方、画像分類部412は、画像分類モデルによって抽出画像がGOODショットでない、すなわちBADショットと分類された場合は、抽出画像にBADショットであることを示す付加情報を付する。BADショットとは、GOODショット以外の画像であり、例えば、ペットの顔が写っていない画像などを言う。画像分類部412は、付加情報を付した抽出画像をDB215へ出力する。
[画像分類モデルの学習]
次に、画像分類部412が用いる画像分類モデルの学習について説明する。画像分類モデルは、いわゆる教師あり学習によって生成される。図4は、画像分類モデルの学習方法を示すブロック図であり、学習データ511と、学習装置512と、を含む。
学習データ511は、GOODショットであるか否かを事前にラベル付けした画像データ(以下、「教師データ」とも呼ぶ)である。画像データへのラベル付けは、ペットの所定の部位が写っているか、ペットが所定の動作をしているか、などを基準に行われる。ペットの所定の部位とは、ペットの顔などを指す。例えば、ペットの顔が写っている画像には、GOODショットのラベルが付与される。一方、ペットが写っていない画像や、ペットが後ろを向いている画像、ペットの胴体や脚しか写っていない画像には、BADショットのラベルが付与される。また、ペットの所定の動作とは、ペットの人目を惹くような動作などを指す。例えば、ペットがジャンプしている画像やペットが道具をくわえている画像にはGOODショットのラベルが付与される。
なお、ペットの飼い主が、複数のペットの画像をGOODショットか否かに選別し、その結果をラベル付けした画像を教師データとして用いてもよい。これにより、よりペットの飼い主の好みに合った画像を分類することが可能な画像分類モデルを生成することができる。
また、ペットの飼い主や第三者がSNS(Social Network Service)上に投稿した動物の画像を収集し、教師データとして用いてもよい。この場合、ペットの飼い主や第三者がSNS上に投稿した画像にはGOODショットのラベル付けが行われる。これにより、教師データの量が増え、より精度の高い画像分類モデルを生成することが可能となる。
学習装置512は、学習データ511をもとに、GOODショットのパターンを学習し、学習済モデルとして画像分類モデルを出力する。これにより、ペットが写っている画像と、GOODショットに該当するペットの状態との関係を学習した画像分類モデルが生成される。
[画像分類モデルによる分類]
画像分類部412は、画像分類モデルを用いて、画像がGOODショットであるか否かを推定する。具体的に、画像分類モデルは、入力された画像がGOODショットであるか否かを推定し、その画像がGOODショットである確率を示すスコア(「GOODショットスコア」と呼ぶ。)と、その画像がBADショットである確率を示すスコア(「BADショットスコア」と呼ぶ。)を算出する。画像分類モデルは、例えば、GOODショットスコアとBADショットスコアの合計が「1」となるように各スコアを算出する。そして、画像分類モデルは、GOODショットスコアと、BADショットスコアを予め決められた所定の閾値THと比較し、閾値THより大きいスコアを有する方を分類結果として採用する。例えば、ある画像について、画像分類モデルは、GOODショットスコア「0.8」、BADショットスコア「0.2」を算出し、予め決められた閾値THと比較する。閾値THを「0.5」とすると、画像分類モデルは、その画像をGOODショットであると推定する。
[画像分類処理]
次に、上記のような画像分類を行う画像分類処理について説明する。図5は、サーバ200において行われる画像分類処理のフローチャートである。この処理は、図2に示すプロセッサ212が予め用意されたプログラムを実行し、図3に示す各要素として動作することにより実現される。
まず、画像取得部411は、ユーザ端末300から撮影動画を取得する。そして、画像取得部411は、撮影動画から画像(静止画又は動画)を取得する(ステップS11)。次に、画像分類部412は、画像取得部411が取得した画像が、GOODショットか否かを分類する(ステップS12)。具体的には、画像分類部412は、その画像がGOODショットである確率を示すスコアと、その画像がBADショットである確率を示すスコアとを算出する。画像分類部412は、算出された各スコアを閾値THと比較し、その画像がGOODショットであるかBADショットであるかを分類する。
次に、画像分類部412は、画像取得部411が取得した画像に分類結果を付して、データベース(DB)215に保存する(ステップS13)。例えば、画像分類部412は、GOODショットであると分類された画像には「1」、BADショットであると分類された画像には「0」などのフラグを付して、DB215に保存する。そして、画像分類処理は終了する。
これにより、ユーザが撮影した膨大な画像から、ユーザの好みに合ったGOODショットの画像が抽出され、サーバ200のDB215内に蓄積される。ユーザは、サーバ200にアクセスし、DB215に保存されているGOODショットの画像を閲覧することができる。また、ユーザは、サーバ200からGOODショットの画像をダウンロードして、ユーザ端末300などの端末装置に保存することができる。
[変形例]
次に、第1実施形態の変形例を説明する。以下の変形例は、適宜組み合わせて第1実施形態に適用することができる。
(変形例1)
上記の第1実施形態では、サーバ200は、撮影動画から抽出された抽出画像に基づいて画像を分類している。サーバ200は、上記に加え、所定の状態発生条件を満たしたか否かを判定し、判定結果を用いて画像を分類してもよい。所定の状態発生条件とは、GOODショットが撮影されたと推定される条件であり、以下、「GOODショットの発生条件」とも呼ぶ。GOODショットの発生条件は、例えば、撮影者の生体情報や行動情報などに基づいて決定される。
具体的に、図6は、変形例1のサーバ200aの機能構成を示す。図示のように、変形例1では、サーバ200aに条件判定部413を設ける。条件判定部413は、ユーザ端末300から、撮影者の生体情報などをタイムスタンプと共に取得する。そして、条件判定部413は、予め学習された学習済みのモデルを用いて、撮影者の生体情報などが所定の条件を満たしているか否かを判定し、判定結果を画像分類部412へ出力する。
撮影者の生体情報は、視線や音声、心拍数などを含む。撮影者の生体情報は、ユーザ端末300によって取得される。ユーザ端末300は、ユーザ端末300に搭載されたカメラ、マイク、センサなどから、生体情報を取得してもよいし、Bluetooth(登録商標)やWi-Fi(登録商標)などにより、外部機器と無線通信を行い、外部機器から生体情報を取得してもよい。また、所定の条件には、例えば、撮影者がペットに視線を向けていること、撮影者が所定の閾値以上の大きさの声を発したこと、撮影者が「いいね」などの所定の言葉を発したこと、撮影者の心拍数が所定の閾値以上の高さとなったこと、などが挙げられる。撮影者の生体情報が上記の条件を満たす場合は、その時点及びその前後の時点において、GOODショットが撮影されている可能性が高いと推定される。なお、条件判定部413は、撮影者の生体情報が所定の条件を満たした時点に加え、その前後の時点においても所定の条件を満たしていると判定し、画像分類部412へ判定結果を出力してもよい。
また、条件判定部413は、撮影者やペットの行動情報に基づいて、GOODショットの発生条件を満たしたか否かの判定を行ってもよい。例えば、撮影者が合図をし、ペットが合図に従って行動した場合や、撮影者が指示や号令をかけ、ペットが指示や号令に従って行動した場合は、条件判定部413は、GOODショットの発生条件を満たしていると判定し、判定結果を画像分類部412へ出力する。なお、撮影者やペットの行動情報は、ユーザ端末300に搭載されたマイク、センサなどから取得してもよいし、ユーザ端末300の撮影動画から取得してもよい。
画像分類部412は、画像取得部411から入力された抽出画像及び、条件判定部413から入力された判定結果に基づいて、抽出画像がGOODショットか否かを分類する。この場合、画像分類部412が使用する画像分類モデルは、抽出画像及び判定結果に基づいてGOODショットか否かを推定するように予め学習された学習済みのモデルとする。
上記のように、撮影者の生体情報や行動情報などを考慮してGOODショットか否かの分類をすることで、撮影者が良いと感じる瞬間を撮影したペットの画像を高精度で取得することが可能になる。
(変形例2)
上記の第1実施形態により分類されたGOODショットを基に、画像分類モデルの再学習用の教師データを作成してもよい。具体的に、ペットの飼い主は、サーバ200が分類したGOODショットの要否を判断する。サーバ200は、ペットの飼い主が必要と判断した画像はGOODショットであるとする。一方、サーバ200は、ペットの飼い主が不要と判断した画像はBADショットであるとし、ラベルの変更を行う。そして、サーバ200は、上記のGOODショットの画像データ及びBADショットの画像データを学習データとし、画像分類モデルの再学習を行う。これにより、サーバ200は、より飼い主の好みに合ったGOODショットを分類することが可能となる。
(変形例3)
上記の第1実施形態では、ユーザ端末300はカメラを常時録画モードにし、撮影動画をサーバ200へ送信している。その代わりに、ユーザ端末300は、カメラに被写体が映ったタイミングで録画を開始し、カメラに被写体が映らなくなったタイミングで録画を終了し、録画開始から録画終了までの撮影動画をサーバ200へ送信してもよい。具体的に、ユーザ端末300は、カメラに映っている画像を所定のタイミング毎にキャプチャし、サーバ200へ送信する。サーバ200は、予め作成した画像認識モデルなどに基づいて、ペットがユーザ端末300のカメラに映ったか否かを判定する。ペットがユーザ端末300のカメラに映った場合は、サーバ200は、ユーザ端末300を録画モードにし、録画を開始する。その後、ペットがユーザ端末300のカメラに映らなくなった場合は、サーバ200は、ユーザ端末300の録画モードを終了する。これにより、ユーザ端末300からサーバ200へ送信する撮影動画のデータ量を削減することができる。
なお、ペットがユーザ端末300のカメラに映ったか否かは、ユーザ端末300が判定してもよい。この場合、ユーザ端末300は、予め作成した画像認識モデルなどを用いて、ペットがユーザ端末300のカメラに映ったか否かを判定する。そして、ユーザ端末300は、判定結果に従って、録画開始や録画終了の制御をしてもよい。
(変形例4)
上記の第1実施形態では、サーバ200は、ペットを被写体とした撮影動画に基づいて、GOODショットを分類しているが、被写体はペットに限らず、例えば、子供など、シャッターチャンスを逃す機会の多い別の被写体であってもよい。
(変形例5)
上記の第1実施形態では、基本的にユーザ端末300により取得された情報がそのままサーバ200へ送信され、サーバ200が受信した情報に基づいてGOODショットを分類している。その代わりに、GOODショットを分類するための処理をユーザ端末300が行い、その処理結果をサーバ200へ送信することとしてもよい。もしくは、サーバ200を使用せず、GOODショットを分類するための処理及び処理結果の保存をユーザ端末300で行うこととしてもよい。これにより、ユーザ端末300からサーバ200への通信負荷、及び、サーバ200における処理負荷を軽減することができる。これらの場合、ユーザ端末300は画像分類装置の一例である。
<第2実施形態>
図7は、第2実施形態の画像分類装置50の機能構成を示すブロック図である。第2実施形態の画像分類装置50は、画像取得手段51と、画像分類手段52と、出力手段53とを備える。
図8は、画像分類装置50による処理のフローチャートである。画像取得手段51は、対象被写体が写っている画像を取得する(ステップS51)。画像分類手段52は、対象被写体が写っている画像と前記対象被写体の所定の状態との関係が機械学習されたモデルを用いて、前記画像から、前記対象被写体の所定の状態が写っている画像を分類する(ステップS52)。出力手段53は、前記画像及び前記分類の結果を出力する(ステップS53)。
第2実施形態の画像分類装置50によれば、ユーザが好む画像を容易に分類することが可能となる。
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)
対象被写体が写っている画像を取得する画像取得手段と、
対象被写体が写っている画像と前記対象被写体の所定の状態との関係が機械学習されたモデルを用いて、前記画像から、前記対象被写体の所定の状態が写っている画像を分類する画像分類手段と、
前記画像及び前記分類の結果を出力する出力手段と、
を備える画像分類装置。
(付記2)
前記画像分類手段は、前記対象被写体の所定の部位が写っている画像を分類する付記1に記載の画像分類装置。
(付記3)
前記画像分類手段は、前記対象被写体が所定の動作を行っている画像を分類する付記1又は2に記載の画像分類装置。
(付記4)
前記所定の状態の発生条件を満たしているか否かを判定する条件判定手段を備え、
前記画像分類手段は、前記画像及び前記発生条件の判定結果に基づいて、前記画像を分類する付記1乃至3のいずれか一項に記載の画像分類装置。
(付記5)
前記条件判定手段は、前記対象被写体の撮影者の視線方向に基づいて、前記発生条件を満たしているか否かを判定する付記4に記載の画像分類装置。
(付記6)
前記条件判定手段は、前記対象被写体の撮影者の心拍数に基づいて、前記発生条件を満たしているか否かを判定する付記4又は5に記載の画像分類装置。
(付記7)
前記条件判定手段は、前記対象被写体の撮影者の音声に基づいて、前記発生条件を満たしているか否かを判定する付記4乃至6のいずれか一項に記載の画像分類装置。
(付記8)
前記条件判定手段は、撮影者の音声を検出し、前記対象被写体が撮影者の音声に反応して行動したことを前記発生条件とする付記4乃至7のいずれか一項に記載の画像分類装置。
(付記9)
前記画像取得手段は、前記対象被写体が端末装置のカメラに写った場合に、対象被写体が写っている画像の取得を開始し、前記対象被写体が前記端末装置のカメラに写らなくなった場合に、対象被写体が写っている画像の取得を終了する付記1乃至8のいずれか一項に記載の画像分類装置。
(付記10)
前記出力手段が出力した結果のうち、ユーザにより要否判断がされた画像を学習データとして用いて前記モデルの再学習を行う学習手段を備える付記1乃至9のいずれか一項に記載の画像分類装置。
(付記11)
対象被写体が写っている画像を取得し、
対象被写体が写っている画像と前記対象被写体の所定の状態との関係が機械学習されたモデルを用いて、前記画像から、前記対象被写体の所定の状態が写っている画像を分類し、
前記画像及び前記分類の結果を出力する画像分類方法。
(付記12)
対象被写体が写っている画像を取得し、
対象被写体が写っている画像と前記対象被写体の所定の状態との関係が機械学習されたモデルを用いて、前記画像から、前記対象被写体の所定の状態が写っている画像を分類し、
前記画像及び前記分類の結果を出力する処理をコンピュータに実行させるプログラムを記録した記録媒体。
以上、実施形態及び実施例を参照して本開示を説明したが、本開示は上記実施形態及び実施例に限定されるものではない。本開示の構成や詳細には、本開示のスコープ内で当業者が理解し得る様々な変更をすることができる。
200 サーバ
215 データベース(DB)
300 ユーザ端末
411 画像取得部
412 画像分類部
413 条件判定部
511 学習データ
512 学習装置

Claims (8)

  1. 対象被写体が写っている画像を取得する画像取得手段と、
    前記対象被写体の所定の状態が撮影されたと推定される条件である所定の状態の発生条件を満たしているか否かを判定する条件判定手段と、
    対象被写体が写っている画像と、所定の状態の発生条件を満たしているか否かの判定結果と、前記対象被写体の所定の状態との関係が機械学習されたモデルを用いて、前記画像取得手段により取得された前記画像と前記条件判定手段により判定された判定結果から、前記対象被写体の所定の状態が写っている画像を分類する画像分類手段と、
    前記画像及び前記分類の結果を出力する出力手段と、
    を備え、
    前記条件判定手段は、前記対象被写体の撮影者の心拍数に基づいて、前記所定の状態の発生条件を満たしているか否かを判定する画像分類装置。
  2. 前記画像分類手段は、前記対象被写体の所定の部位が写っている画像を分類する請求項1に記載の画像分類装置。
  3. 前記画像分類手段は、前記対象被写体が所定の動作を行っている画像を分類する請求項1又は2に記載の画像分類装置。
  4. 前記条件判定手段は、前記対象被写体の撮影者の視線方向に基づいて、前記発生条件を満たしているか否かを判定する請求項1乃至3のいずれか一項に記載の画像分類装置。
  5. 前記条件判定手段は、前記対象被写体の撮影者の音声に基づいて、前記発生条件を満たしているか否かを判定する請求項1乃至4のいずれか一項に記載の画像分類装置。
  6. 前記条件判定手段は、撮影者の音声を検出し、前記対象被写体が撮影者の音声に反応して行動したことを前記発生条件とする請求項1乃至5のいずれか一項に記載の画像分類装置。
  7. コンピュータにより実行される画像分類方法であって、
    対象被写体が写っている画像を取得する画像取得処理を行い
    前記対象被写体の所定の状態が撮影されたと推定される条件である所定の状態の発生条件を満たしているか否かを判定する条件判定処理を行い、
    対象被写体が写っている画像と、所定の状態の発生条件を満たしているか否かの判定結果と、前記対象被写体の所定の状態との関係が機械学習されたモデルを用いて、前記画像取得処理により取得された前記画像と前記条件判定処理により判定された判定結果から、前記対象被写体の所定の状態が写っている画像を分類する画像分類処理を行い
    前記画像及び前記分類の結果を出力する出力処理を行い
    前記条件判定処理は、前記対象被写体の撮影者の心拍数に基づいて、前記所定の状態の発生条件を満たしているか否かを判定する画像分類方法。
  8. 対象被写体が写っている画像を取得する画像取得処理を行い
    前記対象被写体の所定の状態が撮影されたと推定される条件である所定の状態の発生条件を満たしているか否かを判定する条件判定処理を行い、
    対象被写体が写っている画像と、所定の状態の発生条件を満たしているか否かの判定結果と、前記対象被写体の所定の状態との関係が機械学習されたモデルを用いて、前記画像取得処理により取得された前記画像と前記条件判定処理により判定された判定結果から、前記対象被写体の所定の状態が写っている画像を分類する画像分類処理を行い
    前記画像及び前記分類の結果を出力する出力処理を行い
    前記条件判定処理は、前記対象被写体の撮影者の心拍数に基づいて、前記所定の状態の発生条件を満たしているか否かを判定する処理をコンピュータに実行させるプログラム。
JP2024507433A 2022-03-18 2022-03-18 画像分類装置、画像分類方法、及び、プログラム Active JP7729466B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2022/012704 WO2023175931A1 (ja) 2022-03-18 2022-03-18 画像分類装置、画像分類方法、及び、記録媒体

Publications (3)

Publication Number Publication Date
JPWO2023175931A1 JPWO2023175931A1 (ja) 2023-09-21
JPWO2023175931A5 JPWO2023175931A5 (ja) 2024-11-14
JP7729466B2 true JP7729466B2 (ja) 2025-08-26

Family

ID=88022966

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2024507433A Active JP7729466B2 (ja) 2022-03-18 2022-03-18 画像分類装置、画像分類方法、及び、プログラム

Country Status (2)

Country Link
JP (1) JP7729466B2 (ja)
WO (1) WO2023175931A1 (ja)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009059257A (ja) 2007-09-03 2009-03-19 Sony Corp 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
JP2009259122A (ja) 2008-04-18 2009-11-05 Canon Inc 画像処理装置、画像処理方法および画像処理プログラム
WO2017212958A1 (ja) 2016-06-10 2017-12-14 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
JP2019047234A (ja) 2017-08-31 2019-03-22 ソニーセミコンダクタソリューションズ株式会社 情報処理装置、情報処理方法、およびプログラム
JP2020170916A (ja) 2019-04-02 2020-10-15 パナソニックIpマネジメント株式会社 情報処理装置、及び、情報処理方法
JP2021064825A (ja) 2019-10-10 2021-04-22 Kddi株式会社 撮像装置、学習装置、制御方法、学習方法、及びコンピュータプログラム
WO2022050093A1 (ja) 2020-09-01 2022-03-10 パナソニックIpマネジメント株式会社 ペット状況推定システム、ペットカメラ、サーバ、ペット状況推定方法、及びプログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11205773A (ja) * 1998-01-20 1999-07-30 Fujitsu General Ltd 監視映像記録方式

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009059257A (ja) 2007-09-03 2009-03-19 Sony Corp 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
JP2009259122A (ja) 2008-04-18 2009-11-05 Canon Inc 画像処理装置、画像処理方法および画像処理プログラム
WO2017212958A1 (ja) 2016-06-10 2017-12-14 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
JP2019047234A (ja) 2017-08-31 2019-03-22 ソニーセミコンダクタソリューションズ株式会社 情報処理装置、情報処理方法、およびプログラム
JP2020170916A (ja) 2019-04-02 2020-10-15 パナソニックIpマネジメント株式会社 情報処理装置、及び、情報処理方法
JP2021064825A (ja) 2019-10-10 2021-04-22 Kddi株式会社 撮像装置、学習装置、制御方法、学習方法、及びコンピュータプログラム
WO2022050093A1 (ja) 2020-09-01 2022-03-10 パナソニックIpマネジメント株式会社 ペット状況推定システム、ペットカメラ、サーバ、ペット状況推定方法、及びプログラム

Also Published As

Publication number Publication date
JPWO2023175931A1 (ja) 2023-09-21
WO2023175931A1 (ja) 2023-09-21

Similar Documents

Publication Publication Date Title
US20240215882A1 (en) Systems and Methods for Using Mobile and Wearable Video Capture and Feedback Plat-Forms for Therapy of Mental Disorders
US9875445B2 (en) Dynamic hybrid models for multimodal analysis
WO2024253769A1 (en) Ai highlight detection using cascaded filtering of captured content
CN121285841A (zh) 在共享视频上训练的ai亮点检测
JP7729466B2 (ja) 画像分類装置、画像分類方法、及び、プログラム
US20230113158A1 (en) Methods and systems for personalized coloring template
JP2026512673A (ja) 年齢推定のためのシステムおよび方法
CN120260080B (zh) 宠物姿态及表情跟踪方法、装置、电子设备及存储介质
JP2026051501A (ja) システム
JP2026033421A (ja) システム
JP2026038747A (ja) システム
JP2025048974A (ja) システム
JP2026029812A (ja) システム
JP2026018474A (ja) システム
JP2026029718A (ja) システム
JP2026024860A (ja) システム
JP2026018573A (ja) システム
JP2026033409A (ja) システム
JP2026051195A (ja) システム
JP2026038638A (ja) システム
CN121255016A (zh) 电子表多模态ai交互控制健身器械方法及系统
JP2026024532A (ja) システム
JP2026033192A (ja) システム
JP2026044891A (ja) システム
JP2026044666A (ja) システム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240909

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240909

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20250513

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20250626

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20250715

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20250728

R150 Certificate of patent or registration of utility model

Ref document number: 7729466

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150