Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP6190887B2 - 画像検索システムおよび情報記録媒体 - Google Patents
[go: Go Back, main page]

JP6190887B2 - 画像検索システムおよび情報記録媒体 - Google Patents

画像検索システムおよび情報記録媒体 Download PDF

Info

Publication number
JP6190887B2
JP6190887B2 JP2015540296A JP2015540296A JP6190887B2 JP 6190887 B2 JP6190887 B2 JP 6190887B2 JP 2015540296 A JP2015540296 A JP 2015540296A JP 2015540296 A JP2015540296 A JP 2015540296A JP 6190887 B2 JP6190887 B2 JP 6190887B2
Authority
JP
Japan
Prior art keywords
image
search
query
images
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015540296A
Other languages
English (en)
Other versions
JPWO2015049732A1 (ja
Inventor
裕樹 渡邉
裕樹 渡邉
廣池 敦
敦 廣池
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of JPWO2015049732A1 publication Critical patent/JPWO2015049732A1/ja
Application granted granted Critical
Publication of JP6190887B2 publication Critical patent/JP6190887B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/483Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/5866Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/532Query formulation, e.g. graphical querying
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Library & Information Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Description

本発明は、類似画像検索技術に関するものである。
ITインフラの発展に伴い、大量のマルチメディアデータ(文書、映像・画像、音声、種々のログデータなど)が大規模なストレージに蓄積されるようになった。蓄積された大量のデータから効率的に情報を引き出すために、個々のメディアデータに関しては、様々な情報抽出/検索技術が考案され、実用化されてきた。
画像に対する情報抽出の例として、画像内のオブジェクトを認識し、その名称を出力する画像認識技術が研究されている。このような画像認識技術では、事前に画像とその画像を説明するタグを大量に登録した「辞書」を用意し、新たに入力された画像の特徴が辞書内のどの画像と一致するかを調べることで、入力された画像に対するタグを推定する。また、辞書内の全ての画像と照合するのでなく、辞書内の画像とタグを学習データとして機械学習を行い、生成された識別器を用いてタグを推定する方法も用いられる。いずれの方法においても、画像とタグの大量のペアを用意する必要があり、人手での作業が発生する。認識対象が多くなると、辞書を作成する人的コストが増大するため、効率的な辞書作成方法が求められている。
画像認識技術に近い技術として、類似画像検索技術が知られている。類似画像検索は与えられた画像と特徴の近い画像を、データベースから探索し、類似度順に並び替えて出力する技術である。画像認識用の辞書作成において、類似する顔に一括でタグを付与することができれば、辞書を効率的に作成することができる。また、タグ付与済みの複数の画像をクエリとして、類似画像検索を行うことで、多彩な画像を一度に取得することができ、作業効率をさらに高めることができる。その反面で、もしクエリ集合に類似画像に適さない画像が含まれる場合は、検索結果のなかにノイズが含まれる可能性が高くなり、かえって作業効率が落ちる危険性がある。そのため、クエリ集合の質を高める技術が求められる。
多数のクエリを与えたときに、検索結果をクエリにフィードバックさせる方法として、特許文献1では、入力された動画から複数のショットを取り出して、これにより抽出された特徴量をクエリとして動画を検索することが開示されている。検索結果をユーザが評価し、適合する動画に含まれる高類似度のショットのみを選択し、これにより選択されたショットの特徴を検索クエリ特徴に追加することで検索クエリ特徴を更新する。この結果、不要なショットに伴う誤検索を減少させることができる。
特開2008−242965号
特許文献1は、内部では複数のショットを用いた検索をしているが、最終的には動画単位で類似性の高い検索結果を得ることを目的としているため、辞書作成の用途のように、多彩なバリエーションの画像を集めるという目的には適さない。また、クエリの重要度の判定には、ユーザによる評価が必要となり、ユーザの作業を効率化するものではない。
本発明は、上記のような課題に鑑みてなされたものであり、多数のクエリを用いた高精度な類似画像検索を行うことのできる画像検索技術を提供することを目的とする。また、そのために検索結果をクエリ集合にフィードバックする方法である。
上記課題を解決するために、例えば請求の範囲に記載の構成を採用する。本願は上記課題を解決する手段を複数含んでいるが、その一例を挙げるならば、画像検索システムであって、検索対象となる画像から抽出された検索用画像特徴量が蓄積された記憶部と、複数の画像がクエリ画像として入力される入力部と、前記クエリ画像から画像特徴量を抽出する抽出部と、前記画像特徴量を用いて前記記憶部内の前記検索用画像特徴量を検索する検索部と、前記画像特徴量と類似する前記検索用画像特徴量を抽出した元画像を検索結果として表示する表示部と、前記検索結果を元に前記クエリ画像の重要度を判定する判定部と、を備えることを特徴とする。
あるいは、画像検索方法であって、検索対象となる画像から抽出された検索用画像特徴量が蓄積される記憶ステップと、複数の画像がクエリ画像として入力される入力ステップと、前記クエリ画像から画像特徴量を抽出する抽出ステップと、前記画像特徴量を用いて前記検索用画像特徴量を検索する検索ステップと、前記画像特徴量と類似する前記検索用画像特徴量を抽出した元画像を検索結果として表示する表示ステップと、前記検索結果を元に前記クエリ画像の重要度を判定する判定ステップと、を有することを特徴とする。
本発明に係る画像検索装置によれば、入力された多数のクエリをグループ化し、重要度に応じて並び替えられたグループごとに類似画像検索結果を得ることができる上記した以外の課題、構成、および効果は、以下の実施形態の説明により明らかになるであろう。
実施形態1に係る画像検索システム100の構成図である。 画像データベース108の構成とデータ例を示す図である。 検索クエリ生成部109における画像特徴量の抽出処理について説明するための図である。 類似画像検索部110における類似画像検索のためのクラスタリングを説明するための図である。 類似画像検索部110におけるクラスタリングを用いた類似ベクトル検索を説明するための図である。 画像検索装置105が、類似画像検索の結果を用いてクエリをグループに分類する処理を説明するための図である。 画像検索装置105が、類似画像検索の結果を用いてクエリをグループに分類する処理を説明するためのフローチャートである。 画像検索装置105を、画像のタグ付与ツールに適用し、クエリ集合へのフィードバックを行う様子を説明するための図である。 画像検索装置105を適用した画像のタグ付与ツールにおいて、クエリ集合へのフィードバックを行う処理手順を説明するためのフローチャートである。 画像検索装置105を適用した画像のタグ付与ツールの操作画面の構成例を示す図である。 画像検索装置105を適用した画像のタグ付与ツールにおいて、クエリ集合へのフィードバックを行う処理における各機能部間の処理シーケンスを説明するための図である。 画像検索装置105を用いた映像解析を説明するための図である。 画像検索装置105を用いた映像解析の処理手順を説明するためのフローチャートである。 画像検索装置105を用いた部分類似画像検索を説明するための図である。 画像検索装置105を用いた部分類似画像検索の処理手順を説明するためのフローチャートである。 実施形態4に係るコンテンツクラウドシステム1600の概略図である。
<システム構成>
図1は、本発明の実施形態1に係る画像検索システム100の構成図である。画像検索システム100は、ユーザが入力した複数のクエリ画像に対して、クエリのグループを形成し、グループごとに検索結果をまとめることで、検索クエリの質を向上させることを目的とするシステムである。
画像検索システム100は、画像・映像蓄積装置101,入力装置102、表示装置103,データ格納装置104、画像検索装置105を備える。また、図1には図示していないが、撮影された画像を直接入力できるよう、カメラを備えてもよい。
画像・映像記憶装置101は、画像データや映像(動画像)データを保存する記憶媒体であり、コンピュータ内蔵のハードディスクドライブ、NAS(Network Attached Storage)やSAN(Storage Area Network)などのネットワークで接続されたストレージシステムを用いて構成することができる。また、例えば、カメラから継続的に入力される映像データを一時的に保持するキャッシュメモリであっても良い。
入力装置102は、マウス、キーボード、タッチデバイスなど、ユーザの操作を画像検索装置105に伝えるための入力インタフェースである。表示装置103は、液晶ディスプレイなどの出力インタフェースであり、画像検索装置105の検索結果の表示、ユーザとの対話的操作などのために用いられる。データ格納装置104は、画像検索装置105の検索結果を記録するストレージであり、検索結果を上位のアプリケーションで利用するために用いられる。検索結果は、検索で得られる画像データであってもよいし、画像データに付与されたタグであってもよい。
画像検索装置105は、与えられた複数のクエリ画像を用いて類似画像検索を行い、検索過程で得られるデータ分布情報に従ってクエリをグループ化し、グループの重要度を判定し、その重要度でグループを並び替え、グループ毎に検索結果を出力する。検索クエリとして画像データを直接与えてもよいし、指定した条件に該当する画像をデータベースから取得して、これをクエリとしてもよい。また、グループ化された検索結果と検索クエリの関係性から、好ましくない検索結果の要因となるクエリのグループを特定し、該当クエリを検索クエリから除外する機能をもつ。クエリの個数は1つ以上であればよいが、数十から数百のクエリが与えられ、ユーザが全てのクエリを確認することが困難な状況において、本発明が効果的となる。画像検索装置105は、画像入力部106、ユーザ操作入力部107、画像データベース108、検索クエリ生成部109、類似画像検索部110、クエリ分類部111、クエリブループ重要度判定部112、検索結果生成部113、データ出力部114、を備える。
画像入力部106は、画像・映像記憶装置101から、画像・映像データを読み出し、画像検索装置105内部で使用するデータ形式に変換する。この際、映像データは複数のフレームに分解される。読み込まれたデータは、ユーザが画像データベース105にデータを登録する際には画像データベース105に送られ、検索処理を行う際には検索クエリ生成部109に送られる。
ユーザ操作入力部107は、ユーザによる入力装置102の操作を検知し、その信号を検索クエリ生成部109、検索結果生成部113に伝え、各部の処理の実行を制御したり、処理に用いるパラメータを変更したりする。
画像データベース108は、画像データとその特徴量、タグを保存するデータベースである。特徴量は、画像の見た目の類似性に基づく検索に必要なデータである。ここでいうタグとは、指定した条件で画像を絞り込むために使用されるデータである。例えば、画像中の人物の名前、撮影日時、シーン分類(屋内/屋外、日中/夜間など)、である。必要に応じて一つの画像が複数個のタグを持っても良い。画像データベース108へのアクセスは、画像入力部106からのデータ登録時、検索クエリ生成部109と類似画像検索部110からの検索時、検索結果生成部113からのデータ更新時に発生する。画像データベース108の構造について、詳しくは図2の説明として後述する。
検索クエリ生成部109は、類似画像検索に必要な画像特徴量を生成する。画像特徴量は、画像の見た目の特徴を表す数値情報であり、固定長のベクトルで表される。詳しくは図3の説明として後述する。画像検索装置105への入力が1枚以上の画像の場合は、各画像から画像特徴量を計算する。入力がタグの場合は、該当するタグが付与された画像の特徴量を画像データベース108から読みだす。以上で生成された複数の特徴量を検索クエリとして類似画像検索部110に送る。
類似画像検索部110は、与えられた複数の特徴量に対して、それぞれ画像データベース108から類似ベクトルを検索する。ベクトルの類似度は、例えば、ベクトル間のユークリッド距離が小さいほど類似度が高い、と定義する。類似ベクトルの検索は、あらかじめデータを分類しておくことで、高速化できる。詳しくは図4、図5の説明として後述する。類似画像検索部110の出力は、クエリ毎の類似画像とその類似度、検索に使用された分類情報、である。画像検索装置105において、全体の処理が終了するまでは、クエリと検索結果の関係が保持されるものとする。
クエリ分類部111は、類似画像検索部110から出力された分類情報を元にクエリまたはクエリ集合を複数のグループに分類する。この結果、画像の見た目の特徴の近い、すなわち画像特徴量であるベクトルの値が近いクエリ同士は同一のグループに分類される。各グループのメンバ数が所定数に満たない場合は、類似するグループを統合してもよい。
クエリグループ重要度判定部112では、グループの重要度を計算する。重要度の計算方法は、例えば、グループに属するクエリの数や、検索結果の画像の類似度を用いることが考えられるが、具体的な算出方法はアプリケーションによって異なる。
検索結果生成部113では、グループを重要度順に並び替え、グループ内では検索結果を類似度順に並び替えて、グループごとに検索結果を出力する。出力データは、類似画像そのものでも良いし、類似画像に付与されたタグ、そのタグを集計して得られるタグ毎のスコアデータでも良い。検索結果生成部113は、ユーザの指示に応じて、グループに属する類似画像に一括でタグを付与して、画像データベース108の該当画像にタグを追加することができる。また、グループに属するクエリが、検索に適さないものであるとユーザが判断した場合は、画像データベース108の該当画像からタグを削除することができる。この結果、以降の検索処理では、検索クエリ生成部109では不適正なクエリが使用されなくなる。
データ出力部114は、上記の処理において得られたクエリ、グループ情報、検索結果を必要に応じて整形/データ変換し、表示装置103とデータ格納装置104に出力する。
図2は、画像データベース108の構成とデータ例を示す図である。ここではテーブル形式の構成例を示すが、データ形式は任意でよい。
画像データベース108は、画像テーブル200は、画像IDフィールド201、画像データフィールド202、画像特徴量フィールド203、タグフィールド204を有する。
画像IDフィールド201は、各画像データの識別番号を保持する。画像データフィールド202は、画像データをバイナリ形式で保持するフィールドであり、ユーザが検索結果を確認する際に用いられる。画像特徴量フィールド203は、画像特徴量データを保持する。画像特徴量は、画像そのものの持つ色や形状などの特徴を数値化した、固定長の数値ベクトルデータである。画像特徴量フィールドを複数用意し、例えば、形状特徴量と色特徴を別のフィールドで管理しても良い。タグフィールド204は、条件検索用の数値データや文字列データを保持する。図2の例では、画像データフィールド202に顔画像、タグフィールド204に人物名の文字列を表記しているが、画像データフィールド202には風景写真、物品の写真、イラスト、図面など任意の画像を登録でき、タグフィールド204には、例えば、シーン名、撮影日時、物品名、属性情報など、任意のデータを登録できる。また、1つの登録画像に対して、複数のタグを登録しても良い。
<各部の動作>
以上、画像検索システム100の全体構成を説明した。以下では画像検索システム100の動作原理を概説した上で、各機能部の詳細動作を説明する。
(類似画像検索の説明)
図3は、画像検索システム100で用いる画像特徴量の抽出手順の一例である。本手法では、まず入力画像から複数の解像度の画像を生成する。次に、各解像度の画像を領域分割する。各領域に含まれる特徴的なエッジパターンの数を集計することでヒストグラムをつくり、これを多次元のベクトルとする。パターン毎の分布の偏りを補正するための正規化を行い、得られた数千次元のベクトルを主成分分析などにより次元圧縮することで、システムが扱いやすい数百次元程度の固定長ベクトルデータとして保存する。このようにして得られたベクトルデータは、見た目の似た画像間で近い値になるため、類似画像検索に用いることができる。なお、画像の見た目の特徴を表すベクトルデータであれば、一般に広く知られているMPEG−7で規定されているエッジヒストグラム特徴など、他の特徴量を用いてもよい。
類似画像検索は、画像特徴量のベクトル間の類似度を評価することで、似たデータを探索する処理である。2つのn次元ベクトルXとYの非類似度dは、例えば、数1のように、ユークリッド距離の2乗で求めることができる。XiとYiは、それぞれベクトルXとベクトルYのi番目の要素である。
Figure 0006190887
・・・数1
類似画像を得るには、基本的には、データベース内の全ての画像に対して、数1を用いてクエリ画像の特徴量との非類似度を求め、非類似度の小さい順にソーティングして出力すればよい。しかし、データ量に応じて処理時間が線形に増加するため、大規模なデータベースを検索することは困難である。そこで、予め似たデータを集めたグループを生成するクラスタリング処理を事前に行なっておく。クラスタリングの手法として、例えば、K−means法が知られている。K−means法は、クラスタの平均値を用いて、データ集合を与えられたクラスタ数K個のクラスタに自動分割する手法である。
図4は、データのクラスタリングを説明する図である。図4(a)の401は特徴量空間を表しており、データベースに登録された特徴量ベクトル402がマッピングされている。クラスタリング処理を行うと、図4(b)のようにベクトル間の距離の近い特徴量でクラスタ403が形成される。画像データベース108において、クラスタの情報は、クラスタに属する特徴量へのポインタと、クラスタに属する全特徴量の平均値ベクトル403で管理される。また、各クラスタには識別番号が与えられる。
図5は、クラスタリングを用いた検索を説明する図である。検索時には、まず、図5(a)のように、クエリ501とクラスタの平均ベクトルとの距離を求め、距離の近いクラスタ(近傍クラスタ)を1つ以上選択する。図の例ではクラスタAが選択される。次に、選択された近傍クラスタに属する全ての特徴量とクエリ501との距離を計算し、距離の近い順に並び替え、これらの特徴量の元となった画像を類似画像として出力する。クラスタリング済みのデータベースを用いることで、大規模データベースに対する類似画像検索の高速化を実現することができる。例えば、200次元の特徴量を用いて、400万件の画像データベースから上位1000枚の類似画像を検索する処理は、一般的なPCサーバを用いた場合でも、10ミリ秒程度で実行できる。
以上に述べた手順に従うと、画像の見た目の特徴を表す固定長ベクトルの特徴量表現であれば、どのような特徴量を用いても類似画像検索を実現することができるが、データベース画像とクエリ画像の特徴量は同一のアルゴリズムで抽出される必要がある。
図6は、画像検索装置105が複数のクエリをグループ化し、グループの重要度に従って並び替える処理を説明するための図である。
まず、複数のクエリ画像601が与えられると、各画像から画像特徴量を計算し、画像データベース108から類似画像検索結果602を取得する。検索結果602は、類似画像とその類似度、およびクラスタリングを用いた検索において選択された最近傍クラスタの識別番号から構成される。類似度sは、特徴量空間内での距離が小さいほど大きい値となる。例えば、(数2)で計算すると、類似度sは0〜1の値域の実数値であり、sが大きいほどクエリ画像と類似画像とが似ている、と解釈できる。ここで、eは自然対数の底である。ユーザに表示する際には、図6のように、sを100倍した値のパーセント表示にしてもよい。
Figure 0006190887
…数2
次に、クエリと検索結果のペアをグループ化する。図6の例では、共通の最近傍クラスタ番号を持つペアを同じグループ603に集める。図6ではグループ化の手段の一例として、クラスタの情報を用いた方法を示したが、何らかの観点でクエリをグループ化できれば、本手法を適用可能である。例えば、類似画像に付与されたタグ情報が共通するクエリをグループにまとめてもよい。
全てのクエリがグループに振り分けられた後、グループの重要度を算出し、重要度に従ってグループを並び替える。重要度は、例えば、グループに属するクエリの数、類似度の高い類似画像の数などを用いて計算する。
最後に、グループに属する検索結果から類似画像を取り出し、例えば、類似度の高い順に並び替え、グループごとの検索結果として出力する。
以上の処理により、複数のクエリについての類似画像を一括で表示する場合に比べ、特徴の近い類似画像をグループごとにまとめて確認することができるため、検索結果の質が向上する。また、クエリと検索結果のペアを保持することで、好ましくない検索結果の要因となるクエリを発見することが容易になる。このような不適切なクエリを、クエリ集合から除外する例については図8の説明として後述する。
図7は、画像検索装置105が、複数のクエリをグループ化し、グループの重要度に従って並び替えて検索結果を出力する処理手順を表したフローチャートである。以下、図7の各ステップについて説明する。
(図7:ステップS701)
画像検索装置105への入力の種類によって処理を分岐する。入力が1枚以上の画像の場合はステップS702に移動し、画像のタグに対する条件であればステップS704へ移動する。
(図7:ステップS702)
画像入力部106は、画像・映像記憶装置101から1枚以上の画像データを読み出し、装置内で利用可能なデータ形式に変換する。映像データの場合は、所定の間隔でフレームを抽出し、複数枚の画像データとして扱う。
(図7:ステップS703)
検索クエリ生成部109は、ステップS702で読み出された各画像から画像特徴量を抽出する。
(図7:ステップS704)
検索クエリ生成部109は、ユーザ操作入力部107から与えられたユーザ指定の条件に一致するタグを持つ画像の特徴量を、画像データベース108から読みだす。
(図7:ステップS705〜S708)
類似画像検索部110とクエリ分類部111は、全ての特徴量に対して、ステップS705〜S706を実施する。
(図7:ステップS706)
類似画像検索部110は、与えられた特徴量をクエリとして、画像データベース108から類似画像を取得する。また、クラスタリングを用いた検索において使用された最近傍クラスタの識別番号をあわせて検索結果として出力する。
(図7:ステップS707)
クエリ分類部111は、検索結果の最近傍クラスタの識別番号に従って、クエリと検索結果のペアを該当グループに振り分ける。
(図7:ステップS709〜S711)
クエリグループ重要度判定部112は、ステップS707で生成された全てのグループに対して、ステップS710を実施する。
(図7:ステップS710)
クエリグループ重要度判定部112は、グループに属するクエリの数や、類似画像の類似度に従って、グループの重要度を算出する。
(図7:ステップS712)
検索結果生成部113は、重要度に従ってグループを並び替える。
(図7:ステップS713)
検索結果生成部113は、グループ内の類似画像を類似度順に並び替え、グループ毎に検索結果を生成する。この結果をデータ出力部114が、外部のデバイスに出力して本処理フローを終了する。アプリケーションに応じて、表示装置103に表示しても良いし、データ格納装置104に出力しても良い。
図8は、画像検索装置105を、顔画像へのタグ付け支援ツールへ応用した例であり、検索結果のクエリ集合へのフィードバックを説明する図である。ここでは、説明を容易にするため、人物の顔画像を対象としているが、物品やシーンに対してタグを付与する場合も同様である。顔画像に人物名タグが付与されることで、名前の入力による人物検索や、人物の出現頻度による統計解析が可能になる。ただ、大量の画像に対してユーザが人物を判定し、タグを付与することは困難である。
この課題に対して、類似画像検索を用いて得られた類似顔に対して一括でタグを付与することで、タグ付作業を効率化することができる。このとき図8の802のように、入力された人物名801に該当するタグが付与された顔画像802をクエリとして複数使用することで、一度に多様なバリエーションの顔を得ることができる。しかし、図8の803のように、全ての検索結果を類似度順に表示すると、クエリにノイズが含まれた場合に、適切ではない検索結果画像に誤ってタグを付与してしまう可能性が高い。また、異なる特徴の顔画像が入り乱れて表示されるため、検索結果を確認することが困難になる。
本発明の画像検索装置105を用いれば、同様の特徴をもつ検索結果をクエリ毎にグループにまとめて表示することができ、視認性が高まる。図8の例では、検索結果804、805は全ての検索結果が指定された人物であることが確認できるため、グループ内の類似画像に一括でタグを付与する。検索結果806については、一部に異なる人物が含まれるため、個別にタグを付与する。このように新しくタグが付与された画像は、次回以降での検索においてクエリとして使用される。
検索結果807には、指定された人物の顔画像が全く含まれておらず、この結果の要因となったクエリが類似画像検索のクエリとして不適切であることが推測される。画像検索装置105では、クエリと検索結果のペアを対応付けて管理するため、検索結果からクエリを逆探索することができる。この結果、検索結果807が検索される要因となった不適正なクエリ809からタグを除外し、以降の作業ではクエリとして使用されなくなる。
図8では図示していないが、検索結果804-807とそれぞれの検索キーとなったクエリとを対応付けるように表示をしても良い。これにより、さらに視認性が向上する。 図9は、クエリのグループ化を用いた画像へのタグ付与処理と、検索結果のクエリ集合へのフィードバックの処理手順を説明するフローチャートである。以下、図9の各ステップについて説明する。
(図9:ステップS901)
入力部107から与えられたタグを持つ画像の特徴量を画像データベース108から読み出す。
(図9:ステップS902)
画像検索装置105は、ステップS901で生成された1つ以上のクエリを用いて、グループ化されたクエリと検索結果を出力する。この処理は図7のS705〜S713と同様である。
(図9:ステップS903)
データ出力部114は、得られた検索結果を表示装置103に表示する。ユーザ操作入力部は、ユーザが入力装置102を用いてシステムに指示を送るまで待機する。
(図9:ステップS904)
ユーザの指示内容によって処理を分岐する。グループ内の検索結果に対して一括でタグを付与する場合はステップS905へ移動し、グループ内の検索結果に対して個別にタグを付与する場合はステップS908へ移動し、グループのクエリからタグを削除する場合はステップS911へ移動する。
(図9:ステップS905〜S907)
検索結果生成部113は、ユーザに選択されたグループ内の全ての類似画像に対して、ステップS906を実施する。
(図9:ステップS906)
ユーザに選択されたグループ内の全ての類似画像に対して、ステップS901でクエリの条件として使用されたタグを付与し、画像データベース108のタグフィールド204に格納する。
(図9:ステップS908〜S910)
検索結果生成部113は、ユーザに選択された全ての類似画像に対して、ステップS909を実施しタグ付けを行う。
(図9:ステップS909)
ユーザに選択された全ての類似画像に対して、ステップS901でクエリの条件として使用されたタグを付与し、画像データベース108のタグフィールド204に格納する。
(図9:ステップS911〜S913)
検索結果生成部113は、ユーザに選択されたグループ内のクエリ画像に対して、ステップS912を実施する。
(図9:ステップS912)
ユーザに選択されたグループ内のクエリ画像に対して、ステップS901でクエリの条件として使用されたタグを、画像データベース108のタグフィールド204から削除する。
図10は、クエリのグループ化を用いた画像へのタグ付与のために使用する操作画面である。本画面は、表示装置103上で提供することができる。ユーザは、入力装置102を用いて、画面に表示されたカーソル1007を操作することにより、ユーザ操作入力部107に操作情報を送る。
図10の操作画面は、タグ入力領域1001、画像読込ボタン1002、画像ファイル選択ボタン1003、クエリ画像表示領域1004、検索ボタン1005、検索結果表示領域1006、一括タグ付ボタン1008、クエリ表示ボタン1009、クエリタグ削除ボタン1010を有する。
ユーザは、まず、システムに対して検索クエリの集合を与える。クエリの与え方はタグを指定する方法と、画像ファイルを直接与える方法がある。タグを指定する場合は、ユーザはタグ入力領域1001に、人物名などのタグを入力する。画像読込ボタン1002をクリックすると、画像データベースに登録された画像から指定したタグを持つ画像が読み込まれ、クエリ画像表示領域1004に表示される。クエリが多数ある場合には、画面のように所定数毎のページで表示しても良い。
画像ファイルを直接与える場合には、ユーザは画像ファイル選択ボタン1003をクリックする。入力方法は、例えば、ファイルシステムのファイルパスを指定するダイアログを用いてもよいし、ドラッグ&ドロップによる直感的な入力操作にしてもよい。読み込まれた画像は、クエリ表示領域1004に表示される。
次にユーザが、検索ボタン1005をクリックすると、指定されたクエリ集合を用いて類似画像検索が実施され、検索結果表示領域1005にグループ毎の類似画像が表示される。グループは、重要度で並び替えて表示される。ユーザが以降の操作の判断材料として利用するために重要度の数値を表示しても良い。また、ユーザの要求によっては、グループの枠を取り外して、全ての類似画像を一覧で表示するように切り替えるチェックボックス(図の「分類表示」)を加えても良い。
ユーザは検索結果を確認し、グループに属する類似画像が全て該当人物の顔であれば、グループを選択する。選択方法は、例えば、グループの右上にチェックボックを用意して、それをクリックすればよい。グループの一部に別の人物の顔が含まれる場合は、類似画像を個別に選択していく。グループの選択と同様に、類似画像の右上のチェックボックスをクリックする。
以上の手順で、該当人物の類似画像が選択された後、一括タグ付ボタン1008をクリックすると、選択されたグループに属する類似画像と、個別に選択した類似画像に対して、タグ入力領域1001で指定したタグが付与され、画像データベース108のタグフィールド204が更新される。
また、検索の結果、好ましくない結果を多く含むグループが確認できた場合は、そのグループを選択し、クエリ表示ボタン1009をクリックすることで、クエリ画像表示領域1004にそのグループのクエリのみを表示することができる。クエリタグ削除ボタン1010をクリックすることで、不適切なクエリのタグを削除することができる。
図11は、画像検索システム100が、グループ化されたクエリ毎の検索結果を生成し、クエリへフィードバックする処理における、ユーザ1101、計算機1102、画像データベース108の処理シーケンスを説明する図である。以下、図11の各ステップについて説明する。
[クエリ生成処理](図11:ステップS1103〜S1106)
ユーザ1101は、入力装置102を介してタグを計算機1102に入力する(S1103)。計算機1102は、検索クエリ生成部109において、入力されたタグに一致する画像を取得するための要求を画像データベース108に送る(S1104)。画像データベース108は、登録済みの画像から、指定されたタグを持つ画像を探索し、結果の画像の特徴量を計算機1102に返す(S1105)。読み出された画像が以降の処理ではクエリ集合となり、ユーザ1101に提示される(S1106)。
[類似画像検索処理](図11:ステップS1107〜S1113)
ユーザ1101は、提示されたクエリを用いて検索処理の実行要求を計算機1102に送る(S1107)。計算機1102は、ステップS1105で得られた各画像特徴量をクエリとして、画像データベース108に対して、類似画像検索の要求を送る(S1108)。画像データベース108は、特徴量の近い画像を所定数だけ探索し、計算機1102に返す(S1109)。計算機は、図6と図7で述べた処理手順に従って、検索結果をグループ化し(S1110)、グループ毎に重要度を算出し(S1111)、グループを重要度で並び替え(S1112)、ユーザ1101に、グループごとの検索結果を返す(S1113)。
[クエリ更新処理](図11:ステップS1114〜S1117)
ユーザ1101は、検索結果を確認し、グループごとに類似画像へのタグの付与、またはクエリのタグの削除の要求を計算機1102に送る(S1114)。検索結果生成部113はユーザの指示に従い、画像データベース108に対して、タグフィールドの更新の要求を送る(S1115)。画像データベース108は、指定された画像に対してタグを追加/削除し、タグフィールドの更新完了の通知を計算機1102に返す(S1116)。計算機1102は、ユーザ1101にクエリ集合へのフィードバックが完了したことを提示する(S1117)。
以上の処理により、ユーザ1101が新たにステップ1103からの処理を開始すると、更新されたタグによる検索が可能になり、精度の高い検索結果を得ることができる。
以上を踏まえ、本実施例に記載の画像検索システムは、検索対象となる画像から抽出された検索用画像特徴量が蓄積された記憶部108と、複数の画像がクエリ画像として入力される入力部107と前記クエリ画像から画像特徴量を抽出する抽出部となるクエリ生成部109と、前記画像特徴量を用いて前記記憶部内の前記検索用画像特徴量を検索する検索部110と、前記画像特徴量と類似する前記検索用画像特徴量を抽出したもとの画像を検索結果として表示する表示部103と、前記検索結果を元に前記クエリ画像の重要度を判定する判定部112と、を有することを特徴とする。
係る特徴により、複数のクエリについての類似画像を一括で表示する場合に比べ、特徴の近い類似画像をグループごとにまとめて確認することができるため、検索結果の質が向上する。
実施例1では、画像検索装置105を用いて、多数のクエリをグループに分類し、グループごとの検索結果を用いて、画像データベース108のタグを更新することで、クエリの精度を高める方法について説明した。本発明の画像検索装置105のクエリ分類機能を利用すると、入力された多数の画像に含まれる共通のオブジェクトを精度よく認識し、入力画像集合に対する有用な解析結果を生成することが可能となる。以下、本実施例では、1台以上のカメラから撮影された所定時間の連続フレームを入力とした、映像解析への応用について説明する。
図12は、カメラ映像中の車両の車種を解析する処理を説明するための図である。画像検索装置105への入力は、1台以上のカメラから取得された所定時間の連続するフレーム1201である。フレームは、例えば1秒おきに1枚、のように所定の間隔で抽出してもよい。また、リアルタイムにカメラから映像を取得するのではなく、画像・映像蓄積装置101に動画ファイル形式で保存されたデータを入力としてもよい。画像データベース108にはあらかじめ、車両の画像とタグとして車種の情報を登録しておく。
検索クエリ生成部109は、入力されたフレームから車両の含まれる部分領域をクエリオブジェクトとして検出する。画像からの車両領域の抽出は、公知の手段を用いる。例えば、機械学習によって生成した車両専用の識別器を用いて、走査窓を動かしながら画像中の部分領域をしらみつぶしにチェックしていく方法が知られている。
各フレームから得られた複数のクエリオブジェクト、本実施例では車両画像がクエリとなり、本発明の画像検索装置105によってグループ化される(1202)。各車両画像に関しては、まず、類似画像検索により、検索結果である類似画像が得られる。また、その類似画像に付与されたタグの情報を集計することで、検索キーとして用いたクエリ画像に付与されているタグを推定することができる。推定の方法としては、例えば、得られた類似画像数が10枚のうち、5枚に車種A、3枚に車種B、2枚に車種Cのタグが付与されていたとすると、車種Aらしさのスコアは50%、車種Bのスコアは30%、車種Cのスコアは20%、のように、クエリ画像に付与されたタグの推定結果を出すことができる。スコアの算出において、類似度やデータベース中の該当者数の出現頻度に応じて重み付けをしてもよい。
以上によってクエリ毎に個別の推定結果1203が得られる。しかし、シーンによっては背景や遮蔽物の影響が大きく、推定精度が低下する可能性がある。
そこで、グループの分類に従って、推定結果を統合することで、クエリに含まれるノイズの影響を軽減させ、ユーザにとって有用な解析結果のみを提示することが可能になる(1204)。推定結果の統合方法は、例えば、個々の推定結果の単純な平均値でもよいし、車種間のスコア差が最も大きくなる推定結果を採用しても良い。
図13は、画像検索装置105が、クエリ分類を用いた映像解析を行う処理手順を説明するためのフローチャートである。以下、図13の各ステップについて説明する。
(図13:ステップS1301)
画像入力部106は、画像・映像蓄積装置101から、映像データを読み出し、所定間隔でフレームを抽出する。画像検索システム100に1台以上のカメラが接続された場合は、画像・映像蓄積装置101をキャッシュメモリとして機能させ、所定時間の映像データを入力とする。
(図13:ステップS1302)
検索クエリ生成部109は、複数のフレームから車両領域を検出し、検出された領域の画像から画像特徴量を抽出する。
(図13:ステップS1303)
画像検索装置105は、ステップS1302で生成された1つ以上のクエリを用いて、グループ化されたクエリと検索結果を出力する。この処理は図7のS705〜S711と同様であるが、検索結果には、類似画像のタグ情報も付随されるものとする。
(図13:ステップS1304)
検索結果生成部113は、各クエリの検索結果から、タグを推定し、タグごとのスコアを算出する。タグの推定方法は、図12で説明したとおりである。
(図13:ステップS1305)
検索結果生成部113は、グループごとに、個々のタグ推定結果を統合する。
(図13:ステップS1306)
データ出力部114は、外部のデバイスに推定結果を出力して本処理フローを終了する。アプリケーションに応じて、表示装置103に表示しても良いし、データ格納装置104に出力しても良い。例えば、画面に出力する際は、推定結果と、その該当するシーンを並べて表示しても良い。
本発明の画像検索装置105について、実施例1では画像へのタグ付与作業への適用について述べ、実施例2ではタグの自動推定機能への応用について述べた。本実施例では、より高度な類似画像検索を実現する方法について述べる。
これまでの実施例で述べてきた類似画像検索では、入力された画像の全体の特徴が類似する画像をデータベースから検索することができた。これに対して、画像の部分領域に着目して、部分が類似する画像を見つけることが出来れば、多様なアプリケーションに応用可能である。例えば、図形商標検索・審査システムにおいては、審査対象の図形の一部に、公知の図形商標と酷似する部分があることを自動的に検出することができれば、審査業務を効率化される。
図14は、部分類似画像検索を説明するための図である。画像の部分領域を検索対象にするために、画像データベース108に保存されている画像に対して、あらかじめ要素図形をクエリオブジェクトとして抽出しておき、要素図形毎に特徴量と抽出もとの画像へのポインタ(画像ID)を保存しておく(1401)。要素図形の抽出方法は、例えば、図形作成ツールによって作られた図形であれば、図形コンポーネントの情報を利用することができるし、その他任意の画像データに関しても公知の画像認識手法によって要素図形に分解することが可能である。
検索時には、クエリ1402のような複合図形が与えられると、同様の手法で要素図形を抽出し、抽出された全ての要素図形をクエリとして、類似画像検索をかける。検索対象は、画像データベース108の要素図形1401である。この結果、実施例1と同様の方法で、クエリが複数のグループに分類される(1403)。グループの重要度の計算方法としては、例えば、クエリの数に加えて、データベース中の類似要素図形の数を考慮しても良い。例えば、図14の場合、単純な円要素はクエリに多数含まれているが、データベース中のほとんどの図形にも含まれるありふれた要素図形であるため、グループの重要度を下げている。検索結果は図14の1404のように、類似要素図形の抽出元の全体図を表示してもよい。
以上の処理により、ユーザは着目する要素毎に検索結果を閲覧することができ、部分類似画像検索結果の質を高めることができる。
図15は、画像検索装置105が、クエリ分類を用いて、部分類似画像検索を行う処理手順を説明するためのフローチャートである。以下、図15の各ステップについて説明する。
(図15:ステップS1501)
検索クエリ生成部109は、画像入力部106から入力された図形から、要素図形を抽出し、各要素図形から画像特徴量を計算し、クエリとする。
(図15:ステップS1502)
画像検索装置105は、ステップS1502で生成された1つ以上のクエリを用いて、グループ化されたクエリと検索結果を出力する。この処理は図7のS705〜S711と同様である。
(図15:ステップS1503)
クエリグループ重要度判定部112は、グループに含まれるクエリの数と、データベース中の要素図形の使用頻度から重要度を算出する。データベース内の要素図形の使用頻度は、例えば、類似度が一定以上の類似画像が何件見つかったか、で判断する。
(図15:ステップS1504)
検索結果生成部113は、グループを重要度で並び替える。また、グループ内の類似画像を類似度順に並び替える。ここで、類似画像そのものではなく、要素図形の抽出元の画像を検索結果として使用しても良い。
(図15:ステップS1505)
データ出力部114は、外部のデバイスに推定結果を出力して本処理フローを終了する。アプリケーションに応じて、表示装置103に表示しても良いし、データ格納装置104に出力しても良い。
本発明の実施形態4では、画像検索システム100をコンテンツクラウドシステムへ組み込んだ構成例について説明する。以下ではまず、コンテンツクラウドシステムの概要を説明し、その後、画像検索システム100を解析モジュールとしてコンテンツクラウドシステムへ組み込む方法について説明する。画像検索システム100の構成は実施形態1〜3と同様である。
図16は、本実施形態3に係るコンテンツクラウドシステム1600の概略図である。コンテンツクラウドシステム1600は、Extract Transform Load(ETL)モジュール1603、コンテンツストレージ1604、検索エンジン1605、メタデータサーバ1606、マルチメディアサーバ1607を有する。コンテンツクラウドシステムは1つ以上のCPU、メモリ、記憶装置を備えた一般的な計算機上で動作し、システム自体は様々なモジュールで構成されている。また、それぞれのモジュールが独立した計算機で実行されることもあり、その場合、各ストレージとモジュール間はネットワーク等で接続されおり、それらを介してデータ通信を行う分散処理で実現される。
アプリケーションプログラム1608は、ネットワーク等を経由してコンテンツクラウドシステム1600に対してリクエストを送り、コンテンツクラウドシステム1600はリクエストに応じた情報をアプリケーション1608に送信する。
コンテンツクラウドシステム1600は、入力として映像データ、画像データ、文書データ、音声データなどの任意の形式のデータ1601を受け取る。データ1601は、例えば、図形商標とその広報文書、ウェブサイトの画像とHTML文書、クローズドキャプションまたは音声付き映像データなどであり、構造化されたデータでもよいし非構造化データでもよい。コンテンツクラウドシステム1600へ入力されるデータはストレージ1602に一時的に蓄えられる。
ETL1603は、ストレージ1602を監視しており、ストレージ1602へデータ1601が格納されると、ファイルシステムから得られる情報(メタデータ)をコンテンツストレージ1604にアーカイブ化して保存する。
コンテンツストレージ1604は、ETL1603が抽出した情報およびストレージ1602に一時的に蓄えられている処理前のデータ1601を保存する。
検索エンジン1605は、アプリケーションプログラム1608からのリクエストがあると、例えばテキスト検索であれば、ETL1603が作成したインデックスを元にテキスト検索を実施し、検索結果をアプリケーションプログラム1608に送信する。検索エンジン1605のアルゴリズムに関しては、公知の技術を適用することができる。検索エンジン1605はテキストだけでなく、画像、音声などのデータを検索するモジュールを搭載することもできる。
メタデータサーバ1606は、RDB(Relational DataBase)に蓄えられたメタデータを管理する。例えば、ETL1603が抽出した、データのファイル名、データ登録年月日、元データの種類、メタデータテキスト情報、などがRDBに登録されていると仮定する。アプリケーション1608からリクエストの要求があると、メタデータサーバ1606はそのリクエストに従って、RDB内の情報をアプリケーション1608に送信する。
マルチメディアサーバ1607は、コンテンツストレージ1604にアーカイブ化されたデータに対して、そのデータに合わせた情報抽出処理モジュール1609を動作させ、データの内容に関するメタデータを抽出する。
情報抽出処理モジュール1609は、例えば、テキストのインデックスモジュール、画像認識モジュールなどで構成されている。メタデータの例としては、時刻、N−gramインデックス、画像認識結果(物体名、画像中の領域座標)、画像特徴量とその関連語、音声認識結果、などが該当する。情報抽出モジュール1609として、何らかの情報(メタデータ)抽出を行うプログラムすべてを用いることができ、公知の技術を採用することができるので、ここでは情報抽出処理モジュール1609の説明を省略する。
各メディアデータから抽出されたメタデータは、互いに関連付けられ、グラフ形式で構造化されたグラフDB1611に蓄積される。関連図付けの一例としては、コンテンツストレージ1604に蓄えられた「リンゴ」という音声認識結果に対して、元の音声ファイル、画像データ、関連語などの対応関係をネットワーク形式で表現することができる。マルチメディアサーバ1607は、アプリケーション1608からのリクエストがあると、それに応じたメタ情報をアプリケーション1608に送信する。例えば、「リンゴ」というリクエストがあると、構築されたグラフ構造に基づき、リンゴを含む画像、平均相場、アーティストの曲名、などのネットワークグラフ上で関連付けられたメタ情報を提供する。
上記のコンテンツクラウドシステム1600において、画像検索システム100は、2通りの方法で利用される。第一に、情報抽出に必要な辞書データ1610を作成するモジュールとしての利用方法である。実施例1のように、画像に対してタグを付与する作業を効率化することが出来れば、高精度な情報抽出が実現される。第二に、情報抽出処理モジュール1609自体の機能として利用する方法である。実施例2のように、映像データが与えられた際に、推定されたタグとそのスコアをグラフDBに登録させることで、情報抽出処理モジュールとして動作させることができる。マルチメディアサーバ1607に複数の情報抽出処理モジュール1609が組み込まれる場合は、1台の計算機のリソースをシェアしてもよいし、モジュール毎に独立した計算機を用いてもよい。
<実施の形態4:まとめ>
以上のように、本発明に係る画像検索システム100は、コンテンツクラウドシステム1600の構成要素として適用することができる。コンテンツクラウドシステム1600は、各メディアデータに共通して利用可能なメタデータを生成することにより、メディア間にまたがって情報を統合することができる。これにより、付加価値がより高い情報をユーザへ提供することが期待される。
本発明は上記した実施形態に限定されるものではなく、様々な変形例が含まれる。上記実施形態は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全dての構成を備えるものに限定されるものではない。また、ある実施形態の構成の一部を他の実施形態の構成に置き換えることもできる。また、ある実施形態の構成に他の実施形態の構成を加えることもできる。また、各実施形態の構成の一部について、他の構成を追加・削除・置換することもできる。
上記各構成、機能、処理部、処理手段等は、それらの一部や全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリ、ハードディスク、SSD(Solid State Drive)等の記録装置、ICカード、SDカード、DVD等の記録媒体に格納することができる。
100:画像検索システム、
101:画像・映像記憶装置、
102:入力装置、
103:表示装置、
104:データ格納装置、
105:画像検索装置、
106:画像入力部、
107:ユーザ操作入力部、
108:画像データベース、
109:検索クエリ生成部、
110:類似画像検索部、
111:クエリ分類部、
112:クエリグループ重要度判定部、
113:検索結果生成部、
114:データ出力部、
1600:コンテンツクラウドシステム。

Claims (6)

  1. 検索対象となる画像から抽出された検索用画像特徴量が蓄積された記憶部と、
    複数の画像がクエリ画像として入力される入力部と、
    前記クエリ画像から画像特徴量を抽出する抽出部と、
    前記画像特徴量を用いて前記記憶部内の前記検索用画像特徴量を検索する検索部と、
    前記画像特徴量と類似する前記検索用画像特徴量を抽出した元の画像を検索結果として表示する表示部と、
    複数の前記クエリ画像を複数のグループに分類する分類部と、
    前記グループの重要度を求めるグループ重要度判定部と、
    前記グループを前記重要度の順に並び替え、前記グループ内では前記検索結果を類似度の順に並び替えて、前記グループごとに前記検索結果を出力する検索結果生成部と、
    を有する画像検索システム。
  2. 請求項1に記載の画像検索システムであって、
    前記記憶部には、さらに前記画像のタグ情報が蓄積され、
    前記表示部は、前記クエリ画像と前記検索結果である元の画像とを対応付けて表示することを特徴とする画像検索システム。
  3. 請求項に記載の画像検索システムであって、
    前記記憶部は、前記画像および前記画像の一部から抽出した検索対象オブジェクトと蓄積し、前記画像および前記検索対象オブジェクトから抽出されたそれぞれの前記検索用画像特徴量を蓄積し、
    前記抽出部は、前記クエリ画像の一部をクエリオブジェクトとして抽出し、前記クエリオブジェクトから前記画像特徴量を抽出することを特徴とする、画像検索システム。
  4. コンピュータに、
    検索対象となる画像から抽出された検索用画像特徴量が蓄積される記憶ステップと、
    複数の画像がクエリ画像として入力される入力ステップと、
    前記クエリ画像から画像特徴量を抽出する抽出ステップと、
    前記画像特徴量を用いて、蓄積された前記検索用画像特徴量を検索する検索ステップと、
    前記画像特徴量と類似する前記検索用画像特徴量を抽出した元の画像を検索結果として表示する表示ステップと、
    複数の前記クエリ画像を複数のグループに分類する分類ステップと、
    前記グループの重要度を求める重要度判定ステップと、
    前記グループを前記重要度の順に並び替え、前記グループ内では前記検索結果を類似度の順に並び替えて、前記グループごとに前記検索結果を出力する検索結果生成ステップと、
    を実行させることを特徴とするプログラムが記録された情報記録媒体。
  5. 請求項に記載の情報記録媒体であって、
    前記記憶ステップでは、さらに前記画像のタグ情報が蓄積され、
    前記表示ステップは、前記クエリ画像と前記検索結果である元の画像とを対応付けて表示することを特徴とする特徴とするプログラムが記録された情報記録媒体。
  6. 請求項に記載の情報記録媒体であって、
    前記記憶ステップは、前記画像および前記画像の一部から抽出した検索対象オブジェクトと蓄積し、前記画像および前記検索対象オブジェクトから抽出されたそれぞれの前記検索用画像特徴量を蓄積し、
    前記抽出ステップは、前記クエリ画像の一部をクエリオブジェクトとして抽出し、前記クエリオブジェクトから前記画像特徴量を抽出することを特徴とするプログラムが記録された情報記録媒体。
JP2015540296A 2013-10-02 2013-10-02 画像検索システムおよび情報記録媒体 Active JP6190887B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2013/076761 WO2015049732A1 (ja) 2013-10-02 2013-10-02 画像検索方法、画像検索システム、および情報記録媒体

Publications (2)

Publication Number Publication Date
JPWO2015049732A1 JPWO2015049732A1 (ja) 2017-03-09
JP6190887B2 true JP6190887B2 (ja) 2017-08-30

Family

ID=52778346

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015540296A Active JP6190887B2 (ja) 2013-10-02 2013-10-02 画像検索システムおよび情報記録媒体

Country Status (4)

Country Link
US (1) US11157550B2 (ja)
JP (1) JP6190887B2 (ja)
CN (1) CN105612513A (ja)
WO (1) WO2015049732A1 (ja)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201517462D0 (en) * 2015-10-02 2015-11-18 Tractable Ltd Semi-automatic labelling of datasets
KR20170046496A (ko) * 2015-10-21 2017-05-02 삼성전자주식회사 카메라를 갖는 전자 장치와 그의 이미지 처리 방법
US20170132510A1 (en) * 2015-11-05 2017-05-11 Facebook, Inc. Identifying Content Items Using a Deep-Learning Model
CN105426530B (zh) * 2015-12-15 2017-05-10 徐庆 一种商标检索方法、装置和系统
JP6489005B2 (ja) * 2015-12-18 2019-03-27 キヤノンマーケティングジャパン株式会社 情報処理システム、情報処理方法、プログラム
US11146865B2 (en) 2016-03-03 2021-10-12 Comcast Cable Communications, Llc Determining points of interest in a content item
CN107562742B (zh) * 2016-06-30 2021-02-05 江苏苏宁云计算有限公司 一种图像数据处理方法及装置
CN109478319A (zh) * 2016-07-11 2019-03-15 三菱电机株式会社 动态图像处理装置、动态图像处理方法及动态图像处理程序
KR101796506B1 (ko) * 2016-07-20 2017-11-14 엔에이치엔엔터테인먼트 주식회사 기종 정보를 활용한 이미지 검색 결과 제공 방법 및 시스템
US10191990B2 (en) * 2016-11-21 2019-01-29 Comcast Cable Communications, Llc Content recommendation system with weighted metadata annotations
CN110249304B (zh) 2017-01-19 2023-05-23 三星电子株式会社 电子设备的视觉智能管理
US10909371B2 (en) 2017-01-19 2021-02-02 Samsung Electronics Co., Ltd. System and method for contextual driven intelligence
JP6811645B2 (ja) * 2017-02-28 2021-01-13 株式会社日立製作所 画像検索装置及び画像検索方法
JP7005932B2 (ja) * 2017-04-28 2022-01-24 富士通株式会社 検索プログラム、検索装置及び検索方法
TWI650656B (zh) * 2017-05-26 2019-02-11 虹光精密工業股份有限公司 於電腦系統搜尋影像檔案之方法、影像檔案搜尋裝置以及電腦系統
EP4239498A3 (en) * 2017-12-22 2023-10-04 Google LLC Image selection suggestions
JP7018001B2 (ja) * 2018-09-20 2022-02-09 株式会社日立製作所 情報処理システム、情報処理システムを制御する方法及びプログラム
CN111177521B (zh) * 2018-10-24 2025-05-06 北京搜狗科技发展有限公司 一种查询词分类模型的确定方法和装置
CN111125390B (zh) * 2018-11-01 2024-05-17 北京市商汤科技开发有限公司 数据库更新方法和装置、电子设备、计算机存储介质
JP6585327B1 (ja) * 2019-01-25 2019-10-02 株式会社東芝 エピソード管理装置、エピソード管理プログラム及びエピソード管理方法
CN112784083B (zh) * 2019-11-04 2024-12-13 阿里巴巴集团控股有限公司 类目预测模型、特征提取模型的获取方法及装置
EP3882568B1 (de) * 2020-03-16 2022-07-06 Carl Zeiss Industrielle Messtechnik GmbH Computerimplementiertes verfahren zum automatischen erstellen eines prüfplans und entsprechendes computerprogramm, computerprogrammprodukt und koordinatenmessgerät
CN111552829B (zh) * 2020-05-07 2023-06-27 京东科技信息技术有限公司 用于分析图像素材的方法和装置
US20230186597A1 (en) * 2020-05-22 2023-06-15 Nec Corporation Image selection apparatus, image selection method, and non-transitory computer-readable medium
US20220155942A1 (en) * 2020-11-18 2022-05-19 Yokogawa Electric Corporation Information processing apparatus, information processing method, and program
CN112800258B (zh) * 2021-03-11 2024-05-31 上海依图网络科技有限公司 图像检索方法、装置、电子设备及计算机可读存储介质
JP2023129312A (ja) 2022-03-02 2023-09-14 日本電気株式会社 分類装置、分類方法、及びプログラム
US11762898B1 (en) * 2022-03-31 2023-09-19 Dropbox, Inc. Generating and utilizing digital media clips based on contextual metadata from digital environments
WO2024202485A1 (ja) * 2023-03-24 2024-10-03 ソニーグループ株式会社 情報処理装置及び情報処理方法、並びにコンピュータプログラム

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69535098T2 (de) * 1994-11-15 2007-04-19 Canon K.K. Verfahren und -vorrichtung zur Suche von Bildern in einer Datenbank
US6567551B2 (en) * 1998-04-27 2003-05-20 Canon Kabushiki Kaisha Image search apparatus and method, and computer readable memory
US6512850B2 (en) * 1998-12-09 2003-01-28 International Business Machines Corporation Method of and apparatus for identifying subsets of interrelated image objects from a set of image objects
JP2001256244A (ja) * 2000-03-14 2001-09-21 Fuji Xerox Co Ltd 画像データ分類装置および画像データ分類方法
KR100451649B1 (ko) * 2001-03-26 2004-10-08 엘지전자 주식회사 이미지 검색방법과 장치
JP4037790B2 (ja) * 2003-05-02 2008-01-23 アルパイン株式会社 ナビゲーション装置
JP4374902B2 (ja) * 2003-05-16 2009-12-02 富士通株式会社 類似画像検索装置、類似画像検索方法、および類似画像検索プログラム
JP4478513B2 (ja) * 2004-06-10 2010-06-09 キヤノン株式会社 デジタルカメラ、デジタルカメラの制御方法、プログラムおよびそれを格納した記録媒体
US7580952B2 (en) * 2005-02-28 2009-08-25 Microsoft Corporation Automatic digital image grouping using criteria based on image metadata and spatial information
JP5009577B2 (ja) * 2005-09-30 2012-08-22 富士フイルム株式会社 画像検索装置および方法並びにプログラム
US7840076B2 (en) * 2006-11-22 2010-11-23 Intel Corporation Methods and apparatus for retrieving images from a large collection of images
JP5358083B2 (ja) * 2007-11-01 2013-12-04 株式会社日立製作所 人物画像検索装置及び画像検索装置
JP4979070B2 (ja) 2007-03-28 2012-07-18 Kddi株式会社 動画像提示システム
WO2009031297A1 (ja) * 2007-09-07 2009-03-12 Mitsubishi Electric Corporation 画像検索装置、画像分類装置及び方法並びにプログラム
US8554783B2 (en) * 2007-09-17 2013-10-08 Morgan Stanley Computer object tagging
JP2010271769A (ja) 2009-05-19 2010-12-02 Seiko Epson Corp 画像処理方法及び装置、並びに、そのためのコンピュータプログラム
JP5515417B2 (ja) * 2009-05-21 2014-06-11 セイコーエプソン株式会社 画像処理方法及び装置、並びに、そのためのコンピュータープログラム
JP5438436B2 (ja) * 2009-08-27 2014-03-12 株式会社日立国際電気 画像検索装置
US8433140B2 (en) * 2009-11-02 2013-04-30 Microsoft Corporation Image metadata propagation
US8559731B2 (en) * 2010-01-18 2013-10-15 International Business Machines Corporation Personalized tag ranking
US20110188742A1 (en) * 2010-02-02 2011-08-04 Jie Yu Recommending user image to social network groups
US8949252B2 (en) * 2010-03-29 2015-02-03 Ebay Inc. Product category optimization for image similarity searching of image-based listings in a network-based publication system
US8495057B2 (en) * 2010-05-17 2013-07-23 Microsoft Corporation Image searching with recognition suggestion
US8625907B2 (en) * 2010-06-10 2014-01-07 Microsoft Corporation Image clustering
US9703895B2 (en) * 2010-06-11 2017-07-11 Microsoft Technology Licensing, Llc Organizing search results based upon clustered content
CN102483767B (zh) * 2010-07-09 2015-10-21 松下电器(美国)知识产权公司 对象关联装置、对象关联方法、程序及记录介质
KR101753141B1 (ko) * 2010-09-07 2017-07-04 삼성전자 주식회사 디스플레이장치 및 그 컨텐츠 표시방법
CN102207966B (zh) * 2011-06-01 2013-07-10 华南理工大学 基于对象标签的视频内容快速检索方法
US9424258B2 (en) * 2011-09-08 2016-08-23 Telefonaktiebolaget Lm Ericsson (Publ) Assigning tags to media files
KR101191172B1 (ko) * 2012-02-15 2012-10-15 (주)올라웍스 이미지 데이터베이스의 이미지들을 관리하는 방법, 장치 및 컴퓨터 판독 가능한 기록 매체
JP5577371B2 (ja) * 2012-03-29 2014-08-20 楽天株式会社 画像検索装置、画像検索方法およびプログラム
JP5768265B2 (ja) * 2012-05-24 2015-08-26 株式会社日立国際電気 類似画像検索システム
US9292622B2 (en) * 2012-12-27 2016-03-22 Google Inc. Systems and methods for providing search suggestions
US10438050B2 (en) * 2013-02-27 2019-10-08 Hitachi, Ltd. Image analysis device, image analysis system, and image analysis method
WO2014184785A2 (en) * 2013-05-16 2014-11-20 Yandex Europe Ag Method and system for presenting image information to a user of a client device
US9727901B2 (en) * 2013-06-13 2017-08-08 Yahoo! Inc. Systems and methods for image-based recommendations

Also Published As

Publication number Publication date
US20160217158A1 (en) 2016-07-28
WO2015049732A1 (ja) 2015-04-09
JPWO2015049732A1 (ja) 2017-03-09
US11157550B2 (en) 2021-10-26
CN105612513A (zh) 2016-05-25

Similar Documents

Publication Publication Date Title
JP6190887B2 (ja) 画像検索システムおよび情報記録媒体
JP6005837B2 (ja) 画像解析装置、画像解析システム、画像解析方法
JP4335335B2 (ja) ドキュメント画像のソート方法
JP3942290B2 (ja) ドキュメント画像のクライアント・ワークステーションへの送信方法
US9665798B2 (en) Device and method for detecting specified objects in images using metadata
CN103593336B (zh) 一种基于语义分析的知识推送系统及方法
CN105144200A (zh) 用于处理非结构化数字的基于内容的检索引擎
JP6371465B2 (ja) 画像検索装置、及び画像を検索する方法
CN111291191B (zh) 一种广电知识图谱构建方法及装置
CN114329069A (zh) 视觉搜索查询的智能系统和方法
CN103838756A (zh) 一种确定推送信息的方法及装置
CN111373392A (zh) 文献分类装置
Liu et al. Heterogeneous features and model selection for event-based media classification
CN118551063A (zh) 响应于多模态查询而提供的信息的视觉引用
WO2020095357A1 (ja) 検索ニーズ評価装置、検索ニーズ評価システム、及び検索ニーズ評価方法
Thanga Ramya et al. Novel effective X-path particle swarm optimization based deprived video data retrieval for smart city
Mohamadzadeh et al. Content based video retrieval based on hdwt and sparse representation
CN101211344A (zh) 文本信息遍历的快速四维可视化方法
JP2004348771A (ja) 技術文書検索装置
CN111475721A (zh) 信息推送方法、装置、设备及存储介质
Huang et al. Tag refinement of micro-videos by learning from multiple data sources
CN117874217A (zh) 一种非结构化文本数据可视化方法、装置及设备
Henry et al. Multifacet: A faceted interface for browsing large multimedia collections
CN118097479A (zh) 视频文本分类方法、装置、计算机设备和存储介质
CN118690015B (zh) 一种用于烟草行业项目管理的电子档案管理方法、系统及电子设备

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170307

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170426

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170725

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170807

R150 Certificate of patent or registration of utility model

Ref document number: 6190887

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150