JP4099981B2 - Image recognition system, image recognition method, and image recognition program - Google Patents
Image recognition system, image recognition method, and image recognition program Download PDFInfo
- Publication number
- JP4099981B2 JP4099981B2 JP2001369557A JP2001369557A JP4099981B2 JP 4099981 B2 JP4099981 B2 JP 4099981B2 JP 2001369557 A JP2001369557 A JP 2001369557A JP 2001369557 A JP2001369557 A JP 2001369557A JP 4099981 B2 JP4099981 B2 JP 4099981B2
- Authority
- JP
- Japan
- Prior art keywords
- dictionary
- input
- vector
- principal component
- distance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims description 56
- 239000013598 vector Substances 0.000 claims description 404
- 238000004364 calculation method Methods 0.000 claims description 46
- 230000010354 integration Effects 0.000 claims description 18
- 238000000513 principal component analysis Methods 0.000 claims description 15
- 238000009826 distribution Methods 0.000 description 38
- 238000010586 diagram Methods 0.000 description 23
- 238000000605 extraction Methods 0.000 description 15
- 239000011159 matrix material Substances 0.000 description 5
- 238000001514 detection method Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 238000012795 verification Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000000491 multivariate analysis Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、画像認識システム、画像認識方法および画像認識プログラムに関し、特に、画像として撮影された対象物体が、辞書に登録された物体かどうかを識別する、または辞書に登録された複数のカテゴリ中の一つに分類する画像認識システム、画像認識方法および画像認識プログラムに関する。
【0002】
【従来の技術】
従来の画像認識システムの一例が、特開平11−265452号公報(物体認識装置および物体認識方法)に記載されている。図13は、この従来の画像認識システムの構成を示すブロック図である。この図に示すように、従来の画像認識画像認識システムは、画像入力部501と、辞書記憶部502と、部分空間間の角度計算部503と、認識部504とから構成されている。
【0003】
画像入力部501は、複数方向から撮影された複数の画像を獲得する。辞書記憶部502には、あらかじめM次元の部分空間で表現された辞書データが、カテゴリごとに用意されている。部分空間間の角度計算部503は、まず画像入力部501によって獲得された入力画像群をN次元部分空間で表現する。具体的には、入力画像を1次元特徴データとみなして主成分分析し、N個の固有ベクトルを抽出し、このN個の固有ベクトルでN次元部分空間を規定する。部分空間間の角度計算部503は、さらに入力画像のN次元部分空間(以下、入力部分空間という)と辞書のM次元部分空間(以下、辞書部分空間という)との角度Θを、辞書のカテゴリごとに計算する。認識部504は、部分空間間の角度計算部503において算出された角度Θを比較し、角度Θが最も小さいカテゴリを認識結果として出力する。
【0004】
図14を参照して、より具体的に説明する。図14において、511は入力画像から抽出された特徴データが分布する入力特徴分布、512は入力特徴分布511を含む入力部分空間、521は辞書データのあるカテゴリの作成に用いた特徴データが分布する辞書特徴分布、522は辞書特徴分布521を含む辞書部分空間である。
入力部分空間512の基底ベクトルをΨn(n=1,2,…,N)、辞書部分空間522の基底ベクトルをΦm(m=1,2,…,M)とすると、部分空間間の角度計算部503で、式(1)または式(2)のxijを要素にもつ行列Xを計算する。
【0005】
【数7】
【0006】
行列Xの最大固有値として、部分空間512,522間の角度Θの余弦の二乗が求められる。角度Θの余弦の二乗が大きい(または、小さい)とき、角度Θは小さく(または、大きく)なり、また角度Θが小さい(または、大きい)とき、部分空間512,522間の類似度が大きく(または、小さく)なる。したがって、行列Xの最大固有値を、部分空間512,522間の類似度と言い換えることができる。
よって、部分空間間の角度計算部503で、各カテゴリに対し行列Xの最大固有値を求めて類似度とし、認識部504で、類似度が最大のカテゴリに入力画像を分類する。
【0007】
【発明が解決しようとする課題】
図15は、従来の画像認識システムの問題点を示す概念図である。
この図に示すように、同じ入力部分空間512内の異なる位置に3つの入力特徴分布511A,511B,511Cが存在する場合には、3つの入力特徴分布511A〜511Cは互いに離れた位置にあり、辞書部分空間522内の辞書特徴分布521との隔たりも明らかに異なるので、本来は異なる類似度が算出されなければならない。
【0008】
しかし、従来の画像認識システムでは、入力部分空間512と辞書部分空間522との角度Θの余弦の二乗と等価な行列Xの最大固有値を類似度として用いているので、同じ入力部分空間512内に存在する3つの入力特徴分布511A〜511Cと辞書部分空間522との類似度がすべて同じになってしまう。
このように、従来の画像認識システムでは、同じ入力部分空間512内の異なる位置に入力特徴分布がある場合には、辞書部分空間522との類似度がすべて同じとなり、判別できないという問題があった。
【0009】
本発明はこのような課題を解決するためになされたものであり、その目的は、入力部分空間と辞書部分空間との角度に依存せず、入力画像群を正しく判別することができる画像認識システム、画像認識方法および画像認識プログラムを提供することにある。
【0010】
【課題を解決するための手段】
このような目的を達成するために、本発明の画像認識システムは、同じ対象が撮影された複数の入力画像と予め登録された辞書データとを照合し認識結果を出力する画像認識システムであって、前記入力画像から得られた複数の入力特徴データの分布範囲に属する任意の一ベクトルである入力代表ベクトルと、前記入力特徴データによって張られる入力部分空間の基底である入力主成分ベクトルと、予め登録された辞書特徴データの分布範囲に属する任意の一ベクトルである辞書代表ベクトルと、前記辞書特徴データによって張られる辞書部分空間の基底である辞書主成分ベクトルとを用いて、前記入力部分空間と前記辞書部分空間との距離値を算出する距離算出手段と、前記距離値に基づいて前記認識結果を出力する識別を行う識別手段とを備えたことを特徴とする。
【0011】
より具体的には、前記入力画像から得られた複数の入力特徴データの分布範囲に属する任意の一ベクトルである入力代表ベクトルと、前記入力特徴データと入力代表ベクトルとの差分ベクトルによって張られる入力部分空間の基底である入力主成分ベクトルと、予め登録された辞書特徴データの分布範囲に属する任意の一ベクトルである辞書代表ベクトルと、前記辞書特徴データによって張られる辞書部分空間の基底である辞書主成分ベクトルとを用いて、前記入力部分空間と前記辞書部分空間との距離値を算出する距離算出手段と、前記距離値に基づいて前記認識結果を出力する識別を行う識別手段とを備えてもよい。これにより、複数の入力特徴分布が同じ入力部分空間内に存在する場合でも、各入力特徴分布の配置が異なれば距離値も異なるので、入力画像群を正しく判別することができる。
【0012】
この画像認識システムにおいて、入力主成分ベクトルおよび辞書主成分ベクトルが、直交基底であってもよい。直交基底である主成分ベクトルを用いて距離値の計算を行うことにより、直交基底でない場合と比較して、短時間で高精度の照合結果を得ることができ、認識率を向上させることができる。
また、入力代表ベクトルが、入力特徴データの平均ベクトルであり、入力主成分ベクトルが、入力特徴データから入力代表ベクトルを減算した成分のうち固有値が大きい方からK個の固有ベクトルであり、辞書代表ベクトルが、辞書特徴データの平均ベクトルであり、辞書主成分ベクトルが、辞書特徴データから辞書代表ベクトルを減算した成分のうち固有値が大きい方からL個の固有ベクトルであってもよい。
【0013】
また、距離算出手段は、L個の辞書主成分ベクトルで形成される空間と入力代表ベクトルとの第1の距離を算出する入力投影距離算出手段と、K個の入力主成分ベクトルで形成される空間と辞書代表ベクトルとの第2の距離を算出する辞書投影距離算出手段と、第1および第2の距離から入力部分空間と辞書部分空間との距離値を算出する統合手段とを備えるものであってもよい。このように入力画像および辞書データから得られた多くのデータを有効に利用して距離値を算出し、この距離値を照合に用いるので、照合性能が向上し、高い認識率が得られる。
【0014】
ここで、入力代表ベクトルをV1、辞書代表ベクトルをV2、入力主成分ベクトルをΨi(i=1,…,K)、辞書主成分ベクトルをΦj(j=1,…,L)とすると、入力投影距離算出手段は、式(3)により第1の距離d1を算出し、辞書投影距離算出手段は、式(4)により第2の距離d2を算出するものであってもよい。
【0015】
【数8】
【0016】
また、上述した画像認識システムにおいて、前記距離算出手段は、前記入力主成分ベクトルのそれぞれに対応するK個の重みと、前記辞書主成分ベクトルのそれぞれに対応するL個の重みとを用いるものであってもよい。
ここで、入力主成分ベクトルに対応する重みが、入力主成分ベクトルとなる固有ベクトルのK個の固有値であり、辞書主成分ベクトルに対応する重みが、辞書主成分ベクトルとなる固有ベクトルのL個の固有値であってもよい。
【0017】
また、入力代表ベクトルをV1、辞書代表ベクトルをV2、入力主成分ベクトルをΨi(i=1,…,K)、入力主成分ベクトルに対応する重みをμi(i=1,…,K)、辞書主成分ベクトルをΦj(j=1,…,L)、辞書主成分ベクトルに対応する重みをλj(j=1,…,L)とすると、入力投影距離算出手段は、式(5)により第1の距離d1を算出し、辞書投影距離算出手段は、式(6)により第2の距離d2を算出するものであってもよい(ただし、σは任意の定数)。
【0018】
【数9】
【0019】
また、上述した画像認識システムにおいて、統合手段は、第1の距離d1および第2の距離d2から式(7)により入力部分空間と辞書部分空間との距離値Dを算出するものであってもよい。
D=αd1+βd2 ・・・(7)
(ただし、α,βは定数)
あるいは、統合手段は、第1の距離d1および第2の距離d2から式(8)により入力部分空間と辞書部分空間との距離値Dを算出するものであってもよい。
D=αd1・d2/(d1+d2) ・・・(8)
(ただし、αは定数)
【0020】
また、上述した画像認識システムにおいて、前記複数の入力特徴データから前記入力代表ベクトルを生成する入力代表ベクトル生成手段と、前記入力特徴データから前記入力主成分ベクトルを生成する入力主成分データ生成手段とをさらに備えていてもよい。
【0021】
また、上述した画像認識システムにおいて、前記辞書代表ベクトルを生成する辞書代表ベクトル生成手段と、前記辞書主成分ベクトルを生成し、前記辞書代表ベクトルおよび前記辞書主成分ベクトルを格納する辞書格納手段に出力する辞書主成分データ生成手段とをさらに備えていてもよい。
また、上述した画像認識システムは、認識対象が人間の顔画像である。これにより、人間の顔画像を用いて画像中の人物を同定するシステムを構成することができる。
【0022】
また、本発明の画像認識方法は、同じ対象が撮影された複数の入力画像と予め登録された辞書データとを照合し認識結果を出力する画像認識方法であって、前記入力画像から得られた複数の入力特徴データの分布範囲に属する任意の一ベクトルである入力代表ベクトルと、前記入力特徴データによって張られる入力部分空間の基底である入力主成分ベクトルと、予め登録された辞書特徴データの分布範囲に属する任意の一ベクトルである辞書代表ベクトルと、前記辞書特徴データによって張られる辞書部分空間の基底である辞書主成分ベクトルとを用いて、前記入力部分空間と前記辞書部分空間との距離値を算出する距離算出ステップと、前記距離値に基づいて前記認識結果を出力する識別を行う識別ステップとを備えたことを特徴とする。
【0023】
より具体的には、前記入力画像から得られた複数の入力特徴データの分布範囲に属する任意の一ベクトルである入力代表ベクトルと、前記入力特徴データと入力代表ベクトルとの差分ベクトルによって張られる入力部分空間の基底である入力主成分ベクトルと、予め登録された辞書特徴データの分布範囲に属する任意の一ベクトルである辞書代表ベクトルと、前記辞書特徴データによって張られる辞書部分空間の基底である辞書主成分ベクトルとを用いて、前記入力部分空間と前記辞書部分空間との距離値を算出する距離算出ステップと、前記距離値に基づいて前記認識結果を出力する識別を行う識別ステップとを備えていてもよい。
この画像認識方法において、入力主成分ベクトルおよび辞書主成分ベクトルが、直交基底であってもよい。
【0024】
また、前記入力代表ベクトルは、前記入力特徴データの平均ベクトルであり、前記入力主成分ベクトルは、前記入力特徴データから前記入力代表ベクトルを減算した成分のうち、固有値が大きい方からK個の固有ベクトルであり、前記辞書代表ベクトルは、前記辞書特徴データの平均ベクトルであり、前記辞書主成分ベクトルは、前記辞書特徴データから前記辞書代表ベクトルを減算した成分のうち、固有値が大きい方からL個の固有ベクトルであってもよい。
【0025】
また、前記距離算出ステップは、前記L個の辞書主成分ベクトルで形成される空間と前記入力代表ベクトルとの第1の距離を算出する入力投影距離算出ステップと、前記K個の入力主成分ベクトルで形成される空間と前記辞書代表ベクトルとの第2の距離を算出する辞書投影距離算出ステップと、前記第1および第2の距離から前記入力部分空間と前記辞書部分空間との前記距離値を算出する統合ステップとからなるものであってもよい。
【0027】
また、前記入力代表ベクトルをV 1 、前記辞書代表ベクトルをV 2 、前記入力主成分ベクトルをΨ i (i=1,…,K)、前記辞書主成分ベクトルをΦ j (j=1,…,L)とすると、前記入力投影距離算出ステップは、式(9)により前記第1の距離d 1 を算出し、前記辞書投影距離算出ステップは、式(10)により前記第2の距離d 2 を算出するものであってもよい。
【0028】
【数10】
【0029】
また、前記距離算出ステップは、前記入力主成分ベクトルのそれぞれに対応するK個の重みと、前記辞書主成分ベクトルのそれぞれに対応するL個の重みとを用いるものであってもよい。
ここで、前記入力主成分ベクトルに対応する重みは、前記入力主成分ベクトルとなる前記固有ベクトルのK個の固有値であり、前記辞書主成分ベクトルに対応する重みは、前記辞書主成分ベクトルとなる前記固有ベクトルのL個の固有値であってもよい。
【0030】
また、前記入力代表ベクトルをV 1 、前記辞書代表ベクトルをV 2 、前記入力主成分ベクトルをΨ i (i=1,…,K)、前記入力主成分ベクトルに対応する前記重みをμ i (i=1,…,K)、前記辞書主成分ベクトルをΦ j (j=1,…,L)、前記辞書主成分ベクトルに対応する前記重みをλ j (j=1,…,L)とすると、前記入力投影距離算出ステップは、式(11)により前記第1の距離d 1 を算出し、前記辞書投影距離算出ステップは、式(12)により前記第2の距離d 2 を算出するものであってもよい(ただし、σは任意の定数)。
【0031】
【数11】
【0032】
また、前記統合ステップは、前記第1の距離d 1 および前記第2の距離d 2 から式(13)により前記入力部分空間と前記辞書部分空間との前記距離値Dを算出するものであってもよい。
D=αd1+βd2 ・・・(13)
(ただし、α,βは定数)
あるいは、前記統合ステップは、前記第1の距離d 1 および前記第2の距離d 2 から式(14)により前記入力部分空間と前記辞書部分空間との前記距離値Dを算出するものであってもよい。
D=αd1・d2/(d1+d2) ・・・(14)
(ただし、αは定数)
【0033】
また、上述した画像認識方法は、前記複数の入力特徴データから前記入力代表ベクトルを生成する入力代表ベクトル生成ステップと、前記入力特徴データから前記入力主成分ベクトルを生成する入力主成分データ生成ステップとをさらに備えていてもよい。
また、上述した画像認識方法は、前記辞書代表ベクトルを生成する辞書代表ベクトル生成ステップと、前記辞書主成分ベクトルを生成し、前記辞書代表ベクトルおよび前記辞書主成分ベクトルを格納する辞書格納手段に出力する辞書主成分データ生成ステップとをさらに備えていてもよい。
また、上述した画像認識方法は、認識対象が人間の顔画像である。
【0034】
【発明の実施の形態】
次に、本発明の実施の形態について、図面を参照して詳細に説明する。
【0035】
(第1の実施の形態)
図1は、本発明の第1の実施の形態である画像認識システムの構成を示すブロック図である。図2は、図1に示す画像認識システムによる処理を概念的に示す図である。
図1に示す画像認識システムは、同じ対象を撮影して得られた複数の学習画像データからなる学習画像群を獲得する学習画像群入力部1と、この学習画像群入力部1より入力される学習画像群から辞書データを生成する学習部2と、この学習部2で生成される辞書データを撮影対象毎にカテゴリに分けて格納する辞書格納部3と、同じ対象を撮影して得られた複数の入力画像データからなる入力画像群を獲得する識別対象画像群入力部4と、辞書格納部3に格納されている辞書データを用いて識別対象画像群入力部4より入力される入力画像群から撮影対象を認識する照合部5とから構成されている。
【0036】
学習画像群入力部1は、辞書として登録するためビデオカメラ等によって同一対象物体を撮影して得られたM個(Mは自然数)の静止画像を獲得し、これらを学習画像データ1AとしてカテゴリID1Bとともに学習部2に出力する。M個の学習画像データ1Aは、カテゴリID1Bによって指定されたカテゴリに属するものとする。
学習部2は更に、学習画像特徴抽出部21と、辞書代表ベクトル生成部22と、辞書主成分データ生成部(辞書部分空間生成手段)23とから構成されている。
【0037】
学習画像特徴抽出部21は、学習画像群入力部1より入力されるM個の学習画像データ1Aから、認識に用いるM個の辞書特徴データ21Aを特徴抽出し、辞書代表ベクトル生成部22および辞書主成分データ生成部23に出力する。M個の辞書特徴データ21Aからなる辞書特徴データ群は、図2(a)に示す辞書特徴分布21Bに分布しているものとする。
学習画像特徴抽出部21の一例として、元の画像データに1次微分、2次微分フィルタを作用させた出力を、ラスタースキャンして1次元特徴データとして出力するものがある。また、辞書画像特徴抽出部21の他の例として、元の画像データをラスタースキャンして1次元特徴データとし、その平均を0、分散を1.0とするように、平均と分散を一定値に正規化するものがある。これにより、輪郭強調や雑音除去などが施された辞書特徴データ21Aが得られる。
なお、学習画像特徴抽出部21は、仮に識別対象画像群入力部4から出力される入力画像データ4Aが入力されたとしたら、照合部5の入力画像特徴抽出部51と同じ特徴データを抽出するものである必要がある。
【0038】
辞書代表ベクトル生成部22は、M個の入力特徴データ21Aからなる辞書特徴データ群を基に、この辞書特徴データ群を代表する1つのベクトルである辞書代表ベクトル22Aを生成し、辞書主成分データ生成部23および辞書格納部3に出力する。辞書代表ベクトル22Aは、辞書特徴分布21Bを含む辞書部分空間に属する任意のベクトルであり、原点Oを始点とし、辞書部分空間上のP点を終点とする。辞書代表ベクトル22Aの一例として、辞書特徴データ群の平均値(平均ベクトル)や中央値(中央ベクトル)などが挙げられる。
【0039】
辞書主成分データ生成部23は、M個の辞書特徴データ21Aのそれぞれから辞書代表ベクトル22Aを除いた後の成分を代表するL個のベクトルである辞書主成分ベクトル(Φj(j=1,・・・,L))23Aと、辞書主成分ベクトル(Φi)のそれぞれに対応する重み値(λj(j=1,・・・,L))23Bを抽出し、辞書格納部3に出力する。辞書特徴データ21Aの特徴次元数をDとすると、Lは1より大きく、min(M,D)以下の自然数である。min(M,D)は、MとDの小さい方の数を表す。辞書主成分ベクトル23Aは、辞書特徴分布21Bを含む辞書部分空間を表すベクトルである。
【0040】
辞書特徴データ21Aから辞書代表ベクトル22Aを除く方法としては、辞書特徴データ21Aから辞書代表ベクトル22Aを減算する方法や、辞書特徴データ21Aの辞書代表ベクトル22Aに垂直な成分を計算する方法がある。
その後、L個の辞書主成分ベクトル23Aおよび重み値23Bを抽出する方法としては、M個の辞書特徴データ21Aのそれぞれから辞書代表ベクトル22Aを除いた後の成分を主成分分析し、固有値が大きい方からL個の固有ベクトルを辞書主成分ベクトル23Aとして選択し、選択された辞書主成分ベクトル23Aに対応する固有値を重み値23Bとして採用する方法がある。固有値および固有ベクトルの求め方は、一般的な多変量解析の文献に述べられており、例えば文献1(田中、脇本著、「多変量統計解析法」、現代数学社、pp.71-79, 1983)がある。
【0041】
辞書格納部3は、例えば図3に示すように、C個(Cは自然数)のレコード記憶部31,32,・・・,3Cを有し、各レコード記憶部31〜3Cは、それぞれレコード番号61、辞書代表ベクトル62、辞書主成分データ63、カテゴリID64を記憶することができる。辞書代表ベクトル62として、辞書代表ベクトル生成部22で生成された辞書代表ベクトル22Aを、辞書主成分データ63として、辞書主成分データ生成部23で生成されたL個の辞書主成分ベクトル23Aおよび重み値23Bを、カテゴリID64として、カテゴリID1Bを記憶する。このように辞書格納部3は、辞書代表ベクトル62および辞書主成分データ63を辞書データとしてカテゴリID64にしたがって格納する。なお、同じカテゴリIDをもつ複数の辞書データを格納することも可能である。
【0042】
識別対象画像群入力部4は、ビデオカメラ等によって同一対象物体を撮影して得られたN個(Nは自然数)の静止画像を獲得し、これらを入力画像データ4Aとして照合部5に出力する。
照合部5は更に、入力画像特徴抽出部51と、入力代表ベクトル生成部52と、入力主成分データ生成部(入力部分空間生成手段)53と、距離算出部54と、識別部55とから構成されている。
【0043】
入力画像特徴抽出部51は、識別対象画像群入力部4より入力されるN個の入力画像データ4Aから、認識に用いるN個の入力特徴データ51Aを特徴抽出し、入力代表ベクトル生成部52および入力主成分データ生成部53に出力する。N個の入力特徴データ51Aからなる入力特徴データ群は、図2(a)に示す入力特徴分布51Bに分布しているものとする。
入力画像特徴抽出部51の一例として、元の画像データに1次微分、2次微分フィルタを作用させた出力を、ラスタースキャンして1次元特徴データとして出力するものがある。また入力画像特徴抽出部51の他の例として、元の画像データをラスタースキャンして1次元特徴データとし、その平均を0、分散を1.0とするように、平均と分散を一定値に正規化するものがある。これにより、輪郭強調や雑音除去などが施された入力特徴データ51Aが得られる。
【0044】
入力代表ベクトル生成部52は、N個の入力特徴データ51Aからなる入力特徴データ群を基に、この入力特徴データ群を代表する1つのベクトルである入力代表ベクトル52Aを生成し、入力主成分データ生成部53および距離算出部54に出力する。入力代表ベクトル52Aは、入力特徴分布51Bを含む入力部分空間に属する任意のベクトルであり、原点Oを始点とし、入力部分空間上のQ点を終点とする。入力代表ベクトル52Aの一例として、入力特徴データ群の平均値(平均ベクトル)や中央値(中央ベクトル)などが挙げられる。
【0045】
入力主成分データ生成部53は、N個の入力特徴データ51Aのそれぞれから入力代表ベクトル52Aを除いた後の成分を代表するK個のベクトルである入力主成分ベクトル(Ψi(i=1,・・・,K))53Aと、入力主成分ベクトル(Ψj)のそれぞれに対応する重み値(μi(i=1,・・・,K))53Cを抽出し、距離算出部54に出力する。入力特徴データ51Aの特徴次元数をDとすると、Kは1より大きく、min(N,D)以下の自然数である。入力主成分ベクトル53Aは、入力特徴分布51Bを含む入力部分空間を表すベクトルである。
【0046】
入力特徴データ51Aから入力代表ベクトル52Aを除く方法としては、入力特徴データ51Aから入力代表ベクトル52Aを減算する方法や、入力特徴データ51Aの入力代表ベクトル52Aに垂直な成分を計算する方法がある。
K個の入力主成分ベクトル53Aおよび重み値53Cを抽出する方法としては、N個の入力特徴データ51Aのそれぞれから入力代表ベクトル52Aを除いた後の成分を主成分分析し、固有値が大きい方からK個の固有ベクトルを入力主成分ベクトル53Aとして選択し、選択された入力主成分ベクトル53Aに対応する固有値を重み値53Cとして採用する方法がある。
【0047】
距離算出部54は、入力代表ベクトル52A、入力主成分ベクトル53Aおよび重み値53Cを用いて、辞書格納部3に格納されているC個のカテゴリに属する辞書データとの距離値を算出する。より具体的には、辞書格納部3のレコード記憶部31〜3Cのそれぞれから、辞書代表ベクトル62と、辞書主成分データ63として記憶されているL個の辞書主成分ベクトル63Aおよび重み値63Bとを読み出し、入力代表ベクトル52A、入力主成分ベクトル53Aおよび重み値53Cを用いて、図2(b)に示す入力特徴分布51Bを含む入力部分空間と各カテゴリの辞書特徴分布21BBを含む辞書部分空間との間の距離の値Dを算出し、距離値54Aとして識別部55に順次出力する。
【0048】
識別部55は、C個のカテゴリとの距離値54Aに基づいて、入力画像データ4Aに対する認識結果5Aを出力する。この識別部55は、例えば図4に示すように、最小値算出部71と、閾値処理部72とから構成される。最小値算出部71は、C個のカテゴリとの距離値54Aの最小値を求める。閾値処理部72は、最小値算出部71によって求められた最小値を、あらかじめ決められた閾値と比較し、閾値より小さければ、最小値が得られたカテゴリを認識結果5Aとして出力する。逆に、閾値以上であれば、入力画像データ4Aは辞書には存在しないパターンであるという認識結果5Aを出力する。
【0049】
次に、図5および図6を参照し、距離算出部54の構成および動作について詳述する。図5は、距離算出部54の一構成例を示すブロック図である。図6は、距離算出部54の動作を説明する概念図である。
図5に示すように、距離算出部54は、入力投影距離算出部81と、辞書投影距離算出部82と、統合部83とから構成される。
入力投影距離算出部81は、図6に示す入力代表ベクトル52Aの終点Qと、L個の辞書主成分ベクトル63Aで形成される辞書部分空間63Cとの距離を表す入力投影距離値(第1の距離)d1を算出する。入力代表ベクトル52AをV1、辞書代表ベクトル62をV2、σを任意の定数とすると、距離値d1を例えば式(15)によって算出することができる。
【0050】
【数12】
【0051】
計算の高速化のため、定数σ=0とし、式(16)のように簡略化してもよい。
【0052】
【数13】
【0053】
式(15)および式(16)において、ベクトル(V2−V1)は、ベクトルQPであり、入力投影距離値d1は、入力代表ベクトル52Aの終点Qと、辞書部分空間63Cとの距離値を表している。
辞書投影距離算出部82は、図6に示す辞書代表ベクトル62の終点Pと、K個の入力主成分ベクトル53Aで形成される入力部分空間53Cとの辞書投影距離値(第2の距離)d2を算出する。同様に、距離値d2を例えば式(17)によって算出することができる。
【0054】
【数14】
【0055】
計算の高速化のため、定数σ=0とし、式(18)のように簡略化してもよい。
【0056】
【数15】
【0057】
式(17)および式(18)において、ベクトル(V1−V2)は、ベクトルPQであり、辞書投影距離値d2は、辞書代表ベクトル62の終点Pと、入力部分空間53Cとの距離値を表している。
統合部83は、入力投影距離値d1および辞書投影距離値d2の両方を用いて、距離値Dを算出する。例えば、式(19)を用いて距離値Dを算出することができる。
D=αd1+βd2 ・・・(19)
ただし、α,βは定数である。
また、式(20)を用いてもよい。
D=αd1・d2/(d1+d2) ・・・(20)
ただし、αは定数である。
【0058】
図2(b)において、入力特徴分布51Bと辞書特徴分布21BBとの間の距離値Dは、ベクトルPQのノルムを計算することによっても得られるが、この方法では入力代表ベクトル52Aおよび辞書代表ベクトル62の2個のデータしか用いないので、得られた距離値Dを実際の照合に用いても、照合性能が低く、高い認識率は得られない。これに対し、入力代表ベクトル52Aと辞書部分空間63Cとの投影距離値d1と、辞書代表ベクトル62と入力部分空間53Cとの投影距離値d2とを統合することによって得られた距離値Dは、入力代表ベクトル52A、辞書代表ベクトル62に加えて、K個の入力主成分ベクトル53A(および重み値53B)と、L個の辞書主成分ベクトル63A(および重み値63B)という、より多くのデータを利用して得られたものであるから、上述した方法と比較して、照合性能がはるかに高く、高い認識率が得られる。
【0059】
また、入力部分空間53Cと辞書部分空間63Cとの角度ではなく、代表ベクトルおよび主成分ベクトルを用いて算出した分布間の距離値Dを照合に用いるので、図15に示したような分布配置の場合でも、正確な照合が可能となる。
また、入力画像として複数の画像データ4Aを用いるので、1つの入力画像データを用いて認識するシステムに比べると、照合性能がはるかに高い。
なお、距離値Dの計算に用いる辞書主成分ベクトル63Aおよび入力主成分ベクトル53Aは、ともに直交基底であることが好ましい。直交基底である主成分ベクトル63A,53Aを用いて距離値の計算を行うことにより、直交基底でない場合と比較して、短時間で高精度の照合結果を得ることができ、認識率を向上させることができるからである。
【0060】
次に、図1に示した画像認識システムの辞書データ学習の動作について説明する。図7は、この辞書データ学習の動作の流れを示すフローチャートである。また、図8は、辞書学習に用いる学習画像の一例を示す図である。
まず、辞書学習に用いる学習画像群と、この学習画像群に対応するカテゴリIDを入力する(図7のステップS1)。この学習画像群は、例えば図8に示すように、カテゴリ1の学習画像データ91、カテゴリ2の学習画像データ92、カテゴリ3の学習画像データ93のように、特定のカテゴリに属する複数(M個)の画像データからなる。
【0061】
つぎに、入力されたM個の学習画像データのそれぞれに対して特徴抽出を行い、M個の辞書特徴データを得る(図7のステップS2)。つぎに、得られた辞書特徴データ群を代表する1つのベクトルを生成し、辞書代表ベクトルとする(図7のステップS3)。つぎに、辞書特徴データ群から辞書代表ベクトルを除いた成分について、その分布を代表するL個の辞書主成分ベクトルを含む辞書主成分データを生成する(図7のステップS4)。こうして得られた辞書代表ベクトルおよび辞書主成分データを辞書データとして、カテゴリIDによって分類し辞書格納部3に格納する(図7のステップS5)。
他のカテゴリについて学習するかどうかを判断し(図7のステップS6)、学習する場合には学習画像群の入力(図7のステップS1)から作業を繰り返す。作成が終了したら学習動作を終了する。
【0062】
次に、図1に示した画像認識システムの認識動作について説明する。図9は、この認識動作の流れを示すフローチャートである。また、図10は、認識対象の入力画像の一例を示す図である。
まず、認識対象の画像群を入力する(図9のステップS11)。この入力画像群は、例えば図10に示すように、同じ対象物体を撮影して得られた複数(N個)の画像データ90からなる。
【0063】
つぎに、入力されたN個の入力画像データのそれぞれに対して特徴抽出を行い、N個の入力特徴データを得る(図9のステップS12)。つぎに、得られた入力特徴データ群を代表する1つのベクトルを生成し、入力代表ベクトルとする(図9のステップS13)。つぎに、入力特徴データ群から入力代表ベクトルを除いた成分について、その分布を代表するK個の入力主成分ベクトルを含む入力主成分データを生成する(図9のステップS14)。
【0064】
つぎに、辞書格納部3にカテゴリ毎に格納されている辞書データを読み出し、入力代表ベクトルおよび入力主成分データを用いて、辞書データとの距離値をカテゴリ毎に計算する(図9のステップS15)。そして、これらの中で最小の距離値を求める(図9のステップS16)。
つぎに、最小距離値が閾値よりも小さいかどうかを判断する(図9のステップS17)。最小距離値が閾値よりも小さいときは、最小距離となったカテゴリを認識結果として出力して終了する(図9のステップS18)。逆に、最小距離値が閾値以上であるときは、該当クラスなしを出力して終了する(図9のステップS19)。ここでは、最小距離値が閾値と等しい場合、ステップS19に移行することとしたが、ステップS18に移行するようにしてもよいことは言うまでもない。
【0065】
(第2の実施の形態)
図11は、本発明の第2の実施の形態である顔画像認識システムの構成を示すブロック図である。この顔画像認識システムは、顔画像検出部100と、学習部102と、顔辞書格納部103と、照合部105とから構成されている。
顔画像検出部100は、ビデオ映像などの画像シーケンスの各フレームから人間の顔が映っている顔画像データを選択する。辞書データ学習動作の際には、選択された顔画像データを学習部102に出力し、認識動作の際には、照合部105に出力する。顔画像データを選択する方法としては、人間の肌の色に近い色の領域の面積、動きのある領域の面積がある閾値以上になったときに顔があると判断する方法がある。また、人間が手動で顔が撮影された画像群を画面で見ながら選択する方法もある。
【0066】
学習部102の動作は、図1における学習部2の動作と同じである。顔辞書格納部103の動作は、レコードとして人間の顔画像を対象とした辞書データが格納されることを除き、図1における辞書格納部3の動作と同じである。照合部105の動作は、図1における照合部5の動作と同じである。
図8に示す顔画像認識システムは、人間の顔を対象とし、入力された画像に映る人物が誰なのかを認識することができ、セキュリティ、監視、ヒューマンインターフェース等に利用することができる。
【0067】
(第3の実施の形態)
図12は、本発明の画像認識システムである第3の実施の形態の構成を示すブロック図である。この画像認識システムは、プログラム制御により動作するコンピュータ110と、識別対象画像及び学習画像を取り込みコンピュータ110に出力するカメラ121と、コンピュータ110に対してオペレータが認識の指示及び学習の指示を与えるための操作卓122と、コンピュータ110から出力された認識結果を表示する表示装置123とから構成されている。コンピュータ110は、演算処理部111と記憶部112とインタフェース部(以下、I/F部という)1131 〜1134 とがバス114に接続された構成となっている。I/F部1131 〜1133 は、コンピュータ110の外部装置であるカメラ121、操作卓122、表示装置123とインタフェースをとる。
【0068】
コンピュータ110の動作を制御する画像認識プログラムは、磁気ディスク、半導体メモリその他の記録媒体124に記録された状態で提供される。この記録媒体124をI/F部1134 に接続すると、演算処理部111は記録媒体124に書き込まれた画像認識プログラムを読み出し、記憶部112に格納する。その後、操作卓122からの指示に基づき、演算処理部111が記憶部112に格納された画像認識プログラムを実行し、図1に示した学習部2と、辞書格納部3と、照合部5とを実現する。
なお、画像認識プログラムは、インターネットなどの電気通信回線を介して提供されてもよい。
【0069】
コンピュータ110は、図7および図9のフローチャートに示す動作を行う。すなわち、操作卓122より学習の指示があり、カメラ121から学習画像データ群が入力されるとともに操作卓から対応するカテゴリIDが入力されると、学習画像データ群の特徴抽出を行い、得られた辞書特徴データ群を基に辞書代表ベクトルおよび辞書主成分データを生成し、この辞書代表ベクトルおよび辞書主成分データをカテゴリIDによって分類し、記憶部112によって構成される辞書格納部に辞書データとして格納する。つぎに、他のカテゴリについて学習するかどうかを判断し、学習する場合には学習画像データの入力から作業を繰り返す。作成が終了したら学習動作を終了する。
【0070】
また、操作卓122より認識の指示があり、カメラ121から識別対象の画像データ群が入力されると、特徴抽出を行い、得られた入力特徴データ群を基に入力代表ベクトルおよび入力主成分データを生成する。つぎに、辞書格納部にカテゴリ毎に格納されている辞書データを読み出し、入力代表ベクトルおよび入力主成分データを用いて、辞書データとの距離値をカテゴリ毎に計算する。そして、これらの中で最小の距離値を求め、最小距離値が閾値よりも小さいかどうかを判断する。最小距離が閾値よりも小さいときは、最小距離となったカテゴリを認識結果として表示装置123に表示し、逆に最小距離が閾値以上であるときは、該当クラスがない旨を表示装置123に表示し、認識動作を終了する。
なお、演算処理部111が画像認識プログラムを実行することにより、図11に示した顔画像検出部100と、学習部102と、顔辞書格納部103と、照合部105とを実現させることもできる。
【0071】
【発明の効果】
以上説明したように、本発明では、K個の入力主成分ベクトル、入力代表ベクトル、L個の辞書主成分ベクトルおよび辞書代表ベクトルを用いて入力部分空間と辞書部分空間との距離値を算出し、算出された距離値を照合に用いる。これにより、複数の入力特徴分布が同じ入力部分空間内に存在する場合でも、各入力特徴分布の配置が異なれば距離値も異なるので、入力画像群を正しく判別することができる。
また、本発明では、複数の入力画像を用い、しかも複数の入力画像から得られた多くのデータを有効に利用して距離値を算出し、この距離値を照合に用いるので、1つの入力画像を用いて認識を行なう場合と比較して、照合性能がはるかに高く、高い認識率が得られる。
したがって、同一物体の照明による変動、向きによる変動、変形などを吸収し、頑強な認識システムおよび方法を構築することが可能となる。
【0072】
また、直交基底である主成分ベクトルを用いて距離値の計算を行うことにより、直交基底でない場合と比較して、短時間で高精度の照合結果を得ることができ、認識率を向上させることができる。
また、辞書主成分ベクトルおよび辞書代表ベクトルを生成する手段を設けることにより、または、かかる処理を行うことにより、辞書データの内容を随時更新し、急激な内容変化に対応することができる。
また、入力される画像シーケンスから顔画像データを選択する手段を設けることにより、または、かかる処理を行なうことにより、人間の顔画像を用いて画像中の人物を同定するシステムを構築することができる。
【図面の簡単な説明】
【図1】 本発明の第1の実施の形態である画像認識システムの構成を示すブロック図である。
【図2】 図1に示す画像認識システムによる処理を概念的に示す図である。
【図3】 辞書格納部の一構成例を示すブロック図である。
【図4】 識別部の一構成例を示すブロック図である。
【図5】 距離算出部の一構成例を示すブロック図である。
【図6】 距離算出部の動作を説明する概念図である。
【図7】 図1に示す画像認識システムの辞書データ学習の動作の流れを示すフローチャートである。
【図8】 辞書学習に用いる学習画像の一例を示す図である。
【図9】 図1に示す画像認識システムの認識動作の流れを示すフローチャートである。
【図10】 認識対象の入力画像の一例を示す図である。
【図11】 本発明の第2の実施の形態である顔画像認識システムの構成を示すブロック図である。
【図12】 本発明の画像認識システムである第3の実施の形態の構成を示すブロック図である。
【図13】 従来の画像認識システムの構成を示すブロック図である。
【図14】 従来の画像認識システムで用いられる類似度を示す概念図である。
【図15】 従来の画像認識システムの問題点を示す概念図である。
【符号の説明】
1…学習画像群入力部、1A…学習画像データ1A、1B…カテゴリID、2…学習部、3…辞書格納部、4…識別対象画像群入力部、5…照合部、5A…認識結果、21…学習画像特徴抽出部、21A…辞書特徴データ、21B,21B′…辞書特徴分布、22…辞書代表ベクトル生成部、22A…辞書代表ベクトル、23…辞書主成分データ生成部、23A…辞書主成分ベクトル、23B…重み値、31〜3C…レコード記憶部、51…入力画像特徴抽出部、51A…入力特徴データ、51B…入力特徴分布、52…入力代表ベクトル生成部、52A…入力代表ベクトル、53…入力主成分データ生成部、53A…入力主成分ベクトル、53B…重み値、53C…入力部分空間、54…距離算出部、54A…距離値、55…識別部、61…レコード番号、62…辞書代表ベクトル、63…辞書主成分データ、63A…辞書主成分ベクトル、63C…辞書部分空間、64…カテゴリID、71…最小値算出部、72…閾値処理部、81…入力投影距離算出部、82…辞書投影距離算出部、83…統合部、90…識別対象の入力画像データ、91〜93…学習画像データ、100…顔画像検出部、102…学習部、103…顔辞書格納部、105…照合部、110…コンピュータ、111…演算処理部、112…記憶部、113…インタフェース部、114…バス、121…カメラ、122…操作卓、123…表示装置、124…記憶媒体、501…画像入力部、502…辞書記憶部、503…部分空間間の角度計算部、504…認識部、511,511A〜511C…入力特徴分布、512…入力部分空間、521…辞書特徴分布、522…辞書部分空間、D,d1,d2…距離値、O…座標系の原点、P…辞書代表ベクトルの終点、Q…入力代表ベクトルの終点、S1〜S6…学習動作のステップ、S11〜S19…認識動作のステップ、V1…入力代表ベクトル、V2…辞書代表ベクトル、Θ…角度。[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an image recognition system, an image recognition method, and an image recognition program, and in particular, identifies whether a target object photographed as an image is an object registered in a dictionary, or in a plurality of categories registered in a dictionary. The present invention relates to an image recognition system, an image recognition method, and an image recognition program.
[0002]
[Prior art]
An example of a conventional image recognition system is described in Japanese Patent Laid-Open No. 11-265452 (object recognition apparatus and object recognition method). FIG. 13 is a block diagram showing the configuration of this conventional image recognition system. As shown in this figure, the conventional image recognition image recognition system includes an
[0003]
The
[0004]
A more specific description will be given with reference to FIG. In FIG. 14, 511 is an input feature distribution in which feature data extracted from an input image is distributed, 512 is an input subspace including the
When the basis vector of the
[0005]
[Expression 7]
[0006]
As the maximum eigenvalue of the matrix X, the square of the cosine of the angle Θ between the
Therefore, the
[0007]
[Problems to be solved by the invention]
FIG. 15 is a conceptual diagram showing problems of a conventional image recognition system.
As shown in this figure, when there are three
[0008]
However, in the conventional image recognition system, the maximum eigenvalue of the matrix X equivalent to the square of the cosine of the angle Θ between the
As described above, in the conventional image recognition system, when there are input feature distributions at different positions in the
[0009]
The present invention has been made to solve such a problem, and the object thereof is not dependent on the angle between the input subspace and the dictionary subspace, and an image recognition system that can correctly determine an input image group. Another object is to provide an image recognition method and an image recognition program.
[0010]
[Means for Solving the Problems]
In order to achieve such an object, an image recognition system of the present invention is an image recognition system that collates a plurality of input images obtained by photographing the same object with previously registered dictionary data and outputs a recognition result. ,An input representative vector that is an arbitrary vector belonging to a distribution range of a plurality of input feature data obtained from the input image, an input principal component vector that is a basis of an input subspace spanned by the input feature data, and registered in advance A dictionary representative vector that is an arbitrary vector belonging to the distribution range of the dictionary feature data, and a dictionary principal component vector that is a base of the dictionary subspace spanned by the dictionary feature data, and the input subspace and the Distance calculating means for calculating a distance value from the dictionary subspace, and identification means for performing identification for outputting the recognition result based on the distance value;It is provided with.
[0011]
More specifically,It is a base of an input subspace spanned by an input representative vector that is an arbitrary vector belonging to a distribution range of a plurality of input feature data obtained from the input image, and a difference vector between the input feature data and the input representative vector Using an input principal component vector, a dictionary representative vector that is an arbitrary vector belonging to a distribution range of dictionary feature data registered in advance, and a dictionary principal component vector that is a basis of a dictionary subspace spanned by the dictionary feature data Distance calculating means for calculating a distance value between the input subspace and the dictionary subspace; and an identification means for performing identification for outputting the recognition result based on the distance value;May be provided. As a result, even when a plurality of input feature distributions exist in the same input subspace, the input image group can be correctly identified because the distance value is different if the arrangement of each input feature distribution is different.
[0012]
In this image recognition system, the input principal component vector and the dictionary principal component vector may be orthogonal bases. By calculating the distance value using the principal component vector that is an orthogonal basis, a highly accurate collation result can be obtained in a short time and the recognition rate can be improved as compared with the case where it is not an orthogonal basis. .
The input representative vector is an average vector of the input feature data, and the input principal component vector is the K eigenvectors having the largest eigenvalue among components obtained by subtracting the input representative vector from the input feature data, and the dictionary representative vector May be an average vector of dictionary feature data, and the dictionary principal component vector may be L eigenvectors having the largest eigenvalue among components obtained by subtracting the dictionary representative vector from the dictionary feature data.
[0013]
The distance calculation means is formed of input projection distance calculation means for calculating a first distance between a space formed by L dictionary principal component vectors and an input representative vector, and K input principal component vectors. A dictionary projection distance calculating means for calculating a second distance between the space and the dictionary representative vector; and an integrating means for calculating a distance value between the input partial space and the dictionary partial space from the first and second distances. There may be. As described above, the distance value is calculated by effectively using a lot of data obtained from the input image and the dictionary data, and this distance value is used for matching. Therefore, the matching performance is improved and a high recognition rate is obtained.
[0014]
Where the input representative vector is V1, V2, The input principal component vectori(I = 1, ..., K), the principal component vector of the dictionary is ΦjAssuming (j = 1,..., L), the input projection distance calculation means calculates the first distance d by equation (3).1And the dictionary projection distance calculation means calculates the second distance d according to equation (4).2May be calculated.
[0015]
[Equation 8]
[0016]
In the image recognition system described above,The distance calculation unit uses K weights corresponding to the input principal component vectors and L weights corresponding to the dictionary principal component vectors.It may be a thing.
Here, the weight corresponding to the input principal component vector is K eigenvalues of the eigenvector that is the input principal component vector, and the weight corresponding to the dictionary principal component vector is the L eigenvalue of the eigenvector that is the dictionary principal component vector. It may be.
[0017]
The input representative vector is V1, V2, The input principal component vectori(I = 1,..., K), the weight corresponding to the input principal component vector is μi(I = 1, ..., K), the principal component vector of the dictionary is Φj(J = 1,..., L), and the weight corresponding to the dictionary principal component vector is λjIf (j = 1,..., L), the input projection distance calculation means calculates the first distance d according to equation (5).1And the dictionary projection distance calculation means calculates the second distance d according to equation (6).2May be calculated (where σ is an arbitrary constant).
[0018]
[Equation 9]
[0019]
Further, in the image recognition system described above, the integration unit has the first distance d.1And the second distance d2From equation (7), the distance value D between the input subspace and the dictionary subspace may be calculated.
D = αd1+ Βd2 ... (7)
(Where α and β are constants)
Alternatively, the integrating means may use the first distance d1And the second distance d2From equation (8), the distance value D between the input subspace and the dictionary subspace may be calculated.
D = αd1・ D2/ (D1+ D2(8)
(Where α is a constant)
[0020]
In the image recognition system described above,The apparatus may further include input representative vector generation means for generating the input representative vector from the plurality of input feature data, and input principal component data generation means for generating the input principal component vector from the input feature data.
[0021]
In the image recognition system described above,Dictionary representative vector generating means for generating the dictionary representative vector; dictionary principal component data generating means for generating the dictionary principal component vector and outputting the dictionary representative vector and the dictionary storing means for storing the dictionary principal component vector;May be further provided.
In the above-described image recognition system, the recognition target is a human face image.Thereby, the system which identifies the person in an image using a human face image can be comprised.
[0022]
The image recognition method of the present invention is an image recognition method for collating a plurality of input images obtained by photographing the same object with dictionary data registered in advance and outputting a recognition result,An input representative vector that is an arbitrary vector belonging to a distribution range of a plurality of input feature data obtained from the input image, an input principal component vector that is a basis of an input subspace spanned by the input feature data, and registered in advance A dictionary representative vector that is an arbitrary vector belonging to the distribution range of the dictionary feature data, and a dictionary principal component vector that is a base of the dictionary subspace spanned by the dictionary feature data, and the input subspace and the A distance calculating step for calculating a distance value from the dictionary subspace, and an identifying step for performing identification for outputting the recognition result based on the distance value;It is provided with.
[0023]
More specifically,This is a base of an input subspace spanned by an input representative vector that is an arbitrary vector belonging to a distribution range of a plurality of input feature data obtained from the input image, and a difference vector between the input feature data and the input representative vector Using an input principal component vector, a dictionary representative vector that is an arbitrary vector belonging to a distribution range of dictionary feature data registered in advance, and a dictionary principal component vector that is a base of a dictionary subspace spanned by the dictionary feature data A distance calculating step for calculating a distance value between the input subspace and the dictionary subspace, and an identifying step for performing identification for outputting the recognition result based on the distance value;May be provided.
In this image recognition method, the input principal component vector and the dictionary principal component vector may be orthogonal bases.
[0024]
In addition, the input representative vector is an average vector of the input feature data, and the input principal component vector is the K eigenvectors having the largest eigenvalue among components obtained by subtracting the input representative vector from the input feature data. The dictionary representative vector is an average vector of the dictionary feature data, and the dictionary principal component vector is a component obtained by subtracting the dictionary representative vector from the dictionary feature data. It may be an eigenvector.
[0025]
The distance calculating step includes an input projection distance calculating step for calculating a first distance between a space formed by the L dictionary principal component vectors and the input representative vector, and the K input principal component vectors. A dictionary projection distance calculating step for calculating a second distance between the space formed by the dictionary representative vector, and the distance value between the input subspace and the dictionary subspace from the first and second distances. It may consist of an integration step to calculate.
[0027]
The input representative vector is V 1 , The dictionary representative vector is V 2 , The input principal component vector i (I = 1,..., K), the dictionary principal component vector is Φ j (J = 1,..., L), the input projection distance calculation step uses the first distance d according to equation (9). 1 The dictionary projection distance calculating step calculates the second distance d according to equation (10). 2 CalculateIt may be a thing.
[0028]
[Expression 10]
[0029]
Also,The distance calculating step uses K weights corresponding to each of the input principal component vectors and L weights corresponding to the dictionary principal component vectors.It may be a thing.
here,The weight corresponding to the input principal component vector is K eigenvalues of the eigenvector that is the input principal component vector, and the weight corresponding to the dictionary principal component vector is L of the eigenvector that is the dictionary principal component vector. Unique valuesIt may be.
[0030]
Also,The input representative vector is V 1 , The dictionary representative vector is V 2 , The input principal component vector i (I = 1,..., K), and the weight corresponding to the input principal component vector is μ i (I = 1,..., K), the dictionary principal component vector is Φ j (J = 1,..., L), and the weight corresponding to the dictionary principal component vector is λ j (J = 1,..., L), the input projection distance calculation step uses the first distance d according to equation (11). 1 The dictionary projection distance calculation step calculates the second distance d according to equation (12). 2 Calculate(Where σ is an arbitrary constant).
[0031]
## EQU11 ##
[0032]
Also,In the integration step, the first distance d 1 And the second distance d 2 The distance value D between the input subspace and the dictionary subspace is calculated from Equation (13)It may be a thing.
D = αd1+ Βd2 ... (13)
(Where α and β are constants)
OrIn the integration step, the first distance d 1 And the second distance d 2 The distance value D between the input subspace and the dictionary subspace is calculated from Equation (14)It may be a thing.
D = αd1・ D2/ (D1+ D2(14)
(Where α is a constant)
[0033]
Also,The image recognition method described above further includes an input representative vector generation step for generating the input representative vector from the plurality of input feature data, and an input principal component data generation step for generating the input principal component vector from the input feature data. You may have.
Also,The above-described image recognition method includes a dictionary representative vector generating step for generating the dictionary representative vector, a dictionary generating the dictionary principal component vector, and outputting the dictionary representative vector and the dictionary storage means for storing the dictionary principal component vector. A principal component data generation step.
In the image recognition method described above, the recognition target is a human face image.
[0034]
DETAILED DESCRIPTION OF THE INVENTION
Next, embodiments of the present invention will be described in detail with reference to the drawings.
[0035]
(First embodiment)
FIG. 1 is a block diagram showing a configuration of an image recognition system according to the first embodiment of the present invention. FIG. 2 is a diagram conceptually showing processing by the image recognition system shown in FIG.
The image recognition system shown in FIG. 1 receives a learning image
[0036]
The learning image
The
[0037]
The learning image
As an example of the learning image
The learning image
[0038]
The dictionary representative
[0039]
The dictionary principal component
[0040]
As a method of removing the
Thereafter, as a method of extracting L dictionary
[0041]
For example, as shown in FIG. 3, the
[0042]
The identification target image
The
[0043]
The input image
As an example of the input image
[0044]
The input representative
[0045]
The input principal component
[0046]
As a method of removing the
As a method of extracting the K input
[0047]
The
[0048]
The
[0049]
Next, the configuration and operation of the
As shown in FIG. 5, the
The input projection
[0050]
[Expression 12]
[0051]
In order to speed up the calculation, the constant σ = 0 may be set and simplified as shown in Expression (16).
[0052]
[Formula 13]
[0053]
In equations (15) and (16), the vector (V2-V1) Is the vector QP and the input projection distance value d1Represents the distance value between the end point Q of the
The dictionary projection
[0054]
[Expression 14]
[0055]
In order to speed up the calculation, the constant σ = 0 may be set and simplified as shown in Expression (18).
[0056]
[Expression 15]
[0057]
In the equations (17) and (18), the vector (V1-V2) Is the vector PQ and the dictionary projection distance value d2Represents the distance value between the end point P of the
The integrating
D = αd1+ Βd2 ... (19)
However, α and β are constants.
Moreover, you may use Formula (20).
D = αd1・ D2/ (D1+ D2(20)
Where α is a constant.
[0058]
In FIG. 2B, the distance value D between the input feature distribution 51B and the dictionary feature distribution 21BB can also be obtained by calculating the norm of the vector PQ. In this method, the
[0059]
Further, since the distance value D between the distributions calculated using the representative vector and the principal component vector, not the angle between the
In addition, since a plurality of
It is preferable that the dictionary
[0060]
Next, the dictionary data learning operation of the image recognition system shown in FIG. 1 will be described. FIG. 7 is a flowchart showing the flow of the dictionary data learning operation. FIG. 8 is a diagram illustrating an example of a learning image used for dictionary learning.
First, a learning image group used for dictionary learning and a category ID corresponding to the learning image group are input (step S1 in FIG. 7). For example, as shown in FIG. 8, the learning image group includes a plurality of (M pieces of learning images) belonging to a specific category, such as learning
[0061]
Next, feature extraction is performed on each of the M learning image data input to obtain M dictionary feature data (step S2 in FIG. 7). Next, one vector representing the obtained dictionary feature data group is generated and used as a dictionary representative vector (step S3 in FIG. 7). Next, for the component excluding the dictionary representative vector from the dictionary feature data group, dictionary principal component data including L dictionary principal component vectors representing the distribution is generated (step S4 in FIG. 7). The dictionary representative vector and dictionary principal component data thus obtained are classified as dictionary data by category ID and stored in the dictionary storage unit 3 (step S5 in FIG. 7).
It is determined whether or not to learn about another category (step S6 in FIG. 7), and in the case of learning, the operation is repeated from the input of the learning image group (step S1 in FIG. 7). When the creation is finished, the learning operation is finished.
[0062]
Next, the recognition operation of the image recognition system shown in FIG. 1 will be described. FIG. 9 is a flowchart showing the flow of this recognition operation. FIG. 10 is a diagram illustrating an example of an input image to be recognized.
First, a recognition target image group is input (step S11 in FIG. 9). For example, as shown in FIG. 10, the input image group includes a plurality (N) of
[0063]
Next, feature extraction is performed on each of the input N pieces of input image data to obtain N pieces of input feature data (step S12 in FIG. 9). Next, one vector representing the obtained input feature data group is generated and set as an input representative vector (step S13 in FIG. 9). Next, for the component obtained by removing the input representative vector from the input feature data group, input principal component data including K input principal component vectors representing the distribution is generated (step S14 in FIG. 9).
[0064]
Next, the dictionary data stored for each category in the
Next, it is determined whether or not the minimum distance value is smaller than a threshold value (step S17 in FIG. 9). When the minimum distance value is smaller than the threshold value, the category having the minimum distance is output as a recognition result, and the process ends (step S18 in FIG. 9). On the contrary, when the minimum distance value is equal to or greater than the threshold value, “no corresponding class” is output and the process ends (step S19 in FIG. 9). Here, when the minimum distance value is equal to the threshold value, the process proceeds to step S19, but it goes without saying that the process may proceed to step S18.
[0065]
(Second Embodiment)
FIG. 11 is a block diagram showing a configuration of a face image recognition system according to the second embodiment of the present invention. The face image recognition system includes a face
The face
[0066]
The operation of the
The face image recognition system shown in FIG. 8 can recognize a person appearing in an input image for a human face, and can be used for security, monitoring, human interface, and the like.
[0067]
(Third embodiment)
FIG. 12 is a block diagram showing the configuration of the third embodiment which is the image recognition system of the present invention. This image recognition system includes a computer 110 that operates under program control, a camera 121 that captures an identification target image and a learning image and outputs the image to the computer 110, and an operator gives a recognition instruction and a learning instruction to the computer 110. The console 122 includes a display device 123 that displays the recognition result output from the computer 110. The computer 110 includes an arithmetic processing unit 111, a storage unit 112, and an interface unit (hereinafter referred to as an I / F unit) 113.1~ 113FourAre connected to the
[0068]
An image recognition program for controlling the operation of the computer 110 is provided in a state recorded in a magnetic disk, a semiconductor memory, or
The image recognition program may be provided via a telecommunication line such as the Internet.
[0069]
The computer 110 performs the operations shown in the flowcharts of FIGS. That is, when there is a learning instruction from the console 122 and a learning image data group is input from the camera 121 and a corresponding category ID is input from the console, the feature of the learning image data group is extracted and obtained. A dictionary representative vector and dictionary principal component data are generated based on the dictionary feature data group, the dictionary representative vector and the dictionary principal component data are classified by category ID, and stored as dictionary data in a dictionary storage unit configured by the storage unit 112. To do. Next, it is determined whether or not to learn about other categories, and in the case of learning, the operation is repeated from the input of learning image data. When the creation is finished, the learning operation is finished.
[0070]
Further, when there is a recognition instruction from the console 122 and an image data group to be identified is input from the camera 121, feature extraction is performed, and an input representative vector and input principal component data are based on the obtained input feature data group. Is generated. Next, the dictionary data stored for each category in the dictionary storage unit is read, and the distance value from the dictionary data is calculated for each category using the input representative vector and the input principal component data. Then, the minimum distance value among them is obtained, and it is determined whether or not the minimum distance value is smaller than the threshold value. When the minimum distance is smaller than the threshold value, the category having the minimum distance is displayed as a recognition result on the display device 123. Conversely, when the minimum distance is equal to or larger than the threshold value, the display device 123 displays that there is no corresponding class. Then, the recognition operation is finished.
It should be noted that the face
[0071]
【The invention's effect】
As described above, in the present invention, the distance value between the input subspace and the dictionary subspace is calculated using K input principal component vectors, input representative vectors, L dictionary principal component vectors, and dictionary representative vectors. The calculated distance value is used for collation. As a result, even when a plurality of input feature distributions exist in the same input subspace, the input image group can be correctly identified because the distance value is different if the arrangement of each input feature distribution is different.
Further, in the present invention, a distance value is calculated by using a plurality of input images and effectively using a lot of data obtained from the plurality of input images, and this distance value is used for collation. Compared with the case where recognition is performed using, collation performance is much higher and a high recognition rate can be obtained.
Therefore, it is possible to construct a robust recognition system and method that absorbs variations due to illumination of the same object, variations due to orientation, deformation, and the like.
[0072]
In addition, by calculating the distance value using the principal component vector that is an orthogonal basis, it is possible to obtain a highly accurate collation result in a shorter time than when it is not an orthogonal basis, and to improve the recognition rate. Can do.
In addition, by providing means for generating the dictionary principal component vector and the dictionary representative vector, or by performing such processing, the contents of the dictionary data can be updated as needed to cope with abrupt content changes.
In addition, by providing means for selecting face image data from an input image sequence, or by performing such processing, a system for identifying a person in an image using a human face image can be constructed. .
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration of an image recognition system according to a first embodiment of the present invention.
FIG. 2 is a diagram conceptually showing processing by the image recognition system shown in FIG.
FIG. 3 is a block diagram illustrating a configuration example of a dictionary storage unit.
FIG. 4 is a block diagram illustrating a configuration example of an identification unit.
FIG. 5 is a block diagram illustrating a configuration example of a distance calculation unit.
FIG. 6 is a conceptual diagram illustrating the operation of a distance calculation unit.
7 is a flowchart showing a flow of dictionary data learning operation of the image recognition system shown in FIG. 1;
FIG. 8 is a diagram illustrating an example of a learning image used for dictionary learning.
FIG. 9 is a flowchart showing a flow of recognition operation of the image recognition system shown in FIG. 1;
FIG. 10 is a diagram illustrating an example of an input image to be recognized.
FIG. 11 is a block diagram showing a configuration of a face image recognition system according to a second embodiment of the present invention.
FIG. 12 is a block diagram showing a configuration of a third embodiment which is an image recognition system of the present invention.
FIG. 13 is a block diagram showing a configuration of a conventional image recognition system.
FIG. 14 is a conceptual diagram showing the similarity used in a conventional image recognition system.
FIG. 15 is a conceptual diagram showing problems of a conventional image recognition system.
[Explanation of symbols]
DESCRIPTION OF
Claims (39)
前記入力画像から得られた複数の入力特徴データの平均ベクトルである入力代表ベクトルと、前記入力特徴データを主成分分析して得られる、前記入力特徴データによって張られる入力部分空間の基底であるK 個の入力主成分ベクトルと、予め登録された辞書特徴データの平均ベクトルである辞書代表ベクトルと、前記辞書特徴データを主成分分析してえられる、前記辞書特徴データによって張られる辞書部分空間の基底であるL 個の辞書主成分ベクトルとを用いて、前記入力部分空間と前記辞書部分空間との距離値を算出する距離算出手段と、
前記距離値に基づいて前記認識結果を出力する識別を行う識別手段と、
前記距離算出手段は、
前記L個の辞書主成分ベクトルで形成される空間と前記入力代表ベクトルとの第1の距離を算出する入力投影距離算出手段と、
前記K個の入力主成分ベクトルで形成される空間と前記辞書代表ベクトルとの第2の距離を算出する辞書投影距離算出手段と、
前記第1および第2の距離の重み付き加算によって前記入力部分空間と前記辞書部分空間との前記距離値を算出する統合手段と
を備えたことを特徴とする画像認識システム。An image recognition system that collates a plurality of input images obtained by photographing the same object with previously registered dictionary data and outputs a recognition result,
An input representative vector that is an average vector of a plurality of input feature data obtained from the input image, and K that is a basis of an input subspace spanned by the input feature data obtained by principal component analysis of the input feature data and inputs principal component vector, a dictionary representative vector is the mean vector of the dictionary feature data registered in advance, the base of which the dictionary feature data is E and principal component analysis, dictionary subspace spanned by the dictionary feature data a distance calculation means for using the L-number of dictionary principal component vectors, and calculates a distance value between the input subspace and the reference subspace is,
Identification means for performing identification based on the distance value and outputting the recognition result;
The distance calculating means includes
Input projection distance calculating means for calculating a first distance between the space formed by the L dictionary principal component vectors and the input representative vector;
Dictionary projection distance calculating means for calculating a second distance between the space formed by the K input principal component vectors and the dictionary representative vector;
An image recognition system comprising: an integration unit that calculates the distance value between the input subspace and the dictionary subspace by weighted addition of the first and second distances.
前記入力画像から得られた複数の入力特徴データの平均ベクトルである入力代表ベクトルと、前記入力特徴データと入力代表ベクトルとの第1の差分ベクトルを主成分分析して得られる、前記第1の差分ベクトルによって張られる入力部分空間の基底であるK 個の入力主成分ベクトルと、予め登録された辞書特徴データの平均ベクトルである辞書代表ベクトルと、前記辞書特徴データと前記辞書代表ベクトルとの第2の差分ベクトルを主成分分析して得られる、前記第2の差分ベクトルによって張られる辞書部分空間の基底であるL 個の辞書主成分ベクトルとを用いて、前記入力部分空間と前記辞書部分空間との距離値を算出する距離算出手段と、
前記距離値に基づいて前記認識結果を出力する識別を行う識別手段とを備え、
前記距離算出手段は、
前記L個の辞書主成分ベクトルで形成される空間と前記入力代表ベクトルとの第1の距離を算出する入力投影距離算出手段と、
前記K個の入力主成分ベクトルで形成される空間と前記辞書代表ベクトルとの第2の距離を算出する辞書投影距離算出手段と、
前記第1および第2の距離の重み付き加算によって前記入力部分空間と前記辞書部分空間との前記距離値を算出する統合手段と
を備えたことを特徴とする画像認識システム。An image recognition system that collates a plurality of input images obtained by photographing the same object with previously registered dictionary data and outputs a recognition result,
The first representative vector obtained by principal component analysis of an input representative vector, which is an average vector of a plurality of input feature data obtained from the input image, and a first difference vector between the input feature data and the input representative vector . and K input principal component vector is the basis of the input subspace spanned by difference vector, first of a dictionary representative vector is the mean vector of the dictionary feature data registered in advance, and the dictionary feature data and the dictionary representative vector The input subspace and the dictionary subspace using L dictionary principal component vectors that are bases of the dictionary subspace spanned by the second difference vector, obtained by principal component analysis of two difference vectors Distance calculating means for calculating a distance value between and
Identification means for performing identification to output the recognition result based on the distance value;
The distance calculating means includes
Input projection distance calculating means for calculating a first distance between the space formed by the L dictionary principal component vectors and the input representative vector;
Dictionary projection distance calculating means for calculating a second distance between the space formed by the K input principal component vectors and the dictionary representative vector;
An image recognition system comprising: an integration unit that calculates the distance value between the input subspace and the dictionary subspace by weighted addition of the first and second distances.
前記入力主成分ベクトルおよび前記辞書主成分ベクトルは、直交基底であることを特徴とする画像認識システム。The image recognition system according to claim 2,
The image recognition system, wherein the input principal component vector and the dictionary principal component vector are orthogonal bases.
前記入力代表ベクトルは、前記入力特徴データの平均ベクトルであり、
前記入力主成分ベクトルは、前記入力特徴データから前記入力代表ベクトルを減算した成分のうち、固有値が大きい方からK個の固有ベクトルであり、
前記辞書代表ベクトルは、前記辞書特徴データの平均ベクトルであり、
前記辞書主成分ベクトルは、前記辞書特徴データから前記辞書代表ベクトルを減算した成分のうち、固有値が大きい方からL個の固有ベクトルであることを特徴とする画像認識システム。The image recognition system according to claim 2 or 3,
The input representative vector is an average vector of the input feature data,
The input principal component vectors are K eigenvectors having the largest eigenvalue among components obtained by subtracting the input representative vector from the input feature data,
The dictionary representative vector is an average vector of the dictionary feature data,
2. The image recognition system according to claim 1, wherein the dictionary principal component vectors are L eigenvectors having a larger eigenvalue among components obtained by subtracting the dictionary representative vector from the dictionary feature data.
前記入力代表ベクトルをV1、前記辞書代表ベクトルをV2、前記入力主成分ベクトルをΨi(i=1,…,K)、前記辞書主成分ベクトルをΦj(j=1,…,L)とすると、
前記入力投影距離算出手段は、式(A)により前記第1の距離d1を算出し、
前記辞書投影距離算出手段は、式(B)により前記第2の距離d2を算出することを特徴とする画像認識システム。
If the input representative vector is V1, the dictionary representative vector is V2, the input principal component vector is ψi (i = 1,..., K), and the dictionary principal component vector is Φj (j = 1,..., L),
The input projection distance calculation means calculates the first distance d1 by the equation (A),
The image projection system, wherein the dictionary projection distance calculation means calculates the second distance d2 by equation (B).
前記距離算出手段は、前記入力主成分ベクトルのそれぞれに対応するK個の重みと、前記辞書主成分ベクトルのそれぞれに対応するL個の重みとを用いることを特徴とする画像認識システム。In the image recognition system according to any one of claims 1 to 4,
The distance calculating means uses K weights corresponding to each of the input principal component vectors and L weights corresponding to the dictionary principal component vectors, respectively.
前記入力主成分ベクトルに対応する重みは、前記入力主成分ベクトルとなる前記固有ベクトルのK個の固有値であり、
前記辞書主成分ベクトルに対応する重みは、前記辞書主成分ベクトルとなる前記固有ベクトルのL個の固有値である
ことを特徴とする画像認識システム。The image recognition system according to claim 6.
The weight corresponding to the input principal component vector is K eigenvalues of the eigenvector that becomes the input principal component vector,
The weight corresponding to the dictionary principal component vector is L eigenvalues of the eigenvector that becomes the dictionary principal component vector.
前記入力代表ベクトルをV1、前記辞書代表ベクトルをV2、前記入力主成分ベクトルをΨi(i=1,…,K)、前記入力主成分ベクトルに対応する前記重みをμi(i=1,…,K)、前記辞書主成分ベクトルをΦj(j=1,…,L)、前記辞書主成分ベクトルに対応する前記重みをλj(j=1,…,L)とすると、
前記入力投影距離算出手段は、式(C)により前記第1の距離d1を算出し、
前記辞書投影距離算出手段は、式(D)により前記第2の距離d2を算出することを特徴とする画像認識システム。
The input representative vector is V1, the dictionary representative vector is V2, the input principal component vector is ψi (i = 1,..., K), and the weight corresponding to the input principal component vector is μi (i = 1,. K), the dictionary principal component vector is Φj (j = 1,..., L), and the weight corresponding to the dictionary principal component vector is λj (j = 1,..., L).
The input projection distance calculating means calculates the first distance d1 by the equation (C),
The dictionary projection distance calculating means calculates the second distance d2 according to equation (D).
前記統合手段は、前記第1の距離d1および前記第2の距離d2から式(E)により前記入力部分空間と前記辞書部分空間との前記距離値Dを算出することを特徴とする画像認識システム。
D=αd1+βd2 ・・・(E)
(ただし、α,βは定数)The image recognition system according to any one of claims 1 to 4, 5, or 8,
The integration means calculates the distance value D between the input subspace and the dictionary subspace from the first distance d1 and the second distance d2 by the equation (E). .
D = αd1 + βd2 (E)
(Where α and β are constants)
前記統合手段は、前記第1の距離d1および前記第2の距離d2から式(F)により前記入力部分空間と前記辞書部分空間との前記距離値Dを算出することを特徴とする画像認識システム。
D=αd1・d2/(d1+d2) ・・・(F)
(ただし、αは定数)The image recognition system according to any one of claims 1 to 4, 5, or 8,
The integration means calculates the distance value D between the input subspace and the dictionary subspace from the first distance d1 and the second distance d2 by the equation (F). .
D = αd1 · d2 / (d1 + d2) (F)
(Where α is a constant)
前記複数の入力特徴データから前記入力代表ベクトルを生成する入力代表ベクトル生成手段と、
前記入力特徴データから前記入力主成分ベクトルを生成する入力主成分データ生成手段とをさらに備えたことを特徴とする画像認識システム。The image recognition system according to any one of claims 1 to 10,
Input representative vector generation means for generating the input representative vector from the plurality of input feature data;
An image recognition system further comprising input principal component data generation means for generating the input principal component vector from the input feature data.
前記辞書代表ベクトルを生成する辞書代表ベクトル生成手段と、
前記辞書主成分ベクトルを生成し、前記辞書代表ベクトルおよび前記辞書主成分ベクトルを格納する辞書格納手段に出力する辞書主成分データ生成手段とをさらに備えたことを特徴とする画像認識システム。The image recognition system according to any one of claims 1 to 10,
Dictionary representative vector generating means for generating the dictionary representative vector;
An image recognition system, further comprising: dictionary principal component data generating means for generating the dictionary principal component vector and outputting the dictionary representative vector and dictionary dictionary means for storing the dictionary principal component vector.
認識対象が人間の顔画像であることを特徴とする画像認識システム。The image recognition system according to any one of claims 1 to 12,
An image recognition system, wherein a recognition target is a human face image.
前記入力画像から得られた複数の入力特徴データの平均ベクトルである入力代表ベクトルと、前記入力特徴データを主成分分析して得られる、前記入力特徴データによって張られる入力部分空間の基底であるK 個の入力主成分ベクトルと、予め登録された辞書特徴データの平均ベクトルである辞書代表ベクトルと、前記辞書特徴データを主成分分析して得られる、前記辞書特徴データによって張られる辞書部分空間の基底であるL 個の辞書主成分ベクトルとを用いて、前記入力部分空間と前記辞書部分空間との距離値を算出する距離算出ステップと、
前記距離値に基づいて前記認識結果を出力する識別を行う識別ステップとを含み、
前記距離算出ステップは、
前記L個の辞書主成分ベクトルで形成される空間と前記入力代表ベクトルとの第1の距離を算出する入力投影距離算出ステップと、
前記K個の入力主成分ベクトルで形成される空間と前記辞書代表ベクトルとの第2の距離を算出する辞書投影距離算出ステップと、
前記第1および第2の距離の重み付き加算によって前記入力部分空間と前記辞書部分空間との前記距離値を算出する統合ステップと
を含むことを特徴とする画像認識方法。An image recognition method for collating a plurality of input images obtained by photographing the same object with previously registered dictionary data and outputting a recognition result,
An input representative vector that is an average vector of a plurality of input feature data obtained from the input image, and K that is a basis of an input subspace spanned by the input feature data obtained by principal component analysis of the input feature data and inputs principal component vector, a dictionary representative vector is the mean vector of the dictionary feature data registered in advance, the base of which the dictionary feature data obtained by principal component analysis, dictionary subspace spanned by the dictionary feature data a distance calculation step of using the L-number of dictionary principal component vectors, and calculates a distance value between the input subspace and the reference subspace is,
An identification step of performing identification to output the recognition result based on the distance value,
The distance calculating step includes:
An input projection distance calculating step of calculating a first distance between a space formed by the L dictionary principal component vectors and the input representative vector;
A dictionary projection distance calculating step of calculating a second distance between the space formed by the K input principal component vectors and the dictionary representative vector;
An image recognition method comprising: an integration step of calculating the distance value between the input subspace and the dictionary subspace by weighted addition of the first and second distances.
前記入力画像から得られた複数の入力特徴データの平均ベクトルである入力代表ベクトルと、前記入力特徴データと入力代表ベクトルとの第1の差分ベクトルを主成分分析して得られる、前記第1の差分ベクトルによって張られる入力部分空間の基底であるK 個の入力主成分ベクトルと、予め登録された辞書特徴データの平均ベクトルである辞書代表ベクトルと、前記辞書特徴データと前記辞書代表ベクトルとの第 2 の差分ベクトルを主成分分析して得られる、前記第2の差分ベクトルによって張られる辞書部分空間の基底であるL 個の辞書主成分ベクトルとを用いて、前記入力部分空間と前記辞書部分空間との距離値を算出する距離算出ステップと、
前記距離値に基づいて前記認識結果を出力する識別を行う識別ステップと含み、
前記距離算出ステップは、
前記L個の辞書主成分ベクトルで形成される空間と前記入力代表ベクトルとの第1の距離を算出する入力投影距離算出ステップと、
前記K個の入力主成分ベクトルで形成される空間と前記辞書代表ベクトルとの第2の距離を算出する辞書投影距離算出ステップと、
前記第1および第2の距離の重み付き加算によって前記入力部分空間と前記辞書部分空間との前記距離値を算出する統合ステップと
を含むことを特徴とする画像認識方法。An image recognition method for collating a plurality of input images obtained by photographing the same object with previously registered dictionary data and outputting a recognition result,
The first representative vector obtained by principal component analysis of an input representative vector, which is an average vector of a plurality of input feature data obtained from the input image, and a first difference vector between the input feature data and the input representative vector . and K input principal component vector is the basis of the input subspace spanned by difference vector, first of a dictionary representative vector is the mean vector of the dictionary feature data registered in advance, and the dictionary feature data and the dictionary representative vector The input subspace and the dictionary subspace using L dictionary principal component vectors that are bases of the dictionary subspace spanned by the second difference vector, obtained by principal component analysis of two difference vectors A distance calculating step for calculating a distance value between and
An identification step of performing identification to output the recognition result based on the distance value;
The distance calculating step includes:
An input projection distance calculating step of calculating a first distance between a space formed by the L dictionary principal component vectors and the input representative vector;
A dictionary projection distance calculating step of calculating a second distance between the space formed by the K input principal component vectors and the dictionary representative vector;
An image recognition method comprising: an integration step of calculating the distance value between the input subspace and the dictionary subspace by weighted addition of the first and second distances.
前記入力主成分ベクトルおよび前記辞書主成分ベクトルは、直交基底であることを特徴とする画像認識方法。The image recognition method according to claim 15, wherein
The image recognition method, wherein the input principal component vector and the dictionary principal component vector are orthogonal bases.
前記入力代表ベクトルは、前記入力特徴データの平均ベクトルであり、
前記入力主成分ベクトルは、前記入力特徴データから前記入力代表ベクトルを減算した成分のうち、固有値が大きい方からK個の固有ベクトルであり、
前記辞書代表ベクトルは、前記辞書特徴データの平均ベクトルであり、
前記辞書主成分ベクトルは、前記辞書特徴データから前記辞書代表ベクトルを減算した成分のうち、固有値が大きい方からL個の固有ベクトルであることを特徴とする画像認識方法。The image recognition method according to claim 15 or 16,
The input representative vector is an average vector of the input feature data,
The input principal component vectors are K eigenvectors having the largest eigenvalue among components obtained by subtracting the input representative vector from the input feature data,
The dictionary representative vector is an average vector of the dictionary feature data,
The image recognition method, wherein the dictionary principal component vectors are L eigenvectors in descending order of eigenvalues among components obtained by subtracting the dictionary representative vector from the dictionary feature data.
前記入力代表ベクトルをV1、前記辞書代表ベクトルをV2、前記入力主成分ベクトルをΨi(i=1,…,K)、前記辞書主成分ベクトルをΦj(j=1,…,L)とすると、
前記入力投影距離算出ステップは、式(G)により前記第1の距離d1を算出し、
前記辞書投影距離算出ステップは、式(H)により前記第2の距離d2を算出することを特徴とする画像認識方法。
If the input representative vector is V1, the dictionary representative vector is V2, the input principal component vector is ψi (i = 1,..., K), and the dictionary principal component vector is Φj (j = 1,..., L),
In the input projection distance calculating step, the first distance d1 is calculated by the equation (G),
In the image recognition method, the dictionary projection distance calculating step calculates the second distance d2 by the equation (H).
前記距離算出ステップは、前記入力主成分ベクトルのそれぞれに対応するK個の重みと、前記辞書主成分ベクトルのそれぞれに対応するL個の重みとを用いることを特徴とする画像認識方法。The image recognition method according to any one of claims 14 to 17,
The distance calculating step uses K weights corresponding to the input principal component vectors and L weights corresponding to the dictionary principal component vectors, respectively.
前記入力主成分ベクトルに対応する重みは、前記入力主成分ベクトルとなる前記固有ベクトルのK個の固有値であり、
前記辞書主成分ベクトルに対応する重みは、前記辞書主成分ベクトルとなる前記固有ベクトルのL個の固有値である
ことを特徴とする画像認識方法。The image recognition method according to claim 19, wherein
The weight corresponding to the input principal component vector is K eigenvalues of the eigenvector that becomes the input principal component vector,
The weight corresponding to the dictionary principal component vector is L eigenvalues of the eigenvector that becomes the dictionary principal component vector.
前記入力代表ベクトルをV1、前記辞書代表ベクトルをV2、前記入力主成分ベクトルをΨi(i=1,…,K)、前記入力主成分ベクトルに対応する前記重みをμi(i=1,…,K)、前記辞書主成分ベクトルをΦj(j=1,…,L)、前記辞書主成分ベクトルに対応する前記重みをλj(j=1,…,L)とすると、
前記入力投影距離算出ステップは、式(I)により前記第1の距離d1を算出し、
前記辞書投影距離算出ステップは、式(J)により前記第2の距離d2を算出することを特徴とする画像認識方法。
The input representative vector is V1, the dictionary representative vector is V2, the input principal component vector is ψi (i = 1,..., K), and the weight corresponding to the input principal component vector is μi (i = 1,. K), the dictionary principal component vector is Φj (j = 1,..., L), and the weight corresponding to the dictionary principal component vector is λj (j = 1,..., L).
In the input projection distance calculating step, the first distance d1 is calculated by the equation (I),
In the image recognition method, the dictionary projection distance calculating step calculates the second distance d2 by the equation (J).
前記統合ステップは、前記第1の距離d1および前記第2の距離d2から式(K)により前記入力部分空間と前記辞書部分空間との前記距離値Dを算出することを特徴とする画像認識方法。
D=αd1+βd2 ・・・(K)
(ただし、α,βは定数)The image recognition method according to any one of claims 14 to 17, 18 or 21,
In the integration step, the distance value D between the input subspace and the dictionary subspace is calculated from the first distance d1 and the second distance d2 by the equation (K). .
D = αd1 + βd2 (K)
(Where α and β are constants)
前記統合ステップは、前記第1の距離d1および前記第2の距離d2から式(L)により前記入力部分空間と前記辞書部分空間との前記距離値Dを算出することを特徴とする画像認識方法。
D=αd1・d2/(d1+d2) ・・・(L)
(ただし、αは定数)The image recognition method according to any one of claims 14 to 17, 18 or 21,
In the integration step, the distance value D between the input subspace and the dictionary subspace is calculated from the first distance d1 and the second distance d2 by the equation (L). .
D = αd1 · d2 / (d1 + d2) (L)
(Where α is a constant)
前記複数の入力特徴データから前記入力代表ベクトルを生成する入力代表ベクトル生成ステップと、
前記入力特徴データから前記入力主成分ベクトルを生成する入力主成分データ生成ステップとをさらに備えたことを特徴とする画像認識方法。The image recognition method according to any one of claims 14 to 23,
An input representative vector generation step of generating the input representative vector from the plurality of input feature data;
An image recognition method further comprising: an input principal component data generation step of generating the input principal component vector from the input feature data.
前記辞書代表ベクトルを生成する辞書代表ベクトル生成ステップと、
前記辞書主成分ベクトルを生成し、前記辞書代表ベクトルおよび前記辞書主成分ベクトルを格納する辞書格納手段に出力する辞書主成分データ生成ステップとをさらに備えたことを特徴とする画像認識方法。The image recognition method according to any one of claims 14 to 23,
A dictionary representative vector generating step for generating the dictionary representative vector;
An image recognition method, further comprising: a dictionary principal component data generation step of generating the dictionary principal component vector and outputting the dictionary representative vector and a dictionary storage means for storing the dictionary principal component vector.
認識対象が人間の顔画像であることを特徴とする画像認識方法。The image recognition method according to any one of claims 14 to 23,
An image recognition method, wherein the recognition target is a human face image.
前記入力画像から得られた複数の入力特徴データの平均ベクトルである入力代表ベクトルと、前記入力特徴データを主成分分析して得られる、前記入力特徴データによって張られる入力部分空間の基底であるK 個の入力主成分ベクトルと、予め登録された辞書特徴データの平均ベクトルである辞書代表ベクトルと、前記辞書特徴データを主成分分析して得られる、前記辞書特徴データによって張られる辞書部分空間の基底であるL 個の辞書主成分ベクトルとを用いて、前記入力部分空間と前記辞書部分空間との距離値を算出する距離算出ステップと、
前記距離値に基づいて前記認識結果を出力する識別を行う識別ステップとを含み、
前記距離算出ステップは、
前記L個の辞書主成分ベクトルで形成される空間と前記入力代表ベクトルとの第1の距離を算出する入力投影距離算出ステップと、
前記K個の入力主成分ベクトルで形成される空間と前記辞書代表ベクトルとの第2の距離を算出する辞書投影距離算出ステップと、
前記第1および第2の距離の重み付き加算によって前記入力部分空間と前記辞書部分空間との前記距離値を算出する統合ステップとをコンピュータに実行させるための画像認識プログラム。An image recognition program for causing a computer to execute a process of collating a plurality of input images obtained by photographing the same object with previously registered dictionary data and outputting a recognition result,
An input representative vector that is an average vector of a plurality of input feature data obtained from the input image, and K that is a basis of an input subspace spanned by the input feature data obtained by principal component analysis of the input feature data and inputs principal component vector, a dictionary representative vector is the mean vector of the dictionary feature data registered in advance, the base of which the dictionary feature data obtained by principal component analysis, dictionary subspace spanned by the dictionary feature data a distance calculation step of using the L-number of dictionary principal component vectors, and calculates a distance value between the input subspace and the reference subspace is,
An identification step of performing identification to output the recognition result based on the distance value,
The distance calculating step includes:
An input projection distance calculating step of calculating a first distance between a space formed by the L dictionary principal component vectors and the input representative vector;
A dictionary projection distance calculating step of calculating a second distance between the space formed by the K input principal component vectors and the dictionary representative vector;
An image recognition program for causing a computer to execute an integration step of calculating the distance value between the input subspace and the dictionary subspace by weighted addition of the first and second distances.
前記入力画像から得られた複数の入力特徴データの平均ベクトルである入力代表ベクトルと、前記入力特徴データと入力代表ベクトルとの第1の差分ベクトルを主成分分析して得られる、第1の差分ベクトルによって張られる入力部分空間の基底であるK 個の入力主成分ベクトルと、予め登録された辞書特徴データの平均ベクトルである辞書代表ベクトルと、前記辞書特徴データと前記辞書代表ベクトルとの第2の差分ベクトルを主成分分析して得られる、第2の差分ベクトルによって張られる辞書部分空間の基底であるL 個の辞書主成分ベクトルとを用いて、
前記入力部分空間と前記辞書部分空間との距離値を算出する距離算出ステップと、
前記距離値に基づいて前記認識結果を出力する識別を行う識別ステップとを含み
前記距離算出ステップは、
前記L個の辞書主成分ベクトルで形成される空間と前記入力代表ベクトルとの第1の距離を算出する入力投影距離算出ステップと、
前記K個の入力主成分ベクトルで形成される空間と前記辞書代表ベクトルとの第2の距離を算出する辞書投影距離算出ステップと、
前記第1および第2の距離の重み付き加算によって前記入力部分空間と前記辞書部分空間との前記距離値を算出する統合ステップとをコンピュータに実行させるための画像認識プログラム。An image recognition program for causing a computer to execute a process of collating a plurality of input images obtained by photographing the same object with previously registered dictionary data and outputting a recognition result,
A first difference obtained by principal component analysis of an input representative vector, which is an average vector of a plurality of input feature data obtained from the input image, and a first difference vector between the input feature data and the input representative vector. and K input principal component vector is the basis of the input subspace spanned by vectors, a dictionary representative vector is the mean vector of the dictionary feature data registered in advance, the second and the dictionary feature data and the dictionary representative vector Using L dictionary principal component vectors, which are the basis of the dictionary subspace spanned by the second difference vector, obtained by principal component analysis of the difference vector of
A distance calculating step of calculating a distance value between the input subspace and the dictionary subspace;
An identification step of performing identification for outputting the recognition result based on the distance value, and the distance calculation step includes:
An input projection distance calculating step of calculating a first distance between a space formed by the L dictionary principal component vectors and the input representative vector;
A dictionary projection distance calculating step of calculating a second distance between the space formed by the K input principal component vectors and the dictionary representative vector;
An image recognition program for causing a computer to execute an integration step of calculating the distance value between the input subspace and the dictionary subspace by weighted addition of the first and second distances.
前記入力主成分ベクトルおよび前記辞書主成分ベクトルは、直交基底であることを特徴とする画像認識プログラム。In the image recognition program according to claim 28,
The image recognition program, wherein the input principal component vector and the dictionary principal component vector are orthogonal bases.
前記入力代表ベクトルは、前記入力特徴データの平均ベクトルであり、
前記入力主成分ベクトルは、前記入力特徴データから前記入力代表ベクトルを減算した成分のうち、固有値が大きい方からK個の固有ベクトルであり、
前記辞書代表ベクトルは、前記辞書特徴データの平均ベクトルであり、
前記辞書主成分ベクトルは、前記辞書特徴データから前記辞書代表ベクトルを減算した成分のうち、固有値が大きい方からL個の固有ベクトルであることを特徴とする画像認識プログラム。The image recognition program according to claim 26 or 30,
The input representative vector is an average vector of the input feature data,
The input principal component vectors are K eigenvectors having the largest eigenvalue among components obtained by subtracting the input representative vector from the input feature data,
The dictionary representative vector is an average vector of the dictionary feature data,
The image recognition program characterized in that the dictionary principal component vectors are L eigenvectors having the largest eigenvalue among components obtained by subtracting the dictionary representative vector from the dictionary feature data.
前記入力代表ベクトルをV1、前記辞書代表ベクトルをV2、前記入力主成分ベクトルをΨi(i=1,…,K)、前記辞書主成分ベクトルをΦj(j=1,…,L)とすると、
前記入力投影距離算出ステップは、式(M)により前記第1の距離d1を算出し、
前記辞書投影距離算出ステップは、式(N)により前記第2の距離d2を算出することを特徴とする画像認識プログラム。
If the input representative vector is V1, the dictionary representative vector is V2, the input principal component vector is ψi (i = 1,..., K), and the dictionary principal component vector is Φj (j = 1,..., L),
In the input projection distance calculating step, the first distance d1 is calculated by the equation (M),
In the image recognition program, the dictionary projection distance calculating step calculates the second distance d2 according to the equation (N).
前記距離算出ステップは、前記入力主成分ベクトルのそれぞれに対応するK個の重みと、前記辞書主成分ベクトルのそれぞれに対応するL個の重みとを用いることを特徴とする画像認識プログラム。The image recognition program according to any one of claims 27 to 30,
The distance calculation step uses K weights corresponding to each of the input principal component vectors and L weights corresponding to the dictionary principal component vectors, respectively.
前記入力主成分ベクトルに対応する重みは、前記入力主成分ベクトルとなる前記固有ベクトルのK個の固有値であり、
前記辞書主成分ベクトルに対応する重みは、前記辞書主成分ベクトルとなる前記固有ベクトルのL個の固有値である
ことを特徴とする画像認識プログラム。In the image recognition program according to claim 32,
The weight corresponding to the input principal component vector is K eigenvalues of the eigenvector that becomes the input principal component vector,
The weight corresponding to the said dictionary principal component vector is L eigenvalues of the said eigenvector used as the said dictionary principal component vector. The image recognition program characterized by the above-mentioned.
前記入力代表ベクトルをV1、前記辞書代表ベクトルをV2、前記入力主成分ベクトルをΨi(i=1,…,K)、前記入力主成分ベクトルに対応する前記重みをμi(i=1,…,K)、前記辞書主成分ベクトルをΦj(j=1,…,L)、前記辞書主成分ベクトルに対応する前記重みをλj(j=1,…,L)とすると、
前記入力投影距離算出ステップは、式(O)により前記第1の距離d1を算出し、
前記辞書投影距離算出ステップは、式(P)により前記第2の距離d2を算出することを特徴とする画像認識プログラム。
The input representative vector is V1, the dictionary representative vector is V2, the input principal component vector is ψi (i = 1,..., K), and the weight corresponding to the input principal component vector is μi (i = 1,. K), the dictionary principal component vector is Φj (j = 1,..., L), and the weight corresponding to the dictionary principal component vector is λj (j = 1,..., L).
In the input projection distance calculating step, the first distance d1 is calculated by the equation (O),
The dictionary projection distance calculating step calculates the second distance d2 by the equation (P).
前記統合ステップは、前記第1の距離d1および前記第2の距離d2から式(Q)により前記入力部分空間と前記辞書部分空間との前記距離値Dを算出することを特徴とする画像認識プログラム。
D=αd1+βd2 ・・・(Q)
(ただし、α,βは定数)The image recognition program according to any one of claims 27 to 30, 31 and 34,
In the integration step, the distance value D between the input subspace and the dictionary subspace is calculated from the first distance d1 and the second distance d2 by the equation (Q). .
D = αd1 + βd2 (Q)
(Where α and β are constants)
前記統合ステップは、前記第1の距離d1および前記第2の距離d2から式(R)により前記入力部分空間と前記辞書部分空間との前記距離値Dを算出することを特徴とする画像認識プログラム。
D=αd1・d2/(d1+d2) ・・・(R)
(ただし、αは定数)The image recognition program according to any one of claims 27 to 30, 31 and 34,
In the integration step, the distance value D between the input subspace and the dictionary subspace is calculated from the first distance d1 and the second distance d2 by the equation (R). .
D = αd1 · d2 / (d1 + d2) (R)
(Where α is a constant)
前記複数の入力特徴データから前記入力代表ベクトルを生成する入力代表ベクトル生成ステップと、
前記入力特徴データから前記入力主成分ベクトルを生成する入力主成分データ生成ステップとをさらに備えたことを特徴とする画像認識プログラム。In the image recognition program according to any one of claims 27 to 36,
An input representative vector generation step of generating the input representative vector from the plurality of input feature data;
An image recognition program, further comprising: an input principal component data generation step for generating the input principal component vector from the input feature data.
前記辞書代表ベクトルを生成する辞書代表ベクトル生成ステップと、
前記辞書主成分ベクトルを生成し、前記辞書代表ベクトルおよび前記辞書主成分ベクトルを格納する辞書格納手段に出力する辞書主成分データ生成ステップとをさらに備えたことを特徴とする画像認識プログラム。In the image recognition program according to any one of claims 27 to 36,
A dictionary representative vector generating step for generating the dictionary representative vector;
An image recognition program further comprising: a dictionary principal component data generation step of generating the dictionary principal component vector and outputting the dictionary representative vector and a dictionary storage means for storing the dictionary principal component vector.
認識対象が人間の顔画像であることを特徴とする画像認識プログラム。In the image recognition program according to any one of claims 27 to 36,
An image recognition program characterized in that a recognition target is a human face image.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2001369557A JP4099981B2 (en) | 2001-12-04 | 2001-12-04 | Image recognition system, image recognition method, and image recognition program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2001369557A JP4099981B2 (en) | 2001-12-04 | 2001-12-04 | Image recognition system, image recognition method, and image recognition program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2003168113A JP2003168113A (en) | 2003-06-13 |
| JP4099981B2 true JP4099981B2 (en) | 2008-06-11 |
Family
ID=19178926
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2001369557A Expired - Lifetime JP4099981B2 (en) | 2001-12-04 | 2001-12-04 | Image recognition system, image recognition method, and image recognition program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4099981B2 (en) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US10878657B2 (en) | 2018-07-25 | 2020-12-29 | Konami Gaming, Inc. | Casino management system with a patron facial recognition system and methods of operating same |
| US11521460B2 (en) | 2018-07-25 | 2022-12-06 | Konami Gaming, Inc. | Casino management system with a patron facial recognition system and methods of operating same |
Families Citing this family (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP4799397B2 (en) * | 2006-12-27 | 2011-10-26 | 富士フイルム株式会社 | Dictionary data creation device, predetermined area detection device, and photographing device |
| US9183429B2 (en) * | 2012-08-15 | 2015-11-10 | Qualcomm Incorporated | Method and apparatus for facial recognition |
| JP6255296B2 (en) * | 2014-03-31 | 2017-12-27 | セコム株式会社 | Object identification device |
| CN109784325A (en) | 2017-11-10 | 2019-05-21 | 富士通株式会社 | Opener recognition methods and equipment and computer readable storage medium |
| CN110110734B (en) * | 2018-02-01 | 2023-04-07 | 富士通株式会社 | Open set identification method, information processing apparatus, and storage medium |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS6057475A (en) * | 1983-09-07 | 1985-04-03 | Toshiba Corp | Pattern recognizing system |
| JP3569981B2 (en) * | 1994-10-26 | 2004-09-29 | ソニー株式会社 | Search method and speech recognition device |
-
2001
- 2001-12-04 JP JP2001369557A patent/JP4099981B2/en not_active Expired - Lifetime
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US10878657B2 (en) | 2018-07-25 | 2020-12-29 | Konami Gaming, Inc. | Casino management system with a patron facial recognition system and methods of operating same |
| US11455864B2 (en) | 2018-07-25 | 2022-09-27 | Konami Gaming, Inc. | Casino management system with a patron facial recognition system and methods of operating same |
| US11521460B2 (en) | 2018-07-25 | 2022-12-06 | Konami Gaming, Inc. | Casino management system with a patron facial recognition system and methods of operating same |
| US12087130B2 (en) | 2018-07-25 | 2024-09-10 | Konami Gaming, Inc. | Casino management system with a patron facial recognition system and methods of operating same |
| US12106630B2 (en) | 2018-07-25 | 2024-10-01 | Konami Gaming, Inc. | Casino management system with a patron facial recognition system and methods of operating same |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2003168113A (en) | 2003-06-13 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN110909651B (en) | Video subject identification method, device, equipment and readable storage medium | |
| JP4505733B2 (en) | Object recognition method and apparatus using texton | |
| CN106096582B (en) | Distinguish between real faces and flat surfaces | |
| JP4292837B2 (en) | Pattern feature extraction method and apparatus | |
| US7995805B2 (en) | Image matching apparatus, image matching method, computer program and computer-readable storage medium | |
| JP4321350B2 (en) | Parameter estimation method, parameter estimation device, and verification method | |
| US20030161504A1 (en) | Image recognition system and recognition method thereof, and program | |
| US7853052B2 (en) | Face identification device | |
| JP6112801B2 (en) | Image recognition apparatus and image recognition method | |
| US20070122009A1 (en) | Face recognition method and apparatus | |
| JPH08339445A (en) | Method and apparatus for detecting, recognizing and encoding complex objects using probabilistic eigenspace analysis | |
| JP5574033B2 (en) | Image recognition system, recognition method thereof, and program | |
| CN115240280B (en) | Method for constructing human face living body detection classification model, detection classification method and device | |
| US7224835B2 (en) | Three-dimensional object recognizing apparatus, method and computer program product | |
| CN100452084C (en) | Image recognition device and method thereof | |
| JP2005190400A (en) | Face image detection method, face image detection system, and face image detection program | |
| JP7448006B2 (en) | Object position estimation device | |
| JP4099981B2 (en) | Image recognition system, image recognition method, and image recognition program | |
| JP2004118731A (en) | Image recognition device, image recognition method and program for allowing computer to perform the method | |
| JP4708835B2 (en) | Face detection device, face detection method, and face detection program | |
| Geetha et al. | 3D face recognition using Hadoop | |
| JP4061405B2 (en) | Face image classification registration device | |
| Deepa et al. | Challenging aspects for facial feature extraction and age estimation | |
| Sehad et al. | Face recognition under varying views | |
| EP4583067A1 (en) | Method for differentiating a real object in an image from a spoof of the real object |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20041115 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070403 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070605 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070730 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070821 |
|
| RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20070920 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071017 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20070920 |
|
| A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20071029 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071127 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080128 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080226 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080310 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110328 Year of fee payment: 3 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 4099981 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110328 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120328 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120328 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130328 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130328 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140328 Year of fee payment: 6 |
|
| EXPY | Cancellation because of completion of term |