Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP4337738B2 - 画像信号処理装置および画像信号処理方法 - Google Patents
[go: Go Back, main page]

JP4337738B2 - 画像信号処理装置および画像信号処理方法 - Google Patents

画像信号処理装置および画像信号処理方法 Download PDF

Info

Publication number
JP4337738B2
JP4337738B2 JP2004524306A JP2004524306A JP4337738B2 JP 4337738 B2 JP4337738 B2 JP 4337738B2 JP 2004524306 A JP2004524306 A JP 2004524306A JP 2004524306 A JP2004524306 A JP 2004524306A JP 4337738 B2 JP4337738 B2 JP 4337738B2
Authority
JP
Japan
Prior art keywords
data
feature amount
image signal
position information
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004524306A
Other languages
English (en)
Other versions
JPWO2004012450A1 (ja
Inventor
哲二郎 近藤
和志 吉川
淳一 石橋
成司 和田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of JPWO2004012450A1 publication Critical patent/JPWO2004012450A1/ja
Application granted granted Critical
Publication of JP4337738B2 publication Critical patent/JP4337738B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/423Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/43Hardware specially adapted for motion estimation or compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/98Adaptive-dynamic-range coding [ADRC]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Analysis (AREA)
  • Television Signal Processing For Recording (AREA)

Description

本発明は、たとえば動画像圧縮装置などに用いられる動き検出装置やオブジェクト検索装置等、マッチングを必要とする処理に適用可能な画像信号処理装置および画像信号処理方法に関するものである。
信号のマッチング処理、特に画像信号のマッチング処理は、一般的に演算量が多いという問題点がある。マッチング処理を用いた例として、以下に説明するようなブロックマッチングによる動きベクトル検出がある。
すなわち、画像信号処理装置においては、動画像圧縮を効率よく行うための主要技術の1つとして、画像の動きを示す動きベクトルを求める動き検出がある。この動きベクトルを求める手法はいくつか提案されているが、主な手法の1つとしてブロックマッチングアルゴリズムと呼ばれる手法がある。
図1は、ブロックマッチングアルゴリズムを採用した従来の画像信号処理装置における動き検出装置の構成例を示すブロック図である。
この動き検出装置1は、フレームメモリ2,3、および動きベクトル検出部4を有している。
動き検出装置1においては、入力端子TINから画像信号が入力されると、1画面の情報がフレームメモリ2に格納される。
次の画面情報が入力されると、先ほどの(前回に入力された)フレームメモリ2の情報がフレームメモリ3に格納され、現在(今回)入力された情報がフレームメモリ2に格納される。
すなわち、カレントフレームFcの情報がフレームメモリ2に、参照フレームFrの情報がフレームメモリ3に格納されていることになる。
次に、カレントフレームFc、参照フレームFrの情報が動きベクトル検出部4に送られる。そして、動きベクトル検出部4でブロック分けされて動きベクトル(Vx,Vy)が検出されて、端子TOUT から出力される。
図2は、ブロックマッチングアルゴリズムの概要を説明するための図である。以下に、アルゴリズムの概要を図2に関連付けて説明する。
このアルゴリズムにおいては、カレントフレームFc内の注目画素Fc(x,y)における動きベクトルは、注目画素Fc(x,y)を中心としてある基準ブロック範囲(L×L)の画素と、参照フレームFr内のサーチエリアSR内の前記ブロック範囲(L×L)と同じブロック範囲内の画素とで対応する画素との差分絶対値和を演算する。
サーチエリアSR内で抽出するブロック範囲を一画素ずつ移動させながら上述の演算を繰り返し、全てのブロックの中で最も差分絶対値和が最も小さいブロックの中心位置と注目画素位置との差分ベクトルを解(動きベクトル)とする。
次に、図3に関連付けてカレントフレームFc内ある画素Fc(x,y)の動きベクトルを検出する処理手順を詳細に説明する。
[ステップST1]
ステップST1においては、処理開始ST0後、注目画素の位置(x,y)から参照フレーム内の同位置を基準としたサーチエリアSRが決定する。
[ステップST2]
ステップST2においては、演算結果の最小値を格納する変数minの初期化のために、演算式の最大値を代入する。1画素を8ビット、ブロック内の画素数を16とすると、28 ×16=4096を変数minに代入する。
[ステップST3]
ステップST3においては、サーチエリアSR内のブロックをカウントするカウンタ変数nを1に初期化する。
[ステップST4]
ステップST4においては、演算結果を代入する変数sumを0に初期化する。
[ステップST5]
ステップST5においては、基準ブロックの範囲をL×L、カレントフレームFcのあるブロック内の画素をFc(i,j)、参照フレームFrのサーチエリアSR内のk番目のブロック内の画素をFrk(i,j)とすると、対応する画素との差分絶対値和、すなわち次の数1に示す演算を行い、演算結果をsumに代入する。
Figure 0004337738
[ステップST6]
ステップST6においては、演算した差分絶対値和sumと差分絶対値和の最小値minとの大小関係の判別を行う。演算した差分絶対値和sumが小さい場合にはステップST7へ、大きい場合(等しいを含む)には演算結果が最小値ではないので更新手続きのステップST7をスキップしてステップST8へ進む。
[ステップST7]
ステップST7においては、最小値minを演算結果sumに更新し、動きベクトル番号としてブロックのカウント値nを設定する。
[ステップST8]
ステップST8においては、ブロックのカウント値nがサーチエリアSR内のブロック総数、つまり最後のブロックならば終了なのでステップST10へ、最後のブロックではなければ、ST9へ進む。
[ステップST9]
ステップST9においては、ブロックのカウント値nをn+1にインクリメントして、演算を繰り返すためにステップST4へ進む。
[ステップST10]
ステップST10においては、動き番号に格納されているブロック番号のブロックの中心画素と(x,y)から動きベクトルを求めて出力する。
上述したブロックマッチングアルゴリズムは、式(1)の演算を繰り返し行うため、演算量が非常に膨大となっており、MPEG等の画像圧縮処理の大半の時間がこれに費やされるという不利益がある。
本発明の目的は、僅かな演算量のみでマッチング処理等を行うことができ、しかも動きベクトル等を精度良く検出することを可能とする画信号処理装置および画像信号処理方法を提供することにある。
上記目的を達成するため、本発明の第1の観点は、複数の第1のデータを含む第1の画像信号と、複数の第2のデータを含む第2の画像信号を用いて動きベクトルを検出する画像信号処理装置において、上記第1の画像信号において、注目位置のデータである注目データである特徴量を抽出する第1の特徴量抽出手段と、上記第2のデータそれぞれの上記特徴量に対応するアドレスで指定された箇所に、上記第2のデータの位置情報を格納する格納手段と、上記注目データの上記特徴量に対応するアドレスで、上記格納手段に格納された上記第2のデータに位置情報を読み出すことで、上記注目データに対応する上記第2のデータの位置情報を取得し、上記注目データの位置情報と取得された上記第2のデータの位置情報とを用いて、上記注目データの動きベクトルを算出する動きベクトル算出手段とを有する。
好適には、上記動きベクトル算出手段は、上記注目データの特徴量に対応する上記第2のデータの位置情報が、上記格納手段から複数読み出された場合は、上記注目データの位置に最も距離が近い上記位置情報を、上記注目データに対応する上記第2のデータの位置情報とする。
本発明の第2の観点は、複数の第1のデータを含む第1の画像信号と、複数の第2のデータを含む第2の画像信号を用いて動きベクトルを検出する画像信号処理方法において、上記第1の画像信号において、注目位置のデータである注目データである特徴量を抽出する第1のステップと、上記第2のデータそれぞれの上記特徴量に対応するアドレスで指定された箇所に、上記第2のデータの位置情報を格納する第2のステップと、上記注目データの上記特徴量に対応するアドレスで、上記格納手段に格納された上記第2のデータに位置情報を読み出すことで、上記注目データに対応する上記第2のデータの位置情報を取得する第3のステップと、上記注目データの位置情報と取得された上記第2のデータの位置情報とを用いて、上記注目データの動きベクトルを算出する第4のステップと、を有し、上記第3のステップは、上記注目データの特徴量に対応する上記第2のデータの位置情報が、上記格納手段から複数読み出された場合は、上記注目データの位置に最も距離が近い上記位置情報を、上記注目データに対応する上記第2のデータの位置情報とする。
本発明によれば、僅かな演算量のみでマッチング処理等を行うことができ、しかも動きベクトル等を精度良く検出することができる。
以下、本発明の実施の形態を添付図面に関連付けて説明する。
図4は、本発明に係る画像信号処理装置の要部である動き検出装置の基本的な構成を有する信号処理装置を示すブロック図である。
本信号処理装置は、複数の第1のデータを含む第1の信号において、注目位置のデータである注目データの特徴量に対応するアドレスで、動き検出メモリ(以下、MEメモリという)に格納された第2の信号に含まれる第2のデータの位置情報を読み出すことで、注目データに対応する第2のデータの位置情報を取得(決定)する処理を行うことで、僅かな演算で位置情報(動きベクトル)を精度良く推定することを可能とするものである。
なお、以降の説明で、MEメモリ(特徴量アドレス,i)というのは、MEメモリ中で(特徴量アドレス,i)というアドレスで指定されている箇所に格納されているデータを示すことである。
以下、本信号処理装置の具体的な構成および機能について、図面を参照しながら詳細に説明する。
本信号処理装置10は、第1のデータ格納部11、第2のデータ格納部12、MEメモリ13、およびマッチング部14を有している。
なお、第1のデータ格納部11により本発明に係る第1の特徴量抽出手段が構成され、第2のデータ格納部12により本発明に係る第2の特徴量抽出手段が構成され、MEメモリ13により本発明に係る格納手段が構成され、マッチング部14により本発明に係る動きベクトル算出手段(マッチング手段)が構成される。
第1のデータ格納部11は、入力端子TINから入力された複数の第1のデータを含む第1の信号を格納する。
第1のデータ格納部11は、次の第1の信号が入力されるこの次の第1の信号を格納し、先に格納した第1の信号を複数の第2のデータを含む第2の信号として第2のデータ格納部12、およびマッチング部14に出力する。
また、第1のデータ格納部11は、格納した第1の信号において、注目位置のデータである注目データの特徴量を抽出し、注目データの位置情報を含む特徴量情報をマッチング部14に供給する。
第2のデータ格納部12は、第1のデータ格納部11に格納されていた以前(たとえば1回前)の第2の信号を格納し、格納した第2の信号において、第2のデータのそれぞれの特徴量を抽出し、MEメモリ13に格納する。
図5は、第1および第2のデータ格納部の構成例を示すブロック図である。図5に示すように、第1および第2のデータ格納部の各々は、メモリ111と、メモリ111に格納された第1または第2の信号から特徴量を抽出する特徴量抽出部112を有する。
MEメモリ13は、第2のデータ格納部12による第2の信号の第2のデータのそれぞれの特徴量を受けて、第2のデータのそれぞれの特徴量に対応するアドレスで指定された箇所に、第2のデータの位置情報を格納する。
マッチング部14は、第1のデータ格納部11から入力した注目位置のデータである注目データの特徴量に対応するアドレスで、MEメモリ13に格納された第2の信号に含まれる第2のデータの位置情報を読み出すことで、注目データに対応する第2のデータの位置情報を取得(決定)する。
マッチング部14は、注目データの特徴量に対応する第2のデータの位置情報が、MEメモリ13から複数読み出された場合は、注目データの位置に最も距離が近い上記位置情報を、注目データに対応する第2のデータの位置情報とする。
図6は、マッチング部14の構成例を示すブロック図である。
このマッチング部14は、図6に示すように、入力部141と、入力部141からの特徴量情報に基づいて、注目位置のデータである注目データの特徴量に対応するアドレスで、MEメモリ13に格納された第2の信号に含まれる第2のデータの位置情報を読み出す読み出し部142と、入力部141による第1のデータの位置情報とMEメモリ13から読み出した情報に基づいて注目データに対応する第2のデータの位置情報を決定する決定部143とを含む。動き検出に用いる場合は、決定部143で動きベクトルと決定し出力する。
なお、第1および第2の信号は、たとえば画像信号である。
また、たとえば第1および第2のデータ格納部11,12における特徴量抽出は、所定数の第1ないし第2のデータを用いて抽出される。また、特徴量は、所定数の第1ないし第2のデータの値の分布である。あるいは、第1ないし第2のデータは、複数のビットで表され、特徴量は、上記複数のビットの所定のビットを省いた上記所定数の第1ないし第2のデータの値の分布である。ここで、所定ビットは、第1ないし第2のデータの下位側のビットである。また、特徴量は、所定数の再量子化された第1ないし第2のデータの値の分布である。あるいは、特徴量は、所定数の適応的量子化がなされた第1ないし第2のデータの値の分布であり、適応的量子化は、ADRC(Adaptive Dynamic Range Coding)である。
以下に、以上の構成を有する信号処理装置を基本とした画像信号処理装置の要部である動き検出装置に具体化した実施形態を説明する。
<第1実施形態>
図7は、本発明に係る画像処理装置の要部である動き検出装置の第1の実施形態を示すブロック図である。
本動き検出装置は、特徴量をアドレスとして位置情報を格納するMEメモリを設け、周辺画素値を特徴量としてマッチング処理を行うことにより、僅かな演算で動きベクトルを精度良く推定することを可能とするものである。
以下、本動き検出装置の具体的な構成および機能について、図面を参照しながら詳細に説明する。
本動き検出装置20は、第1のデータ格納部としての第2のフレームメモリ21、第2のデータ格納部としての第2のフレームメモリ22、MEメモリ23、およびマッチング部としてのマッチング部24を有している。
なお、第1のフレームメモリ21により本発明に係る第1の特徴量抽出手段が構成され、第2のフレームメモリ22により本発明に係る第2の特徴量抽出手段が構成され、MEメモリ23により本発明に係る格納手段が構成され、マッチング部24により本発明に係る動きベクトル算出手段(マッチング手段)が構成される。
第1のフレームメモリ21は、入力端子TINから入力された画像信号の1画面の情報を格納する。
第1のフレームメモリ21は、次の画面情報が入力されると先に格納した画面情報、すなわちカレントフレームFcの情報を格納し、カレントフレームFcの情報を第2のフレームメモリ22、およびマッチング部24に出力する。
また、第1のフレームメモリ21は、カレントフレームFcの情報とともに、注目画素の特徴量、つまりアドレス情報をマッチング部24に供給する。
第2のフレームメモリ22は、第1のフレームメモリ21に格納されていた以前(たとえば1回前)の画面情報を参照フレームFrの情報として格納する。
MEメモリ23は、第2のフレームメモリ22に格納されている参照フレームFrの情報に基づいて、注目画素を中心としたあるブロック範囲の画素値である特徴量をアドレスとしてその特徴量に対応する注目画素の位置座標を含む情報を格納する。
マッチング部24は、第1のフレームメモリ21から供給されたカレントフレームFcの情報に含まれる注目画素の特徴量を、特徴量アドレスとしてMEメモリ23の格納情報を読み取る。カレントフレーム内の注目画素とMEメモリ23から読み込んだ格納情報に基づいた差分座標を注目画素の動きベクトル(Vx,Vy)として端子TOUT から出力する。なお、注目画素の特徴量に対応する特徴量アドレスに、複数の格納情報(位置座標)がある場合は、複数の候補の中から注目画素の位置と距離が最小となる動きベクトルを出力する。
図8は、本実施形態に係る動きベクトル検出の概要を示すフローチャートである。
この例では、まず、参照フレームFrのデータをMEメモリ23に格納する(ステップST21)。次に、マッチング部24が、カレントフレームFc内の画素Lnの特徴量に応じた特徴量アドレスで、MEメモリ13からデータを読み出す(ステップST22)。
マッチング部24が、読み出したデータの中で、画素Lnに対応するデータの位置情報を決定する(ステップST23)。そして、動きベクトルを全ての画素に対して動きベクトルが求まるまで算出する(ステップST23,ST24)。
以下、本実施形態の特徴である特徴量アドレス方式を採用したMEメモリ23の構成および機能について、図9および図10に関連付けて、さらに詳細に説明する。
図9は、特徴量アドレス方式を採用したMEメモリの構成例を示す図である。また、図10は、参照フレームの情報をMEメモリに格納する手順を説明するためのフローチャートである。
従来のメモリの場合、画素の位置情報をアドレスとして画素値を格納するものであるが、本MEメモリ23の場合、特徴量をアドレスとして、特徴量毎にその特徴量を持つ画素の位置情報を順次フラグアドレスFRGA1,2...、つまり図9のB、C・・・に格納していく。
本実施形態においては、1つのセルME−B1は、位置情報分の記憶容量を備えているものとする。同時に、フラグアドレスFRGA0には、その特徴量に格納した位置情報の個数を格納しておくものとする。
特徴量としては、注目画素を中心としたあるブロック内の画素値とする。たとえば、ブロック範囲を3×3、垂直方向をi、水平方向をj、位置(i,j)の画素値をL(i,j)とすると、この場合の特徴量は、次の2のようになる。
Figure 0004337738
次に、参照フレームの情報をMEメモリに格納する手順を、図10のフローチャートに関連付けて説明する。
参照フレームFrの情報がフレームメモリ22に格納されると処理を開始する。
[ステップST101]
ステップST101においては、MEメモリ内の全データを0に初期化する。0を書き込むか、リセット信号をOnする。
[ステップST102]
ステップST102においては、1フレームメモリ内の画素をカウントするカウンタ変数nを0に初期化する。
[ステップST103]
ステップST103においては、図4のフレームメモリ21から注目画素Lnを中心としたあるブロック範囲の画素値を特徴量(特徴量アドレス)とする。
[ステップST104]
ステップST104においては、MEメモリ(特徴量、0)の内容を1つインクリメントする。
[ステップST105]
特徴量アドレスをステップST103での特徴量、フラグアドレスを0とした場合のMEメモリ23の内容であるMEメモリ(特徴量、0)を読み込みフラグアドレスに設定する。ステップST105においては、MEメモリ13の内容であるMEメモリ(特徴量、フラグアドレス)の内容に、注目画素Lnの位置情報を書き込む。
[ステップST106]
ステップST106においては、カウント変数nをインクリメントする。
[ステップST107]
ステップST107においては、注目画素Lnがフレーム内の最後の画素かの判別を行う。最後の画素ではなければ、ステップST103へ進んで次の画素に関して同処理を繰り返す。
また、最後の画素ならば、処理を終了するために、ステップST109へ進む。
次に、本実施形態に係る動きベクトル検出の処理手順を、図7および図11に関連付けて説明する。
なお、図11は、本実施形態に係る動きベクトル検出の処理手順を説明するためのフローチャートである。
[ステップST201]
ステップST201においては、フレームメモリ21,22にそれぞれカレントフレームFc、参照フレームFrの情報が格納された後に、参照フレームの情報を特徴量アドレスに変換しながらMEメモリ23に格納する。詳細は、上述(ステップST100〜ST109)している。
[ステップST202]
ステップST202においては、1フレームの画素をカウントするカウント変数nを0に初期化する。
[ステップST203]
ステップST203においては、第1のカレントフレーム21内の注目画素Lnの特徴量は、その画素を中心としたあるブロック範囲の画素値なので、それらを特徴量として、マッチング部24に送る。
[ステップST204]
ステップST204においては、マッチング部24は、受け取った特徴量を特徴量アドレスとして、MEメモリ23から内容MEメモリ(特徴量アドレス、0)の値を読み込み、候補数を意味する変数knに代入する。
また、候補数カウンタを意味する変数kを1に、距離の最小値を意味する変数minを∞もしくは十分大きな値に、距離を意味する変数Lを0に初期化する。
[ステップST205]
ステップST205においては、カレントフレーム内の注目画素LnとMEメモリ23から読み込んだMEメモリ内容(特徴量アドレス、k)=位置座標との距離を演算して、変数Lに代入する。
[ステップST206]
ステップST206においては、ステップST205で求まった距離Lと距離の最小値minとの大小判別を行う。
その結果、min>Lならば、距離の最小値Lを更新するためにステップST207へ、min≦Lならば、更新ステップをスキップして、ステップST208へ進む。
[ステップST207]
ステップST207においては、距離の最小値minをLに更新する。その際のフラグアドレス値、つまりkを変数ansに格納しておく。
[ステップST208]
ステップST208においては、候補カウンタが候補数であるかの判別を行い、候補数である場合はステップST210へ、まだ候補がある場合は、ステップST209へ進む。
[ステップST209]
ステップST209においては、候補カウンタkをインクリメント後、ステップST205へ進む。
[ステップST210]
ステップST210においては、カレントフレーム内の画素Lnと距離が最少である位置情報、つまりMEメモリ23の内容MEメモリ(特徴量アドレス、ans)の値を読み込み、差分座標を動きベクトルとする。
[ステップST211]
ステップST211においては、注目画素の動きベクトルを出力する。
[ステップST212]
ステップST212においては、画素のカウンタ変数nをインクリメントする。
[ステップST213]
ステップST213においては、注目画素がカレントフレーム内の最後の画素であるかの判別を行う。判別の結果、最後の画素であれば終了のためステップST214へ、違う場合は、次の画素の動きベクトルを求めるためにステップST203へ進む。
画素値としては、たとえば1画素=8ビットとした場合、コンピュータグラフィックス(CG)のような画像はフルビット(8ビット)情報でマッチング処理を行えるが、自然画像の場合は、フレーム毎にバラツキを含むので、複数ビットのうち所定ビットを除いて、マッチング処理を行うことが望ましい。具体的には、下位数ビットをマスクして使用してもよいし、ビット数を少なくして再量子化しても良い。
つまり、非線形/線形な量子化におけるビット数を削減する(量子化ビット数を少なくする)ことが望ましい。
以上説明したように、本第1の実施形態によれは、カレントフレームFcの情報を格納し、カレントフレームFcの情報とともに、注目画素の特徴量であるアドレス情報を出力する第1のフレームメモリ21と、第1のフレームメモリ21に格納されていた以前(1回前)の画面情報を参照フレームFrの情報として格納する第2のフレームメモリ12と、第2のフレームメモリ22に格納されている参照フレームFrの情報に基づいて、注目画素を中心としたあるブロック範囲の画素値を含む特徴量をアドレスとして変換し、変換後の位置情報を含む情報を格納するMEメモリ23と、第1のフレームメモリ21から供給されたカレントフレームFcの情報に含まれる注目画素の特徴量を、特徴量アドレスとしてMEメモリ23の格納情報を読み取り、カレントフレーム内の注目画素とMEメモリ23から読み込んだ特徴量アドレス(位置座標)との距離を演算し、複数の候補の中から距離が最小である位置情報に基づいた差分座標を注目画素の動きベクトル(Vx,Vy)として検出するマッチング部24とを設けたので、以下の効果を得ることができる。
すなわち、本第1の実施形態においては、ブロックエリア内の空間パターン情報を特徴量とし、候補数だけの距離演算比較をするだけなので、従来の手法よりも僅かな演算量で、かつ、精度の高い動きベクトル検出が可能となる利点がある。
なお、候補数が多くなる場合は、MEメモリ23に格納する情報を1フレームの全情報ではなく、ある程度のエリアに区分してもよい。
<第2実施形態>
図12は、本発明に係る画像処理装置としての動き検出装置の第2の実施形態を示すブロック図である。
本第2の実施形態が上述した第1の実施形態と異なる点は、特徴量を求める特徴量生成手段としてのクラス生成部25−1,25−を設けることによって、好ましい特徴量でマッチングが可能となる点である。なお、図13に示すように一つのクラス生成部25を設ける構成も可能である。回路の機能としては、クラス生成部25−1,25−の機能を併せ持つことになる。
クラス生成部25−1は、第1のフレームメモリ21のカレントフレームFcの情報を受けてADRCに基づく量子化コードをカレントフレームの特徴量として生成してマッチング部24Aに出力する。
また、クラス生成部25−2は、第2のフレームメモリ22の参照フレームFrの情報を受けてADRCに基づく量子化コードをカレントフレームの特徴量として生成してMEメモリ23に出力する。
マッチング部24Aは、カレントフレームの特徴量を、特徴量アドレスとしてMEメモリ23の格納情報を読み取り、カレントフレーム内の注目画素とMEメモリ23から読み込んだ特徴量アドレスに含まれるADRCの量子化コードのマッチングを行うことにより注目画素の動きベクトルを検出する。
このように、本第2の実施形態に係るクラス生成部25−1,25−2での特徴量の生成としてADRCを用いる。ADRC(Adaptive Dynamic Range Coding)は、VTR(Video Tape Recorder)向け高性能符号化用に開発された適応的量子化法であるが、信号レベルの局所的なパターンを短い語長で効率的に表現できるので、この第2の実施形態では、ADRCを空間クラス分類のコード発生に使用している。
ADRCは、空間クラスタップのダイナミックレンジをDR、ビット割り当てをn、空間クラスタップの画素のデータレベルをL、再量子化コードをQとして、以下の数3により、最大値MAXと最小値MINとの間を指定されたビット長で均等に分割して再量子化を行うアルゴリズムである。
Figure 0004337738
ただし、{}は切り捨て処理を意味する。マッチング処理フローは、上述した図11の説明の特徴量をADRCの量子化コードとしたものと等価なので省略する。
空間クラスタップの取り方の一例として、ブロックサイズが3×3の場合は、図14Aに示すように全画素を使用してもよいし、図14Bに示すように十文字で構成してもよく、クラスコードに与えられる情報量の制限の中で決定すればよい。
同様にして、ブロックサイズが5×5の場合の一例としては、図14Cおよび図14Dに示すような形態が採用可能である。
図14Cの例は十文字で構成する場合であり、図14Dの例は十文字で構成し、さらに端部の画素を使用する場合である。
次に、周辺画素値よりもADRC量子化コードを用いた方が優れていることを、図15Aおよび図15Bに関連付けて説明する。
図15Aおよび図15Bは、分かりやすいように画像のある1ラインが参照フレームからカレントフレームに移動した際の画素値を表示している。また、図16は輝度値の10進数表記と16進数表記との対応関係を示している。
通常、自然画像の場合は、同じ絵柄(パターン)が移動しても、同じ画素値になる可能性は低く、図15Aおよび図15Bに示すように、画素レベルがずれてしまう。
この場合、同じパターンとして正しく検出できるかがポイントとなる。周辺画素値を特徴量として用いた場合で、ノイズ成分の影響を抑えるために、下位ビットをマスクした場合のコード結果を載せている。
記載しているように、同じパターンであるにもかかわらず誤検出することがある。
これに対して、ADRCでの量子化コードは、信号レベルの局所的なパターンを短い語長で効率的に表現できることから微小なレベル変動に強く、同じコード結果が得られることが分かる。
具体的には、参照フレームのある1ラインのADRCコードは「01101」であり、カレントフレームのある1ラインのADRCコードも「01101」であり、両者が一致する。
以上説明したように、本第2の実施形態によれば、ADRCの量子化コードを特徴量とすることによって従来よりも精度の高い動きベクトル検出が可能となる利点がある。
第1乃至第2の実施の形態では、動きベクトル検出に対応した記憶装置について、説明した。そのため、各特徴量をアドレスとして、空間座標を記憶する記憶装置を例に挙げた。
しかし、本発明は、動きベクトル検出以外にも、マッチングを行うシステムに適用できるものである。
この概念は、「第1のデータに関する情報を記憶した記憶装置において、
上記第1のデータとは異なる第2のデータ中における注目データの第1の特徴(アドレス)を示す第1の特徴量が入力される入力手段と、
上記第1のデータ中における或るデータの上記第1の特徴(アドレス)を示す第3の特徴量に対応する箇所に、上記第1のデータ中における上記或るデータの第2の特徴(座標)を示す第2の特徴量を記憶する記憶手段とを有し、
上記記憶手段の上記第1の特徴量に対応する箇所から、上記第1のデータの上記第2の特徴である上記第2の特徴量を出力することを特徴とする記憶装置。」という形で表現できる。
つまり、データの特徴A(第1の特徴)を示す各第1の特徴量をアドレスとして、データの特徴B(第2の特徴)を示す第2の特徴量を記憶するようにしても良い。この特徴A、特徴Bに関しては、マッチングを行うシステム/装置の目的によって適宜設定・変更できるものである。例えば、本実施の形態では、特徴A:画素値パターン/ADRCコード、特徴B:座標として説明したが、これら以外の特徴を用いてもよい。
本発明の画像信号処理装置および画像信号処理方法よれば、精度の高い動きベクトル検出が可能となることから、動画像圧縮装置などに用いられる動き検出装置やオブジェクト検索装置等、マッチングを必要とする処理に適用可能である。
図1は、ブロックマッチングアルゴリズムを採用した従来の動き検出装置の構成例を示すブロック図である。 図2は、ブロックマッチングアルゴリズムの概要を説明するための図である。 図3は、カレントフレームFC内ある画素Fc(x,y)の動きベクトルを検出する処理手順を説明するためのフローチャートである。 図4は、本発明に係る画像信号処理装置の要部である動き検出装置の基本的な構成を有する信号処理装置を示すブロック図である。 図5は、図4の第1および第2のデータ格納部の基本的な構成例を示すブロック図である。 図6は、図4のマッチング部の構成例を示すブロック図である。 図7は、本発明に係る動き検出装置の第1の実施形態を示すブロック図である。 図8は、本実施形態に係る動きベクトル検出の概要を示すフローチャートである。 図9は、本実施形態に係る特徴量アドレス方式における動きメモリの構造を説明するための図である。 図10は、本実施形態に係る特徴量アドレス方式における動きメモリへの格納手順を説明するための図である。 図11は、本実施形態に係る特徴量アドレス方式における動き検出の動作を説明するためのフローチャートである。 図12は、本発明に係る動き検出装置の第2の実施形態を示すブロック図である。 図13は、本第2の実施形態に係る動き検出装置の他の構成例を示すブロック図である。 図14A〜図14Dは、クラスタップのとり方の一例を示す図である。 図15Aおよび図15Bは、周辺画素値よりもADRC量子化コードを用いた方が優れていることを説明するための図である。 図16は、輝度値の10進数と16進数との対応関係を示す図である。
10・・・信号処理装置、11・・・第1のデータ格納部、12・・・第2のデータ格納部、13・・・動き検出メモリ(MEメモリ)、14・・・マッチング部、20,20A・・・動き検出装置、21・・・第1のフレームメモリ、22・・・第2のフレームメモリ、23・・・動き検出メモリ(MEメモリ)、24,24A・・・マッチング部、25・・・クラス生成部。

Claims (4)

  1. 複数の第1のデータを含む第1の画像信号と、複数の第2のデータを含む第2の画像信号を用いて動きベクトルを検出する画像信号処理装置において、
    上記第1の画像信号において、注目位置のデータである注目データである特徴量を抽出する第1の特徴量抽出手段と、
    上記第2のデータそれぞれの上記特徴量に対応するアドレスで指定された箇所に、上記第2のデータの位置情報を格納する格納手段と、
    上記注目データの上記特徴量に対応するアドレスで、上記格納手段に格納された上記第2のデータに位置情報を読み出すことで、上記注目データに対応する上記第2のデータの位置情報を取得し、上記注目データの位置情報と取得された上記第2のデータの位置情報とを用いて、上記注目データの動きベクトルを算出する動きベクトル算出手段と、を有し、
    上記動きベクトル算出手段は、
    上記注目データの特徴量に対応する上記第2のデータの位置情報が、上記格納手段から複数読み出された場合は、上記注目データの位置に最も距離が近い上記位置情報を、上記注目データに対応する上記第2のデータの位置情報とする
    画像信号処理装置。
  2. 上記画像信号処理装置は、さらに、
    上記第2の画像信号において、第2のデータそれぞれの特徴量を抽出する第2の特徴量抽出手段を有する
    請求項1記載の画像信号処理装置。
  3. 上記第1の特徴量抽出手段は、さらに、
    上記第2の画像信号において、第2のデータそれぞれの特徴量を抽出する第2の特徴量抽出手段を有する
    請求項1記載の画像信号処理装置。
  4. 複数の第1のデータを含む第1の画像信号と、複数の第2のデータを含む第2の画像信号を用いて動きベクトルを検出する画像信号処理方法において、
    上記第1の画像信号において、注目位置のデータである注目データである特徴量を抽出する第1のステップと、
    上記第2のデータそれぞれの上記特徴量に対応するアドレスで指定された箇所に、上記第2のデータの位置情報を格納する第2のステップと、
    上記注目データの上記特徴量に対応するアドレスで、上記格納手段に格納された上記第2のデータに位置情報を読み出すことで、上記注目データに対応する上記第2のデータの位置情報を取得する第3のステップと、
    上記注目データの位置情報と取得された上記第2のデータの位置情報とを用いて、上記注目データの動きベクトルを算出する第4のステップと、を有し、
    上記第3のステップは、
    上記注目データの特徴量に対応する上記第2のデータの位置情報が、上記格納手段から複数読み出された場合は、上記注目データの位置に最も距離が近い上記位置情報を、上記注目データに対応する上記第2のデータの位置情報とする
    画像信号処理方法。
JP2004524306A 2002-07-30 2003-07-30 画像信号処理装置および画像信号処理方法 Expired - Fee Related JP4337738B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2002222008 2002-07-30
JP2002222008 2002-07-30
PCT/JP2003/009637 WO2004012450A1 (ja) 2002-07-30 2003-07-30 記憶装置、信号処理装置、および画像信号処理装置、並びにそれらの方法

Publications (2)

Publication Number Publication Date
JPWO2004012450A1 JPWO2004012450A1 (ja) 2005-11-24
JP4337738B2 true JP4337738B2 (ja) 2009-09-30

Family

ID=31184888

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004524306A Expired - Fee Related JP4337738B2 (ja) 2002-07-30 2003-07-30 画像信号処理装置および画像信号処理方法

Country Status (7)

Country Link
US (1) US7800624B2 (ja)
EP (1) EP1526728B1 (ja)
JP (1) JP4337738B2 (ja)
KR (1) KR100964621B1 (ja)
CN (1) CN1326394C (ja)
TW (1) TWI287927B (ja)
WO (1) WO2004012450A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7636481B2 (en) * 2002-10-09 2009-12-22 Sony Corporation Image processing apparatus, method, storage medium, and program for compressing an input image using a motion vector that is detected based on stored position information of pixels
CN100393125C (zh) * 2005-02-05 2008-06-04 威盛电子股份有限公司 处理图像帧的方法
JP5322416B2 (ja) * 2007-09-12 2013-10-23 株式会社メガチップス ブロックマッチング回路及びデータ更新方法
KR101452859B1 (ko) 2009-08-13 2014-10-23 삼성전자주식회사 움직임 벡터를 부호화 및 복호화하는 방법 및 장치
JP2012043051A (ja) * 2010-08-16 2012-03-01 Fuji Xerox Co Ltd 情報処理装置およびプログラム

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2050752B (en) * 1979-06-07 1984-05-31 Japan Broadcasting Corp Motion compensated interframe coding system
JPS61107886A (ja) 1984-10-31 1986-05-26 Sony Corp 動きベクトルの平滑回路
CA1251555A (en) 1984-12-19 1989-03-21 Tetsujiro Kondo High efficiency technique for coding a digital video signal
JPH0793724B2 (ja) 1984-12-21 1995-10-09 ソニー株式会社 テレビジョン信号の高能率符号化装置及び符号化方法
US4754490A (en) * 1987-05-22 1988-06-28 Environmental Research Institute Of Michigan Linked-list image feature extraction
JP2953712B2 (ja) * 1989-09-27 1999-09-27 株式会社東芝 移動物体検知装置
JPH0622301A (ja) * 1992-06-30 1994-01-28 Sony Corp 画像符号化装置
JP3106749B2 (ja) * 1992-12-10 2000-11-06 ソニー株式会社 適応型ダイナミックレンジ符号化装置
JP3271387B2 (ja) 1993-08-19 2002-04-02 ソニー株式会社 動き量検出装置及び動き量検出方法
JP3277417B2 (ja) 1993-09-09 2002-04-22 ソニー株式会社 動きベクトル検出装置および方法
JP3277419B2 (ja) * 1993-09-09 2002-04-22 ソニー株式会社 動きベクトル検出装置および方法
JP3606597B2 (ja) * 1994-01-21 2005-01-05 ソニー株式会社 動きベクトル検出装置
JPH0865681A (ja) * 1994-08-25 1996-03-08 Sony Corp 動きベクトル検出装置およびそれを使用した動き補償予測符号化システム
FR2728091B1 (fr) 1994-12-13 1997-01-31 Thomson Consumer Electronics Procede de selection de vecteurs mouvement et dispositif de traitement d'images mettant en oeuvre ledit procede
KR0171143B1 (ko) * 1995-03-20 1999-03-20 배순훈 육각그리드에서의 삼각구조 형성 장치
US5809173A (en) * 1995-04-18 1998-09-15 Advanced Micro Devices, Inc. Method and apparatus for improved video decompression using previous frame DCT coefficients
US5692063A (en) * 1996-01-19 1997-11-25 Microsoft Corporation Method and system for unrestricted motion estimation for video
JPH09212650A (ja) * 1996-02-05 1997-08-15 Sony Corp 動きベクトル検出装置および検出方法
JP2914441B2 (ja) * 1996-12-27 1999-06-28 日本電気株式会社 動き検出方法
US6259734B1 (en) * 1998-04-03 2001-07-10 Matsushita Electric Industrial Co., Ltd. Image processing method, image processing apparatus, and data storage media
JP4161441B2 (ja) * 1998-12-24 2008-10-08 ソニー株式会社 動きベクトル推定装置および動きベクトル推定方法
FI110743B (fi) * 1999-06-28 2003-03-14 Valtion Teknillinen Menetelmä ja järjestelmä liike-estimoinnin suorittamiseksi
US6661842B1 (en) * 2000-09-22 2003-12-09 General Dynamics Decision Systems, Inc. Methods and apparatus for error-resilient video coding
JP2002197061A (ja) 2000-12-25 2002-07-12 Nec Corp ユーザ認証方法、ユーザ認証システム、及びユーザ認証プログラムを記録した記録媒体
JP4147456B2 (ja) 2002-03-29 2008-09-10 富士通株式会社 赤外線画像信号処理装置

Also Published As

Publication number Publication date
WO2004012450A1 (ja) 2004-02-05
EP1526728B1 (en) 2013-02-27
JPWO2004012450A1 (ja) 2005-11-24
KR100964621B1 (ko) 2010-06-21
CN1326394C (zh) 2007-07-11
US7800624B2 (en) 2010-09-21
US20040252125A1 (en) 2004-12-16
TW200423714A (en) 2004-11-01
TWI287927B (en) 2007-10-01
EP1526728A4 (en) 2008-05-28
EP1526728A1 (en) 2005-04-27
KR20050027206A (ko) 2005-03-18
CN1565123A (zh) 2005-01-12

Similar Documents

Publication Publication Date Title
EP0446001B1 (en) Motion vector detection circuit used in hierarchical processing of moving picture signal
EP1775664A2 (en) Image processing apparatus
US8648931B2 (en) Systems and methods for capturing images of objects
US10424068B2 (en) Image processing apparatus and image processing method for person identification
US6016163A (en) Methods and apparatus for comparing blocks of pixels
JP4337738B2 (ja) 画像信号処理装置および画像信号処理方法
CN111652186A (zh) 一种视频类别识别的方法及相关装置
JP2000184336A (ja) 画像処理装置、画像処理方法及びコンピュ―タ読み取り可能な記憶媒体
CN116993620B (zh) 一种去模糊方法和电子设备
US20210350582A1 (en) Point cloud global tetris packing
US8098944B2 (en) Image processing apparatus, method, storage medium, and program
JP2010044586A (ja) 2次元コード読取装置とそのプログラム
JP4224999B2 (ja) 画像処理装置および画像処理方法
CN113392241B (zh) 测井图像清晰度的识别方法、装置、介质及电子设备
CN1565124B (zh) 存储器设备,信号处理设备,图像信号处理设备和信号处理方法
JP4129788B2 (ja) 画像データ処理装置および方法、記録媒体、並びにプログラム
JP3985653B2 (ja) 動きベクトル検出装置及び方法、記録媒体、並びにプログラム
JP3985652B2 (ja) 動きベクトル検出装置及び方法、記録媒体、並びにプログラム
JP4329331B2 (ja) 画像処理装置および方法、記録媒体、並びにプログラム
JP2840007B2 (ja) 動きベクトル検出回路
JP4239557B2 (ja) 画像処理装置および方法、記録媒体、並びにプログラム
JPH08147474A (ja) 画像処理装置
JPH10143677A (ja) 画像処理方法、画像処理装置、および画像処理プログラム記録媒体
JP2002354482A (ja) 動きベクトル検出方法、動きベクトル検出装置、動画像符号化方法、動画像符号化装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060719

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090317

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090515

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090609

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090622

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120710

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130710

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees