JP4688147B2 - Moving image processing device - Google Patents
Moving image processing device Download PDFInfo
- Publication number
- JP4688147B2 JP4688147B2 JP2005175047A JP2005175047A JP4688147B2 JP 4688147 B2 JP4688147 B2 JP 4688147B2 JP 2005175047 A JP2005175047 A JP 2005175047A JP 2005175047 A JP2005175047 A JP 2005175047A JP 4688147 B2 JP4688147 B2 JP 4688147B2
- Authority
- JP
- Japan
- Prior art keywords
- moving image
- feature point
- image processing
- processing apparatus
- motion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Image Analysis (AREA)
Description
本発明は、動画像処理装置に関し、特に、符号化動画像の復号情報だけでなく、符号情報を利用して動画像における移動物体を効率的に高速かつ高精度に追跡することができる動画像処理装置に関する。 The present invention relates to a moving image processing apparatus, and in particular, a moving image capable of efficiently and rapidly tracking a moving object in a moving image using not only decoding information of an encoded moving image but also code information. The present invention relates to a processing apparatus.
動画像における移動物体を追跡する方式には、画素領域で追跡する方式と符号領域で追跡する方式がある。画素領域で移動物体を追跡する方式としては、背景差分法やKLT法などが知られている。背景差分法では、背景画像と対象画像との差分絶対値和を移動物体検出の判定に使用する。また、KLT法では、画像の勾配に関する拘束式を解くことにより移動物体を検出する。 As a method of tracking a moving object in a moving image, there are a method of tracking in a pixel region and a method of tracking in a code region. Background subtraction methods, KLT methods, and the like are known as methods for tracking a moving object in a pixel region. In the background difference method, the sum of absolute differences between the background image and the target image is used for the determination of moving object detection. In the KLT method, a moving object is detected by solving a constraint equation related to the gradient of an image.
符号領域で移動物体を追跡する方式としては、圧縮符号化された動画像の符号情報そのものを利用する方式が提案されており、これでは、圧縮符号化の際に求められた各種パラメータや符号情報を直接操作することで移動物体検出の処理を達成する。移動物体検出の処理では、画像内の符号単位ブロックが持つ動き予測情報を中心に必要な情報のみが取捨選択されて処理され、これによる検出結果に従って移動物体が追跡される。 As a method for tracking a moving object in a code area, a method using code information itself of a compression-coded moving image has been proposed. In this case, various parameters and code information obtained at the time of compression coding are proposed. The process of moving object detection is achieved by directly operating. In the moving object detection process, only necessary information is selected and processed based on the motion prediction information of the code unit block in the image, and the moving object is tracked according to the detection result.
しかしながら、画素領域で移動物体を追跡する方式は、動画像が符号化されている場合、該方式を適用するに際し、符号化動画像の符号情報を一旦画素領域まで復号し、画素領域で全ての処理を行うので、復号処理や追跡処理の計算量負荷が大きくなるという課題がある。 However, the method of tracking a moving object in the pixel area is such that, when a moving image is encoded, when the method is applied, the code information of the encoded moving image is once decoded to the pixel region, Since the process is performed, there is a problem that the calculation load of the decoding process and the tracking process increases.
一方、符号領域で移動物体を追跡する方法は、圧縮効率を高めるように決定された動きベクトルに依存し、この動きベクトルを元に検出された動画像における動きは本来の動きと一致するとは限らないため、追跡の信頼性に欠けるという課題がある。例えば、平坦な画像領域ではノイズの影響が大きく、動きベクトルは本来の動きと異なる場合が多いので、動きベクトルを元に検出された動きの信頼性は、特に乏しくなる。 On the other hand, the method of tracking a moving object in a code region depends on a motion vector determined to increase compression efficiency, and the motion in a moving image detected based on this motion vector does not always match the original motion. Therefore, there is a problem that the reliability of tracking is lacking. For example, since the influence of noise is large in a flat image region and the motion vector is often different from the original motion, the reliability of the motion detected based on the motion vector is particularly poor.
移動物体の検出や追跡などの画像理解には、画素そのものだけではなく周波数上での特徴量を解析することが有効である。しかし、符号化動画像の内容を周波数上で解析するために、一度画素領域まで復号した後に改めて周波数領域に変換すると、処理コストが大きくなってしまう。 For image understanding such as detection and tracking of a moving object, it is effective to analyze not only the pixel itself but also the feature quantity on the frequency. However, in order to analyze the content of the encoded moving image on the frequency, if the pixel region is once decoded and then converted to the frequency region again, the processing cost increases.
本発明の目的は、上記課題を解決し、符号化動画像の符号情報そのものを周波数上の情報として利用することで動画像における移動物体を効率的に高速かつ高精度に追跡することができる動画像処理装置を提供することにある。 An object of the present invention is to solve the above-described problem and use moving image information that can efficiently and rapidly track a moving object in a moving image by using code information itself of the encoded moving image as information on the frequency. An object is to provide an image processing apparatus.
上記課題を解決するために、本発明は、符号化動画像の符号情報を利用して動画像における移動物体を追跡する動画像処理装置において、伝送または蓄積された符号化動画像を入力する入力部と、入力された符号化動画像から符号情報の抽出および復号を行う復号部と、移動物体を形成し、かつ画素の変化に富んでいる領域の複数の特徴点を前記符号情報を用いて選択する特徴点選択部と、前記特徴点の位置情報および復号された動画像を用いて符号化動画像での動き探索の領域単位より小さい、特徴点を含む小領域単位で動きを推定して移動物体の動きを推定する動き推定部と、前記動き推定部により推定された移動物体の動きに基づいて移動物体を追跡する整合部を備えたことを基本的特徴としている。 In order to solve the above problems, the present invention provides an input for inputting a transmitted or accumulated encoded moving image in a moving image processing apparatus that tracks moving objects in the moving image using code information of the encoded moving image. using the parts, and a decoder for extracting and decoding of the code information from the input encoded moving image, to form a moving objects, and the code information a plurality of feature points of a region rich in change of the pixel a feature point selection section for selecting Te, by using the positional information and the decoded moving image of the feature point area unit smaller than the motion search in the encoded moving image, and estimating motion in a small region unit including a feature point It is basically characterized in that it comprises a motion estimator for estimating a motion of a moving object, the matching unit to track the moving object based on the motion of the moving object estimated by the motion estimation unit Te.
本発明では、符号化動画像の復号情報だけでなく、符号情報も利用して移動物体の検出と追跡を行う。この際、移動物体を形成し、かつ画素の変化に富んでいる領域の複数の特徴点を符号情報を用いて選択し、移動物体の検出および追跡処理では、該特徴点に追跡対象を限定して処理するので、画素領域で追跡する方式と比較して処理コストを低減することができる。また、符号領域で追跡する方式と比較しても処理コストを低減することができる。さらに、特徴点の位置情報および復号された動画像を用いて符号化動画像での動き探索の領域単位より小さい、特徴点を含む小領域単位で動きを推定して移動物体の動きを推定するので、移動物体を高精度に追跡することができる。 In the present invention, the moving object is detected and tracked using not only the decoding information of the encoded moving image but also the code information. At this time, a plurality of feature points in a region that forms a moving object and is rich in pixel changes are selected using code information , and the tracking target is limited to the feature points in the detection and tracking process of the moving object. Therefore , the processing cost can be reduced as compared with the method of tracking in the pixel area. Also, the processing cost can be reduced compared with the method of tracking in the code area. Furthermore, the motion of a moving object is estimated by estimating the motion in units of small areas including feature points, which is smaller than the unit of motion search in the encoded video using the position information of the feature points and the decoded video. Therefore, it is possible to track a moving object with high accuracy.
以下、図面を参照して本発明について説明する。図1は、本発明に係る動画像処理装置の一実施形態の機能ブロック図である。本実施形態の動画像処理装置は、入力部10、復号部11、特徴点選択部12、動き推定部13、整合部14および表示部15を備える。
The present invention will be described below with reference to the drawings. FIG. 1 is a functional block diagram of an embodiment of a moving image processing apparatus according to the present invention. The moving image processing apparatus according to the present embodiment includes an
以下、各部の機能を順に説明する。なお、以下では、入力される動画像が国際標準であるMPEG-1 ビデオ(ISO/IEC11172-2)に従って符号化された符号化動画像であるとして説明するが、本発明は、その他の方式の符号化動画像に対しても適用でき、対象とする符号化動画像を限定するものではない。 Hereinafter, functions of each unit will be described in order. In the following description, it is assumed that the input moving image is an encoded moving image encoded according to the MPEG-1 video (ISO / IEC11172-2) which is an international standard. The present invention can also be applied to an encoded moving image, and does not limit the target encoded moving image.
符号化動画像は、入力部10を介して復号部11に入力される。入力される符号化動画像は、遠隔地から伝送されてきたものでも、装置内外のデータベースから読み出されたものでもよい。
The encoded moving image is input to the
復号部11は、入力された符号化動画像を復号し、また、符号化動画像から符号化係数や発生符号量などの符号情報を抽出する。抽出された符号情報は、特徴点選択部12に送出され、復号情報は、動き推定部13へ送出される。
The
特徴点選択部12は、復号部11から送出される符号情報を入力とし、移動物体の動きが正確に捕捉できるように、フレーム間での一致の対応付けが容易な動き物体を形成する特徴点を選択する。
The feature
例えば、変化の乏しい平坦な画像領域は、追跡する際に正確な動きを推定することが困難であるため、特徴点としては相応しくない。また、ノイズが大きい画像領域やランダムな画素値を持つ画像領域も特徴点として相応しくない。逆に、明確なエッジが存在する画像領域は、位置の特定が容易であるので特徴点として相応しい。特に、物体の角や端点など、複数のエッジが交差する部分を含む画像領域は特徴点として相応しい。移動物体の領域は、複数の特徴点を囲う外接領域として形成することができる。 For example, a flat image region with little change is not suitable as a feature point because it is difficult to estimate an accurate motion when tracking. Also, an image area with a large noise or an image area with a random pixel value is not suitable as a feature point. On the contrary, an image region where a clear edge exists is suitable as a feature point because the position can be easily identified. In particular, an image region including a portion where a plurality of edges intersect, such as an object corner or an end point, is suitable as a feature point. The area of the moving object can be formed as a circumscribed area surrounding a plurality of feature points.
以下では、エッジに着目した特徴点選択について説明する。図2は、特徴点選択部12の機能を具体的に示す機能ブロック図である。本例の特徴点選択部12は、テクスチャ判定21、分布判定22およびブロック境界について判定23の3種類の判定を順次実行して、入力された符号情報から特徴点を選択する。
Hereinafter, feature point selection focusing on edges will be described. FIG. 2 is a functional block diagram specifically illustrating the function of the feature
まず、テクスチャ判定21について説明する。テクスチャ判定21は、符号化係数のテクスチャを基に、平坦領域とノイズ領域を排除し、適度なエッジを持った領域を特徴点候補とする。発生符号量やDCT係数を判定することにより、特徴点候補を符号領域上で選定することができる。 First, the texture determination 21 will be described. The texture determination 21 excludes a flat area and a noise area based on the texture of the coding coefficient, and sets an area having an appropriate edge as a feature point candidate. By determining the generated code amount and DCT coefficient, feature point candidates can be selected on the code area.
例えば、可変長符号化されているビット量(発生符号量)を判定し、このビット量が所定の範囲内に収まる領域を特徴点候補とすることができる。また、量子化されたDCT係数の最高次係数まで連続する0の長さを判定し、この長さが所定の範囲内に収まる領域を特徴点候補とすることができる。また、DCT係数のAC成分絶対値和を判定し、この絶対値和が所定の範囲内に収まる領域を特徴点候補とすることもできる。これらの判定の元となる情報は、いずれも符号情報として格納されているので、簡単に取得できる。 For example, it is possible to determine a bit amount (generated code amount) that has been subjected to variable-length coding, and set a region in which this bit amount falls within a predetermined range as a feature point candidate. Further, it is possible to determine a length of 0 that continues to the highest order coefficient of the quantized DCT coefficient, and to select a region where this length falls within a predetermined range as a feature point candidate. It is also possible to determine the sum of the AC component absolute values of the DCT coefficient, and to set a region where the sum of the absolute values falls within a predetermined range as a feature point candidate. Since all the information that is the basis of these determinations is stored as code information, it can be easily obtained.
また、テクスチャ判定21に用いる閾値は、量子化パラメータなどの量子化情報や、符号化係数がフレームDCTによるものであるかフィールドDCTによるものであるかなどの符号化パラメータなどに応じて適応的に変化させてもよい。 The threshold used for the texture determination 21 is adaptive according to quantization information such as a quantization parameter, an encoding parameter such as whether the encoding coefficient is based on the frame DCT or the field DCT, and the like. It may be changed.
次に、分布判定22について説明する。分布判定22は、テクスチャ判定21で選定された特徴点候補から単純な形状を持つ候補を排除し、適度な複雑度を持った領域を特徴点として選定する。適度な複雑度を持った領域は、例えば、DCT係数の分布の偏りを基に符号領域上で選定することができる。 Next, the distribution determination 22 will be described. The distribution determination 22 excludes a candidate having a simple shape from the feature point candidates selected in the texture determination 21, and selects a region having an appropriate complexity as a feature point. A region having an appropriate complexity can be selected on the code region based on, for example, a bias in the distribution of DCT coefficients.
具体的には、DCT係数の水平方向のAC成分の絶対値和および垂直方向のAC成分の絶対値和およびその他の低域のAC成分の絶対値和がともに閾値を超えることを判定基準にして判定することができる。 Specifically, the criterion is that both the absolute value sum of the horizontal AC component and the sum of the absolute AC component values of the DCT coefficient and the absolute sum of the other low frequency AC components exceed the threshold. Can be determined.
次に、ブロック境界について判定23について説明する。テクスチャ判定21および分布判定22では、ブロックを単位とした判定であるため、複数のブロックを跨ぐ特徴点を判定できない。例えば、ブロック境界にエッジが存在する場合、ブロックのDCT係数のAC成分は大きな係数とならない。このため、DCT係数を用いる判定では、このようなエッジを判定できない。 Next, the determination 23 for the block boundary will be described. Since the texture determination 21 and the distribution determination 22 are determinations in units of blocks, it is not possible to determine feature points that straddle a plurality of blocks. For example, when an edge exists at a block boundary, the AC component of the DCT coefficient of the block is not a large coefficient. For this reason, such an edge cannot be determined in the determination using the DCT coefficient.
テクスチャ判定21および分布判定22では判定できない特徴点を判定して選択するため、ブロック境界についての判定23では、複数のブロックからブロックを跨ぐブロックを構成し、テクスチャ判定21および分布判定22とは異なる階層のブロックで階層的に特徴点を選択する。 Since the feature points that cannot be determined by the texture determination 21 and the distribution determination 22 are determined and selected, the block boundary determination 23 constitutes a block extending from a plurality of blocks to the block, and is different from the texture determination 21 and the distribution determination 22. Select feature points in a hierarchical block.
例えば、隣接する4組のDCT係数X,Y,Z,Wの各DCT係数をそれぞれxi,yi,zi,wi(ここで、iは、DCT係数を水平方向かつ垂直方向に並べたときの順番であるとする)とし、1/4の縮小画像で4個のブロックを跨ぐブロックを構成することを考えると、式(1)で4個のブロックを跨ぐ縮小されたブロックが得られる。なお、式(1)では、4個のブロックそれぞれのDC成分と3つの低域AC成分を用いてIDCT(復号処理)を近似している。 For example, the DCT coefficients of four adjacent DCT coefficients X, Y, Z, and W are respectively xi, yi, zi, and wi (where i is the order in which the DCT coefficients are arranged horizontally and vertically) And a block that straddles four blocks with a 1/4 reduced image, a reduced block that straddles four blocks is obtained by equation (1). In Equation (1), IDCT (decoding processing) is approximated using DC components and three low-frequency AC components of each of the four blocks.
次に、エッジ検出に用いられるハイパスフィルタとして2次微分のラプラシアンフィルタをベクトルの積に分離すると、式(2)が得られる。 Next, when a second-order Laplacian filter is separated into vector products as a high-pass filter used for edge detection, Equation (2) is obtained.
式(2)のベクトルを式(1)で縮小されたブロックに適用すると、ラプラシアンフィルタによるコンボリューション演算は行列積の形の式(3)で表現される。式(3)の定数をまとめると、式(4)が得られる。式(4)を用いてDCT係数から直接ラプラシアンフィルタの結果を導くことができる。 When the vector of Expression (2) is applied to the block reduced by Expression (1), the convolution operation by the Laplacian filter is expressed by Expression (3) in the form of a matrix product. Summarizing the constants of equation (3) yields equation (4). Equation (4) can be used to derive the Laplacian filter results directly from the DCT coefficients.
式(4)の計算結果である判定基準が閾値よりも大きい場合はブロック境界にエッジが存在するとして特徴点に加える。式(4)の演算は、途中の計算結果を保持することにより定数行列と任意のベクトル(a,b,c,d)t(tは転置を表す)の積の演算量を削減することができる。図3は、演算過程と途中の計算結果の保持による演算量削減を示している。 If the criterion of the calculation result of Equation (4) is larger than the threshold, it is added to the feature point as an edge exists at the block boundary. The calculation of equation (4) can reduce the amount of calculation of the product of a constant matrix and an arbitrary vector (a, b, c, d) t (t represents transposition) by holding the calculation result in the middle. it can. FIG. 3 shows the calculation amount reduction by holding the calculation process and the calculation result in the middle.
例えば左側2行列を演算して結果行列の1列目2要素を求める際には、a,b,c,dをそれぞれx0,x8,z0,z8とすればよい。結果行列の他の要素、さらに結果行列と右側行列の演算による各要素も、a,b,c,dに適宜の値を与えて同様にして求めることができる。 For example, when the left two matrices are calculated to obtain the first element and the second element of the result matrix, a, b, c, and d may be set to x 0 , x 8 , z 0 , and z 8 , respectively. Other elements of the result matrix, and further each element obtained by the calculation of the result matrix and the right matrix can be obtained in the same manner by giving appropriate values to a, b, c, and d.
なお、上記実施形態では、DCT係数のDC成分とそれに隣接する3つの低域AC成分で近似したIDCTとハイパスフィルタを統合して1/4縮小画像でブロック境界におけるエッジ検出を行っているが、他の解像度でもIDCTを近似して同様にエッジ検出を行うことができる。ブロック境界について判定23では、エッジの存在を見極めさえすればよいのでIDCTの近似は任意であり、演算の高速化が優先されるようにIDCTを近似できる。 In the above embodiment, the DCT coefficient of the DCT coefficient and the IDCT approximated by the three low-frequency AC components adjacent thereto and the high-pass filter are integrated to perform edge detection at the block boundary in the 1/4 reduced image. Edge detection can be performed similarly by approximating IDCT at other resolutions. In the determination 23 on the block boundary, since it is only necessary to determine the presence of an edge, the approximation of IDCT is arbitrary, and the IDCT can be approximated so that high-speed computation is prioritized.
追跡すべき移動物体が分かっている場合には、手動で特徴点を選択する領域を初めから指定して該領域に処理を限定することもできる。この場合、移動物体の詳細な形状を指定する必要はなく、矩形や円などの大まかな形状で領域を指定するだけで構わない。指定された領域の中から自動的に追跡に適した複数の特徴点が選択され、選択された特徴点を囲う最小の多角形が移動物体追跡の初期領域となるからである。 When the moving object to be tracked is known, it is possible to manually specify an area for selecting feature points from the beginning and limit the processing to the area. In this case, it is not necessary to specify the detailed shape of the moving object, and it is only necessary to specify the region with a rough shape such as a rectangle or a circle. This is because a plurality of feature points suitable for tracking are automatically selected from the designated region, and the smallest polygon surrounding the selected feature point is the initial region for moving object tracking.
図4は、動き推定部13の機能を具体的に示す機能ブロック図である。動き推定部13は、動き探索41と予測誤差判定42の機能を有し、探索時に得られる予測誤差を判定し、移動物体を形成する複数の特徴点を個々に追跡することで移動物体の動きを推定する。動き探索MPEGの符号情報としてMV(動きベクトル)が格納されているので、領域内MVの重み平均から移動物体の動きを推定するようにすることも考えられるが、移動物体が小さい場合、マクロブロック(MB)数の僅かな増減で動きが大きく変動する可能性があり、逆に、移動物体が大きい場合には平坦部におけるMVのように信頼性の低いベクトルの影響を受ける可能性がある。MVはMB(マクロブロック)という面単位で予測誤差を最小にするように決定されているため、特徴点の動きを正確に表現していない。そこで、本発明では特徴点を含む小領域単位で動きを推定し直すこととしている。
FIG. 4 is a functional block diagram specifically illustrating the function of the
特徴点の動きは、エッジ保存性、ノイズ耐性、計算負荷の観点から、予測誤差評価関数を最小化するベクトルを決定することで推定するのがよい。特徴点を含む小領域は画素の変化に富んでいるので、MPEGのMBに比べ大幅に小さな領域でも正確な動きを推定することが可能である。また、動き推定の単位をMPEGのMBより小領域にすることで、計算量が削減されるだけでなく、予測誤差評価関数の最小化方向と勾配方向が一致しやすくなる。 The movement of the feature point is preferably estimated by determining a vector that minimizes the prediction error evaluation function from the viewpoint of edge preservation, noise resistance, and calculation load. Since the small region including the feature point is rich in change of pixels, it is possible to estimate an accurate motion even in a region that is much smaller than the MPEG MB. Also, by making the unit of motion estimation smaller than the MB of MPEG, not only the amount of calculation is reduced, but also the minimization direction and the gradient direction of the prediction error evaluation function are easily matched.
特徴点の座標を〈x〉=(x,y)で表し,座標〈x〉かつ時刻tの画素値をI(〈x〉,t)で表すと、特徴点の動きベクトル〈v〉=(vx,vy) の予測誤差評価関数e(〈v〉)は、式(5)で定義される。 If the coordinates of the feature point are represented by <x> = (x, y), the coordinates <x> and the pixel value at time t is represented by I (<x>, t), the motion vector <v> = ( The prediction error evaluation function e (<v>) of v x , v y ) is defined by equation (5).
ここで、Wは特徴点を含む小領域を示し、w(〈x〉) は重み係数を示す。重み係数w(〈x〉) を常に1にすれば式(5)を簡略化できるが、DCT係数AC成分の絶対値和やDCT係数の非0の個数など、重み係数を任意に設定することも可能である。 Here, W represents a small region including feature points, and w (<x>) represents a weighting coefficient. Equation (5) can be simplified if the weighting factor w (<x>) is always set to 1, but the weighting factor can be set arbitrarily, such as the sum of the absolute values of the DCT coefficients AC component and the number of nonzero DCT coefficients. Is also possible.
予測誤差評価関数e(〈v〉)の値を最小化する最適な動きベクトル〈va〉は、ある初期ベクトル〈v0〉を使って式(6)〜(9)を反復繰り返すことによって求めることができる。ただし、IxおよびIyは、I(〈x〉,t)のそれぞれx方向、y方向の微分であり、式(10)、式(11)で表される。また、ΔIkは、I(〈x〉,t)の動き予測誤差であり、式(12)で表される。 An optimal motion vector <v a > that minimizes the value of the prediction error evaluation function e (<v>) is obtained by iteratively repeating equations (6) to (9) using a certain initial vector <v 0 >. be able to. Here, I x and I y are the differentials of I (<x>, t) in the x direction and y direction, respectively, and are expressed by equations (10) and (11). ΔI k is a motion prediction error of I (<x>, t) and is expressed by Expression (12).
反復繰り返しの終了条件は、Δ〈vk〉のノルムが予め定めた閾値より小さくなったとき、あるいは反復繰り返しの回数が予め定められた回数に達したときとすることができる。また、初期ベクトル〈v0〉としてMPEGのMVを用いれば、収束するまでの反復繰り返しの回数を抑えることができる。 The end condition of the repeated iteration can be when the norm of Δ <v k > becomes smaller than a predetermined threshold or when the number of repeated iterations reaches a predetermined number. Further, if MPEG MV is used as the initial vector <v 0 >, the number of repeated iterations until convergence can be suppressed.
平坦な画像領域などでは動きベクトルはノイズに影響されるので、本来の動きを捉えることは困難であるが、平坦な画像領域などは特徴点選択部12において特徴点から排除されている。しかし、特徴点選択部12により選択された特徴点でも真の動きを捉えにくい場合があるので、動き推定部13で該当する画像領域を排除するのが好ましい。例えば、大きなDCT係数が存在する周期的なエッジ領域は、特徴点選択部12で排除しきれないが、この領域は誤った動きベクトルを誘発しやすい。この誤った動きベクトルが誘発されるのを防ぐため、特徴点選択部12で選択された特徴点(エッジ領域)をすべて特徴点とするのではなく、動き探索の過程で得られる誤差評価関数の値を基にエッジ領域を分別し、特徴点としての信頼性を高める。
Since a motion vector is affected by noise in a flat image region or the like, it is difficult to capture the original motion, but the flat image region or the like is excluded from the feature points in the feature
動きベクトルは、上述したように、画素値の差の2乗和や絶対値和などで定義される予測誤差評価関数の値が最小になるよう決定されるが、周期的なエッジ領域の場合には予測誤差評価関数の値が極小となる場所が一定間隔で複数存在する。また、例えば、単純なエッジ領域では、予測誤差評価関数は、エッジに沿った方向で同程度の値を取る。 As described above, the motion vector is determined so as to minimize the value of the prediction error evaluation function defined by the sum of squares of pixel value differences or the sum of absolute values. There are a plurality of locations where the value of the prediction error evaluation function is minimized at regular intervals. Further, for example, in a simple edge region, the prediction error evaluation function takes the same value in the direction along the edge.
このような誤った動きベクトルが誘発されやすい周期的なエッジ領域や単純なエッジ領域を排除するために、画素領域で動きベクトル情報を用いて特徴点を分別する。この分別は、予測誤差の分布をみることで達成できる。例えば動きベクトルが指す場所の予測誤差評価関数の値とその周囲の予測誤差評価関数の値を比較判断すればよい。 In order to eliminate periodic edge regions and simple edge regions in which such erroneous motion vectors are likely to be induced, feature points are classified using motion vector information in the pixel regions. This classification can be achieved by looking at the distribution of prediction errors. For example, the value of the prediction error evaluation function at the location indicated by the motion vector may be compared with the value of the surrounding prediction error evaluation function.
比較判断の結果、動きベクトルが指す場所だけが十分小であれば特徴点として相応しい複雑性を持つ特徴点として分別でき、複数の場所で同程度の値であれば特徴点として相応しくない特徴点として分別できる。比較判断には、例えば、動きベクトルが指す場所とその隣接8つの近傍を利用することができる。あるいは数画素離れた近傍地点を利用することもできる。 As a result of comparison, if only the location pointed to by the motion vector is sufficiently small, it can be classified as a feature point having a suitable complexity as a feature point, and if it is the same value at multiple locations, it is not suitable as a feature point Can be separated. For the comparison determination, for example, a location indicated by a motion vector and eight neighboring points can be used. Alternatively, a nearby point several pixels away can be used.
整合部14は、動き推定部13により推定された特徴点の動きに基づいて移動物体を追跡する。整合部14で監視カメラを制御するようにすれば、移動物体を検出・追跡可能な監視システムを構築することができる。具体的には、特徴点の動きベクトル〈v〉を用いてフレーム毎の特徴点を対応付け、特徴点を囲う領域を形成することによって移動物体とし、その軌跡を追跡する。フレーム間の特徴点の対応付けは、複数の特徴点の相対的位置関係、過去の特徴点の位置と動きベクトル〈v〉による予測位置の空間的距離を用いて行うことができる。
The matching unit 14 tracks the moving object based on the motion of the feature points estimated by the
また、さらに特徴点ごとの色情報などを考慮して対応付けを行うことにより、一部特徴点が誤って選択された場合に該特徴点を誤って対応付けてしまうことを、より低減できる。 Further, by performing association in consideration of color information for each feature point, it is possible to further reduce the possibility that the feature points are erroneously associated when some feature points are selected by mistake.
表示部15は、整合部14により追跡された移動物体の軌跡を、復号された動画像に重畳して表示する。この表示を見れば、移動物体がどのように動いたかを簡単に把握できる。
The
10・・・入力部、11・・・復号部、12・・・特徴点選択部、13・・・動き推定部、14・・・整合部、15・・・表示部、21・・・テクスチャ判定、22・・・分布判定、23・・・境界判定、41・・・動き探索、42・・・予測誤差判定
DESCRIPTION OF
Claims (23)
伝送または蓄積された符号化動画像を入力する入力部と、
入力された符号化動画像から符号情報の抽出および復号を行う復号部と、
移動物体を形成し、かつ画素の変化に富んでいる領域の複数の特徴点を前記符号情報を用いて選択する特徴点選択部と、
前記特徴点の位置情報および復号された動画像を用いて符号化動画像での動き探索の領域単位より小さい、特徴点を含む小領域単位で動きを推定して移動物体の動きを推定する動き推定部と、
前記動き推定部により推定された移動物体の動きに基づいて移動物体を追跡する整合部を備えたことを特徴とする動画像処理装置。 In a moving image processing apparatus for tracking a moving object in a moving image using code information of the encoded moving image,
An input unit for inputting transmitted or accumulated encoded moving images; and
A decoding unit that extracts and decodes code information from the input encoded moving image;
A feature point selection section for selecting moving objects is formed, and a plurality of feature points of a region rich in change of the pixel by using the code information,
A motion that estimates a motion of a moving object by estimating a motion in a small area unit including a feature point, which is smaller than a motion search area unit in an encoded video using the position information of the feature point and the decoded video. An estimation unit;
A moving image processing apparatus comprising: a matching unit that tracks a moving object based on the movement of the moving object estimated by the motion estimation unit.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2005175047A JP4688147B2 (en) | 2005-06-15 | 2005-06-15 | Moving image processing device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2005175047A JP4688147B2 (en) | 2005-06-15 | 2005-06-15 | Moving image processing device |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2006350618A JP2006350618A (en) | 2006-12-28 |
| JP4688147B2 true JP4688147B2 (en) | 2011-05-25 |
Family
ID=37646398
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2005175047A Expired - Fee Related JP4688147B2 (en) | 2005-06-15 | 2005-06-15 | Moving image processing device |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4688147B2 (en) |
Families Citing this family (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2009102013A1 (en) * | 2008-02-14 | 2009-08-20 | Nec Corporation | Motion vector detection device |
| CN101957655B (en) * | 2009-07-17 | 2013-06-05 | 深圳泰山在线科技有限公司 | Marked point-based motion recognition method and terminal equipment |
| KR101700276B1 (en) * | 2011-11-24 | 2017-01-31 | 에스케이플래닛 주식회사 | Apparatus and Method for setting feature point, tracking object apparatus and method usig that |
| JP2013109773A (en) * | 2013-01-07 | 2013-06-06 | Olympus Corp | Feature matching method and article recognition system |
| WO2024070190A1 (en) * | 2022-09-27 | 2024-04-04 | パナソニックIpマネジメント株式会社 | Transmitter/receiver system, receiver, transmitter, transmitting/receiving method, method for controlling receiver, method for controlling transmitter, and program |
Family Cites Families (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH08186842A (en) * | 1994-12-28 | 1996-07-16 | Fuji Photo Film Co Ltd | Noise reducing device for image data and method therefor |
| JPH08205171A (en) * | 1995-01-23 | 1996-08-09 | Matsushita Electric Ind Co Ltd | Video coding device |
| JPH09307883A (en) * | 1996-05-10 | 1997-11-28 | Nippon Telegr & Teleph Corp <Ntt> | Object tracking method and apparatus and image display apparatus using the same |
| JPH10126766A (en) * | 1996-10-18 | 1998-05-15 | Fujitsu General Ltd | Surveillance camera device |
| JPH11331851A (en) * | 1998-05-13 | 1999-11-30 | Matsushita Electric Ind Co Ltd | Low bit rate video encoder |
| JP2001204029A (en) * | 1999-08-25 | 2001-07-27 | Matsushita Electric Ind Co Ltd | Noise detection method, noise detection device, and image decoding device |
| JP3948596B2 (en) * | 2000-03-06 | 2007-07-25 | Kddi株式会社 | Moving object detection and tracking device in moving images |
| JP2002051342A (en) * | 2000-08-04 | 2002-02-15 | Canon Inc | Coding apparatus, method of coding and storage medium |
| JP3926572B2 (en) * | 2001-03-02 | 2007-06-06 | 株式会社日立製作所 | Image monitoring method, image monitoring apparatus, and storage medium |
| JP3753232B2 (en) * | 2001-03-30 | 2006-03-08 | オムロン株式会社 | Motor motion analysis support device |
| JP3836814B2 (en) * | 2003-05-20 | 2006-10-25 | 株式会社東芝 | Image processing method, image processing apparatus, and image processing program |
-
2005
- 2005-06-15 JP JP2005175047A patent/JP4688147B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2006350618A (en) | 2006-12-28 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US11546627B2 (en) | Moving picture decoding method and moving picture encoding method | |
| US8229174B2 (en) | Technique for estimating motion and occlusion | |
| JP5281891B2 (en) | Adaptive motion search range | |
| KR100901904B1 (en) | Video content understanding through real time video motion analysis | |
| US8625671B2 (en) | Look-ahead system and method for pan and zoom detection in video sequences | |
| EP1639829B1 (en) | Optical flow estimation method | |
| KR20040028911A (en) | Method and apparatus for motion estimation between video frames | |
| JP2015536092A5 (en) | ||
| US9143790B2 (en) | Encoding and decoding a video image sequence by image areas | |
| US20180091818A1 (en) | Methods of and apparatus for encoding data arrays | |
| Fei et al. | Mean shift clustering-based moving object segmentation in the H. 264 compressed domain | |
| KR20060055296A (en) | How to estimate noise displacement from video sequence | |
| JP4688147B2 (en) | Moving image processing device | |
| CN112837238A (en) | Image processing method and device | |
| US12132923B2 (en) | Motion estimation using pixel activity metrics | |
| JP4197695B2 (en) | Video encoding method, apparatus, and program | |
| JP4763241B2 (en) | Motion prediction information detection device | |
| JP7229982B2 (en) | Method and system for encoding images of a video sequence | |
| KR101670987B1 (en) | Method for endcoding image data and method for and decoding image data based on scale and angle variation information and apparatus for encoding image data and apparatus for decoding image data based on scale and angle variation information | |
| JP2002051342A (en) | Coding apparatus, method of coding and storage medium | |
| JP4824712B2 (en) | Motion estimation accuracy estimation method, motion estimation accuracy estimation device, motion estimation accuracy estimation program, and computer-readable recording medium recording the program | |
| CN120186340A (en) | A search starting point prediction method for sparse optical flow tracking in H265 format | |
| Vinolee et al. | Motion interpolation using interframe coding for block motion picture | |
| JP2005328115A (en) | Motion vector detection apparatus and motion vector detection program |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080304 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101116 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101124 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110121 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110209 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110210 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140225 Year of fee payment: 3 |
|
| LAPS | Cancellation because of no payment of annual fees |