JP4448115B2 - Encoded video playback device - Google Patents
Encoded video playback device Download PDFInfo
- Publication number
- JP4448115B2 JP4448115B2 JP2006238986A JP2006238986A JP4448115B2 JP 4448115 B2 JP4448115 B2 JP 4448115B2 JP 2006238986 A JP2006238986 A JP 2006238986A JP 2006238986 A JP2006238986 A JP 2006238986A JP 4448115 B2 JP4448115 B2 JP 4448115B2
- Authority
- JP
- Japan
- Prior art keywords
- image data
- encoded
- moving image
- data
- motion compensation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
この発明は符号化動画像再生装置に関し、特に、MPEG2等により符号化された動画像を再生する際に、フレームメモリサイズを削減することが可能な符号化動画像再生装置に関する。 The present invention relates to an encoded moving image reproducing apparatus, and more particularly to an encoded moving image reproducing apparatus capable of reducing a frame memory size when reproducing a moving image encoded by MPEG2 or the like.
これまで、符号化動画像データの復号処理で、フレームメモリサイズを削減する方法としては、岩橋らの「低域ドリフトのないスケーラブル・デコーダ」(信学技報 DSP94-108)に示されているようなスケーラブルデコーダ(図2)がある。本来、スケーラブルデコーダは符号化データの一部を用いて復号する装置であるが、図の場合、次数の削減された逆DCT(IDCT:Inverse Discrete Cosine Transform) を用いることによってフレームメモリサイズを削減することができる。 So far, a method for reducing the frame memory size in the decoding process of encoded video data has been shown in Iwahashi et al.'S "Scalable decoder without low-frequency drift" (Science Technical Report DSP94-108). There is such a scalable decoder (FIG. 2). Originally, a scalable decoder is a device that decodes using a part of encoded data, but in the case of the figure, the frame memory size is reduced by using an inverse DCT (Inverse Discrete Cosine Transform) with reduced order. be able to.
MPEG2 などで符号化された動画像データは可変長復号器1で可変長復号され、そこで得られた量子化DCT 係数は逆量子化器2で逆量子化され、8 x 8 DCT 係数が得られる。8 x 8DCT係数の内4 x 4 係数のみを用いて、4 x 4 IDCTで2次元の逆DCT 処理を行うと、もとの画像の縦横共に1/2の4 x 4 画素データが得られる。復号するブロックが動き補償ブロックの場合は、動き補償部8からの動き補償ブロックを加算して画像復元を行う。復元された画像はもとの画像に比べ縦横共に1/2に縮小されているため、拡大器11で画面を拡大処理して、後段の図示しない表示用メモリに順次蓄積され、表示される。
Video data encoded by MPEG2 or the like is variable-length decoded by the variable-
更に、復元された画像データは、フレームメモリ6に蓄積される。この場合も、復元された画像が縦横ともに1/2であるため、必要となるフレームメモリサイズも元の1/4のサイズになる。また、動き補償も縮小された空間で行うため、動きベクトル変換器12で動きベクトルを縦横1/2に変換してフレームメモリ6から該当するブロックを抽出する。また、2次元IDCTを横方向のみ4x4 IDCTを用い、縦方向は8x8IDCT を用いた場合、画像サイズおよびフレームメモリサイズは元の1/2になる。
前記したような従来の方式では、IDCTのサイズを変更することによって、フレームメモリサイズを削減することが可能になるが、符号化側と復号側での予測画像の不一致によりドリフト雑音が生じ、画質劣化の原因になるという問題点があった。また、復元された画像の解像度も元の1/2、1/4になるため、復号画像の品質が劣化するという問題点もあった。 In the conventional method as described above, it is possible to reduce the frame memory size by changing the IDCT size, but drift noise occurs due to the mismatch of the predicted image on the encoding side and the decoding side, and the image quality There was a problem of causing deterioration. In addition, since the resolution of the restored image is also 1/2 or 1/4 of the original, there is a problem that the quality of the decoded image is deteriorated.
この発明は、前記問題点を解決し、符号化動画像データを復元する際に、ドリフト雑音を抑制し、かつ復号する解像度をなるべく低減させずに、フレームメモリサイズのみを削減することが可能な符号化動画像再生装置を提供することを目的とする。 The present invention solves the above-mentioned problems, suppresses drift noise when restoring encoded moving image data, and can reduce only the frame memory size without reducing the resolution to be decoded as much as possible. It is an object of the present invention to provide an encoded moving image reproduction apparatus.
この発明は、N×N画素(Nは正の整数)のブロックサイズで周波数変換符号化された符号化動画像データを入力する手段と、該入力されたN×N個の周波数変換係数のうち、低周波成分のK×M部分(K,MはNより小さい正の整数)のみを水平方向にK×KのDCT基底で逆変換処理、垂直方向にM×MのDCT基底で逆変換処理をして、K×M個の画素ブロックデータを得るようにした、前記符号化動画像データを復号する手段と、前記復号された動画像データを予測符号化により再圧縮する圧縮手段と、前記圧縮手段から出力されたデータを蓄積する蓄積手段と、前記蓄積手段から出力されたデータを伸張する伸張手段と、前記伸張手段から出力された動画像データに対して動き補償予測を行う動き補償予測手段とを具備し、前記動き補償予測は、水平垂直方向それぞれ、K/N、M/Nにスケーリングされた動きベクトルを用いるようにした点に特徴がある。 According to the present invention, there is provided means for inputting encoded moving image data frequency-transform encoded with a block size of N × N pixels (N is a positive integer), and among the inputted N × N frequency conversion coefficients. , K × M of the low-frequency component (K, M is a positive integer smaller than N) only the inverse transform processing in the DCT basis of K × K in the horizontal direction, the inverse transform processing in the DCT basis of M × M in the vertical direction A means for decoding the encoded moving image data, and a compression means for recompressing the decoded moving image data by predictive encoding, so as to obtain K × M pixel block data ; Accumulating means for accumulating data outputted from the compressing means, decompressing means for decompressing data outputted from the accumulating means, and motion compensated prediction for performing motion compensation prediction on moving image data outputted from the decompressing means Means for compensating for movement. Prediction is characterized respectively horizontal and vertical direction, K / N, in that to use a scaled motion vector to M / N.
この発明によれば、フレームメモリに入力される画素データを劣化させることなく、あるいはわずかな劣化で圧縮し、また、削減したブロックサイズのIDCTと組み合わせることによってフレームメモリサイズを削減するため、従来のフレームメモリ削減方式と比べてドリフト雑音や解像度劣化を抑制することができるという効果がある。 According to the present invention, the pixel data input to the frame memory is compressed without being degraded or slightly degraded, and the frame memory size is reduced by combining with the reduced block size IDCT. Compared with the frame memory reduction method, there is an effect that drift noise and resolution degradation can be suppressed.
1例として、ISO で用いているテスト用動画像(Flower Garden )シーケンスをMPEG2 方式で2Mbit/s から6Mbit/s で圧縮したデータを用いて、フレームメモリサイズを水平方向に半減する条件で復号特性を評価した所、第2実施例の場合、従来の方式に比較して、1.5dB から4.5dB のゲインを得ることができた。また、主観的にも解像度の劣化やドリフト雑音が大きく改善されていることが確認された。 As an example, using video data that is compressed from 2Mbit / s to 6Mbit / s in MPEG2 format for test video sequence (Flower Garden) used in ISO, decoding characteristics under the condition of halving the frame memory size in the horizontal direction In the case of the second embodiment, a gain of 1.5 dB to 4.5 dB could be obtained as compared with the conventional method. In addition, it was confirmed subjectively that resolution degradation and drift noise were greatly improved.
以下に、図面を参照して本発明を詳細に説明する。図1は、本発明の符号化動画像再生装置の第1の実施例の構成を示すブロック図である。 MPEG2などで符号化された動画像データは可変長復号器1で可変長復号され、そこで得られた量子化DCT 係数は逆量子化器2で逆量子化され、N×NDCT 係数が得られる。なお、MPEG方式の場合N=8である。そして、逆DCT変換器3で逆DCT処理によりN×Nの差分画素データが得られる。加算器4は、差分画素データとフレームメモリ6から読み出された画像データとを加算し、再生画像データを出力する。復号するブロックが動き補償ブロックの場合は、動き補償部8において、動き補償に必要なブロックをフレームメモリ6から読み出して画像復元を行う。なお、出力データは後段の図示しない表示用メモリに順次蓄積され、表示される。
Hereinafter, the present invention will be described in detail with reference to the drawings. FIG. 1 is a block diagram showing the configuration of a first embodiment of the encoded moving image reproduction apparatus of the present invention. The moving image data encoded by MPEG2 or the like is variable-length decoded by the variable-
復元された画像データは、更に圧縮器5で画素データが再度圧縮され、フレームメモリ6に蓄積される。圧縮された画素データは動き補償で必要となるブロックを抽出する際に、伸長器7で動き補償ブロック内の画素がすべて復号され、動き補償部8で動き補償処理される。以上のように、本発明はフレームメモリに入力される画素データを圧縮することにより、フレームメモリサイズを削減した点に特徴がある。
The restored image data is further compressed again by the
図3は、圧縮器5の構成を示すブロック図である。圧縮器5では、入力画素データは減算器20に入力され、予測器24から出力される予測値が減算されて、予測誤差Δが求められ、量子化器21で量子化処理される。また、量子化されたデータは逆量子化器25、加算器23および予測器24からなる局所復号器によって復号される。入力された画素データをX、予測された画素データをPXとすると、
Δ=X−PX
となる。
FIG. 3 is a block diagram showing the configuration of the
Δ = X-PX
It becomes.
PXはいくつかの方法で求めることができる。図5は、予測値PXの各種予測方法を示す説明図である。図5において横軸は画素の水平方向を示す。ここでは水平方向の予測を例にとって説明する。また、斜線を付した画素は予測を用いずに画素値そのものを符号化する画素であり、白丸の画素は予測して圧縮符号化する画素を示す。動き補償を行うためには、フレームメモリの任意の位置からブロックを読み出すランダムアクセスが必要であるが、所定の周期ごとに画素値そのものを記憶することによって、差分符号化を採用してもランダムアクセスが可能となる。 PX can be determined in several ways. FIG. 5 is an explanatory diagram showing various prediction methods for the predicted value PX. In FIG. 5, the horizontal axis indicates the horizontal direction of the pixel. Here, description will be made by taking prediction in the horizontal direction as an example. Also, the hatched pixels are pixels that encode the pixel values themselves without using prediction, and the white circle pixels indicate pixels that are predicted and compressed and encoded. In order to perform motion compensation, random access to read a block from an arbitrary position in the frame memory is necessary, but even if differential encoding is adopted by storing the pixel value itself at a predetermined cycle, random access is performed. Is possible.
図5(a)は、左隣の画素を用いて予測する方式である。例えばX1に関する予測画素をPX1とすると、
PX1=X0、 Δ1=X1−X0
としてΔ1を符号化する。X2については、符号化され、局所復元されたX1(RX1とする)を用いて予測する。従って、X2については予測画素をPX2とすると、
PX2=RX1、 Δ2=X2−RX1
として、Δ2を符号化する。ただし、PN画素毎の画素は予測を用いず符号化する。PNは2以上の整数で、無限大の場合は最初の画素のみを予測を用いずに符号化する。
FIG. 5A shows a prediction method using a pixel on the left side. For example, if the predicted pixel for X1 is PX1,
PX1 = X0, Δ1 = X1-X0
.DELTA.1 is encoded as follows. X2 is predicted by using encoded and locally restored X1 (referred to as RX1). Therefore, for X2, if the predicted pixel is PX2,
PX2 = RX1, Δ2 = X2-RX1
.DELTA.2 is encoded as follows. However, the pixels for each PN pixel are encoded without using prediction. PN is an integer greater than or equal to 2, and when it is infinite, only the first pixel is encoded without using prediction.
図5(b)は予測符号化を用いずに符号化する画素のみを用いて予測符号化を行う例で、図でX1、X2、X3はすべてX0から予測する。例えばX3については予測画素をPX3とすると、
PX3=X0、 Δ3=X3−X0
として、Δ3を符号化する。ただし、PN画素毎の画素は予測を用いずに符号化する。
FIG. 5B shows an example in which predictive encoding is performed using only pixels to be encoded without using predictive encoding. In FIG. 5, X1, X2, and X3 are all predicted from X0. For example, for X3, if the predicted pixel is PX3,
PX3 = X0, Δ3 = X3-X0
.DELTA.3 is encoded as follows. However, the pixels for each PN pixel are encoded without using prediction.
図5(c)は、予測する画素に複数の復号された画素を用いて予測する方法の1例を示したものである。図で、例えばX1は水平方向に隣接するX0とX4を用いて予測する。この場合、予測画素PX1は、
PX1=αX0+βX4
となる。αとβは重み係数で、α=β=1/2として単純平均として用いたいり、画素間距離に応じて加重平均を取り、α=3/4、β=1/4とすることが可能である。
FIG. 5C shows an example of a prediction method using a plurality of decoded pixels as prediction pixels. In the figure, for example, X1 is predicted using X0 and X4 adjacent in the horizontal direction. In this case, the predicted pixel PX1 is
PX1 = αX0 + βX4
It becomes. α and β are weighting factors, and α = β = 1/2 can be used as a simple average, or a weighted average can be taken according to the distance between pixels, and α = 3/4 and β = 1/4 can be set. It is.
上記予測方法は水平方向のみならず、垂直方向でも同様に処理することが可能である。また、予測も垂直方向のみならず、対角線方向の予測も可能である。図6は、図5(c)の予測を2次元空間に拡張した例を示す説明図である。ここで、X00、X02、X20、X22は予測せずに符号化する画素である。予測方法については、X01は同一水平上の画素X00、X02を用いて予測する。また、X10は垂直方向に位置するX00とX20を用い、X11は対角線方向に位置するX00とX22を用いて予測することができる。 The prediction method can be processed not only in the horizontal direction but also in the vertical direction. Further, prediction is possible not only in the vertical direction but also in the diagonal direction. FIG. 6 is an explanatory diagram showing an example in which the prediction of FIG. 5C is extended to a two-dimensional space. Here, X00, X02, X20, and X22 are pixels to be encoded without prediction. As for the prediction method, X01 is predicted using pixels X00 and X02 on the same horizontal. X10 can be predicted using X00 and X20 positioned in the vertical direction, and X11 can be predicted using X00 and X22 positioned in the diagonal direction.
図7は、量子化器21の特性例を示すグラフである。図7においては横軸が入力値で縦軸が出力値である。また、Qは量子化ステップサイズである。図7の点線で示す特性(a)は線形量子化器の特性を示している。例えば、入力値をX、出力値となる量子化代表値をYとすると、(Q/2)≦X<(3Q/2)では Y=Qとなる。また、実線で示す特性(b)はMPEG等で用いられているデッドゾーン付きの線形量子化器で、入力値が±Qの間は0が出力される。量子化器21はこれらを含む線形量子化器の他に非線形量子化器を用いることも可能である。また、画素によって量子化方法を変更することも可能である。例えば、図4で示した予測を用いずに符号化する画素については、全く量子化の処理を行わず、直接入力値を出力することも可能である。 FIG. 7 is a graph illustrating an example of characteristics of the quantizer 21. In FIG. 7, the horizontal axis represents the input value and the vertical axis represents the output value. Q is the quantization step size. A characteristic (a) indicated by a dotted line in FIG. 7 indicates a characteristic of the linear quantizer. For example, assuming that the input value is X and the quantized representative value that is the output value is Y, Y = Q when (Q / 2) ≦ X <(3Q / 2). The characteristic (b) indicated by the solid line is a linear quantizer with a dead zone used in MPEG or the like, and 0 is output while the input value is ± Q. The quantizer 21 can use a nonlinear quantizer in addition to the linear quantizer including them. It is also possible to change the quantization method depending on the pixel. For example, for pixels to be encoded without using the prediction shown in FIG. 4, it is also possible to output the input value directly without performing any quantization processing.
符号器22については、固定長符号化器やMPEGで用いられているような可変長符号化器を利用することが可能である。固定長符号化器の場合、例えば64個の量子化代表値が得られる場合、各データは6ビットで表現することができる。また、2の補数表現を用いて符号化情報量を削減することも可能である。例えば、画素データは8ビットで表され、予測誤差Δが−255〜+255で量子化ステップQが4の場合、図7(a)の量子化器を用いると−252、−248…0…248、252の127種類の量子化代表値が得られる。そして、127個のデータを表現するためには7ビット必要となる。 As the encoder 22, a fixed length encoder or a variable length encoder such as that used in MPEG can be used. In the case of a fixed-length encoder, for example, when 64 quantized representative values are obtained, each data can be represented by 6 bits. It is also possible to reduce the amount of encoded information using 2's complement representation. For example, when the pixel data is represented by 8 bits, the prediction error Δ is −255 to +255, and the quantization step Q is 4, −252, −248... 0 to 248 using the quantizer of FIG. , 252 of 127 kinds of quantized representative values are obtained. 7 bits are required to represent 127 data.
しかし、ある画素Xに対して予測誤差Δは必ず256個ダイナミックレンジに収まることを利用すると量子化代表値は64個のデータで表現でき、6ビットで表現することができる。例えばP=0の場合、Xの範囲は0から255の範囲なので、Δ=X−Pの範囲は0から255となる。また、P=255の場合、Δの場合は−255から0までの範囲となる。このようにΔは常に256個のダイナミックレンジに収まるため、量子化ステップQが4の場合、量子化代表値も64個のデータで表現できる。 However, if the prediction error Δ always falls within the 256 dynamic range for a certain pixel X, the quantized representative value can be expressed by 64 data and can be expressed by 6 bits. For example, when P = 0, the range of X is from 0 to 255, so the range of Δ = X−P is from 0 to 255. In the case of P = 255, in the case of Δ, the range is from −255 to 0. As described above, Δ always falls within 256 dynamic ranges. Therefore, when the quantization step Q is 4, the quantization representative value can also be expressed by 64 data.
図4は、伸長器7の構成を示すブロック図である。フレームメモリに蓄積された圧縮画素データは、まず復号器30では、図3の符号器22の逆の処理が行われ、固定長符号や可変長符号などの符号から量子化データが得られる。量子化データは逆量子化器31において逆量子化処理が行われ、予測誤差Δが復元される。例えば図7(a)の量子化特性を用いた場合、量子化代表値は0、Q、2Q、…となり、量子化ステップQが4、量子化データが0、1、…63の場合、Δは0、4、8、12、…252となる。
FIG. 4 is a block diagram showing the configuration of the
さらに、予測誤差Δは加算器32で予測値Pと加算されて画素Xが復号される。即ち、X=P+Δとなる。なお、予測器33については、図3の予測器24と全く同一の装置を用いることが可能である。また、逆量子化処理については図7の線形量子化処理や非線形量子化処理の逆処理を用いることができる。 Further, the prediction error Δ is added to the predicted value P by the adder 32, and the pixel X is decoded. That is, X = P + Δ. For the predictor 33, the same device as the predictor 24 of FIG. 3 can be used. As the inverse quantization process, the inverse process of the linear quantization process or the nonlinear quantization process of FIG. 7 can be used.
次に第2実施例について説明する。図8は、本発明の復号装置の第2実施例の構成を示すブロック図である。 MPEG2などで符号化された動画像データは可変長復号器1で可変長復号され、そこで得られた量子化DCT 係数は逆量子化器2で逆量子化され、N×N DCT係数が得られる。K×M逆DCT変換器40では、N×NDCT 係数の内、低周波成分のK×M部分(K,M ≦N)のみを水平方向にK×Kの逆DCT処理、垂直方向にM×Mの逆DCT処理を行って、K×Mの画素データを得る。復号するブロックが動き補償ブロックの場合は動き補償部8からの動き補償ブロックを加算器4で加算して画像復元する。
Next, a second embodiment will be described. FIG. 8 is a block diagram showing the configuration of the second embodiment of the decoding apparatus of the present invention. Moving picture data encoded by MPEG2 or the like is variable-length decoded by the variable-
更に、復元された画像データは、圧縮器5で画素データが再度圧縮され、フレームメモリ6に蓄積される。圧縮された画素データは動き補償で必要となるブロックを抽出する際に、伸長器7で動き補償ブロック内の画素がすべて復号され、動き補償部8で動き補償処理される。ただし、動きベクトルについては、動きベクトル変換器12によって、可変長復号器1から得られる動きベクトルMVを水平、垂直それぞれK/N、M/Nにスケーリングした動きベクトルMV’を用いて動き補償を行う。また、復元された画像は拡大器41で必要な画像サイズに変換する。例えば、符号化画像サイズと同一にするためには、垂直、水平それぞれN/K、N/M倍に拡大スケーリングする。
Further, the restored image data is compressed again in the
以上のように、本発明は削減したサイズのIDCT40とフレームメモリに入力される画素データの圧縮の双方を用いることにより、フレームメモリサイズを削減した点に特徴がある。
As described above, the present invention is characterized in that the frame memory size is reduced by using both the reduced
ここでK×MIDCTについて図10(a)を用いて説明する。図10(a)はN×NDCT 係数を示したものである。K×MIDCTはこのN×N DCT係数の内、低周波成分から水平方向にK個、垂直方向にMラインの領域のK×M個のDCT 係数を用いてIDCT処理を行う。このIDCT処理は水平方向にK×KIDCT、垂直方向にM×M IDCT を用いて処理し、K×Mの画素ブロックデータが得られる。 Here, K × MIDCT will be described with reference to FIG. FIG. 10A shows N × NDCT coefficients. K × MIDCT performs IDCT processing using K × M DCT coefficients in the region of M lines in the vertical direction and K × M DCT coefficients in the horizontal direction from the low frequency component among the N × N DCT coefficients. This IDCT processing is performed using K × KIDCT in the horizontal direction and M × M IDCT in the vertical direction to obtain K × M pixel block data.
動きベクトル変換器12では、動きベクトルMVを水平、垂直それぞれK/N 、M/N 倍してMV’として出力する。従って、水平、垂直方向のMV、MV’をそれぞれMVx 、MVx ’、MVy 、MVy ’とすると、
MVx ’= MVx × K / N
MVy ’= MVy × M / N
となる。ただし、演算精度は整数精度の他、少数点精度で求めることができ、動き補償もMPEGで用いられているような小数点精度の動き補償を適用することができる。
The motion vector converter 12 multiplies the motion vector MV horizontally and vertically by K / N and M / N, respectively, and outputs it as MV ′. Therefore, if the horizontal and vertical MV and MV ′ are MVx, MVx ′, MVy and MVy ′, respectively,
MVx '= MVx × K / N
MVy '= MVy × M / N
It becomes. However, the calculation accuracy can be obtained with integer accuracy as well as decimal point accuracy, and motion compensation with decimal point accuracy as used in MPEG can be applied for motion compensation.
拡大器41は、復元された画像を必要な画像サイズに変換する。例えば、符号化画像サイズと同一にするためには、垂直、水平それぞれN/K、N/M倍に拡大スケーリングする。この処理は線形内挿により実現することができる。例えば3画素を4画素に変換する場合には、元の連続する画素値をR0, R1, R2、求める画素値をQ0,Q1,Q2,Q3 とすると、Q0,Q1,Q2,Q3 はR0,R1,R2の画素位置の距離比により以下のようにして求めることができる。
Q0 = R0 , Q1 = 1/3 R0 + 2/3 R1
Q2 = 2/3 R1 + 1/3 R2 , Q3 = R2
The enlarger 41 converts the restored image into a necessary image size. For example, in order to make it the same as the encoded image size, the scale is enlarged and scaled to N / K and N / M times respectively in the vertical and horizontal directions. This process can be realized by linear interpolation. For example, when converting 3 pixels to 4 pixels, if the original continuous pixel values are R0, R1, R2 and the pixel values to be calculated are Q0, Q1, Q2, Q3, Q0, Q1, Q2, Q3 are R0, It can be obtained as follows according to the distance ratio of the pixel positions of R1 and R2.
Q0 = R0, Q1 = 1/3 R0 + 2/3 R1
Q2 = 2/3 R1 + 1/3 R2, Q3 = R2
図9は本発明の再生装置の第3実施例の構成を示すブロック図である。MPEG2 などで符号化された動画像データは可変長復号器1で可変長復号され、そこで得られた量子化DCT 係数は逆量子化器2で逆量子化され、N×N DCT係数が得られる。ゼロパッドIDCT(0 Pad IDCT)50では、逆量子化器2から出力されたN×N DCT係数の内、低周波成分のK×M部分以外は0で埋めて、N×Nの逆DCT処理を行い、N×Nの画素データを得る。図10(b)は、ゼロパッドIDCTの説明図である。ゼロパッドIDCT50では、N×N DCT係数の内、低周波側からK×M個の係数以外の係数を0とし、N×NのIDCTを行うことによりN×Nの画素データを得る。復号するブロックが動き補償ブロックの場合は、動き補償部8からの動き補償ブロックを加算器4で加算して画像復元する。
FIG. 9 is a block diagram showing the configuration of the third embodiment of the reproducing apparatus of the present invention. Video data encoded by MPEG2 or the like is variable-length decoded by the variable-
更に、復元された画像データは、圧縮器5で画素データが再度圧縮され、フレームメモリ6に蓄積される。圧縮された画素データは動き補償で必要となるブロックを抽出する際に、伸長器7で動き補償ブロック内の画素がすべて復号され、動き補償部8で動き補償処理される。以上のように、本実施例は、ある領域を0で埋めてIDCTを行い、フレームメモリに入力される画素データを圧縮することにより、フレームメモリサイズを削減した点に特徴がある。このような構成によって、逆DCT変換器から出力される差分画像データの高周波成分を削減することにより、フレームメモリ6に記憶される画像データの精度に対して相性が良くなる。
Further, the restored image data is compressed again in the
図11は、本発明の再生装置の第4の実施例の構成を示すブロック図である。MPEG2 などで符号化された動画像データは可変長復号器1で可変長復号され、そこで得られた量子化DCT 係数は逆量子化器2で逆量子化され、N×N DCT係数が得られる。IDCT3で逆DCT処理によりN×Nの画素データが得られる。復号するブロックが動き補償ブロックの場合は動き補償部8からの動き補償ブロックを加算して画像復元を行う。
FIG. 11 is a block diagram showing the configuration of the fourth embodiment of the reproducing apparatus of the present invention. Video data encoded by MPEG2 or the like is variable-length decoded by the variable-
更に、復元された画像データは、ダウンサンプラ60で画素データ数が削減され、フレームメモリ6に蓄積される。削減された画素データは動き補償で必要となるブロックを抽出する際に、アップサンプラ61でブロック内の画素がすべて復元され動き補償部8で動き補償処理される。
Further, the restored image data is stored in the
ダウンサンプラ60は、例えばSN画素毎(SN>0、SNは整数)の画素のみをサンプルし、それ以外の画素は廃棄することにより、1:Nの割合で画素データ数を削減する。これにより、フレームメモリに記録する画素データ数は1/SNになる。アップサンプラ61は、例えば線形補間により廃棄された画素データを復元するものである。例えばX0とX3がフレームメモリ6に記録された画素データであるものとすると、X1、X2はX0とX3の距離比を用いてそれぞれ以下のように求めることができる。
X1 = 2/3 X0 + 1/3 X3, X2 = 1/3 X0 + 2/3 X3
For example, the
X1 = 2/3 X0 + 1/3 X3, X2 = 1/3 X0 + 2/3 X3
図12、13は、本発明の再生装置の第5の実施例の要部構成を示すブロック図である。第5の実施例は、図1に示す第1の実施例において、圧縮器5および伸長器7に、それぞれ図12および図13に示す構成を採用したものである。図12は、第5実施例における圧縮器5の構成を示すブロック図である。S×Tアダマール変換器70は、画素データをS×Tブロック(S、Tは正の整数)毎にアダマール変換し、周波数領域のデータに変換する。この出力データは量子化器21により量子化され、符号器22によって符号化される。量子化器21、符号器22については第1の実施例と同様の方式を用いることができ、量子化器21については、ブロック内の係数の位置や大きさに応じて量子化ステップQを変化させることも可能である。
FIGS. 12 and 13 are block diagrams showing the main configuration of the fifth embodiment of the reproducing apparatus of the present invention. In the fifth embodiment, the configuration shown in FIGS. 12 and 13 is adopted for the
図13は第5実施例における伸長器7の構成を示すブロック図である。フレームメモリ6に蓄積された圧縮画像データは、まず復号器30によって量子化データが復元され、該量子化データは逆量子化器31によってS×Tブロック毎の周波数領域データに復元される。そして、周波数領域データはS×T逆アダマール変換器71によって画像データに復元される。復号器30や逆量子化器31については、実施例1と同様の方式を用いることができる。なお、第5実施例においてはアダマール変換を用いる例を開示したが、アダマール変換の代わりにDCTなどの他の直交変換を採用することも可能である。
FIG. 13 is a block diagram showing the configuration of the
以上、実施例を開示したが、更に以下に述べるような変形例も考えられる。変換符号化については、DCT のみならず、ウェーブレット(Wavelet )変換などあらゆる変換符号化に適用することが可能である。 Although the embodiments have been disclosed above, the following modifications are also conceivable. The transform coding can be applied not only to DCT but also to any transform coding such as wavelet transform.
本実施例については、量子化器を使用する例を開示したが、量子化器を用いない構成も可能であり、この場合ロスレス(完全に復元可能な)符号化を行うことが可能である。 In this embodiment, an example using a quantizer has been disclosed. However, a configuration that does not use a quantizer is possible, and in this case, lossless (completely recoverable) encoding can be performed.
本発明の各機能ブロックは、例えばパソコンやワークステーション等のコンピュータによって全てソフトウェアにより処理を行うことが可能であり、また専用のLSI等により処理することも可能である。 Each functional block of the present invention can be processed by software by a computer such as a personal computer or a workstation, and can also be processed by a dedicated LSI or the like.
1…可変長復号器、2…逆量子化器、3…逆DCT変換器、4…加算器、5…圧縮器、6…フレームメモリ、7…伸長器、8…動き補償部、10…4×4逆DCT変換器、11、41…拡大器、12…動きベクトル変換器、20…減算器、21…量子化器、22…符号器、23、32…加算器、24、33…予測器、30…復号器、31…逆量子化器、40…K×M逆DCT変換器、50…ゼロパッド逆DCT変換器、60…ダウンサンプラ、61…アップサンプラ、70…アダマール変換器、71…逆アダマール変換器
DESCRIPTION OF
Claims (2)
該入力されたN×N個の周波数変換係数のうち、低周波成分のK×M部分(K,MはNより小さい正の整数)のみを水平方向にK×KのDCT基底で逆変換処理、垂直方向にM×MのDCT基底で逆変換処理をして、K×M個の画素ブロックデータを得るようにした、前記符号化動画像データを復号する手段と、
前記復号された動画像データを予測符号化により再圧縮する圧縮手段と、
前記圧縮手段から出力されたデータを蓄積する蓄積手段と、
前記蓄積手段から出力されたデータを伸張する伸張手段と、
前記伸張手段から出力された動画像データに対して動き補償予測を行う動き補償予測手段とを具備し、
前記動き補償予測は、水平垂直方向それぞれ、K/N、M/Nにスケーリングされた動きベクトルを用いることを特徴とする符号化動画像再生装置。 Means for inputting encoded moving image data frequency-transform encoded with a block size of N × N pixels (N is a positive integer);
Of N × N number of frequency transform coefficients the input, K × M of the low-frequency component (K, M is a positive integer smaller than N) inverse transform processing in the DCT basis of K × K only in the horizontal direction Means for decoding the encoded moving image data , wherein K × M pixel block data is obtained by performing an inverse transformation process on the M × M DCT base in the vertical direction;
Compression means for recompressing the decoded moving image data by predictive encoding;
Storage means for storing data output from the compression means;
Decompression means for decompressing data output from the storage means;
Motion compensation prediction means for performing motion compensation prediction on the moving image data output from the decompression means,
The motion compensated prediction uses a motion vector scaled to K / N and M / N in the horizontal and vertical directions, respectively.
前記再圧縮する圧縮手段は、周期的にサンプルされた画像データは非圧縮のままとし、他の画像データは該非圧縮の画像データを用いて予測符号化により圧縮することを特徴とする符号化動画像再生装置。 In the encoded moving image reproduction device according to claim 1,
The encoded moving image characterized in that the compression means for recompressing keeps periodically sampled image data uncompressed and compresses other image data by predictive encoding using the uncompressed image data. Image reproduction device.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2006238986A JP4448115B2 (en) | 2006-09-04 | 2006-09-04 | Encoded video playback device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2006238986A JP4448115B2 (en) | 2006-09-04 | 2006-09-04 | Encoded video playback device |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2004137273A Division JP4411131B2 (en) | 2004-05-06 | 2004-05-06 | Encoded video playback device |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2007014017A JP2007014017A (en) | 2007-01-18 |
| JP4448115B2 true JP4448115B2 (en) | 2010-04-07 |
Family
ID=37751760
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2006238986A Expired - Fee Related JP4448115B2 (en) | 2006-09-04 | 2006-09-04 | Encoded video playback device |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4448115B2 (en) |
-
2006
- 2006-09-04 JP JP2006238986A patent/JP4448115B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2007014017A (en) | 2007-01-18 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3575508B2 (en) | Encoded video playback device | |
| JP3776920B2 (en) | Image coding method | |
| CN104135665B (en) | Moving picture encoding device and method, dynamic image decoding device and method | |
| JP4491349B2 (en) | Intra-coding method and apparatus for video data | |
| JP2009260977A (en) | Video data compression using combination of irreversible compression and reversible compression | |
| KR19980071541A (en) | Image processing apparatus and image processing method | |
| JP4973886B2 (en) | Moving picture decoding apparatus, decoded picture recording apparatus, method and program thereof | |
| JP2001204037A (en) | Motion compensation adaptive image processing method and its device | |
| JP4209631B2 (en) | Encoding device, decoding device, and compression / decompression system | |
| JP2010098352A (en) | Image information encoder | |
| CN1825976B (en) | Method and device for decoding digital image sequence | |
| JP4825227B2 (en) | Image decoding apparatus and image processing program | |
| JPH08294125A (en) | Moving picture coding apparatus and moving picture decoding apparatus | |
| US20060133512A1 (en) | Video decoder and associated methods of operation | |
| JP4411131B2 (en) | Encoded video playback device | |
| JP4448115B2 (en) | Encoded video playback device | |
| JP6875566B2 (en) | Moving image prediction coding device, moving image prediction decoding device, moving image prediction coding method, moving image prediction decoding method and moving image prediction decoding program | |
| JP4776505B2 (en) | Image encoding device, image decoding device, and image processing program | |
| CN107257459A (en) | Dynamic image prediction decoding device and dynamic image prediction decoding method | |
| JP6646125B2 (en) | Video prediction decoding method and video prediction decoding device | |
| JP2001112002A (en) | Digital video decoding device capable of image size conversion | |
| JP2010183401A (en) | Image encoding device and method thereof | |
| JPH11146403A (en) | Video signal encoding device, video signal encoding method, and video signal encoding program storage medium | |
| CN112004095A (en) | Storage-medium-free still image interframe lossless recovery algorithm | |
| JP2001016589A (en) | Image information conversion device, image information transmission system, and image information conversion method |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061124 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070110 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070309 |
|
| A911 | Transfer of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20070328 |
|
| A912 | Removal of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20070420 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091214 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100121 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130129 Year of fee payment: 3 |
|
| R150 | Certificate of patent (=grant) or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| LAPS | Cancellation because of no payment of annual fees |