JP7594364B2 - Encoding device, decoding device, and program - Google Patents
Encoding device, decoding device, and program Download PDFInfo
- Publication number
- JP7594364B2 JP7594364B2 JP2020012909A JP2020012909A JP7594364B2 JP 7594364 B2 JP7594364 B2 JP 7594364B2 JP 2020012909 A JP2020012909 A JP 2020012909A JP 2020012909 A JP2020012909 A JP 2020012909A JP 7594364 B2 JP7594364 B2 JP 7594364B2
- Authority
- JP
- Japan
- Prior art keywords
- reference pixel
- unit
- frequency power
- power value
- correction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
本発明は、符号化装置、復号装置、及びプログラムに関し、特に、画像情報の画面内予測を行う符号化装置、復号装置、及びプログラムに関する。 The present invention relates to an encoding device, a decoding device, and a program, and in particular to an encoding device, a decoding device, and a program that perform intra-frame prediction of image information.
近年の画像(動画像を含む)の高精細化に伴い、より符号化効率を向上させた符号化方式が求められている。例えば、動画像の予測符号化方式であるMPEG(Moving Picture Experts Group)-2、H.264/AVC(Advanced Video Coding)、H.265/HEVC(High Efficiency Video Coding)等では、動画像の各フレームをブロックに分割し、それぞれのブロックを基本処理単位として予測画像を生成し、原画像と予測画像の差分(残差信号)を符号化して出力する。 As images (including video) become increasingly high-definition in recent years, there is a demand for coding methods with improved coding efficiency. For example, in predictive coding methods for video such as MPEG (Moving Picture Experts Group)-2, H.264/AVC (Advanced Video Coding), and H.265/HEVC (High Efficiency Video Coding), each frame of a video is divided into blocks, and a predicted image is generated for each block as a basic processing unit, and the difference between the original image and the predicted image (residual signal) is coded and output.
予測画像の生成には画面内予測(イントラ予測)と動き補償予測(インター予測)の2種類の生成手法がある。画面内予測は予測対象であるブロックを、その周辺画素を参照画素として内挿又は外挿予測する(非特許文献1)。また、動き補償予測は前後フレームからフレームを内挿予測する。このうち、画面内予測で生成される予測画像(Iフレーム(Intra-coded Frame))は、画面間予測の基礎となる画像(フレーム)であるため、画面内予測には、より精度が高く、予測効率の良い予測符号化方法が求められている。 There are two methods for generating predicted images: intra-frame prediction (intra-prediction) and motion-compensated prediction (inter-prediction). Intra-frame prediction predicts a block to be predicted by interpolation or extrapolation using surrounding pixels as reference pixels (Non-Patent Document 1). Motion-compensated prediction predicts a frame by interpolation from previous and next frames. Of these, the predicted image generated by intra-frame prediction (I-frame (Intra-coded Frame)) is the image (frame) that forms the basis of inter-frame prediction, so a predictive coding method with higher accuracy and better prediction efficiency is required for intra-frame prediction.
例えば、画面内予測において、大きなサイズの予測ブロックの方向性予測を行った場合に参照画素からの距離が離れるにしたがって予測が当たりづらくなるという課題に対して、参照画素と予測画素の距離に応じて利用する参照画素の数を変えるなどの処理を行うことが提案されている(特許文献1)。 For example, in intra-frame prediction, when directional prediction is performed on a large predicted block, the prediction becomes less likely to be correct as the distance from the reference pixel increases. To address this issue, it has been proposed to perform processing such as changing the number of reference pixels used depending on the distance between the reference pixel and the predicted pixel (Patent Document 1).
代表的な動画像の予測符号化方式であるHEVCの画面内予測では、予測する変換ユニット(TU:Transform Unit)の左側と上側の隣接画素を参照画素として、参照画素を用いた内挿又は外挿処理により予測画素を生成する。 In intra-frame prediction in HEVC, a representative predictive coding method for video, adjacent pixels to the left and above the transform unit (TU) being predicted are used as reference pixels, and predicted pixels are generated by interpolation or extrapolation processing using the reference pixels.
図7は、一辺のサイズがN(図ではN=4)の被予測TU(被予測変換ユニット)1と、その予測に用いる参照画素の位置関係を示す図である。被予測TU1の左上の画素(ピクセル)位置を原点(0,0)とし、図示のようにx,y軸を設定すると、被予測TU1の左側のx=-1でy=-1~2N-1の座標にある画素と被予測TU1の上側のy=-1でx=-1~2N-1の座標にある画素の計4N+1個の画素を参照画素として準備する。 Figure 7 shows the positional relationship between a predicted TU (predicted transform unit) 1 with a side size of N (N=4 in the figure) and the reference pixels used for its prediction. If the top left pixel position of predicted TU1 is set as the origin (0,0) and the x and y axes are set as shown, a total of 4N+1 pixels are prepared as reference pixels: the pixel on the left side of predicted TU1 at x=-1 and y=-1 to 2N-1 coordinates, and the pixel on the top side of predicted TU1 at y=-1 and x=-1 to 2N-1 coordinates.
ここで参照画素位置の画素が未復号である場合(未復号のTUに属している場合)、未復号の参照画素位置では、復号済の近傍参照画素の画素値を代入して用いる。しかし同一画素が連続して用いられることが多いため、これら未復号の位置の参照画素は低周波成分になりやすく、予測するTU内に高周波成分が含まれる場合には予測効率が低下しやすいという課題がある。 If the pixel at the reference pixel position is undecoded (belongs to an undecoded TU), the pixel value of a nearby decoded reference pixel is substituted for the undecoded reference pixel position. However, because the same pixel is often used consecutively, the reference pixels at these undecoded positions tend to be low-frequency components, and there is an issue that prediction efficiency is likely to decrease if high-frequency components are included in the TU to be predicted.
従って、上記のような問題点に鑑みてなされた本発明の目的は、画面内予測において、参照画素位置の画素が未復号である場合でも、高周波成分が含まれるTUを精度良く予測し、予測効率を向上させることができる符号化装置、復号装置、及びプログラムを提供することにある。 Therefore, in consideration of the above problems, the object of the present invention is to provide an encoding device, a decoding device, and a program that can accurately predict TUs containing high-frequency components and improve prediction efficiency in intra-screen prediction, even when the pixel at the reference pixel position has not been decoded.
上記課題を解決するために本発明に係る符号化装置は、画像の画面内予測を行う符号化装置において、画面内予測部は、被予測変換ユニット(TU)に対して、参照画素を準備し、未復号の参照画素位置に復号済の近傍参照画素と等しい参照画素を準備する、参照画素準備部と、未復号の参照画素位置に準備した前記参照画素の周波数成分を補正する、参照画素補正部と、補正された前記参照画素に基づいて、前記被予測変換ユニットの予測処理を行う、予測処理部とを備え、前記参照画素補正部は、未復号の参照画素位置で用いる復号済の近傍参照画素が属する変換ユニット内の参照画素の周波数パワー値を用いて、未復号の参照画素位置に準備した前記参照画素の周波数パワー値を補正し、
前記参照画素補正部は、未復号の参照画素位置で用いる復号済の近傍参照画素が属する変換ユニット内の参照画素についてDCT(離散コサイン変換)を行うことにより各周波数に含まれる補正元周波数パワー値を求めるとともに、未復号の参照画素位置に準備した前記参照画素についてDCTを行うことにより各周波数に含まれる補正先周波数パワー値を求め、前記補正元周波数パワー値で前記補正先周波数パワー値を補正し、補正された前記補正先周波数パワー値をIDCT(逆離散コサイン変換)することにより未復号の参照画素位置の前記参照画素を設定し、
前記参照画素補正部はさらに、未復号の参照画素位置に準備した前記参照画素の前記補正先周波数パワー値を前記補正元周波数パワー値で補正し、IDCTすることにより、未復号の参照画素位置に準備した前記参照画素の画素値に加えられた補正量に対し、未復号の参照画素位置と、その位置で用いる復号済の近傍参照画素との間の距離に応じて重みを乗じ、前記補正量を調整することを特徴とする。
In order to solve the above problem, the coding device according to the present invention is a coding device that performs intra-screen prediction of an image, and the intra-screen prediction unit includes a reference pixel preparation unit that prepares reference pixels for a predicted transform unit (TU) and prepares reference pixels equal to decoded neighboring reference pixels at undecoded reference pixel positions, a reference pixel correction unit that corrects frequency components of the reference pixels prepared at the undecoded reference pixel positions, and a prediction processing unit that performs prediction processing of the predicted transform unit based on the corrected reference pixels, and the reference pixel correction unit corrects a frequency power value of the reference pixel prepared at the undecoded reference pixel position using a frequency power value of a reference pixel in a transform unit to which a decoded neighboring reference pixel used at the undecoded reference pixel position belongs,
the reference pixel correction unit obtains a source frequency power value included in each frequency by performing a discrete cosine transform (DCT) on a reference pixel in a transform unit to which a decoded neighboring reference pixel used at an undecoded reference pixel position belongs, and obtains a destination frequency power value included in each frequency by performing a discrete cosine transform (DCT) on the reference pixel prepared at the undecoded reference pixel position, corrects the destination frequency power value with the source frequency power value, and sets the reference pixel at the undecoded reference pixel position by performing an inverse discrete cosine transform (IDCT) on the corrected destination frequency power value;
The reference pixel correction unit is further characterized in that it corrects the destination frequency power value of the reference pixel prepared at an undecoded reference pixel position with the source frequency power value, and performs IDCT, thereby multiplying the correction amount added to the pixel value of the reference pixel prepared at the undecoded reference pixel position by a weight according to the distance between the undecoded reference pixel position and a decoded neighboring reference pixel used at that position, thereby adjusting the correction amount .
また、前記符号化装置は、前記補正先周波数パワー値を前記補正元周波数パワー値で置き換えること、前記補正先周波数パワー値と前記補正元周波数パワー値との平均をとること、周波数ごとに所定比率で前記補正先周波数パワー値と前記補正元周波数パワー値をマージすること、のいずれかにより、前記補正先周波数パワー値の補正を行うことが望ましい。 It is also preferable that the encoding device corrects the correction destination frequency power value by either replacing the correction destination frequency power value with the correction source frequency power value, taking the average of the correction destination frequency power value and the correction source frequency power value, or merging the correction destination frequency power value and the correction source frequency power value at a predetermined ratio for each frequency.
上記課題を解決するために本発明に係る復号装置は、画像の画面内予測を行う復号装置において、画面内予測部は、被予測変換ユニット(TU)に対して、参照画素を準備し、未復号の参照画素位置に復号済の近傍参照画素と等しい参照画素を準備する、参照画素準備部と、未復号の参照画素位置に準備した前記参照画素の周波数成分を補正する、参照画素補正部と、補正された前記参照画素に基づいて、前記被予測変換ユニットの予測処理を行う、予測処理部とを備え、前記参照画素補正部は、未復号の参照画素位置で用いる復号済の近傍参照画素が属する変換ユニット内の参照画素の周波数パワー値を用いて、未復号の参照画素位置に準備した前記参照画素の周波数パワー値を補正し、
前記参照画素補正部は、未復号の参照画素位置で用いる復号済の近傍参照画素が属する変換ユニット内の参照画素についてDCT(離散コサイン変換)を行うことにより各周波数に含まれる補正元周波数パワー値を求めるとともに、未復号の参照画素位置に準備した前記参照画素についてDCTを行うことにより各周波数に含まれる補正先周波数パワー値を求め、前記補正元周波数パワー値で前記補正先周波数パワー値を補正し、補正された前記補正先周波数パワー値をIDCT(逆離散コサイン変換)することにより未復号の参照画素位置の前記参照画素を設定し、
前記参照画素補正部はさらに、未復号の参照画素位置に準備した前記参照画素の前記補正先周波数パワー値を前記補正元周波数パワー値で補正し、IDCTすることにより、未復号の参照画素位置に準備した前記参照画素の画素値に加えられた補正量に対し、未復号の参照画素位置と、その位置で用いる復号済の近傍参照画素との間の距離に応じて重みを乗じ、前記補正量を調整することを特徴とする。
In order to solve the above problem, a decoding device according to the present invention is a decoding device that performs intra-screen prediction of an image, the intra-screen prediction unit includes a reference pixel preparation unit that prepares reference pixels for a predicted transform unit (TU) and prepares reference pixels equal to decoded neighboring reference pixels at undecoded reference pixel positions, a reference pixel correction unit that corrects frequency components of the reference pixels prepared at the undecoded reference pixel positions, and a prediction processing unit that performs prediction processing of the predicted transform unit based on the corrected reference pixels, and the reference pixel correction unit corrects a frequency power value of the reference pixel prepared at the undecoded reference pixel position using a frequency power value of a reference pixel in a transform unit to which a decoded neighboring reference pixel used at the undecoded reference pixel position belongs ,
the reference pixel correction unit obtains a source frequency power value included in each frequency by performing a discrete cosine transform (DCT) on a reference pixel in a transform unit to which a decoded neighboring reference pixel used at an undecoded reference pixel position belongs, and obtains a destination frequency power value included in each frequency by performing a discrete cosine transform (DCT) on the reference pixel prepared at the undecoded reference pixel position, corrects the destination frequency power value with the source frequency power value, and sets the reference pixel at the undecoded reference pixel position by performing an inverse discrete cosine transform (IDCT) on the corrected destination frequency power value;
The reference pixel correction unit is further characterized in that it corrects the destination frequency power value of the reference pixel prepared at an undecoded reference pixel position with the source frequency power value, and performs IDCT, thereby multiplying the correction amount added to the pixel value of the reference pixel prepared at the undecoded reference pixel position by a weight according to the distance between the undecoded reference pixel position and a decoded neighboring reference pixel used at that position, thereby adjusting the correction amount .
上記課題を解決するために本発明に係るプログラムは、コンピュータを、前記符号化装置として機能させることを特徴とする。 To solve the above problem, the program of the present invention is characterized by causing a computer to function as the encoding device.
上記課題を解決するために本発明に係るプログラムは、コンピュータを、前記復号装置として機能させることを特徴とする。 To solve the above problem, the program of the present invention is characterized by causing a computer to function as the decryption device.
本発明における符号化装置、復号装置、及びプログラムによれば、画面内予測において、参照画素位置の画素が未復号である場合でも、高周波成分が含まれるTUを精度良く予測し、予測効率を向上させることができる。 The encoding device, decoding device, and program of the present invention make it possible to accurately predict TUs containing high-frequency components and improve prediction efficiency in intra-screen prediction, even when the pixel at the reference pixel position has not yet been decoded.
以下、本発明の実施の形態について、図を参照して説明する。 The following describes an embodiment of the present invention with reference to the drawings.
(実施の形態1)
図1は、本発明の符号化装置(及び復号装置)の一部を構成する、画面内予測部の一例のブロック図である。画面内予測部10は、被予測画像が入力され、被予測TUごとに復号済TUを用いた予測処理を行い、予測画像を出力する。
(Embodiment 1)
1 is a block diagram of an example of an intra-screen prediction unit constituting a part of the encoding device (and decoding device) of the present invention. The
画面内予測部10は、被予測TUごとに参照画素を準備する参照画素準備部11と、参照画素の補正を行う参照画素補正部12と、補正された参照画素に基づいて被予測TUの予測処理を行う予測処理部13とを備えている。このうち、参照画素準備部11と予測処理部13は、従来の画面内予測で行われていた処理を行うものであり、参照画素補正部12が、従来の画面内予測では行っていない新しい処理を行う。本発明は、参照画素補正部12で、未復号の参照画素位置において用いる復号済の近傍参照画素値を補正することにより、予測精度を向上させる。なお、画面内予測部10は、明確にこのようなブロック構成を有する必要はなく、後述する参照画素準備部11、参照画素補正部12、及び予測処理部13の各部の処理を行う機能を備えていればよい。
The
まず、本発明の実施の形態1としての符号化装置について説明する。図2は、本発明の符号化装置の一例のブロック図であり、符号化方式として代表的なH.265/HEVCによる符号化を行う符号化装置100である。なお、本発明の符号化装置100はHEVCの符号化を行う装置に限られず、H.264/AVCの符号化を行う装置等、内部に画面内予測部を含む符号化装置であればよい。
First, a coding device according to a first embodiment of the present invention will be described. FIG. 2 is a block diagram of an example of a coding device according to the present invention, which is a
符号化装置100は、分割部101、減算処理部102、変換部103、量子化部104、エントロピー符号化部105、逆量子化部106、逆変換部107、加算処理部108、ブロックメモリ109、画面内予測部(イントラ予測部)110、ループフィルタ111、フレームメモリ112、動き補償予測部(インター予測部)113、及び切り換え制御部114を備えている。このうち、画面内予測部110として、図1の画面内予測部10を利用する。符号化装置100は、コンピュータとプログラムによって実現することができる。
The
分割部101は、入力された画像を、所定サイズのブロックに分割する。分割されたそれぞれのブロック(ブロック画像)は、予測・符号化のための基本処理単位となる。ブロックのサイズは、最大64×64画素(ピクセル)であり、更に、予測のユニットとして、4×4、8×8、16×16、又は32×32画素等に分割される。ブロック化された画像は、減算処理部102に出力され、画像ブロック毎にその後の処理が行われる。
The
減算処理部102は、分割部101から入力されるブロック化された画像から、画面内予測部110又は動き補償予測部113からの予測画像の減算処理を行い、両画像の差分を求めて、残差信号(差分画像)を変換部103に出力する。
The
変換部103は、減算処理部102から入力された残差信号に対して、H.265/HEVC等で規定されている変換符号化処理(離散コサイン変換(DCT:Discrete Cosine Transform)又は離散サイン変換(DST:Discrete Sine Transform)等)を行い、得られた変換係数を量子化部104へ出力する。以下では、DCTを処理に用いるものとして説明する。
The
量子化部104は、変換部103から入力された変換係数を、所定の量子化パラメータに基づいて量子化処理を行う。そして、その結果(量子化済み変換係数)をエントロピー符号化部105及び逆量子化部106に出力する。
The
エントロピー符号化部105は、量子化部104から入力された量子化済み変換係数(画像の符号化データ)とともに、画像の復号に必要なデータをエントロピー符号化して、ビットストリームを作成する。このビットストリームが符号化装置100の出力信号となる。
The
逆量子化部106は、量子化部104から入力された量子化済み変換係数を逆量子化し、変換係数に戻して逆変換部107に出力する。
The
逆変換部107は、逆量子化されたデータ(変換係数)に対して逆変換(離散コサイン逆変換(IDCT:Inverse Discrete Cosine Transform)等)をする。すなわち、逆量子化部106と逆変換部107により、変換部103及び量子化部104で行われた符号化処理と反対の復号処理を行い、その結果を加算処理部108に出力する。
The
加算処理部108は、逆量子化部106と逆変換部107で逆量子化及び逆変換されたデータ、すなわち、残差信号の復号処理されたデータと、後述の画面内予測部110又は動き補償予測部113で処理された予測画像データとを加算し、その合成画像データ(再構成されたブロック画像)をブロックメモリ109とループフィルタ111に出力する。
The
ブロックメモリ109は、加算処理部108から入力される再構成されたブロック画像を蓄積する記憶部である。画面内予測のための被予測画像を格納し、画面内予測部110に出力する。
The
画面内予測部110は、ブロックメモリ109に格納された被予測画像のデータに基づいて、被予測TUの画面内予測(イントラ予測)による予測画像を生成する。本発明では、画面内予測部110を図1に示す画面内予測部10の構成とし、参照画素の補正を行う予測画像生成を行う。その処理については後述する。画面内予測部110は、画面内予測画像を切り換え制御部114に出力する。
The
ループフィルタ111は、例えば、ブロック歪みを低減するデブロッキング・フィルタと、リンギング歪みを低減するサンプル・アダプティブ・オフセット等によって構成される。加算処理部108で合成された画像データに対して、フィルタ処理を行うことにより、符号化ループ内の量子化処理によって発生する符号化歪みを低減する。ループフィルタ111はフィルタ処理した画像データをフレームメモリ112に出力する。
The
フレームメモリ112は、ループフィルタ111で処理された画像データを蓄積する。フレームメモリ112は、動き補償予測(インター予測)に用いられる参照ピクチャを格納する記憶部として機能する。
The
動き補償予測部113は、フレームメモリ112に蓄積された画像と、図示しない動き検出部で求めた画像の動きの情報に基づいて、動き補償予測処理(動きベクトルに基づくフレーム間予測)を行い、動き予測画像を切り換え制御部114に出力する。
The motion
切り換え制御部114は、減算処理部102に、画面内予測部110からの画面内予測画像と、動き補償予測部113からの動き予測画像とのいずれかを、選択して出力する。
The switching
本発明の符号化装置100は、画面内予測部110において参照画素の補正を行うことにより、画面内予測の予測効率を向上させることができる。
The
次に、画面内予測部110(10)の動作について詳述する。図1の参照画素準備部11は、被予測画像が入力され、被予測TUの予測処理に用いる参照画素を準備して出力する。図3に、被予測TU1の参照画素を準備する例を示す。
Next, the operation of the intra-screen prediction unit 110 (10) will be described in detail. The reference
TUの一辺のサイズをNとする。そして図3に示すように、予測するTU1に隣接する4N+1個の画素を参照画素p[x][y]として準備する。被予測TU1に対する4N+1個の参照画素の配置関係は、図7と同じである。図3では、被予測TU1(N=4)の左上の画素(ピクセル)位置を座標(12,12)とし、被予測TU1の左側のx=11でy=11~19の座標にある画素と被予測TU1の上側のy=11でx=11~19の座標にある画素の計17個の画素を参照画素として準備することとする。 The size of one side of a TU is N. Then, as shown in FIG. 3, 4N+1 pixels adjacent to the TU1 to be predicted are prepared as reference pixels p[x][y]. The arrangement of the 4N+1 reference pixels with respect to the predicted TU1 is the same as that in FIG. 7. In FIG. 3, the top left pixel position of the predicted TU1 (N=4) is set to coordinates (12, 12), and a total of 17 pixels are prepared as reference pixels: the pixel at coordinates x=11 and y=11-19 on the left side of the predicted TU1, and the pixel at coordinates y=11 and x=11-19 on the top side of the predicted TU1.
参照画素の準備手順は次のとおりである。
(1)参照画素が全て復号済の場合、それらをそのままp[x][y]の値とする。
The procedure for preparing the reference pixels is as follows.
(1) If all reference pixels have been decoded, they are used as the values of p[x][y] as they are.
(2)復号済み画素が1つもない場合、p[x][y]=1<<(BitDepth-1)とする(BitDepthはビット深度)。 (2) If no pixels have been decoded, set p[x][y]=1<<(BitDepth-1) (BitDepth is the bit depth).
(3)それ以外の場合(一部のみ復号済みの場合)、
(3-1)図3の左下端(11,19)から参照画素を右上端(19,11)に向かって順に走査し、最初に存在する復号済み画素値(ここでは、p[11][15])を左下端(p[11][19])の値とする。
(3-2)図3の左下端の1つ上(11,18)から(11,11)まで順に走査し、当該画素が復号されていなければそのすぐ下の画素値を当該画素の値とする。すなわち、p[11][y+1]をp[11][y]の値とする。
(3-3)同様に、図3の(12,11)から右上端(19,11)まで順に走査し、当該画素が復号されていなければそのすぐ左側の画素値を当該画素の値とする。すなわち、p[x-1][11]をp[x][11]の値とする。
(3) In other cases (when only part of the data has been decrypted),
(3-1) Scan the reference pixels in order from the bottom left corner (11, 19) in Figure 3 to the top right corner (19, 11), and use the first decoded pixel value (here, p[11][15]) as the value of the bottom left corner (p[11][19]).
(3-2) Scan from (11,18) one pixel above the bottom left corner of Figure 3 to (11,11) in order, and if the pixel in question has not been decoded, set the pixel value just below it as the value of the pixel in question. In other words, set p[11][y+1] as the value of p[11][y].
(3-3) Similarly, scan from (12,11) to the top right corner (19,11) in Figure 3 in order, and if the pixel in question has not been decoded, set the value of the pixel immediately to the left of it as the value of the pixel in question. In other words, set p[x-1][11] to the value of p[x][11].
上記の(3-1)、(3-2)の手順により、未復号の参照画素の値p[11][19]~p[11][16]は、これらと隣接する復号済みの近傍参照画素p[11][15]と等しくなる。以上の手順により、4N+1個の参照画素の全てに値が設定され、p[x][y]として準備される。 By the above steps (3-1) and (3-2), the values of the undecoded reference pixels p[11][19] to p[11][16] become equal to the adjacent decoded reference pixel p[11][15]. By the above steps, values are set for all 4N+1 reference pixels, and they are prepared as p[x][y].
次に、参照画素補正部12の処理について説明する。参照画素補正部12は、参照画素準備部11で準備された参照画素の内、未復号の参照画素位置の画素値の補正を行う。図4に、未復号の参照画素位置の画素値を補正する例を示す。参照画素補正部12には、例えば、未復号の参照画素位置で用いる復号済の近傍参照画素、被予測画像、及びTU情報(TU分割情報)が入力され、補正された参照画素が出力される。
Next, the processing of the reference
参照画素補正部12は、まず、未復号の参照画素位置に用いる復号済み近傍参照画素を有する復号済TU(隣接する複合済TU5)の参照画素の周波数パワーを解析する。今、参照画素準備部11の処理により、参照画素値p[11][19]~p[11][16]は復号済み近傍参照画素p[11][15]の値となっている。復号済の近傍参照画素p[11][15]が元々属するTU(復号済TU5)内の参照画素の周波数パワーを周波数成分解析(例えば、DCT解析)して、その結果を周波数パワー解析情報として出力する。
The reference
すなわち、復号済TU5の参照画素p[11][15]~p[11][12]に含まれる周波数パワーをDCT解析によって求める。以下にDCTの計算式を示す。 That is, the frequency power contained in the reference pixels p[11][15] to p[11][12] of the decoded TU5 is calculated by DCT analysis. The formula for DCT is shown below.
図4における補正元の参照画素p[11][15]を含む、復号済TU5のp[11][15]~p[11][12]のDCTにおいてはN=4であるため、p[11][15]~p[11][12]に対応する周波数パワー解析結果として、k番目の周波数のパワー係数:Xk(補正元), (k = 0, 1, 2, 3)が出力される。なお、この係数を「周波数パワー値」ということがある。 Since N=4 in the DCT of p[11][15] to p[11][12] of the decoded TU5 including the reference pixel p[11][15] of the correction source in Fig. 4, the power coefficient of the kth frequency: Xk (correction source), (k = 0, 1, 2, 3) is output as the frequency power analysis result corresponding to p[11][15] to p[11][12]. Note that this coefficient is sometimes called the "frequency power value".
次に、未復号の参照画素位置で用いる画素値を補正する。まず、未復号の参照画素位置における画素(今は復号済の近傍参照画素と等しい)の周波数パワーを周波数成分解析(例えば、DCT解析)する。すなわち、補正先であるp[11][19]~p[11][16]をDCT解析して、k番目の周波数のパワー係数:Xk(補正先), (k = 0, 1, 2, 3)を得る。なお、未復号の参照画素位置で用いる画素値が全て等しい場合は、パワー係数は直流(DC)成分のみとなり、他の周波数成分は0となる。 Next, the pixel values used at the undecoded reference pixel positions are corrected. First, the frequency power of the pixels at the undecoded reference pixel positions (which are now equal to the decoded neighboring reference pixels) is subjected to frequency component analysis (e.g., DCT analysis). That is, p[11][19] to p[11][16], which are the correction destinations, are subjected to DCT analysis to obtain the power coefficient of the kth frequency: X k (correction destination), (k = 0, 1, 2, 3). Note that if all pixel values used at the undecoded reference pixel positions are equal, the power coefficient will be only a direct current (DC) component, and the other frequency components will be zero.
そして、得られた周波数パワー値:Xk(補正先)を、前述の周波数パワー値:Xk(補正元)を用いて補正する。補正においては、例えば、Xk(補正先)をXk(補正元)で置き換える、Xk(補正先)とXk(補正元)の各要素で平均をとる、或いは、Xk(補正先)とXk(補正元)を要素ごと(周波数ごと)に所定比率でマージする等を行うことができる。所定比率は周波数ごとに変えてもよい。どのような手法で補正するかは、画像の特徴等に基づいて最適なものを選択してもよい。 Then, the obtained frequency power value: Xk (correction destination) is corrected using the above-mentioned frequency power value: Xk (correction source). In the correction, for example, Xk (correction destination) may be replaced with Xk (correction source), an average may be taken for each element of Xk (correction destination) and Xk (correction source), or Xk (correction destination) and Xk (correction source) may be merged at a predetermined ratio for each element (each frequency). The predetermined ratio may be changed for each frequency. The method of correction may be selected optimally based on the characteristics of the image, etc.
未復号の参照画素位置が属するTU内の参照画素数と、復号済の近傍参照画素が属するTU内の参照画素数が異なる場合は、画素数に対応させてXkをマッピングすることができる。例えばXk(補正元)がN=4、Xk(補正先)がN=2の場合は、X0(補正元)とX1(補正元)の平均をX0(補正先)、X2(補正元)とX3(補正元)の平均をX1(補正先)として用いることができる。 When the number of reference pixels in a TU to which an undecoded reference pixel position belongs differs from the number of reference pixels in a TU to which a decoded neighboring reference pixel belongs, X k can be mapped in accordance with the number of pixels. For example, when X k (correction source) is N=4 and X k (correction destination) is N=2, the average of X 0 (correction source) and X 1 (correction source) can be used as X 0 (correction destination), and the average of X 2 (correction source) and X 3 (correction source) can be used as X 1 (correction destination).
以上のように、未復号の参照画素位置の周波数パワー値を補正した後、IDCTすることで、未復号の参照画素位置で用いる補正された画素値が得られる。よって、未復号の参照画素位置の画素値について、周波数成分(周波数パワー)の補正を行うことができる。すなわち、未復号の参照画素位置の参照画素に対し、近傍の復号済の変換ユニットの周波数成分を加える補正を行うことができる。 As described above, after correcting the frequency power value of the undecoded reference pixel position, IDCT is performed to obtain the corrected pixel value to be used at the undecoded reference pixel position. Therefore, the frequency component (frequency power) can be corrected for the pixel value of the undecoded reference pixel position. In other words, a correction can be performed by adding the frequency component of a nearby decoded transform unit to the reference pixel at the undecoded reference pixel position.
更に、前記の補正を行った後で、未復号の参照画素位置と、その位置で用いる復号済の近傍参照画素との間の距離に応じて重みαを乗じることができる。例えばp[11][16]はp[11][15]から近いので大きな重み(α=1.0)、p[11][19]はp[11][15]から遠いので小さな重み(α=0.7)という具合で距離に応じた重みを画素値の補正量に乗じ、未復号の参照画素位置における補正量を調整することができる。なお、IDCTをする前に、距離に応じた重みをDCT成分に対して乗じ、補正量を調整してもよい。 Furthermore, after the above correction, a weight α can be multiplied according to the distance between the undecoded reference pixel position and the nearby decoded reference pixel used at that position. For example, p[11][16] is close to p[11][15], so a large weight (α = 1.0) is used, and p[11][19] is far from p[11][15], so a small weight (α = 0.7) is used. In this way, the correction amount for the undecoded reference pixel position can be adjusted by multiplying the correction amount for the pixel value by a weight according to the distance. Note that before performing IDCT, the DCT components may be multiplied by a weight according to the distance to adjust the correction amount.
本実施形態では、参照画素準備部11はHEVCを前提としており、未復号の参照画素位置p[11][19]~p[11][16]の画素値を全て復号済み近傍参照画素p[11][15]の値と等しくする処理により準備された未復号TUの参照画素に対して補正を行ったが、参照画素補正部12による補正は、未復号の参照画素位置の画素に対し、近接する復号済TUの周波数成分を加えるよう補正するものであるから、参照画素の準備処理はこれに限られない。他の処理により準備された未復号の参照画素位置の画素に対しても、同様に補正することにより、予測効率を高める効果を得ることができる。
In this embodiment, the reference
次に、予測処理部13の処理について説明する。予測処理部13の処理は、従来の符号化方式で行われた面内の予測処理を用いることができる。例えば、符号化方式がHEVCであれば、(1)プレーナ(Planar)予測、(2)直流(DC)予測、(3)方向性予測のいずれかを行う。予測処理は、参照画素補正部12から出力された、補正済みの参照画素値を用いて行う。
Next, the processing of the
ここで、(1)プレーナ(Planar)予測は、被予測TUの周囲の4個の参照画素値に基づいて、各予測画素値を滑らかに生成する手法であり、(2)直流(DC)予測は、被予測TUのすぐ左側及び上側の2N個の参照画素の平均値でTU内を埋める処理である。また、(3)方向性予測は、33通りの参照方向のいずれかに基づいて、参照方向にある参照画素値(又は内分値)を予測値とするものであり、これらの予測方法から予測効率の良い方法を選択して予測することができる。 Here, (1) planar prediction is a method for smoothly generating each predicted pixel value based on the four reference pixel values surrounding the predicted TU, and (2) direct current (DC) prediction is a process for filling the TU with the average value of 2N reference pixels immediately to the left and above the predicted TU. Also, (3) directional prediction is a process for predicting a reference pixel value (or an internal division value) in a reference direction based on one of 33 reference directions, and a method with good prediction efficiency can be selected from these prediction methods to make a prediction.
次に、画面内予測部10の処理について、より一般化して説明する。図5は、画面内予測部10の動作の例を示すフローチャートである。以下、各ステップについて説明する。
Next, the processing of the
ステップS11:被予測TU(一辺のサイズをN)に対して、隣接する4N+1個の画素(図7参照)を参照画素p[x][y]として準備する。なお、参照画素が全て復号済みの場合、それらをそのままp[x][y]の値とし、復号済み画素が1つもない場合、p[x][y]=1<<(BitDepth-1)とする。それ以外の場合、左下端(-1, 2N-1)から右上端(2N-1, -1)に向かって参照画素を順に走査し、最初に存在する復号済み画素値をp[-1][2N-1]の値とする。次に、左下端の1つ上(-1, 2N-2)から(-1, -1)まで順に走査し、(-1, y)が復号されていなければp[-1][y+1]をp[-1][y]の値とする。さらに、(0, -1)から右上端(2N-1, -1)まで順に走査し、(x, -1)が復号されていなければp[x-1][-1]をp[x][-1]の値とする。 Step S11: For the predicted TU (size of one side is N), prepare 4N+1 adjacent pixels (see FIG. 7) as reference pixels p[x][y]. If all reference pixels have already been decoded, they are set as the value of p[x][y]. If there are no decoded pixels, set p[x][y] = 1 << (BitDepth - 1). Otherwise, scan the reference pixels in order from the bottom left corner (-1, 2N-1) to the top right corner (2N-1, -1), and set the first decoded pixel value to the value of p[-1][2N-1]. Next, scan from (-1, 2N-2) above the bottom left corner to (-1, -1) in order, and if (-1, y) has not been decoded, set p[-1][y+1] to the value of p[-1][y]. Furthermore, it scans sequentially from (0, -1) to the top right corner (2N-1, -1), and if (x, -1) has not been decoded, it sets p[x-1][-1] to the value of p[x][-1].
ステップS12:未復号の参照画素位置で用いる復号済みの近傍参照画素が元々属するTU(未復号TU6に隣接する復号済TU5)内の参照画素の周波数パワーをDCT解析して、その結果を周波数パワー解析情報(補正元の周波数別のパワー係数)として出力する(図4参照)。 Step S12: Perform DCT analysis on the frequency power of the reference pixels in the TU (decoded TU5 adjacent to undecoded TU6) to which the decoded neighboring reference pixel used at the undecoded reference pixel position originally belongs, and output the result as frequency power analysis information (power coefficients for each frequency of the correction source) (see Figure 4).
ステップS13:補正対象である未復号の参照画素位置の画素値についてDCT解析を行い、得られた周波数パワー解析情報(補正先の周波数別のパワー係数)を、ステップS12で得られた復号済TUの参照画素の周波数パワー解析情報に基づいて、補正する(図4参照)。補正においては、例えば補正先の係数列(周波数パワー値)を補正元の係数列(周波数パワー値)で置き換える、補正先周波数パワー値と補正元周波数パワー値の平均をとる、補正先と補正元の各周波数のパワー値を所定比率でマージする等の処理を行うことができる。その後、補正された補正先周波数パワー値をIDCTすることで、未復号の参照画素位置で用いる補正された参照画素値が得られる。なお、補正先と補正元の画素間の距離に基づいて、補正量の重み付け処理を行ってもよい。 Step S13: DCT analysis is performed on the pixel value of the undecoded reference pixel position to be corrected, and the obtained frequency power analysis information (power coefficients for each frequency of the correction destination) is corrected based on the frequency power analysis information of the reference pixel of the decoded TU obtained in step S12 (see FIG. 4). In the correction, for example, the coefficient sequence (frequency power value) of the correction destination may be replaced with the coefficient sequence (frequency power value) of the correction source, the average of the correction destination frequency power value and the correction source frequency power value may be taken, and the power values of each frequency of the correction destination and correction source may be merged at a predetermined ratio. Then, the corrected correction destination frequency power value is subjected to IDCT to obtain the corrected reference pixel value to be used at the undecoded reference pixel position. Note that the correction amount may be weighted based on the distance between the correction destination and correction source pixels.
ステップS14:参照画素(補正された参照画素を含む)に対し、線形フィルタ又は平滑化フィルタ等のフィルタ処理を、必要に応じて行う。なお、このフィルタ処理は、歪や雑音を低減するための処理であり、HEVC等で行われる通常の処理である。 Step S14: Filter processing such as a linear filter or a smoothing filter is performed on the reference pixels (including the corrected reference pixels) as necessary. Note that this filtering is a process for reducing distortion and noise, and is a normal process performed in HEVC, etc.
ステップS15:ステップS11~S14で得られた参照画素にもとづいて、被予測TUの予測処理を行う。例えば、HEVCでは、33通りの参照方向を有する方向性予測、及び非方向性予測として、プレーナ(Planar)予測又は直流(DC)予測が用意されており、これらの予測処理により、画面内予測を行う。 Step S15: Prediction processing of the predicted TU is performed based on the reference pixels obtained in steps S11 to S14. For example, HEVC provides directional prediction with 33 reference directions, and planar prediction or direct current (DC) prediction as non-directional prediction, and performs intra-screen prediction using these prediction processes.
なお、本実施形態では、周波数成分解析として、DCT解析を行ったが、これに限られず、DST解析等、周波数パワー係数を求める他の手法を用いてもよい。 In this embodiment, DCT analysis is used as the frequency component analysis, but this is not limited to this, and other methods for finding frequency power coefficients, such as DST analysis, may also be used.
(実施の形態2)
実施の形態2として、復号装置について説明する。画面内予測部10は、符号化装置における局部復号処理のみならず、復号装置の復号処理においても同様に使用される。
(Embodiment 2)
A decoding device will be described as
図6は、本発明の復号装置の一例のブロック図であり、符号化方式として代表的なH.265/HEVCによる復号を行う復号装置200である。なお、本発明の復号装置200はHEVCによる復号を行う装置に限られず、H.264/AVCによる復号を行う装置等、内部に画面内予測部を含む復号装置であればよい。復号装置200は、符号化データであるビットストリームを入力し、復号処理を行い、復元した画像を出力する。
Fig. 6 is a block diagram of an example of a decoding device of the present invention, which is a
復号装置200は、エントロピー復号部201、逆量子化部202、逆変換部203、加算処理部204、ループフィルタ205、ブロックメモリ206、画面内予測部207、フレームメモリ208、動き補償予測部209、及び切り換え制御部210を備えている。このうち、画面内予測部207として、図1の画面内予測部10を利用する。復号装置200は、コンピュータとプログラムによって実現することができる。
The
エントロピー復号部201は、入力されたビットストリームをエントロピー復号し、伝送された画像の符号化データとともに、画像の復号に必要なデータを復号する。画像の符号化データは、ブロック単位で逆量子化部202に出力される。
The
逆量子化部202は、エントロピー復号部201から入力された画像の符号化データ(量子化係数)を逆量子化する。この逆量子化により、符号化側の変換符号化処理(離散コサイン変換等)で生成された変換係数が得られる。そして、逆量子化されたデータを、逆変換部203に出力する。
The
逆変換部203は、逆量子化されたデータ(変換係数)を逆変換(離散コサイン逆変換等)する。すなわち、逆量子化部202と逆変換部203は、符号化装置100で行われた変換部103及び量子化部104の処理と反対の復号処理を行い、その結果を加算処理部204に出力する。
The
加算処理部204は、逆量子化部202及び逆変換部203で逆量子化及び逆変換されたデータ(これは、差分画像のデータに相当する)と、後述の画面内予測部207(又は動き補償予測部209)で処理された予測画像データとを加算し、その合成画像データ(再構成されたブロック画像)をループフィルタ205とブロックメモリ206に出力する。
The
ループフィルタ205は、加算処理部204から入力された画像データに対して、サンプル・アダプティブ・オフセットの処理、或いは、デブロッキング・フィルタの処理等を行う。ループフィルタ205は、フィルタ処理した画像データをフレームメモリ208に出力するとともに、復号装置200の出力画像(復元画像)として出力する。
The
ブロックメモリ206は、加算処理部204で生成された合成画像データ(再構成ブロック画像)を順次蓄積する記憶部である。画面内予測のための被予測画像を格納し、画面内予測部207に出力する。
The
画面内予測部207は、ブロックメモリ206に格納された被予測画像のデータに基づいて、被予測TUの画面内予測(イントラ予測)による予測画像を生成する。本発明では、画面内予測部207を図1に示す画面内予測部10の構成とし、参照画素の補正を行って予測画像生成を行う。その処理については前述したとおりである。なお、復号側では、符号化側でどのような予測処理をしたかの情報が送られてくるため、それに基づく予測を行う。画面内予測部207は、画面内予測画像を切り換え制御部210に出力する。
The
フレームメモリ208は、ループフィルタ205で処理された画像データを蓄積する。フレームメモリ208は、動き補償予測(インター予測)に用いられる参照ピクチャを格納する記憶部として機能する。
The
動き補償予測部209は、フレームメモリ208に蓄積された画像と、図示しない動き検出部で求めた画像の動きの情報に基づいて、動き補償予測処理を行い、動き予測画像を切り換え制御部210に出力する。
The motion
切り換え制御部210は、加算処理部204に、画面内予測部207からの画面内予測画像と、動き補償予測部209からの動き予測画像とのいずれかを、選択して出力する。
The switching
本発明の復号装置200は、画面内予測部207において参照画素の補正を行うことにより、画面内予測の予測効率を向上させることができる。
The
上記の実施の形態では、符号化装置100及び復号装置200の構成と動作について説明したが、本発明はこれに限らず、画面内予測において参照画素の補正を行う符号化方法、又は復号方法として構成されてもよい。或いは、図5のフローチャートに基づいて、画像の画面内予測方法としても良い。
In the above embodiment, the configuration and operation of the
なお、上述した符号化装置100又は復号装置200として機能させるためにコンピュータを好適に用いることができ、そのようなコンピュータは、符号化装置100又は復号装置200の各機能を実現する処理内容を記述したプログラムを該コンピュータの記憶部に格納しておき、該コンピュータのCPUによってこのプログラムを読み出して実行させることで実現することができる。なお、このプログラムは、コンピュータ読取り可能な記録媒体に記録可能である。
A computer can be suitably used to function as the
上述の実施形態は代表的な例として説明したが、本発明の趣旨及び範囲内で、多くの変更及び置換ができることは当業者に明らかである。したがって、本発明は、上述の実施形態によって制限するものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。例えば、実施形態に記載の複数の構成ブロックを1つに組み合わせたり、あるいは1つの構成ブロックを分割したりすることが可能である。 The above-mentioned embodiment has been described as a representative example, but it will be apparent to those skilled in the art that many modifications and substitutions can be made within the spirit and scope of the present invention. Therefore, the present invention should not be interpreted as being limited by the above-mentioned embodiment, and various modifications and changes are possible without departing from the scope of the claims. For example, it is possible to combine multiple component blocks described in the embodiment into one, or to divide one component block.
1 被予測TU
2~5 復号済TU
6 未復号TU
10 画面内予測部
11 参照画素準備部
12 参照画素補正部
13 予測処理部
100 符号化装置
101 分割部
102 減算処理部
103 変換部
104 量子化部
105 エントロピー符号化部
106 逆量子化部
107 逆変換部
108 加算処理部
109 ブロックメモリ
110 画面内予測部(イントラ予測部)
111 ループフィルタ
112 フレームメモリ
113 動き補償予測部(インター予測部)
114 切り換え制御部
200 復号装置
201 エントロピー復号部
202 逆量子化部
203 逆変換部
204 加算処理部
205 ループフィルタ
206 ブロックメモリ
207 画面内予測部
208 フレームメモリ
209 動き補償予測部
210 切り換え制御部
1 Predicted TU
2 to 5 Decoded TU
6 Undecoded TU
10
114
Claims (5)
画面内予測部は、
被予測変換ユニット(TU)に対して、参照画素を準備し、未復号の参照画素位置に復号済の近傍参照画素と等しい参照画素を準備する、参照画素準備部と、
未復号の参照画素位置に準備した前記参照画素の周波数成分を補正する、参照画素補正部と、
補正された前記参照画素に基づいて、前記被予測変換ユニットの予測処理を行う、予測処理部と
を備え、
前記参照画素補正部は、未復号の参照画素位置で用いる復号済の近傍参照画素が属する変換ユニット内の参照画素の周波数パワー値を用いて、未復号の参照画素位置に準備した前記参照画素の周波数パワー値を補正する、符号化装置であって、
前記参照画素補正部は、未復号の参照画素位置で用いる復号済の近傍参照画素が属する変換ユニット内の参照画素についてDCT(離散コサイン変換)を行うことにより各周波数に含まれる補正元周波数パワー値を求めるとともに、未復号の参照画素位置に準備した前記参照画素についてDCTを行うことにより各周波数に含まれる補正先周波数パワー値を求め、
前記補正元周波数パワー値で前記補正先周波数パワー値を補正し、
補正された前記補正先周波数パワー値をIDCT(逆離散コサイン変換)することにより未復号の参照画素位置の前記参照画素を設定し、
前記参照画素補正部はさらに、未復号の参照画素位置に準備した前記参照画素の前記補正先周波数パワー値を前記補正元周波数パワー値で補正し、IDCTすることにより、未復号の参照画素位置に準備した前記参照画素の画素値に加えられた補正量に対し、未復号の参照画素位置と、その位置で用いる復号済の近傍参照画素との間の距離に応じて重みを乗じ、前記補正量を調整することを特徴とする、符号化装置。 In a coding device that performs intra-frame prediction of an image,
The in-screen prediction unit
A reference pixel preparation unit that prepares reference pixels for a predicted transform unit (TU) and prepares reference pixels equal to decoded neighboring reference pixels at undecoded reference pixel positions;
a reference pixel correction unit that corrects a frequency component of the reference pixel prepared at an undecoded reference pixel position;
a prediction processing unit that performs a prediction process on the predicted conversion unit based on the corrected reference pixels,
The reference pixel correction unit corrects a frequency power value of a reference pixel prepared at an undecoded reference pixel position by using a frequency power value of a reference pixel in a transform unit to which a decoded neighboring reference pixel used at an undecoded reference pixel position belongs,
the reference pixel correction unit obtains a source frequency power value included in each frequency by performing a discrete cosine transform (DCT) on a reference pixel in a transform unit to which a decoded neighboring reference pixel used at an undecoded reference pixel position belongs, and obtains a destination frequency power value included in each frequency by performing a DCT on the reference pixel prepared at an undecoded reference pixel position;
correcting the correction destination frequency power value with the correction source frequency power value;
The corrected frequency power value is subjected to IDCT (inverse discrete cosine transform) to set the reference pixel at the undecoded reference pixel position;
the reference pixel correction unit further corrects the destination frequency power value of the reference pixel prepared at an undecoded reference pixel position with the source frequency power value, and performs IDCT to multiply the correction amount added to the pixel value of the reference pixel prepared at the undecoded reference pixel position by a weight according to a distance between the undecoded reference pixel position and a decoded neighboring reference pixel used at that position, thereby adjusting the correction amount .
前記補正先周波数パワー値を前記補正元周波数パワー値で置き換えること、前記補正先周波数パワー値と前記補正元周波数パワー値との平均をとること、周波数ごとに所定比率で前記補正先周波数パワー値と前記補正元周波数パワー値をマージすること、のいずれかにより、前記補正先周波数パワー値の補正を行うことを特徴とする、符号化装置。 2. The encoding device according to claim 1 ,
A coding device, characterized in that the correction destination frequency power value is corrected by any one of replacing the correction destination frequency power value with the correction source frequency power value, taking an average of the correction destination frequency power value and the correction source frequency power value, and merging the correction destination frequency power value and the correction source frequency power value at a predetermined ratio for each frequency.
画面内予測部は、
被予測変換ユニット(TU)に対して、参照画素を準備し、未復号の参照画素位置に復号済の近傍参照画素と等しい参照画素を準備する、参照画素準備部と、
未復号の参照画素位置に準備した前記参照画素の周波数成分を補正する、参照画素補正部と、
補正された前記参照画素に基づいて、前記被予測変換ユニットの予測処理を行う、予測処理部と
を備え、
前記参照画素補正部は、未復号の参照画素位置で用いる復号済の近傍参照画素が属する変換ユニット内の参照画素の周波数パワー値を用いて、未復号の参照画素位置に準備した前記参照画素の周波数パワー値を補正する、復号装置であって、
前記参照画素補正部は、未復号の参照画素位置で用いる復号済の近傍参照画素が属する変換ユニット内の参照画素についてDCT(離散コサイン変換)を行うことにより各周波数に含まれる補正元周波数パワー値を求めるとともに、未復号の参照画素位置に準備した前記参照画素についてDCTを行うことにより各周波数に含まれる補正先周波数パワー値を求め、
前記補正元周波数パワー値で前記補正先周波数パワー値を補正し、
補正された前記補正先周波数パワー値をIDCT(逆離散コサイン変換)することにより未復号の参照画素位置の前記参照画素を設定し、
前記参照画素補正部はさらに、未復号の参照画素位置に準備した前記参照画素の前記補正先周波数パワー値を前記補正元周波数パワー値で補正し、IDCTすることにより、未復号の参照画素位置に準備した前記参照画素の画素値に加えられた補正量に対し、未復号の参照画素位置と、その位置で用いる復号済の近傍参照画素との間の距離に応じて重みを乗じ、前記補正量を調整することを特徴とする、復号装置。 In a decoding device that performs intra-frame prediction of an image,
The in-screen prediction unit
A reference pixel preparation unit that prepares reference pixels for a predicted transform unit (TU) and prepares reference pixels equal to decoded neighboring reference pixels at undecoded reference pixel positions;
a reference pixel correction unit that corrects a frequency component of the reference pixel prepared at an undecoded reference pixel position;
a prediction processing unit that performs a prediction process on the predicted conversion unit based on the corrected reference pixels,
The reference pixel correction unit corrects a frequency power value of a reference pixel prepared at an undecoded reference pixel position by using a frequency power value of a reference pixel in a transform unit to which a decoded neighboring reference pixel used at an undecoded reference pixel position belongs ,
the reference pixel correction unit obtains a source frequency power value included in each frequency by performing a discrete cosine transform (DCT) on a reference pixel in a transform unit to which a decoded neighboring reference pixel used at an undecoded reference pixel position belongs, and obtains a destination frequency power value included in each frequency by performing a DCT on the reference pixel prepared at an undecoded reference pixel position;
correcting the correction destination frequency power value with the correction source frequency power value;
The corrected frequency power value is subjected to IDCT (inverse discrete cosine transform) to set the reference pixel at the undecoded reference pixel position;
the reference pixel correction unit further corrects the destination frequency power value of the reference pixel prepared at an undecoded reference pixel position with the source frequency power value, and performs IDCT to multiply the correction amount added to the pixel value of the reference pixel prepared at the undecoded reference pixel position by a weight according to a distance between the undecoded reference pixel position and a nearby decoded reference pixel used at that position, thereby adjusting the correction amount .
A program causing a computer to function as the decoding device according to claim 3 .
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020012909A JP7594364B2 (en) | 2020-01-29 | 2020-01-29 | Encoding device, decoding device, and program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020012909A JP7594364B2 (en) | 2020-01-29 | 2020-01-29 | Encoding device, decoding device, and program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2021118525A JP2021118525A (en) | 2021-08-10 |
| JP7594364B2 true JP7594364B2 (en) | 2024-12-04 |
Family
ID=77175785
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2020012909A Active JP7594364B2 (en) | 2020-01-29 | 2020-01-29 | Encoding device, decoding device, and program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7594364B2 (en) |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008245088A (en) | 2007-03-28 | 2008-10-09 | Kddi R & D Laboratories Inc | Intra prediction system for moving image encoding apparatus and moving image decoding apparatus |
-
2020
- 2020-01-29 JP JP2020012909A patent/JP7594364B2/en active Active
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008245088A (en) | 2007-03-28 | 2008-10-09 | Kddi R & D Laboratories Inc | Intra prediction system for moving image encoding apparatus and moving image decoding apparatus |
Non-Patent Citations (1)
| Title |
|---|
| Jaeil Kim et al.,Improved Extrapolation for Intra Prediction Coding,Joint Collaborative Team on Video Coding (JCT-VC),2011年11月22日,[JCTVC-G594] (version 2) |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2021118525A (en) | 2021-08-10 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7777640B2 (en) | Cross-component prediction | |
| RU2694144C1 (en) | Improved intra prediction encoding using planar views | |
| JP6660074B2 (en) | Video decoding method and apparatus | |
| KR101789478B1 (en) | Intra prediction method of chrominance block using luminance sample, and apparatus using same | |
| WO2022191934A1 (en) | Sample offset with predefined filters | |
| US10735746B2 (en) | Method and apparatus for motion compensation prediction | |
| CN115136600B (en) | Methods, apparatus and readable storage media for video decoding | |
| CN116391355B (en) | Method, apparatus and storage medium for filtering video | |
| JP5594841B2 (en) | Image encoding apparatus and image decoding apparatus | |
| WO2006128072A2 (en) | Method and apparatus for coding motion and prediction weighting parameters | |
| US12250401B2 (en) | Harmonized design for offset based refinement and multiple reference line selection | |
| CN114143548B (en) | Coding and decoding of transform coefficients in video coding and decoding | |
| CN119324990A (en) | Video encoding and decoding method, device and storage medium | |
| JP7594364B2 (en) | Encoding device, decoding device, and program | |
| CN121547579A (en) | Image component prediction method, apparatus and computer storage medium | |
| CN116546218B (en) | Decoding prediction method, device and computer storage medium | |
| KR101938389B1 (en) | Intra prediction method and apparatus using the method | |
| KR20170082485A (en) | A method and an apparatus for decoding a video signal | |
| CN120323011A (en) | System and method for signaling and deriving quantization parameters for frame-level interpolation prediction mode | |
| CN120036002A (en) | Method, device and medium for video processing | |
| HK40051634A (en) | Methods and apparatuses for video decoding |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230104 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240131 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240213 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240403 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240730 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240828 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20241029 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20241122 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7594364 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |