JP7812892B2 - Prediction device, image encoding device, image decoding device, and program - Google Patents
Prediction device, image encoding device, image decoding device, and programInfo
- Publication number
- JP7812892B2 JP7812892B2 JP2024133213A JP2024133213A JP7812892B2 JP 7812892 B2 JP7812892 B2 JP 7812892B2 JP 2024133213 A JP2024133213 A JP 2024133213A JP 2024133213 A JP2024133213 A JP 2024133213A JP 7812892 B2 JP7812892 B2 JP 7812892B2
- Authority
- JP
- Japan
- Prior art keywords
- prediction
- image
- unit
- intra
- predicted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
本発明は、イントラ予測装置、画像符号化装置、画像復号装置、及びプログラムに関する。 The present invention relates to an intra-prediction device, an image encoding device, an image decoding device, and a program.
静止画像や動画像の伝送時や保存時のデータ量圧縮のため、映像符号化方式の研究が行われている。近年、映像符号化技術では8K-SHVに代表されるような超高解像度映像の普及が進んでおり、膨大なデータ量の動画像を伝送するための手法としてAVC/H.264やHEVC/H.265などの符号化方式が知られている。 Research is being conducted into video coding methods to compress the amount of data used to transmit and store still and moving images. In recent years, ultra-high-resolution video, such as 8K-SHV, has become increasingly popular in video coding technology, and coding methods such as AVC/H.264 and HEVC/H.265 are known as methods for transmitting massive amounts of moving image data.
MPEG及びITUが合同で標準化を行っている次世代映像符号化方式であるVVCの評価用ソフトウェア(VTM)では、フレーム内の空間的な相関を利用したイントラ予測が利用されている(非特許文献1参照)。符号化対象の画像ブロックの周辺の復号済み参照画素を利用して、Planar予測、DC予測、及び65通りの方向性予測の、計67通りの予測モードから、エンコーダ側で最適なモードが選択され、その情報がデコーダ側へ送られる。 The evaluation software (VTM) for VVC, the next-generation video coding standard being jointly standardized by MPEG and ITU, uses intra-prediction, which takes advantage of spatial correlation within a frame (see non-patent document 1). Using decoded reference pixels surrounding the image block to be coded, the encoder selects the optimal mode from a total of 67 prediction modes, including planar prediction, DC prediction, and 65 directional predictions, and sends this information to the decoder.
イントラ予測の予測精度を高めるための手法として、2つのイントラ予測モードによりそれぞれ予測画像を生成し、2つの予測画像の各画素を足し合わせて新しい予測画像を生成する予測画像合成手法が提案されている(非特許文献2参照)。具体的には、上述の65通りの方向性予測のうちいずれかのモードによって生成した予測画像である方向性予測画像と、Planarモードによって生成した予測画像であるPlanar予測画像とを足し合わせて予測画像を生成する。 As a method for improving the prediction accuracy of intra prediction, a prediction image synthesis method has been proposed in which a prediction image is generated using two intra prediction modes and each pixel of the two prediction images is added together to generate a new prediction image (see Non-Patent Document 2). Specifically, a prediction image is generated by adding a directional prediction image, which is a prediction image generated using one of the 65 directional prediction modes mentioned above, and a planar prediction image, which is a prediction image generated using the planar mode.
ところで、方向性予測は、参照画素に近い位置の画素については予測の精度が高いものの、参照画素から遠ざかるにつれて予測の精度が低くなりうるという欠点を有する。 By the way, directional prediction has the disadvantage that while it has high prediction accuracy for pixels close to the reference pixel, the prediction accuracy can decrease as the pixel moves away from the reference pixel.
しかしながら、非特許文献2に記載の予測画像合成手法は、方向性予測画像とPlanar予測画像とを単に画素単位で平均化するに過ぎないものであって、方向性予測の欠点について考慮しておらず、イントラ予測の予測精度をさらに高める点において改善の余地があった。 However, the predicted image synthesis method described in Non-Patent Document 2 simply averages directional predicted images and planar predicted images on a pixel-by-pixel basis, and does not take into account the drawbacks of directional prediction, leaving room for improvement in terms of further improving the prediction accuracy of intra prediction.
そこで、本発明は、予測画像合成手法によりイントラ予測の予測精度をさらに高めるイントラ予測装置、画像符号化装置、画像復号装置、及びプログラムを提供することを目的とする。 Therefore, the present invention aims to provide an intra prediction device, an image encoding device, an image decoding device, and a program that further improve the prediction accuracy of intra prediction using a predicted image synthesis technique.
第1の態様に係るイントラ予測装置は、原画像を分割して得た画像ブロックに対するイントラ予測を行う。前記イントラ予測装置は、方向性予測である第1イントラ予測モードにより前記画像ブロックを予測して第1予測画像を生成する第1予測画像生成部と、非方向性予測である第2イントラ予測モードにより前記画像ブロックを予測して第2予測画像を生成する第2予測画像生成部と、前記画像ブロックのブロックサイズ及びブロック形状のうち少なくとも一方に基づいて、前記第1予測画像及び前記第2予測画像を重み付け合成する際に用いる重み係数を決定する重み係数決定部と、前記重み係数決定部により決定された前記重み係数を用いて、前記第1予測画像及び前記第2予測画像を重み付け合成する画像合成部とを備える。 An intra prediction device according to a first aspect performs intra prediction on image blocks obtained by dividing an original image. The intra prediction device includes a first predicted image generation unit that predicts the image block using a first intra prediction mode, which is directional prediction, to generate a first predicted image; a second predicted image generation unit that predicts the image block using a second intra prediction mode, which is non-directional prediction, to generate a second predicted image; a weighting coefficient determination unit that determines a weighting coefficient to be used when weighting and combining the first predicted image and the second predicted image based on at least one of the block size and block shape of the image block; and an image synthesis unit that weights and combines the first predicted image and the second predicted image using the weighting coefficient determined by the weighting coefficient determination unit.
第2の態様に係る画像符号化装置は、第1の態様に係るイントラ予測装置を備える。 The image encoding device according to the second aspect includes the intra prediction device according to the first aspect.
第3の態様に係る画像復号装置は、第1の態様に係るイントラ予測装置を備える。 The image decoding device according to the third aspect includes the intra prediction device according to the first aspect.
第4の態様に係るプログラムは、コンピュータを第1の態様に係るイントラ予測装置として機能させる。 A program according to the fourth aspect causes a computer to function as the intra prediction device according to the first aspect.
本発明によれば、予測画像合成手法によりイントラ予測の予測精度をさらに高めるイントラ予測装置、画像符号化装置、画像復号装置、及びプログラムを提供できる。 The present invention provides an intra prediction device, an image encoding device, an image decoding device, and a program that further improve the prediction accuracy of intra prediction using a predicted image synthesis technique.
図面を参照して、実施形態に係る画像符号化装置及び画像復号装置について説明する。実施形態に係る画像符号化装置及び画像復号装置は、MPEGに代表される動画の符号化及び復号をそれぞれ行う。以下の図面の記載において、同一又は類似の部分には同一又は類似の符号を付している。 An image encoding device and an image decoding device according to an embodiment will be described with reference to the drawings. The image encoding device and the image decoding device according to the embodiment encode and decode moving images, respectively, as typified by MPEG. In the following description of the drawings, the same or similar parts are designated by the same or similar reference numerals.
<画像符号化装置の構成>
まず、本実施形態に係る画像符号化装置について説明する。図1は、本実施形態に係る画像符号化装置1の構成を示す図である。
<Configuration of Image Encoding Device>
First, an image encoding device according to this embodiment will be described. Fig. 1 is a diagram showing the configuration of an image encoding device 1 according to this embodiment.
図1に示すように、画像符号化装置1は、ブロック分割部100と、減算部110と、変換・量子化部120と、エントロピー符号化部130と、逆量子化・逆変換部140と、合成部150と、メモリ160と、予測部170とを有する。 As shown in FIG. 1, the image coding device 1 includes a block division unit 100, a subtraction unit 110, a transformation/quantization unit 120, an entropy coding unit 130, an inverse quantization/inverse transformation unit 140, a synthesis unit 150, a memory 160, and a prediction unit 170.
ブロック分割部100は、動画像を構成するフレーム(或いはピクチャ)単位の入力画像である原画像を複数の画像ブロックに分割し、分割により得た画像ブロックを減算部110に出力する。画像ブロックのサイズは、例えば32×32画素、16×16画素、8×8画素、又は4×4画素等である。画像ブロックの形状は正方形に限らず長方形(矩形)であってもよい。画像ブロックは、画像符号化装置1が符号化を行う単位(符号化対象ブロック)であり、且つ画像復号装置が復号を行う単位(復号対象ブロック)である。かかる画像ブロックはCU(Coding Unit)と呼ばれることがある。 The block division unit 100 divides an original image, which is an input image in units of frames (or pictures) that make up a moving image, into multiple image blocks and outputs the image blocks obtained by division to the subtraction unit 110. The size of the image blocks is, for example, 32 x 32 pixels, 16 x 16 pixels, 8 x 8 pixels, or 4 x 4 pixels. The shape of the image blocks is not limited to squares and may be rectangular (rectangular). An image block is a unit of encoding performed by the image encoding device 1 (block to be encoded) and a unit of decoding performed by the image decoding device (block to be decoded). Such an image block is sometimes called a CU (Coding Unit).
減算部110は、ブロック分割部100から入力された符号化対象ブロックと、符号化対象ブロックを予測部170が予測して得た予測画像との差分(誤差)を表す予測残差を算出する。具体的には、減算部110は、ブロックの各画素値から予測画像の各画素値を減算することにより予測残差を算出し、算出した予測残差を変換・量子化部120に出力する。 The subtraction unit 110 calculates a prediction residual that represents the difference (error) between the current block to be coded input from the block division unit 100 and the predicted image obtained by the prediction unit 170 predicting the current block to be coded. Specifically, the subtraction unit 110 calculates the prediction residual by subtracting each pixel value of the predicted image from each pixel value of the block, and outputs the calculated prediction residual to the transformation/quantization unit 120.
変換・量子化部120は、ブロック単位で直交変換処理及び量子化処理を行う。変換・量子化部120は、変換部121と、量子化部122とを有する。 The transform/quantization unit 120 performs orthogonal transform processing and quantization processing on a block-by-block basis. The transform/quantization unit 120 includes a transform unit 121 and a quantization unit 122.
変換部121は、減算部110から入力された予測残差に対して直交変換処理を行って直交変換係数を算出し、算出した直交変換係数を量子化部122に出力する。直交変換とは、例えば、離散コサイン変換(DCT:Discrete Cosine Transform)や離散サイン変換(DST:Discrete Sine Transform)、カルーネンレーブ変換(KLT: Karhunen-Loeve Transform)等をいう。 The transform unit 121 performs orthogonal transform processing on the prediction residuals input from the subtraction unit 110 to calculate orthogonal transform coefficients, and outputs the calculated orthogonal transform coefficients to the quantization unit 122. Examples of orthogonal transform include the discrete cosine transform (DCT), discrete sine transform (DST), and Karhunen-Loeve transform (KLT).
量子化部122は、変換部121から入力された直交変換係数を量子化パラメータ(Qp)及び量子化行列を用いて量子化し、量子化した直交変換係数をエントロピー符号化部130及び逆量子化・逆変換部140に出力する。なお、量子化パラメータ(Qp)は、ブロック内の各直交変換係数に対して共通して適用されるパラメータであって、量子化の粗さを定めるパラメータである。量子化行列は、各直交変換係数を量子化する際の量子化値を要素として有する行列である。 The quantization unit 122 quantizes the orthogonal transform coefficients input from the transform unit 121 using a quantization parameter (Qp) and a quantization matrix, and outputs the quantized orthogonal transform coefficients to the entropy coding unit 130 and the inverse quantization and inverse transform unit 140. The quantization parameter (Qp) is a parameter that is commonly applied to each orthogonal transform coefficient in a block and determines the coarseness of quantization. The quantization matrix is a matrix whose elements are the quantization values used when quantizing each orthogonal transform coefficient.
エントロピー符号化部130は、量子化部122から入力された直交変換係数に対してエントロピー符号化を行い、データ圧縮を行って符号化データ(ビットストリーム)を生成し、符号化データを画像符号化装置1の外部に出力する。エントロピー符号化には、ハフマン符号やCABAC(Context-based Adaptive Binary Arithmetic Coding;コンテキスト適応型2値算術符号)等を用いることができる。なお、エントロピー符号化部130は、予測部170から予測に関するシンタックス等の情報が入力され、入力された情報のエントロピー符号化も行う。 The entropy coding unit 130 performs entropy coding on the orthogonal transform coefficients input from the quantization unit 122, compresses the data, generates coded data (bitstream), and outputs the coded data to the outside of the image coding device 1. Entropy coding can use Huffman coding or CABAC (Context-based Adaptive Binary Arithmetic Coding), among others. The entropy coding unit 130 also receives information such as syntax related to prediction from the prediction unit 170 and performs entropy coding on the input information.
逆量子化・逆変換部140は、ブロック単位で逆量子化処理及び逆直交変換処理を行う。逆量子化・逆変換部140は、逆量子化部141と、逆変換部142とを有する。 The inverse quantization and inverse transform unit 140 performs inverse quantization and inverse orthogonal transform processing on a block-by-block basis. The inverse quantization and inverse transform unit 140 includes an inverse quantization unit 141 and an inverse transform unit 142.
逆量子化部141は、量子化部122が行う量子化処理に対応する逆量子化処理を行う。具体的には、逆量子化部141は、量子化部122から入力された直交変換係数を、量子化パラメータ(Qp)及び量子化行列を用いて逆量子化することにより直交変換係数を復元し、復元した直交変換係数を逆変換部142に出力する。 The inverse quantization unit 141 performs inverse quantization processing corresponding to the quantization processing performed by the quantization unit 122. Specifically, the inverse quantization unit 141 restores the orthogonal transform coefficients by inverse quantizing the orthogonal transform coefficients input from the quantization unit 122 using a quantization parameter (Qp) and a quantization matrix, and outputs the restored orthogonal transform coefficients to the inverse transform unit 142.
逆変換部142は、変換部121が行う直交変換処理に対応する逆直交変換処理を行う。例えば、変換部121が離散コサイン変換を行った場合には、逆変換部142は逆離散コサイン変換を行う。逆変換部142は、逆量子化部141から入力された直交変換係数に対して逆直交変換処理を行って予測残差を復元し、復元した予測残差である復元予測残差を合成部150に出力する。 The inverse transform unit 142 performs inverse orthogonal transform processing corresponding to the orthogonal transform processing performed by the transform unit 121. For example, if the transform unit 121 performs a discrete cosine transform, the inverse transform unit 142 performs an inverse discrete cosine transform. The inverse transform unit 142 performs inverse orthogonal transform processing on the orthogonal transform coefficients input from the inverse quantization unit 141 to restore the prediction residual, and outputs the restored prediction residual, which is the restored prediction residual, to the synthesis unit 150.
合成部150は、逆変換部142から入力された復元予測残差を、予測部170から入力された予測画像と画素単位で合成する。合成部150は、復元予測残差の各画素値と予測画像の各画素値を加算して符号化対象ブロックを再構成(復号)し、復号したブロック単位の復号画像をメモリ160に出力する。かかる復号画像は、再構成画像と呼ばれることがある。 The synthesis unit 150 synthesizes, on a pixel-by-pixel basis, the reconstructed prediction residual input from the inverse transform unit 142 with the predicted image input from the prediction unit 170. The synthesis unit 150 adds each pixel value of the reconstructed prediction residual to each pixel value of the predicted image to reconstruct (decode) the block to be coded, and outputs the decoded image on a block-by-block basis to the memory 160. Such a decoded image is sometimes called a reconstructed image.
メモリ160は、合成部150から入力された復号画像を記憶する。メモリ160は、復号画像をフレーム単位で記憶する。メモリ160は、記憶している復号画像を予測部170に出力する。なお、合成部150とメモリ160との間にループフィルタが設けられてもよい。なお、メモリ160の一部は、予測部170に含まれていてもよい。 Memory 160 stores the decoded image input from synthesis unit 150. Memory 160 stores the decoded image on a frame-by-frame basis. Memory 160 outputs the stored decoded image to prediction unit 170. Note that a loop filter may be provided between synthesis unit 150 and memory 160. Note that part of memory 160 may be included in prediction unit 170.
予測部170は、ブロック単位で予測を行う。予測部170は、インター予測部171と、イントラ予測部172と、切替部173とを有する。 The prediction unit 170 performs prediction on a block-by-block basis. The prediction unit 170 includes an inter prediction unit 171, an intra prediction unit 172, and a switching unit 173.
インター予測部171は、メモリ160に記憶された復号画像を参照画像として用いて、ブロックマッチングなどの手法により動きベクトルを算出し、符号化対象ブロックを予測してインター予測画像を生成し、生成したインター予測画像を切替部173に出力する。 The inter prediction unit 171 uses the decoded image stored in the memory 160 as a reference image to calculate a motion vector using a technique such as block matching, predicts the block to be coded, generates an inter prediction image, and outputs the generated inter prediction image to the switching unit 173.
インター予測部171は、複数の参照画像を用いるインター予測(典型的には、双予測)や、1つの参照画像を用いるインター予測(片方向予測)の中から最適なインター予測方法を選択し、選択したインター予測方法を用いてインター予測を行う。インター予測部171は、インター予測に関する情報(動きベクトル等)をエントロピー符号化部130に出力する。 The inter prediction unit 171 selects the optimal inter prediction method from among inter prediction using multiple reference images (typically bi-prediction) and inter prediction using a single reference image (unidirectional prediction), and performs inter prediction using the selected inter prediction method. The inter prediction unit 171 outputs information related to the inter prediction (motion vectors, etc.) to the entropy coding unit 130.
イントラ予測部172は、メモリ160に記憶された復号画像のうち、符号化対象ブロックの周辺にある復号画素値を参照してイントラ予測画像を生成し、生成したイントラ予測画像を切替部173に出力する。また、イントラ予測部172は、選択した予測モードに関するシンタックスをエントロピー符号化部130に出力する。以下において、イントラ予測の対象となるブロックをイントラ予測対象ブロックと呼ぶ。 The intra prediction unit 172 generates an intra prediction image by referencing decoded pixel values surrounding the block to be coded among the decoded images stored in the memory 160, and outputs the generated intra prediction image to the switching unit 173. The intra prediction unit 172 also outputs syntax related to the selected prediction mode to the entropy coding unit 130. Hereinafter, the block to be intra prediction is referred to as the intra prediction target block.
イントラ予測部172は、複数の予測モードの中から、イントラ予測対象ブロックに適用する最適な予測モードを選択し、選択した予測モードを用いてイントラ予測対象ブロックを予測する。 The intra prediction unit 172 selects the optimal prediction mode to apply to the block to be intra-predicted from among multiple prediction modes, and predicts the block to be intra-predicted using the selected prediction mode.
図2は、本実施形態に係るイントラ予測の予測モードを示す図である。図2に示すように、0から66までの67通りの予測モードがある。予測モードのモード「0」はPlanar予測であり、予測モードのモード「1」はDC予測であり、予測モードのモード「2」乃至「66」は方向性予測である。方向性予測において、矢印の方向は予測方向を示し、矢印の起点は予測対象の画素の位置を示し、矢印の終点はこの予測対象画素の予測に用いる参照画素の位置を示す。モード「2」~「33」は、イントラ予測の対象ブロックの左側の参照画素を主として参照する予測モードである。一方で、モード「35」~「66」は、イントラ予測の対象ブロックの上側の参照画素を主として参照する予測モードである。 Figure 2 is a diagram showing prediction modes for intra prediction according to this embodiment. As shown in Figure 2, there are 67 prediction modes, from 0 to 66. Prediction mode mode "0" is planar prediction, prediction mode mode "1" is DC prediction, and prediction modes "2" to "66" are directional prediction. In directional prediction, the direction of the arrow indicates the prediction direction, the starting point of the arrow indicates the position of the pixel to be predicted, and the end point of the arrow indicates the position of the reference pixel used to predict this pixel to be predicted. Modes "2" to "33" are prediction modes that primarily reference reference pixels on the left side of the block to be intra predicted. On the other hand, modes "35" to "66" are prediction modes that primarily reference reference pixels on the top side of the block to be intra predicted.
切替部173は、インター予測部171から入力されるインター予測画像とイントラ予測部172から入力されるイントラ予測画像とを切り替えて、いずれかの予測画像を減算部110及び合成部150に出力する。 The switching unit 173 switches between the inter-predicted image input from the inter-prediction unit 171 and the intra-predicted image input from the intra-prediction unit 172, and outputs either of the predicted images to the subtraction unit 110 and the synthesis unit 150.
図3は、本実施形態に係るイントラ予測部172の構成を示す図である。イントラ予測部172は、画像符号化装置1に設けられるイントラ予測装置に相当する。 Figure 3 shows the configuration of the intra prediction unit 172 according to this embodiment. The intra prediction unit 172 corresponds to the intra prediction device provided in the image encoding device 1.
図3に示すように、イントラ予測部172は、メモリ160aと、第1予測画像生成部172aと、第2予測画像生成部172bと、重み係数決定部172cと、画像合成部172dとを有する。 As shown in FIG. 3, the intra prediction unit 172 includes a memory 160a, a first predicted image generation unit 172a, a second predicted image generation unit 172b, a weighting coefficient determination unit 172c, and an image synthesis unit 172d.
メモリ160aは、図1に示すメモリ160の一部である。メモリ160aは、イントラ予測の際に参照される復号済み画素である参照画素を記憶する。 Memory 160a is part of memory 160 shown in Figure 1. Memory 160a stores reference pixels, which are decoded pixels that are referenced during intra prediction.
第1予測画像生成部172aは、方向性予測である第1イントラ予測モードによりイントラ予測対象ブロックを予測して方向性予測画像(第1予測画像)を生成し、生成した方向性予測画像を画像合成部172dに出力する。具体的には、第1予測画像生成部172aは、メモリ160aに記憶された参照画素を参照し、65通りの方向性予測のうちいずれかのモードによって方向性予測画像を生成する。 The first predicted image generation unit 172a predicts the block to be intra-predicted using a first intra-prediction mode, which is directional prediction, to generate a directional predicted image (first predicted image), and outputs the generated directional predicted image to the image synthesis unit 172d. Specifically, the first predicted image generation unit 172a references reference pixels stored in memory 160a and generates a directional predicted image using one of 65 directional prediction modes.
第2予測画像生成部172bは、非方向性予測である第2イントラ予測モードによりイントラ予測対象ブロックを予測して予測画像(第2予測画像)を生成し、生成した予測画像を画像合成部172dに出力する。具体的には、第2予測画像生成部172bは、メモリ160aに記憶された参照画素を参照し、予め定められた非方向性の第2イントラ予測モードによって方向性予測画像を生成する。 The second predicted image generation unit 172b predicts the block to be intra-predicted using a second intra prediction mode, which is non-directional prediction, to generate a predicted image (second predicted image), and outputs the generated predicted image to the image synthesis unit 172d. Specifically, the second predicted image generation unit 172b references reference pixels stored in memory 160a and generates a directional predicted image using a predetermined non-directional second intra prediction mode.
第2イントラ予測モードは、非方向性の予測モードであればどのような予測モードであってもよいが、本実施形態において第2イントラ予測モードがPlanar予測である一例について説明する。 The second intra prediction mode may be any non-directional prediction mode, but in this embodiment, an example will be described in which the second intra prediction mode is planar prediction.
重み係数決定部172cは、イントラ予測対象ブロックのブロックサイズ及びブロック形状のうち少なくとも一方に基づいて重み係数を決定し、決定した重み係数を画像合成部172dに出力する。重み係数決定部172cが出力する重み係数は、第1予測画像生成部172aが生成する方向性予測画像及び第2予測画像生成部172bが生成するPlanar予測画像を重み付け合成する際に用いられる。 The weighting coefficient determination unit 172c determines a weighting coefficient based on at least one of the block size and block shape of the block to be intra-predicted, and outputs the determined weighting coefficient to the image synthesis unit 172d. The weighting coefficient output by the weighting coefficient determination unit 172c is used when weighting and synthesizing the directional predicted image generated by the first predicted image generation unit 172a and the planar predicted image generated by the second predicted image generation unit 172b.
画像合成部172dは、重み係数決定部172cから入力された重み係数を用いて、第1予測画像生成部172aから入力された方向性予測画像及び第2予測画像生成部172bから入力されたPlanar予測画像を重み付け合成し、重み付け合成後の予測画像をイントラ予測画像として出力する。 The image synthesis unit 172d uses the weighting coefficients input from the weighting coefficient determination unit 172c to weight-synthesize the directional prediction image input from the first prediction image generation unit 172a and the planar prediction image input from the second prediction image generation unit 172b, and outputs the weighted-synthesized prediction image as an intra-prediction image.
図4は、本実施形態に係るイントラ予測部172の動作例を示す図である。図4において、イントラ予測対象ブロックが8×8画素の正方形状である一例を例示しているが、イントラ予測対象ブロックは正方形でなくてもよい。また、図4における黒丸は参照画素を表す。 Figure 4 is a diagram showing an example of the operation of the intra prediction unit 172 according to this embodiment. Figure 4 illustrates an example in which the block to be intra predicted is a square of 8x8 pixels, but the block to be intra predicted does not have to be square. Also, the black circles in Figure 4 represent reference pixels.
図4(a)に示すように、第2予測画像生成部172bは、Planar予測によりイントラ予測対象ブロックを予測してPlanar予測画像を生成する。具体的には、Planar予測は、図4(a)に示す4つの参照画素を用いて内挿予測により予測画素値を生成するものである。 As shown in Figure 4(a), the second predicted image generation unit 172b predicts the intra-prediction target block using planar prediction to generate a planar predicted image. Specifically, planar prediction generates predicted pixel values by interpolation prediction using the four reference pixels shown in Figure 4(a).
図4(b)に示すように、第1予測画像生成部172aは、方向性予測モードによりイントラ予測対象ブロックを予測して方向性予測画像を生成する。方向性予測は、参照画素を予測方向に沿って外挿して予測画素値を生成するものであるため、参照画素に近い位置の画素については予測の精度が高いものの、参照画素から遠ざかるにつれて予測の精度が低くなりうるという欠点を有する。 As shown in Figure 4(b), the first predicted image generation unit 172a predicts the block to be intra-predicted using a directional prediction mode to generate a directional predicted image. Directional prediction generates predicted pixel values by extrapolating reference pixels along the prediction direction, so while prediction accuracy is high for pixels close to the reference pixels, it has the disadvantage that prediction accuracy can decrease as pixels move farther away from the reference pixels.
重み係数決定部172cは、イントラ予測対象ブロックのブロックサイズ及びブロック形状のうち少なくとも一方に基づいて重み係数を決定する。本実施形態において、重み係数決定部172cは、Planar予測画像に適用する重み係数α(第2重み係数)と、方向性予測画像に適用する重み係数β(第1重み係数)とを決定する。 The weighting factor determination unit 172c determines weighting factors based on at least one of the block size and block shape of the block to be intra-predicted. In this embodiment, the weighting factor determination unit 172c determines the weighting factor α (second weighting factor) to be applied to the planar predicted image and the weighting factor β (first weighting factor) to be applied to the directional predicted image.
図4(c)に示すように、画像合成部172dは、第1予測画像生成部172aが生成した方向性予測画像の画素ごとに重み係数βを適用するとともに、第2予測画像生成部172bが生成したPlanar予測画像の画素ごとに重み係数αを適用し、且つ、方向性予測画像及びPlanar予測画像を画素単位で合成し、合成後の予測画像をイントラ予測画像として出力する。 As shown in FIG. 4(c), the image synthesis unit 172d applies a weighting factor β to each pixel of the directional predicted image generated by the first predicted image generation unit 172a, and applies a weighting factor α to each pixel of the planar predicted image generated by the second predicted image generation unit 172b, synthesizes the directional predicted image and the planar predicted image on a pixel-by-pixel basis, and outputs the synthesized predicted image as an intra-predicted image.
図5は、本実施形態に係る重み係数決定部172cの動作例1を示す図である。図5において、「小さい一辺の長さ」は、矩形状のイントラ予測対象ブロックの短辺の長さを画素数で表したものである。すなわち、「小さい一辺の長さ」は、イントラ予測対象ブロックのブロックサイズを表す。一方、図5の「α:β」は、重み係数αの重み係数βに対する比を表す。 Figure 5 shows a first example of the operation of the weighting coefficient determination unit 172c according to this embodiment. In Figure 5, the "length of the shortest side" is the length of the shortest side of the rectangular block to be intra-predicted, expressed in number of pixels. In other words, the "length of the shortest side" represents the block size of the block to be intra-predicted. Meanwhile, "α:β" in Figure 5 represents the ratio of weighting coefficient α to weighting coefficient β.
ここではイントラ予測対象ブロックのブロックサイズを示す一例として「小さい一辺の長さ」を提示したが、ほかの例として「ブロックの幅+ブロックの高さ」や「ブロックの幅×ブロックの高さ」などを用いても構わない。 Here, "the length of the smallest side" is presented as an example of the block size of the block to be intra-predicted, but other examples such as "block width + block height" or "block width x block height" can also be used.
図5に示すように、重み係数決定部172cは、イントラ予測対象ブロックのブロックサイズが大きくなるにつれて、方向性予測画像の重み(β)に対するPlanar予測画像の重み(α)の比を大きくするように、重み係数α及びβを決定する。 As shown in Figure 5, the weighting coefficient determination unit 172c determines the weighting coefficients α and β so that the ratio of the weight (α) of the planar prediction image to the weight (β) of the directional prediction image increases as the block size of the block to be intra-predicted increases.
図5に示す例において、ブロックサイズが「8」である場合、Planar予測画像の重み(α)と方向性予測画像の重み(β)とが等しい。この場合、画像合成部172dは、Planar予測画像と方向性予測画像との平均をとって得た予測画像をイントラ予測画像として出力する。以下において、ブロックサイズ「8」を基準ブロックサイズと呼ぶ。 In the example shown in Figure 5, when the block size is "8", the weight (α) of the planar predicted image and the weight (β) of the directional predicted image are equal. In this case, the image synthesis unit 172d outputs the predicted image obtained by averaging the planar predicted image and the directional predicted image as the intra predicted image. Hereinafter, the block size "8" will be referred to as the reference block size.
基準ブロックサイズよりも小さいブロックサイズ「4」である場合、重み係数決定部172cは、Planar予測画像の重み(α=1)が方向性予測画像の重み(β=2)よりも小さくなるように重み係数α及びβを決定する。この場合、画像合成部172dが出力するイントラ予測画像のうちPlanar予測画像の占める割合が小さくなる。 When the block size is "4" which is smaller than the reference block size, the weighting coefficient determination unit 172c determines the weighting coefficients α and β so that the weight of the planar predicted image (α = 1) is smaller than the weight of the directional predicted image (β = 2). In this case, the proportion of the planar predicted image in the intra predicted image output by the image synthesis unit 172d becomes smaller.
一方、重み係数決定部172cは、基準ブロックサイズよりもブロックサイズが大きくなるにつれて、Planar予測画像の重み(α)が方向性予測画像の重み(β)よりも大きくなるように重み係数α及びβを決定する。この場合、画像合成部172dが出力するイントラ予測画像のうちPlanar予測画像の占める割合が大きくなる。 On the other hand, as the block size becomes larger than the reference block size, the weighting coefficient determination unit 172c determines the weighting coefficients α and β so that the weight (α) of the planar predicted image becomes larger than the weight (β) of the directional predicted image. In this case, the proportion of planar predicted images in the intra predicted images output by the image synthesis unit 172d increases.
ここで、方向性予測においては、イントラ予測対象ブロックのブロックサイズが大きくなるほど、参照画素から遠い画素の予測精度が低くなりうる。このため、Planar予測画像の占める割合を大きくし、且つ、方向性予測画像の占める割合を小さくするように重み係数α及びβを決定することにより、予測精度を改善できる。 Here, in directional prediction, the larger the block size of the block to be intra-predicted, the lower the prediction accuracy of pixels farther from the reference pixel. Therefore, prediction accuracy can be improved by determining the weighting factors α and β so that the proportion of planar predicted images is increased and the proportion of directional predicted images is decreased.
なお、図5に示す重み係数α及びβの決定方法は一例であって、重み係数α及びβの具体的な値については図5に示す例に限定されるものではない。 Note that the method for determining the weighting coefficients α and β shown in Figure 5 is just one example, and the specific values of the weighting coefficients α and β are not limited to the example shown in Figure 5.
図6は、本実施形態に係る重み係数決定部172cの動作例2を示す図である。図6において、「width/heightまたはheight/widthの大きい方」は、イントラ予測対象ブロックについて、幅(width)/高さ(height)の値、高さ(height)/幅(width)の値のうち、大きい方の値である。すなわち、「width/heightまたはheight/widthの大きい方」は、イントラ予測対象ブロックが細長形状であるほど大きくなる値である。一方、図6の「α:β」は、重み係数αの重み係数βに対する比を表す。 Figure 6 is a diagram showing a second example of the operation of the weighting coefficient determination unit 172c according to this embodiment. In Figure 6, the "larger of width/height or height/width" refers to the larger of the width/height or height/width values for the block to be intra-predicted. In other words, the "larger of width/height or height/width" is a value that increases as the shape of the block to be intra-predicted becomes more elongated. Meanwhile, "α:β" in Figure 6 represents the ratio of weighting coefficient α to weighting coefficient β.
図6に示すように、重み係数決定部172cは、矩形状のイントラ予測対象ブロックの短辺に対する長辺の比が大きくなるにつれて、方向性予測画像の重み(β)に対するPlanar予測画像の重み(α)の比を小さくするように、重み係数α及びβを決定する。なお、短辺とは矩形の短い方の辺をいい、長辺とは矩形の長い方の辺をいう。 As shown in Figure 6, the weighting coefficient determination unit 172c determines the weighting coefficients α and β so that the ratio of the weight (α) of the planar predicted image to the weight (β) of the directional predicted image decreases as the ratio of the long side to the short side of the rectangular intra-prediction target block increases. Note that the short side refers to the shorter side of the rectangle, and the long side refers to the longer side of the rectangle.
言い換えると、重み係数決定部172cは、イントラ予測対象ブロックが細長形状であるほど、方向性予測画像の重み(β)に対するPlanar予測画像の重み(α)の比を小さくするように、重み係数α及びβを決定する。 In other words, the weighting coefficient determination unit 172c determines the weighting coefficients α and β so that the ratio of the weight (α) of the planar prediction image to the weight (β) of the directional prediction image becomes smaller the more elongated the shape of the block to be intra-predicted.
図6に示す例において、「width/heightまたはheight/widthの大きい方」が「1」である場合、すなわち、イントラ予測対象ブロックが正方形である場合、Planar予測画像の重み(α)と方向性予測画像の重み(β)とが等しい。この場合、画像合成部172dは、Planar予測画像と方向性予測画像との平均をとって得た予測画像をイントラ予測画像として出力する。以下において、正方形のイントラ予測対象ブロックを基準形状と呼ぶ。 In the example shown in Figure 6, if the "larger of width/height or height/width" is "1," that is, if the target block for intra prediction is square, the weight (α) of the planar predicted image and the weight (β) of the directional predicted image are equal. In this case, the image synthesis unit 172d outputs the predicted image obtained by averaging the planar predicted image and the directional predicted image as the intra predicted image. Hereinafter, the square target block for intra prediction is referred to as the reference shape.
重み係数決定部172cは、イントラ予測対象ブロックが基準形状(正方形)から細長形状に変化するにつれて、Planar予測画像の重み(α)が方向性予測画像の重み(β)よりも小さくなるように重み係数α及びβを決定する。この場合、画像合成部172dが出力するイントラ予測画像のうちPlanar予測画像の占める割合が小さくなる。 As the intra-prediction target block changes from its reference shape (square) to an elongated shape, the weighting coefficient determination unit 172c determines the weighting coefficients α and β so that the weight (α) of the planar prediction image becomes smaller than the weight (β) of the directional prediction image. In this case, the proportion of the planar prediction image in the intra-prediction image output by the image synthesis unit 172d decreases.
ここで、方向性予測においては、イントラ予測対象ブロックが細長形状であるほど、参照画素から遠く離れた画素を予測する可能性が小さくなり、予測精度が高くなりうる。このため、Planar予測画像の占める割合を小さくし、且つ、方向性予測画像の占める割合を大きくするように重み係数α及びβを決定することにより、予測精度を改善できる。 Here, in directional prediction, the more elongated the block to be intra-predicted is, the less likely it is to predict pixels farther away from the reference pixel, potentially resulting in higher prediction accuracy. Therefore, prediction accuracy can be improved by determining the weighting factors α and β so that the proportion of planar predicted images is reduced and the proportion of directional predicted images is increased.
なお、図6に示す重み係数α及びβの決定方法は一例であって、重み係数α及びβの具体的な値については図6に示す例に限定されるものではない。 Note that the method for determining the weighting coefficients α and β shown in Figure 6 is just one example, and the specific values of the weighting coefficients α and β are not limited to the example shown in Figure 6.
また、重み係数決定部172cの動作例1と動作例2とを組み合わせて実施してもよい。例えば、「小さい一辺の長さ」(すなわち、ブロックサイズ)の値ごとに、図6のようなテーブルを別々に定義してもよい。或いは、「width/heightまたはheight/widthの大きい方」の値ごとに、図5のようなテーブルを別々に定義してもよい。 Furthermore, operation example 1 and operation example 2 of the weighting coefficient determination unit 172c may be combined and implemented. For example, a table like that shown in Figure 6 may be defined separately for each value of the "length of the smallest side" (i.e., block size). Alternatively, a table like that shown in Figure 5 may be defined separately for each value of the "larger of width/height or height/width."
<画像復号装置の構成>
次に、本実施形態に係る画像復号装置について説明する。図7は、本実施形態に係る画像復号装置2の構成を示す図である。
<Configuration of Image Decoding Device>
Next, an image decoding device according to this embodiment will be described. Fig. 7 is a diagram showing the configuration of an image decoding device 2 according to this embodiment.
図7に示すように、画像復号装置2は、エントロピー復号部200と、逆量子化・逆変換部210と、合成部220と、メモリ230と、予測部240とを有する。 As shown in FIG. 7, the image decoding device 2 has an entropy decoding unit 200, an inverse quantization/inverse transform unit 210, a synthesis unit 220, a memory 230, and a prediction unit 240.
エントロピー復号部200は、画像符号化装置1により生成された符号化データを復号し、量子化された直交変換係数を逆量子化・逆変換部210に出力する。また、エントロピー復号部200は、予測(イントラ予測及びインター予測)に関するシンタックスを取得し、取得したシンタックスを予測部240に出力する。 The entropy decoding unit 200 decodes the coded data generated by the image coding device 1 and outputs the quantized orthogonal transform coefficients to the inverse quantization and inverse transform unit 210. The entropy decoding unit 200 also acquires syntax related to prediction (intra prediction and inter prediction) and outputs the acquired syntax to the prediction unit 240.
逆量子化・逆変換部210は、ブロック単位で逆量子化処理及び逆直交変換処理を行う。逆量子化・逆変換部210は、逆量子化部211と、逆変換部212とを有する。 The inverse quantization and inverse transform unit 210 performs inverse quantization processing and inverse orthogonal transform processing on a block-by-block basis. The inverse quantization and inverse transform unit 210 includes an inverse quantization unit 211 and an inverse transform unit 212.
逆量子化部211は、画像符号化装置1の量子化部122が行う量子化処理に対応する逆量子化処理を行う。逆量子化部211は、エントロピー復号部200から入力された量子化直交変換係数を、量子化パラメータ(Qp)及び量子化行列を用いて逆量子化することにより、復号対象ブロックの直交変換係数を復元し、復元した直交変換係数を逆変換部212に出力する。 The inverse quantization unit 211 performs inverse quantization processing corresponding to the quantization processing performed by the quantization unit 122 of the image encoding device 1. The inverse quantization unit 211 reconstructs the orthogonal transform coefficients of the block to be decoded by inverse quantizing the quantized orthogonal transform coefficients input from the entropy decoding unit 200 using a quantization parameter (Qp) and a quantization matrix, and outputs the reconstructed orthogonal transform coefficients to the inverse transform unit 212.
逆変換部212は、画像符号化装置1の変換部121が行う直交変換処理に対応する逆直交変換処理を行う。逆変換部212は、逆量子化部211から入力された直交変換係数に対して逆直交変換処理を行って予測残差を復元し、復元した予測残差(復元予測残差)を合成部220に出力する。 The inverse transform unit 212 performs inverse orthogonal transform processing corresponding to the orthogonal transform processing performed by the transform unit 121 of the image encoding device 1. The inverse transform unit 212 performs inverse orthogonal transform processing on the orthogonal transform coefficients input from the inverse quantization unit 211 to restore the prediction residual, and outputs the restored prediction residual (restored prediction residual) to the synthesis unit 220.
合成部220は、逆変換部212から入力された予測残差と、予測部240から入力された予測画像とを画素単位で合成することにより、元のブロックを再構成(復号)し、ブロック単位の復号画像をメモリ230に出力する。 The synthesis unit 220 reconstructs (decodes) the original block by synthesizing the prediction residual input from the inverse transform unit 212 and the predicted image input from the prediction unit 240 on a pixel-by-pixel basis, and outputs the decoded image on a block-by-block basis to the memory 230.
メモリ230は、合成部220から入力された復号画像を記憶する。メモリ230は、復号画像をフレーム単位で記憶する。メモリ230は、フレーム単位の復号画像を画像復号装置2の外部に出力する。なお、合成部220とメモリ230との間にループフィルタが設けられてもよい。また、メモリ230の一部は、予測部240に含まれていてもよい。 The memory 230 stores the decoded image input from the synthesis unit 220. The memory 230 stores the decoded image in frame units. The memory 230 outputs the decoded image in frame units to the outside of the image decoding device 2. Note that a loop filter may be provided between the synthesis unit 220 and the memory 230. Furthermore, a portion of the memory 230 may be included in the prediction unit 240.
予測部240は、ブロック単位で予測を行う。予測部240は、インター予測部241と、イントラ予測部242と、切替部243とを有する。 The prediction unit 240 performs prediction on a block-by-block basis. The prediction unit 240 has an inter prediction unit 241, an intra prediction unit 242, and a switching unit 243.
インター予測部241は、メモリ230に記憶された復号画像を参照画像として用いて、復号対象ブロックをインター予測により予測する。インター予測部241は、エントロピー復号部200から入力されたシンタックス及び動きベクトル等に従ってインター予測を行うことによりインター予測画像を生成し、生成したインター予測画像を切替部243に出力する。 The inter prediction unit 241 predicts the current block to be decoded by inter prediction, using the decoded image stored in the memory 230 as a reference image. The inter prediction unit 241 generates an inter prediction image by performing inter prediction in accordance with the syntax, motion vectors, etc. input from the entropy decoding unit 200, and outputs the generated inter prediction image to the switching unit 243.
イントラ予測部242は、メモリ230に記憶された復号画像を参照し、エントロピー復号部200から入力されたシンタックスに基づいて、復号対象ブロックをイントラ予測により予測することによりイントラ予測画像を生成し、生成したイントラ予測画像を切替部243に出力する。 The intra prediction unit 242 references the decoded image stored in the memory 230 and generates an intra prediction image by predicting the block to be decoded using intra prediction based on the syntax input from the entropy decoding unit 200, and outputs the generated intra prediction image to the switching unit 243.
切替部243は、インター予測部241から入力されるインター予測画像とイントラ予測部242から入力されるイントラ予測画像とを切り替えて、いずれかの予測画像を合成部220に出力する。 The switching unit 243 switches between the inter-predicted image input from the inter-prediction unit 241 and the intra-predicted image input from the intra-prediction unit 242, and outputs one of the predicted images to the synthesis unit 220.
図8は、本実施形態に係るイントラ予測部242の構成を示す図である。イントラ予測部242は、画像復号装置2に設けられるイントラ予測装置に相当する。イントラ予測部242は、画像符号化装置1に設けられるイントラ予測部172と同様な動作を行う。 Figure 8 shows the configuration of the intra prediction unit 242 according to this embodiment. The intra prediction unit 242 corresponds to the intra prediction device provided in the image decoding device 2. The intra prediction unit 242 performs operations similar to those of the intra prediction unit 172 provided in the image encoding device 1.
図8に示すように、イントラ予測部242は、メモリ230aと、第1予測画像生成部242aと、第2予測画像生成部242bと、重み係数決定部242cと、画像合成部242dとを有する。 As shown in FIG. 8, the intra prediction unit 242 has a memory 230a, a first predicted image generation unit 242a, a second predicted image generation unit 242b, a weighting coefficient determination unit 242c, and an image synthesis unit 242d.
メモリ230aは、図7に示すメモリ230の一部である。メモリ230aは、イントラ予測の際に参照される復号済み画素である参照画素を記憶する。 Memory 230a is part of memory 230 shown in Figure 7. Memory 230a stores reference pixels, which are decoded pixels that are referenced during intra prediction.
第1予測画像生成部242aは、方向性予測である第1イントラ予測モードによりイントラ予測対象ブロックを予測して方向性予測画像(第1予測画像)を生成し、生成した方向性予測画像を画像合成部242dに出力する。具体的には、第1予測画像生成部242aは、メモリ230aに記憶された参照画素を参照し、エントロピー復号部200から入力されたシンタックスが示す方向性予測モードによって方向性予測画像を生成する。 The first predicted image generation unit 242a predicts the block to be intra-predicted using a first intra-prediction mode, which is directional prediction, to generate a directional predicted image (first predicted image), and outputs the generated directional predicted image to the image synthesis unit 242d. Specifically, the first predicted image generation unit 242a references reference pixels stored in the memory 230a and generates a directional predicted image using the directional prediction mode indicated by the syntax input from the entropy decoding unit 200.
第2予測画像生成部242bは、非方向性予測である第2イントラ予測モードによりイントラ予測対象ブロックを予測して予測画像(第2予測画像)を生成し、生成した予測画像を画像合成部242dに出力する。具体的には、第2予測画像生成部242bは、メモリ230aに記憶された参照画素を参照し、予め定められた非方向性の第2イントラ予測モードによって方向性予測画像を生成する。本実施形態において第2イントラ予測モードはPlanar予測である。 The second predicted image generation unit 242b predicts the block to be intra-predicted using a second intra prediction mode, which is non-directional prediction, to generate a predicted image (second predicted image), and outputs the generated predicted image to the image synthesis unit 242d. Specifically, the second predicted image generation unit 242b references reference pixels stored in the memory 230a and generates a directional predicted image using a predetermined non-directional second intra prediction mode. In this embodiment, the second intra prediction mode is planar prediction.
重み係数決定部242cは、イントラ予測対象ブロックのブロックサイズ及びブロック形状のうち少なくとも一方に基づいて重み係数を決定し、決定した重み係数を画像合成部242dに出力する。イントラ予測対象ブロックのブロックサイズ及びブロック形状は、エントロピー復号部200から重み係数決定部242cに入力される。重み係数決定部242cの動作は、上述した動作例1及び2と同じ動作である。 The weighting coefficient determination unit 242c determines a weighting coefficient based on at least one of the block size and block shape of the block to be intra-predicted, and outputs the determined weighting coefficient to the image synthesis unit 242d. The block size and block shape of the block to be intra-predicted are input to the weighting coefficient determination unit 242c from the entropy decoding unit 200. The operation of the weighting coefficient determination unit 242c is the same as that of operation examples 1 and 2 described above.
画像合成部242dは、重み係数決定部242cから入力された重み係数を用いて、第1予測画像生成部242aから入力された方向性予測画像及び第2予測画像生成部242bから入力されたPlanar予測画像を重み付け合成し、重み付け合成後の予測画像をイントラ予測画像として出力する。 The image synthesis unit 242d uses the weighting coefficients input from the weighting coefficient determination unit 242c to weight-synthesize the directional prediction image input from the first prediction image generation unit 242a and the planar prediction image input from the second prediction image generation unit 242b, and outputs the weighted-synthesized prediction image as an intra-prediction image.
<イントラ予測の動作フロー例>
次に、本実施形態に係るイントラ予測の動作フロー例について説明する。画像符号化装置1及び画像復号装置2でイントラ予測の動作は同じであるが、ここでは画像復号装置2におけるイントラ予測(イントラ予測部242)の動作を説明する。図9は、イントラ予測部242の動作フロー例を示す図である。
<Example of intra prediction operation flow>
Next, an example of the operation flow of intra prediction according to this embodiment will be described. The operation of intra prediction is the same in the image encoding device 1 and the image decoding device 2, but here, the operation of intra prediction (intra prediction unit 242) in the image decoding device 2 will be described. Fig. 9 is a diagram showing an example of the operation flow of the intra prediction unit 242.
第1に、エントロピー復号部200は、画像符号化装置1により選択されたイントラ予測モードを示すシンタックスを復号する。このシンタックスが方向性予測モード以外のモード(DC予測又はPlanar予測)を示す場合(ステップS1:NO)、イントラ予測部242は、従来と同様なイントラ予測を行う(ステップS7)。 First, the entropy decoding unit 200 decodes syntax indicating the intra prediction mode selected by the image encoding device 1. If this syntax indicates a mode other than a directional prediction mode (DC prediction or planar prediction) (step S1: NO), the intra prediction unit 242 performs intra prediction similar to conventional methods (step S7).
第2に、エントロピー復号部200は、予測画像合成手法を適用するか否かを示すシンタックスを復号する。このシンタックスが予測画像合成手法を適用しないことを示す場合(ステップS2:NO)、イントラ予測部242は、従来と同様なイントラ予測を行う(ステップS7)。但し、画像符号化装置1により選択されたイントラ予測モードが方向性予測モードである場合、常に予測画像合成手法を適用するとしてもよい。この場合、予測画像合成手法を適用するか否かを示すシンタックスのシグナリングは不要である。 Second, the entropy decoding unit 200 decodes syntax indicating whether or not to apply a predictive image synthesis method. If this syntax indicates that a predictive image synthesis method is not to be applied (step S2: NO), the intra prediction unit 242 performs intra prediction similar to conventional methods (step S7). However, if the intra prediction mode selected by the image encoding device 1 is a directional prediction mode, the predictive image synthesis method may always be applied. In this case, there is no need to signal syntax indicating whether or not to apply a predictive image synthesis method.
第3に、画像符号化装置1により選択されたイントラ予測モードが方向性予測であり(ステップS1:YES)、且つ、予測画像合成手法を適用する場合(ステップS2:YES)、重み係数決定部242cは、イントラ予測対象ブロックのブロックサイズ及びブロック形状のうち少なくとも一方に基づいて重み係数α及びβを決定する(ステップS3)。 Third, if the intra prediction mode selected by the image encoding device 1 is directional prediction (step S1: YES) and a predicted image synthesis method is applied (step S2: YES), the weighting coefficient determination unit 242c determines the weighting coefficients α and β based on at least one of the block size and block shape of the block to be intra predicted (step S3).
第4に、第1予測画像生成部242aは、画像符号化装置1により選択された方向性予測モードによりイントラ予測対象ブロックを予測して方向性予測画像を生成する(ステップS4)。また、第2予測画像生成部242bは、Planar予測によりイントラ予測対象ブロックを予測してPlanar予測画像を生成する(ステップS5)。 Fourth, the first predicted image generation unit 242a predicts the intra-prediction target block using the directional prediction mode selected by the image encoding device 1 to generate a directional predicted image (step S4). Furthermore, the second predicted image generation unit 242b predicts the intra-prediction target block using planar prediction to generate a planar predicted image (step S5).
第5に、画像合成部242dは、ステップS3で決定された重み係数α及びβを用いて、ステップS4で生成された方向性予測画像とステップS5で生成されたPlanar予測画像とを重み付け合成し、重み付け合成後の予測画像をイントラ予測画像として出力する(ステップS6)。 Fifth, the image synthesis unit 242d uses the weighting coefficients α and β determined in step S3 to weight and synthesize the directional prediction image generated in step S4 and the planar prediction image generated in step S5, and outputs the weighted and synthesized prediction image as an intra-prediction image (step S6).
<実施形態のまとめ>
本実施形態に係る画像符号化装置1及び画像復号装置2は、イントラ予測対象ブロックのブロックサイズ及びブロック形状のうち少なくとも一方に基づいて重み係数を決定し、決定した重み係数を用いて方向性予測画像及びPlanar予測画像を重み付け合成する。これにより、予測画像合成手法において、方向性予測画像とPlanar予測画像とを単に平均化する場合に比べて、イントラ予測の予測精度を高めることができる。
<Summary of the embodiment>
The image encoding device 1 and the image decoding device 2 according to this embodiment determine weighting factors based on at least one of the block size and block shape of a block to be intra-predicted, and weight-combine a directional predicted image and a planar predicted image using the determined weighting factors. This allows for higher prediction accuracy of intra-prediction compared to a case where the directional predicted image and the planar predicted image are simply averaged in the predicted image combining technique.
<その他の実施形態>
上述した実施形態において、第2イントラ予測モードがPlanar予測である一例について主として説明した。しかしながら、第2イントラ予測モードは、Plane予測であってもよい。第2イントラ予測モードがPlane予測である場合、上述した実施形態における「Planar予測」を「Plane予測」と読み替えればよい。
<Other embodiments>
In the above-described embodiment, an example in which the second intra prediction mode is planar prediction has been mainly described. However, the second intra prediction mode may be planar prediction. When the second intra prediction mode is planar prediction, the term "planar prediction" in the above-described embodiment may be read as "planar prediction."
或いは、第2イントラ予測モードは、DC予測であってもよい。第2イントラ予測モードがDC予測である場合、上述した実施形態における「Planar予測」を「DC予測」と読み替えればよい。 Alternatively, the second intra prediction mode may be DC prediction. When the second intra prediction mode is DC prediction, "Planar prediction" in the above-described embodiment may be read as "DC prediction."
画像符号化装置1が行う各処理をコンピュータに実行させるプログラムが提供されてもよい。画像復号装置2が行う各処理をコンピュータに実行させるプログラムが提供されてもよい。プログラムは、コンピュータ読取り可能媒体に記録されていてもよい。コンピュータ読取り可能媒体を用いれば、コンピュータにプログラムをインストールすることが可能である。ここで、プログラムが記録されたコンピュータ読取り可能媒体は、非一過性の記録媒体であってもよい。非一過性の記録媒体は、特に限定されるものではないが、例えば、CD-ROMやDVD-ROM等の記録媒体であってもよい。 A program may be provided that causes a computer to execute each process performed by the image encoding device 1. A program may be provided that causes a computer to execute each process performed by the image decoding device 2. The program may be recorded on a computer-readable medium. Using a computer-readable medium makes it possible to install the program on a computer. Here, the computer-readable medium on which the program is recorded may be a non-transitory recording medium. The non-transitory recording medium is not particularly limited, and may be, for example, a CD-ROM, DVD-ROM, or other recording medium.
画像符号化装置1が行う各処理を実行する回路を集積化し、画像符号化装置1を半導体集積回路(チップセット、SoC)により構成してもよい。画像復号装置2が行う各処理を実行する回路を集積化し、画像復号装置2を半導体集積回路(チップセット、SoC)により構成してもよい。 The circuits that perform each process performed by the image encoding device 1 may be integrated, and the image encoding device 1 may be configured as a semiconductor integrated circuit (chip set, SoC). The circuits that perform each process performed by the image decoding device 2 may be integrated, and the image decoding device 2 may be configured as a semiconductor integrated circuit (chip set, SoC).
以上、図面を参照して実施形態について詳しく説明したが、具体的な構成は上述のものに限られることはなく、要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。 The above describes the embodiments in detail with reference to the drawings, but the specific configuration is not limited to that described above, and various design changes can be made without departing from the spirit of the invention.
1 :画像符号化装置
2 :画像復号装置
100 :ブロック分割部
110 :減算部
120 :変換・量子化部
121 :変換部
122 :量子化部
130 :エントロピー符号化部
140 :逆量子化・逆変換部
141 :逆量子化部
142 :逆変換部
150 :合成部
160 :メモリ
160a :メモリ
170 :予測部
171 :インター予測部
172 :イントラ予測部
172a :第1予測画像生成部
172b :第2予測画像生成部
172c :重み係数決定部
172d :画像合成部
173 :切替部
200 :エントロピー復号部
210 :逆量子化・逆変換部
211 :逆量子化部
212 :逆変換部
220 :合成部
230 :メモリ
230a :メモリ
240 :予測部
241 :インター予測部
242 :イントラ予測部
242a :第1予測画像生成部
242b :第2予測画像生成部
242c :重み係数決定部
242d :画像合成部
243 :切替部
1: Image encoding device 2: Image decoding device 100: Block division unit 110: Subtraction unit 120: Transform/quantization unit 121: Transform unit 122: Quantization unit 130: Entropy encoding unit 140: Inverse quantization/inverse transform unit 141: Inverse quantization unit 142: Inverse transform unit 150: Combining unit 160: Memory 160a: Memory 170: Prediction unit 171: Inter prediction unit 172: Intra prediction unit 172a: First predicted image generation unit 172b: Second predicted image generation unit 172c: Weighting coefficient determination unit 172d: Image composition unit 173: Switching unit 200: Entropy decoding unit 210: Inverse quantization/inverse transform unit 211: Inverse quantization unit 212: Inverse transform unit 220: Combining unit 230: Memory 230a : Memory 240 : Prediction unit 241 : Inter prediction unit 242 : Intra prediction unit 242 a : First predicted image generation unit 242 b : Second predicted image generation unit 242 c : Weighting coefficient determination unit 242 d : Image synthesis unit 243 : Switching unit
Claims (2)
イントラ予測モードを取得するエントロピー復号部と、
方向性予測により前記画像ブロックを予測して第1イントラ予測画像を生成する第1予測画像生成部と、
非方向性予測により前記画像ブロックを予測して第2イントラ予測画像を生成する第2予測画像生成部と、
前記画像ブロックのブロック形状に基づいて、前記第1イントラ予測画像及び前記第2イントラ予測画像を重み付け合成する画像合成部と、を備え、
前記エントロピー復号部は、前記非方向性予測を特定する情報を取得しない
復号装置。 A decoding device that performs intra prediction on image blocks obtained by dividing an original image,
an entropy decoding unit for obtaining an intra-prediction mode;
a first predicted image generation unit that predicts the image block using directional prediction to generate a first intra predicted image;
a second predicted image generation unit that predicts the image block using non-directional prediction to generate a second intra predicted image;
an image synthesis unit that weights and synthesizes the first intra- predicted image and the second intra -predicted image based on the block shape of the image block ,
The entropy decoding unit does not acquire information that specifies the non-directional prediction.
Decryption device.
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2019023028 | 2019-02-12 | ||
| JP2019023028 | 2019-02-12 | ||
| JP2020020957A JP7537879B2 (en) | 2019-02-12 | 2020-02-10 | Intra prediction device, image encoding device, image decoding device, and program |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2020020957A Division JP7537879B2 (en) | 2019-02-12 | 2020-02-10 | Intra prediction device, image encoding device, image decoding device, and program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2024144780A JP2024144780A (en) | 2024-10-11 |
| JP7812892B2 true JP7812892B2 (en) | 2026-02-10 |
Family
ID=72263785
Family Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2020020957A Active JP7537879B2 (en) | 2019-02-12 | 2020-02-10 | Intra prediction device, image encoding device, image decoding device, and program |
| JP2024133213A Active JP7812892B2 (en) | 2019-02-12 | 2024-08-08 | Prediction device, image encoding device, image decoding device, and program |
Family Applications Before (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2020020957A Active JP7537879B2 (en) | 2019-02-12 | 2020-02-10 | Intra prediction device, image encoding device, image decoding device, and program |
Country Status (1)
| Country | Link |
|---|---|
| JP (2) | JP7537879B2 (en) |
Families Citing this family (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP7483422B2 (en) * | 2019-03-15 | 2024-05-15 | 日本放送協会 | Intra prediction device, image decoding device, and program |
| JP7735065B2 (en) * | 2021-03-26 | 2025-09-08 | シャープ株式会社 | Image decoding device and image encoding device |
| JP7809108B2 (en) * | 2021-05-31 | 2026-01-30 | シャープ株式会社 | Video decoding device and video encoding device |
| CN114938453B (en) * | 2022-07-19 | 2022-09-30 | 深流微智能科技(深圳)有限公司 | Video coding method, chip, storage medium and computer equipment |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2018066849A1 (en) | 2016-10-04 | 2018-04-12 | 한국전자통신연구원 | Method and device for encoding/decoding image, and recording medium storing bit stream |
-
2020
- 2020-02-10 JP JP2020020957A patent/JP7537879B2/en active Active
-
2024
- 2024-08-08 JP JP2024133213A patent/JP7812892B2/en active Active
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2018066849A1 (en) | 2016-10-04 | 2018-04-12 | 한국전자통신연구원 | Method and device for encoding/decoding image, and recording medium storing bit stream |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2020137119A (en) | 2020-08-31 |
| JP2024144780A (en) | 2024-10-11 |
| JP7537879B2 (en) | 2024-08-21 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7812892B2 (en) | Prediction device, image encoding device, image decoding device, and program | |
| JP7649886B2 (en) | Image encoding device, image decoding device, and image decoding method | |
| JP7733083B2 (en) | Prediction block generation device, image encoding device, image decoding device, and program | |
| JP7699266B2 (en) | Intra prediction device, image decoding device, and program | |
| US20210014489A1 (en) | Intra prediction device, image encoding device, image decoding device and program | |
| JP7749052B2 (en) | Prediction device, encoding device, decoding device, and program | |
| JP2022093657A (en) | Encoding device, decoding device, and program | |
| JP7229413B2 (en) | Image encoding device, image decoding device, and program | |
| KR102924785B1 (en) | Intra prediction device, image decoding device, and program | |
| JP7590510B2 (en) | Intra prediction device, image encoding device, image decoding device, and program | |
| JP2020028066A (en) | Color difference intra prediction candidate generation device, image coding device, image decoding device, and program | |
| JPWO2020059616A1 (en) | Image coding device, image decoding device, and program | |
| JP7531683B2 (en) | Encoding device, decoding device, and program | |
| JP7361498B2 (en) | Intra prediction device, image encoding device, image decoding device, and program | |
| JP7449690B2 (en) | Inter prediction device, image encoding device, image decoding device, and program | |
| JP7444599B2 (en) | Intra prediction device, image encoding device, image decoding device, and program | |
| WO2025005269A1 (en) | Prediction device, encoding device, decoding device, and program |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240808 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20250624 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250825 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20250930 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20251201 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20260120 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20260129 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7812892 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |