Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP7686426B2 - Encoding device and program - Google Patents
[go: Go Back, main page]

JP7686426B2 - Encoding device and program - Google Patents

Encoding device and program Download PDF

Info

Publication number
JP7686426B2
JP7686426B2 JP2021064985A JP2021064985A JP7686426B2 JP 7686426 B2 JP7686426 B2 JP 7686426B2 JP 2021064985 A JP2021064985 A JP 2021064985A JP 2021064985 A JP2021064985 A JP 2021064985A JP 7686426 B2 JP7686426 B2 JP 7686426B2
Authority
JP
Japan
Prior art keywords
image
unit
frequency component
block
decomposition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021064985A
Other languages
Japanese (ja)
Other versions
JP2022160316A (en
Inventor
康孝 松尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2021064985A priority Critical patent/JP7686426B2/en
Publication of JP2022160316A publication Critical patent/JP2022160316A/en
Application granted granted Critical
Publication of JP7686426B2 publication Critical patent/JP7686426B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、符号化装置及びプログラムに関する。 The present invention relates to an encoding device and a program.

H.265/HEVC(High Efficiency Video Coding)、H.266/VVC(Versatile Video Coding)などの符号化方式では、画素相関を利用して動画像符号化を行うことが知られている(例えば、非特許文献1参照)。画面間予測では、符号化対象フレーム(予測対象フレーム)の前後の参照フレームを参照して予測を行う。一般に、予測対象ユニットとその参照フレームの復号済ユニットが同一オブジェクトである場合は、同一オブジェクト間の画素相関は高いと考えられるため、画面間予測を高精度に行うことができる。 It is known that coding methods such as H.265/HEVC (High Efficiency Video Coding) and H.266/VVC (Versatile Video Coding) use pixel correlation to code moving images (see, for example, Non-Patent Document 1). In inter-frame prediction, prediction is performed by referring to reference frames before and after the frame to be coded (frame to be predicted). In general, when a unit to be predicted and a decoded unit of the reference frame are the same object, pixel correlation between the same objects is considered to be high, and therefore inter-frame prediction can be performed with high accuracy.

大久保榮監修、「インプレス標準教科書シリーズ H.265/HEVC教科書」、株式会社インプレスジャパン、2013年10月21日Edited by Eiichiro Okubo, "Impress Standard Textbook Series H.265/HEVC Textbook", Impress Japan Co., Ltd., October 21, 2013

しかし、従来の符号化技術において、フレーム間で鮮鋭度が異なる場合には、画面間予測が困難であり、符号化効率が低下しやすいという課題がある。 However, with conventional coding techniques, when sharpness differs between frames, inter-frame prediction is difficult, and coding efficiency is likely to decrease.

かかる事情に鑑みてなされた本発明の目的は、フレーム間で鮮鋭度が異なる動画像の符号化効率を向上させることが可能な符号化装置及びプログラムを提供することにある。 In view of the above circumstances, the object of the present invention is to provide an encoding device and program capable of improving the encoding efficiency of video images in which the sharpness differs between frames.

一実施形態に係る符号化装置は、原画像を符号化する符号化装置であって、前記原画像 を局所復号したフレームを記憶するフレームメモリと、前記フレームメモリから取得した 参照フレームに対して画像処理を行って、周波数成分を変化させたフィルタ処理フレーム を1以上生成する画像処理部と、前記1以上のフィルタ処理フレームを参照して、符号化 対象フレームに対する画面間予測画像を生成する画面間予測部と、を備える。
前記画像処理部は、前記参照フレームに対して多重解像度分解を行って、分解階数をn1とするn1階層分解画像、及び分解階数をn1よりも大きいn2とするn2階層分解画像を生成する多重解像度分解部と、前記n1階層分解画像の最低周波数成分画像の分割ブロックごとに、前記n2階層分解画像の最低周波数成分画像内で最も類似度が高い類似ブロックを決定し、該類似ブロックの位置を示すレジストレーション情報を生成するレジストレーション部と、前記レジストレーション情報に従って前記類似ブロックの位置を特定し、前記n2階層分解画像の各周波数成分画像内で、前記類似ブロックと同じ空間位相位置のブロックを割付ブロックとして特定し、該割付ブロックを前記n1階層分解画像の高周波成分内における前記分割ブロックと同じ空間位相位置に割り付けた高周波成分割付画像を生成する高周波成分割付部と、前記高周波成分割付画像に対して多重解像度再構成を行って、前記参照フレームの高周波成分を鮮鋭化した前記フィルタ処理フレームを生成する鮮鋭化再構成部と、を備える。
前記高周波成分割付部は、前記n2階層分解画像を、分解階数がn2よりも1小さいn3階層の各周波数成分画像内で高周波成分画像と低周波成分画像に分類し、前記低周波成分画像内で前記類似ブロックと同じ空間位相位置のブロックを比較ブロックとして特定し、前記n3階層の各周波数成分画像内で、前記割付ブロックの画素値と前記比較ブロックの画素値との差分が第1割付閾値を超える場合に、該割付ブロックを割り付ける。
あるいは、前記高周波成分割付部は、前記n2階層分解画像を、分解階数がn2よりも1小さいn3階層の各周波数成分画像内で高周波成分画像と低周波成分画像に分類し、前記低周波成分画像内で前記類似ブロックと同じ空間位相位置のブロックを比較ブロックとして特定し、前記類似ブロックの画素値と前記比較ブロックの画素値との差分が第2割付閾値を超える場合に、前記n3階層において該比較ブロックと同一の周波数成分画像内の前記割付ブロックを割り付ける。
An encoding device according to one embodiment is an encoding device that encodes an original image, and includes a frame memory that stores a frame obtained by locally decoding the original image, an image processing unit that performs image processing on a reference frame obtained from the frame memory to generate one or more filter-processed frames with changed frequency components, and an inter prediction unit that generates an inter prediction image for a frame to be encoded by referring to the one or more filter-processed frames.
The image processing unit includes a multi-resolution decomposition unit that performs multi-resolution decomposition on the reference frame to generate an n1 hierarchical decomposition image with a decomposition rank of n1 and an n2 hierarchical decomposition image with a decomposition rank of n2, which is greater than n1; a registration unit that determines, for each divided block of a lowest frequency component image of the n1 hierarchical decomposition image, a similar block with the highest similarity in the lowest frequency component image of the n2 hierarchical decomposition image and generates registration information indicating a position of the similar block; a high frequency component allocation unit that identifies a position of the similar block according to the registration information, identifies a block at the same spatial phase position as the similar block in each frequency component image of the n2 hierarchical decomposition image as an allocation block, and generates a high frequency component allocated image in which the allocation block is allocated to the same spatial phase position as the divided block in the high frequency components of the n1 hierarchical decomposition image; and a sharpening reconstruction unit that performs multi-resolution reconstruction on the high frequency component allocated image to generate the filtered frame in which the high frequency components of the reference frame are sharpened.
The high frequency component allocation unit classifies the n2 hierarchical decomposition image into high frequency component images and low frequency component images within each frequency component image of n3 hierarchical levels, where the decomposition rank is one less than n2, identifies a block within the low frequency component image that has the same spatial phase position as the similar block as a comparison block, and allocates the allocation block when the difference between the pixel value of the allocation block and the pixel value of the comparison block within each frequency component image of the n3 hierarchical levels exceeds a first allocation threshold.
Alternatively, the high frequency component allocation unit classifies the n2 hierarchical decomposition image into high frequency component images and low frequency component images within each frequency component image of n3 hierarchical layers, where the decomposition rank is one less than n2, identifies a block in the low frequency component image that has the same spatial phase position as the similar block as a comparison block, and when the difference between the pixel values of the similar block and the comparison block exceeds a second allocation threshold, allocates the allocation block in the same frequency component image as the comparison block in the n3 hierarchical layer.

さらに、一実施形態において、前記レジストレーション部は、前記分割ブロックの画素値と前記類似ブロックの画素値との差分がレジストレーション閾値を超える場合にのみ、前記レジストレーション情報を生成してもよい。 Furthermore, in one embodiment, the registration unit may generate the registration information only when the difference between the pixel values of the divided block and the pixel values of the similar block exceeds a registration threshold.

さらに、一実施形態において、前記参照フレームに対して幾何変換を行い、幾何変換後の参照フレームを1以上生成する幾何変換部を更に備え、前記画像処理部は、前記幾何変換後の参照フレームに対して画像処理を行ってもよい。 Furthermore, in one embodiment, the device may further include a geometric transformation unit that performs a geometric transformation on the reference frame and generates one or more reference frames after the geometric transformation, and the image processing unit may perform image processing on the reference frames after the geometric transformation.

さらに、一実施形態において、前記参照フレームは、前記符号化対象フレームの時間的に前に位置する1以上のフレーム、又は前記符号化対象フレームの時間的に後に位置する1以上のフレームを更に含んでもよい。 Furthermore, in one embodiment, the reference frames may further include one or more frames located temporally before the frame to be encoded, or one or more frames located temporally after the frame to be encoded.

また、一実施形態係るプログラムは、コンピュータを、上記符号化装置として機能させる。 In one embodiment, the program causes a computer to function as the encoding device.

本発明によれば、画像の符号化効率を向上させることが可能となる。 The present invention makes it possible to improve the efficiency of image coding.

一実施形態に係る符号化装置の構成例を示すブロック図である。1 is a block diagram showing an example of the configuration of an encoding device according to an embodiment. FIG. 一実施形態に係る符号化装置における画像処理部の構成例を示すブロック図である。2 is a block diagram showing an example of the configuration of an image processing unit in an encoding device according to an embodiment. FIG. 一実施形態に係る符号化装置における鮮鋭化画像生成部の構成例を示すブロック図である。1 is a block diagram showing an example of the configuration of a sharpened image generating unit in an encoding device according to an embodiment. FIG. 一実施形態に係る符号化装置におけるレジストレーション処理の一例を説明する図である。10A to 10C are diagrams illustrating an example of a registration process in an encoding device according to an embodiment. 一実施形態に係る符号化装置における割り付け処理の一例を説明する図である。11A and 11B are diagrams illustrating an example of an allocation process in an encoding device according to an embodiment. 一実施形態に係る符号化装置における割り付けの確度判定の第1の例を示す図である。11 is a diagram showing a first example of an allocation accuracy determination in an encoding device according to an embodiment. FIG. 一実施形態に係る符号化装置における割り付けの確度判定の第2の例を示す図である。FIG. 11 is a diagram showing a second example of allocation accuracy determination in an encoding device according to an embodiment. 一実施形態に係る符号化装置におけるぼやけ画像生成部の構成例を示すブロック図である。1 is a block diagram showing an example of the configuration of a blurred image generating unit in an encoding device according to an embodiment. FIG. 一実施形態に係る符号化装置における高周波成分抑制処理の一例を説明する図である。10A to 10C are diagrams illustrating an example of high-frequency component suppression processing in an encoding device according to an embodiment. 一実施形態に係る符号化装置における画像処理部の変形例を示すブロック図である。FIG. 13 is a block diagram showing a modified example of an image processing unit in the encoding device according to an embodiment.

以下、一実施形態について、図面を参照して詳細に説明する。 One embodiment is described in detail below with reference to the drawings.

図1は、一実施形態に係る符号化装置の構成例を示すブロック図である。図1に示す符号化装置1は、画像処理部10と、ブロック分割部11と、減算部12と、変換部13と、ビジュアルアクティビティ算出部14と、QP決定部15と、量子化部16と、逆量子化部17と、逆変換部18と、加算部19と、画面内予測部20と、フレームメモリ21と、画面間予測部22と、切替部23と、エントロピー符号化部24と、を備える。 Fig. 1 is a block diagram showing an example of the configuration of an encoding device according to an embodiment. The encoding device 1 shown in Fig. 1 includes an image processing unit 10, a block division unit 11, a subtraction unit 12, a transformation unit 13, a visual activity calculation unit 14, a QP determination unit 15, a quantization unit 16, a dequantization unit 17, an inverse transformation unit 18, an addition unit 19, an intra-screen prediction unit 20, a frame memory 21, an inter-screen prediction unit 22, a switching unit 23, and an entropy encoding unit 24.

ブロック分割部11は、入力画像(原画像)を分割した分割ブロックを符号ユニット(CU:Coding Unit)として生成し、減算部12、ビジュアルアクティビティ算出部14、及び画面間予測部22に出力する。 The block division unit 11 divides the input image (original image) into divided blocks, which are then generated as coding units (CUs), and outputs the CUs to the subtraction unit 12, the visual activity calculation unit 14, and the inter-screen prediction unit 22.

減算部12は、ブロック分割部11から入力した符号化ユニットの各画素値から、後述する画面内予測部20又は画面間予測部22から入力した予測ユニットの各画素値を減算して、符号化ユニットと予測ユニットと画素値の差分を示す残差信号を生成し、変換部13に出力する。 The subtraction unit 12 subtracts each pixel value of the prediction unit input from the intra-screen prediction unit 20 or the inter-screen prediction unit 22 described below from each pixel value of the coding unit input from the block division unit 11 to generate a residual signal indicating the difference between the coding unit, the prediction unit, and the pixel value, and outputs the residual signal to the conversion unit 13.

変換部13は、減算部12から入力した残差信号を更に変換ユニット(TU:Transform Unit)に分割して、TUごとに直交変換などの変換処理を行って変換係数を算出し、量子化部16に出力する。 The transform unit 13 further divides the residual signal input from the subtraction unit 12 into transform units (TUs), performs a transform process such as an orthogonal transform for each TU, calculates transform coefficients, and outputs them to the quantization unit 16.

ビジュアルアクティビティ算出部14は、ブロック分割部11から入力した符号化ユニットのビジュアルアクティビティを算出し、QP決定部15に出力する。符号化ユニットが高い周波数成分を多く含む場合にはビジュアルアクティビティは大きくなり、符号ユニットが高い周波数成分を多く含まない場合にはビジュアルアクティビティは小さくなる。 The visual activity calculation unit 14 calculates the visual activity of the coding unit input from the block division unit 11 and outputs it to the QP determination unit 15. If the coding unit contains many high frequency components, the visual activity is large, and if the coding unit does not contain many high frequency components, the visual activity is small.

QP決定部15は、ビジュアルアクティビティ算出部14から入力したビジュアルアクティビティに基づいて量子化パラメータ(QP値)を決定し、量子化部16に出力する。 The QP determination unit 15 determines a quantization parameter (QP value) based on the visual activity input from the visual activity calculation unit 14 and outputs it to the quantization unit 16.

量子化部16は、変換部13から入力した変換係数を、QP決定部15から入力したQP値に対応する量子化ステップで除算して量子化することにより量子化係数を生成し、逆量子化部17及びエントロピー符号化部24に出力する。 The quantization unit 16 generates quantization coefficients by dividing the transformation coefficients input from the transformation unit 13 by the quantization step corresponding to the QP value input from the QP determination unit 15 and quantizing the coefficients, and outputs the quantization coefficients to the inverse quantization unit 17 and the entropy coding unit 24.

逆量子化部17は、量子化部16から入力した量子化係数に対して、量子化ステップを乗ずることにより変換係数を復元し、逆変換部18に出力する。 The inverse quantization unit 17 restores the transform coefficients by multiplying the quantization coefficients input from the quantization unit 16 by the quantization step, and outputs the restored transform coefficients to the inverse transform unit 18.

逆変換部18は、逆量子化部17から入力した変換係数に対して、逆変換処理(変換部13で行った変換を元に戻す処理)を行って残差信号を復元し、加算部19に出力する。例えば、変換部13が離散コサイン変換を行った場合には、逆変換部18は逆離散コサイン変換を行う。 The inverse transform unit 18 performs an inverse transform process (a process of undoing the transform performed by the transform unit 13) on the transform coefficients input from the inverse quantization unit 17 to restore the residual signal, and outputs it to the addition unit 19. For example, if the transform unit 13 performs a discrete cosine transform, the inverse transform unit 18 performs an inverse discrete cosine transform.

加算部19は、逆変換部18から入力した残差信号と、切替部23から入力した予測ユニットとを加算して復号済ユニットを生成し、フレームメモリ21及び画面内予測部20に出力する。 The adder 19 adds the residual signal input from the inverse transformer 18 to the prediction unit input from the switching unit 23 to generate a decoded unit, and outputs it to the frame memory 21 and the intra-screen prediction unit 20.

逆量子化部17、逆変換部18、及び加算部19により、局所復号部を構成し、局所復号(ローカルデコード)処理を行う。すなわち、局所復号部は、量子化係数に対して量子化ステップを乗じて変換係数を復元し、該変換係数に対して逆変換処理を行って残差信号を復元し、該残差信号と予測ユニットとを加算して復号済ユニットを生成する。 The inverse quantization unit 17, the inverse transform unit 18, and the addition unit 19 constitute a local decoding unit, which performs local decoding processing. That is, the local decoding unit multiplies the quantization coefficients by the quantization step to restore the transform coefficients, performs inverse transform processing on the transform coefficients to restore the residual signal, and adds the residual signal to the prediction unit to generate a decoded unit.

画面内予測部20は、加算部19から入力した復号済ユニットを参照して、予測ユニット(PU:Prediction Unit)ごとに画面内予測(イントラ予測)を行って画面内予測画像を生成し、切替部23に出力する。 The intra-screen prediction unit 20 references the decoded units input from the adder unit 19, performs intra-screen prediction (intra-prediction) for each prediction unit (PU: Prediction Unit), generates an intra-screen predicted image, and outputs it to the switching unit 23.

フレームメモリ21は、加算部19から入力した復号済ユニットを、フレーム単位で記憶する。すなわち、フレームメモリ21は、原画像を量子化した後に局所復号したフレームを記憶する。 The frame memory 21 stores the decoded units input from the adder 19 on a frame-by-frame basis. In other words, the frame memory 21 stores frames that have been locally decoded after quantizing the original image.

画像処理部10は、フレームメモリ21から参照フレームを取得し、参照フレームに対して画像処理を行って、周波数成分を変化させたフィルタ処理フレームを1以上生成し、画面間予測部22に出力する。画像処理部10は、参照フレームの高周波成分をぼかす処理又は鮮鋭化する処理を行い、フィルタ処理フレームを生成してもよい。画像処理部10の詳細については後述する。 The image processing unit 10 acquires a reference frame from the frame memory 21, performs image processing on the reference frame, generates one or more filter processing frames in which the frequency components are changed, and outputs the generated frames to the inter prediction unit 22. The image processing unit 10 may also perform a process of blurring or sharpening the high frequency components of the reference frame to generate a filter processing frame. Details of the image processing unit 10 will be described later.

画面間予測部22は、ブロック分割部11から入力した符号化ユニットを予測ユニットに分割する。そして、画面間予測部22は、参照フレームに加えて、画像処理部10から入力した1以上のフィルタ処理フレームを参照して、予測ユニットごとにブロックマッチングなどの手法により動きベクトルを生成する。画面間予測部22は、RD最適化等により最も符号化効率がよい動きベクトルを採用してもよい。画面間予測部22は、予測ユニットごとに動きベクトルに基づいて動き補償予測を行って、符号化対象フレームに対する画面間予測画像を生成し、切替部23に出力する。従来の符号化装置では参照フレームを参照して画面間予測を行うところ、符号化装置1では参照フレームに加えてフィルタ処理フレームを参照して画面間予測を行う点が相違する。 The inter prediction unit 22 divides the coding unit input from the block division unit 11 into prediction units. The inter prediction unit 22 then references one or more filter processing frames input from the image processing unit 10 in addition to the reference frame to generate a motion vector for each prediction unit by a technique such as block matching. The inter prediction unit 22 may adopt a motion vector with the highest coding efficiency by RD optimization or the like. The inter prediction unit 22 performs motion compensation prediction based on the motion vector for each prediction unit to generate an inter prediction image for the frame to be coded, and outputs it to the switching unit 23. The coding device 1 is different in that, while conventional coding devices perform inter prediction by referring to the reference frame, the coding device 1 performs inter prediction by referring to the filter processing frame in addition to the reference frame.

切替部23は、画面内予測部20から入力された画面内予測画像と、画面間予測部22から入力された画面間予測画像とを切替えて予測画像とし、減算部12及び加算部19に出力する。 The switching unit 23 switches between the intra-screen predicted image input from the intra-screen prediction unit 20 and the inter-screen predicted image input from the inter-screen prediction unit 22 to obtain a predicted image, and outputs the predicted image to the subtraction unit 12 and the addition unit 19.

エントロピー符号化部24は、量子化部16から入力された量子化係数、画面内予測部20から入力された予測モード情報、画面間予測部22から入力された動きベクトル情報などに対してエントロピー符号化を行い、データ圧縮を行ってビットストリームを生成し、符号化装置1の外部に出力する。エントロピー符号化は、0次指数ゴロム符号やコンテキスト適応型2値算術符号(CABAC:Context-based Adaptive Binary Arithmetic Coding)など、任意のエントロピー符号化方式を用いることができる。 The entropy coding unit 24 performs entropy coding on the quantization coefficients input from the quantization unit 16, the prediction mode information input from the intra-screen prediction unit 20, the motion vector information input from the inter-screen prediction unit 22, and the like, compresses the data, generates a bit stream, and outputs it to the outside of the coding device 1. For the entropy coding, any entropy coding method can be used, such as zeroth-order exponential Golomb coding or context-based adaptive binary arithmetic coding (CABAC).

<画像処理部>
次に、画像処理部10の処理について説明する。図2は、画像処理部10の構成例を示すブロック図である。図2に示す画像処理部10は、多重解像度分解部30と、鮮鋭化画像生成部40と、ぼやけ画像生成部50と、を備える。
<Image Processing Unit>
Next, a description will be given of the processing of the image processing unit 10. Fig. 2 is a block diagram showing an example of the configuration of the image processing unit 10. The image processing unit 10 shown in Fig. 2 includes a multi-resolution decomposition unit 30, a sharpened image generation unit 40, and a blurred image generation unit 50.

画像処理部10は、フレームメモリ21から、局所復号部(逆量子化部17、逆変換部18、及び加算部19)により局所復号された参照フレームを入力(取得)する。参照フレームとは、画面間予測部22において画面間予測処理を行う際に参照されるフレームである。参照フレームは、H.265/HEVC、H.266/VVCなどの符号化方式で規定されている。符号化対象フレームがPピクチャ(Predictive Picture)である場合には、参照フレームは1枚であり、符号化対象フレームがBピクチャ(Bidirectionally Predictive Picture)である場合には、参照フレームは2枚である。画像処理部10は、フレームメモリ21から、さらに符号化対象フレームの前フレーム又は/及び後フレームを入力(取得)してもよい。前フレームは符号化対象フレームの時間的に前に位置する1以上のフレームを意味し、後フレームは符号化対象フレームの時間的に後に位置する1以上のフレームを意味する。以下に説明する実施形態では、画像処理部10は、参照フレームのみを入力するものとして説明する。 The image processing unit 10 inputs (acquires) a reference frame locally decoded by the local decoding unit (the inverse quantization unit 17, the inverse transformation unit 18, and the addition unit 19) from the frame memory 21. The reference frame is a frame that is referenced when performing inter-prediction processing in the inter-prediction unit 22. The reference frame is specified in encoding methods such as H.265/HEVC and H.266/VVC. If the frame to be encoded is a P-picture (Predictive Picture), there is one reference frame, and if the frame to be encoded is a B-picture (Bidirectionally Predictive Picture), there are two reference frames. The image processing unit 10 may further input (acquire) a previous frame and/or a subsequent frame of the frame to be encoded from the frame memory 21. The previous frame means one or more frames located chronologically before the frame to be encoded, and the subsequent frame means one or more frames located chronologically after the frame to be encoded. In the embodiment described below, the image processing unit 10 is described as inputting only the reference frame.

多重解像度分解部30は、フレームメモリ21から入力した参照フレームに対して多重解像度分解を行って、分解階数をn1とするn1階層分解画像、及び分解階数をn1よりも大きいn2とするn2階層分解画像を生成する。そして、多重解像度分解部30は、n1階層分解画像及びn2階層分解画像を鮮鋭化画像生成部40に出力し、n1階層分解画像をぼやけ画像生成部50出力する。 The multi-resolution decomposition unit 30 performs multi-resolution decomposition on the reference frame input from the frame memory 21 to generate an n1-layer decomposition image with a decomposition level of n1, and an n2-layer decomposition image with a decomposition level of n2, which is greater than n1. The multi-resolution decomposition unit 30 then outputs the n1-layer decomposition image and the n2-layer decomposition image to the sharpened image generation unit 40, and outputs the n1-layer decomposition image to the blurred image generation unit 50.

多重解像度分解部30は、ウェーブレットパケット分解により多重解像度分解を行ってもよい。ウェーブレットパケット分解を行うことにより、各周波数成分画像の位相情報を同じサイズとして扱うことができる。本実施形態では、多重解像度分解部30は、分解階数n1=1,n2=2としてウェーブレットパケット分解を行うものとする。多重解像度分解部30は、分解階数n1,n2の情報を外部から取得してもよい。 The multi-resolution decomposition unit 30 may perform multi-resolution decomposition by wavelet packet decomposition. By performing wavelet packet decomposition, the phase information of each frequency component image can be treated as being of the same size. In this embodiment, the multi-resolution decomposition unit 30 performs wavelet packet decomposition with decomposition levels n1=1 and n2=2. The multi-resolution decomposition unit 30 may obtain information on the decomposition levels n1 and n2 from the outside.

鮮鋭化画像生成部40は、多重解像度分解部30からn1階層分解画像及びn2階層分解画像を入力する。そして、鮮鋭化画像生成部40は、n1階層分解画像の高周波帯域に、n2階層分解画像の高周波帯域を割り付けた後、多重解像度再構成を行うことで、参照フレームを鮮鋭化したフィルタ処理フレーム(鮮鋭化参照フレーム)を生成する。鮮鋭化画像生成部40は、生成した鮮鋭化参照フレームを画面間予測部22に出力する。 The sharpened image generation unit 40 inputs the n1-layer decomposition image and the n2-layer decomposition image from the multi-resolution decomposition unit 30. The sharpened image generation unit 40 then assigns the high-frequency band of the n2-layer decomposition image to the high-frequency band of the n1-layer decomposition image, and then performs multi-resolution reconstruction to generate a filter processing frame (sharpened reference frame) in which the reference frame has been sharpened. The sharpened image generation unit 40 outputs the generated sharpened reference frame to the inter-screen prediction unit 22.

ぼやけ画像生成部50は、多重解像度分解部30からn1階層分解画像を入力する。そして、ぼやけ画像生成部50は、n1階層分解画像の高周波帯域を抑制した後、多重解像度再構成を行うことで、参照フレームをぼかしたフィルタ処理フレーム(ぼやけ参照フレーム)を生成する。ぼやけ画像生成部50は、生成したぼやけ参照フレームを画面間予測部22に出力する。 The blurred image generation unit 50 inputs the n1-layer decomposition image from the multi-resolution decomposition unit 30. The blurred image generation unit 50 then suppresses the high-frequency band of the n1-layer decomposition image, and performs multi-resolution reconstruction to generate a filtered frame (blurred reference frame) in which the reference frame is blurred. The blurred image generation unit 50 outputs the generated blurred reference frame to the inter-screen prediction unit 22.

<<鮮鋭化画像生成部>>
次に、鮮鋭化画像生成部40の詳細について説明する。図3は、鮮鋭化画像生成部40の構成例を示すブロック図である。図3に示す鮮鋭化画像生成部40は、レジストレーション部41と、高周波成分割付部42と、鮮鋭化再構成部43と、を備える。
<<Sharpened image generation unit>>
Next, a detailed description will be given of the sharpened image generating unit 40. Fig. 3 is a block diagram showing an example of the configuration of the sharpened image generating unit 40. The sharpened image generating unit 40 shown in Fig. 3 includes a registration unit 41, a high frequency component allocation unit 42, and a sharpening reconstruction unit 43.

レジストレーション部41は、n1階層分解画像の最低周波数成分画像を所定のサイズ(例えば、8×8画素)の分割ブロックに分割する。そして、n1階層分解画像の最低周波数成分画像内の分割ブロックごとに、n2階層分解画像の最低周波数成分画像内で分割ブロックと最も類似度(相関性)が高い類似ブロックをブロックマッチングにより決定する。そして、レジストレーション部41は、類似ブロックの位置を示すレジストレーション情報を生成し、高周波成分割付部42に出力する。 The registration unit 41 divides the lowest frequency component image of the n1-hierarchical decomposition image into division blocks of a predetermined size (e.g., 8 x 8 pixels). Then, for each division block in the lowest frequency component image of the n1-hierarchical decomposition image, a similar block that has the highest similarity (correlation) to the division block in the lowest frequency component image of the n2-hierarchical decomposition image is determined by block matching. The registration unit 41 then generates registration information indicating the position of the similar block and outputs it to the high frequency component allocation unit 42.

図4を参照して、レジストレーション部41によるレジストレーション処理の具体例を説明する。この例では、多重解像度分解部30は、第1参照フレームに対して分解階数1のウェーブレットパケット分解を行って1階層分解画像F1を生成し、第2参照フレームに対して分解階数2のウェーブレットパケット分解を行って2階層分解画像F2を生成している。第1参照フレームと第2参照フレームは、同一フレームであってもよい。第2参照フレームを分解階数n2=2で多重解像度分解することにより、1階層分割画像として、4個の周波数成分画像(LL,HL,LH,HH)が生成される。また、2階層分解画像F2として、16個の周波数成分画像(LLLL,LLLH,LLHL,LLHH,HLLL,HLLH,HLHL,HLHH,LHLL,LHLH,LHHL,LHHH,HHLL,HHLH,HHHL,HHHH)が生成される。 A specific example of the registration process by the registration unit 41 will be described with reference to FIG. 4. In this example, the multi-resolution decomposition unit 30 performs wavelet packet decomposition at decomposition level 1 on the first reference frame to generate a one-layer decomposition image F1, and performs wavelet packet decomposition at decomposition level 2 on the second reference frame to generate a two-layer decomposition image F2. The first reference frame and the second reference frame may be the same frame. By performing multi-resolution decomposition on the second reference frame at decomposition level n2=2, four frequency component images (LL, HL, LH, HH) are generated as one-layer divided images. In addition, 16 frequency component images (LLLL, LLLH, LLHL, LLHH, HLLL, HLLH, HLHL, HLHH, LHLL, LHLH, LHHL, LHHH, HHLL, HHLH, HHHL, HHHH) are generated as the two-layer decomposition image F2.

レジストレーション部41は、1階層分解画像F1の最低周波数成分画像LLの各分割ブロックBについて、2階層分解画像F2の最低周波数成分画像LLLLとレジストレーション(位置合わせ)を行い、最低周波数成分画像LLLL内で分割ブロックBと最も類似度(相関性)が高い類似ブロックSを決定する。 The registration unit 41 registers (aligns) each divided block B of the lowest frequency component image LL of the one-level decomposition image F1 with the lowest frequency component image LLLL of the two-level decomposition image F2, and determines the similar block S in the lowest frequency component image LLLL that has the highest similarity (correlation) with the divided block B.

レジストレーション部41は、レジストレーションの確度判定を行い、確度が高い場合にのみレジストレーション情報を生成するようにしてもよい。 The registration unit 41 may determine the accuracy of the registration and generate registration information only if the accuracy is high.

レジストレーション部41が確度判定を行う場合の処理について説明する。例えば、レジストレーション部41は、分割ブロックBの画素値と、類似ブロックSの画素値との差分がレジストレーション閾値を超える場合にのみ、レジストレーションの確度が高いと判定してレジストレーション情報を生成する。すなわち、該差分がレジストレーション閾値以下である場合には、レジストレーションの確度が低いと判定してレジストレーション情報を生成しない。レジストレーション部41は、画素値の差分として、SAD(Sum of Absolute Difference)又はSSD(Sum of Squared Difference)を算出してもよい。 The following describes the process performed by the registration unit 41 when determining the accuracy. For example, the registration unit 41 determines that the accuracy of the registration is high and generates registration information only when the difference between the pixel values of the divided block B and the pixel values of the similar block S exceeds a registration threshold. In other words, when the difference is equal to or less than the registration threshold, the registration unit 41 determines that the accuracy of the registration is low and does not generate registration information. The registration unit 41 may calculate the sum of absolute difference (SAD) or sum of squared difference (SSD) as the difference in pixel values.

高周波成分割付部42は、レジストレーション部41から入力したレジストレーション情報に従って、類似ブロックSの位置を特定する。そして、高周波成分割付部42は、n2階層分解画像F2の各周波数成分画像内で、類似ブロックSと同じ空間位相位置のブロックを割付ブロックAとして特定する。そして、高周波成分割付部42は、割付ブロックAを、n1階層分解画像F1の高周波成分内における分割ブロックBと同じ空間位相位置に割り付けた高周波成分割付画像を生成する。そして、高周波成分割付部42は、高周波成分割付画像を鮮鋭化再構成部43に出力する。 The high frequency component allocation unit 42 identifies the position of the similar block S according to the registration information input from the registration unit 41. The high frequency component allocation unit 42 then identifies, within each frequency component image of the n2 hierarchical decomposition image F2, a block at the same spatial phase position as the similar block S as an allocation block A. The high frequency component allocation unit 42 then generates a high frequency component allocation image in which the allocation block A is allocated to the same spatial phase position as the divided block B within the high frequency components of the n1 hierarchical decomposition image F1. The high frequency component allocation unit 42 then outputs the high frequency component allocation image to the sharpening reconstruction unit 43.

図5を参照して、高周波成分割付部42による割り付け処理について具体的に説明する。ここでは図4と同様に、n1=1であり、n2=2である。高周波成分割付部42は、レジストレーション情報に従って、2階層分解画像F2の最低周波数成分画像LLLL内における類似ブロックSの位置を特定する。図5ではこの位置合わせを、破線の矢印で示している。 The allocation process by the high frequency component allocation unit 42 will be described in detail with reference to FIG. 5. Here, as in FIG. 4, n1=1 and n2=2. The high frequency component allocation unit 42 identifies the position of the similar block S in the lowest frequency component image LLLL of the two-layer decomposition image F2 according to the registration information. In FIG. 5, this alignment is indicated by the dashed arrow.

高周波成分割付部42は、2階層分解画像F2のうち、分解階数n2-1=1の各周波数成分画像における高周波成分画像(LLHL,LLLH,LLHH,HLHL,HLLH,HLHH,LHHL,LHLH,LHHH,HHHL,HHLH,HHHH)内で、類似ブロックSと同じ空間位相位置のブロックを割付ブロックAとして特定する。図5では説明の便宜上、高周波成分画像LLHL、HLHL,LHHL,HHHLについてのみ割付ブロックAを示している。そして、高周波成分割付部42は、2階層分解画像F2のうち、分解階数1の各周波数成分画像における水平低周波・垂直高周波成分画像(LLHL,HLHL,LHHL,HHHL)内の割付ブロックAを、1階層分解画像F1の水平低周波・垂直高周波成分画像(HL)内において分割ブロックBと同じ空間位相位置に割り付ける。図5ではこの割り付けを、実線の4本の矢印で示している。 The high frequency component allocation unit 42 identifies, as allocation block A, a block at the same spatial phase position as the similar block S within the high frequency component images (LLHL, LLLH, LLHH, HLHL, HLLH, HLHH, LHHL, LHLH, LHHH, HHHL, HHLH, HHHH) in each frequency component image of the decomposition rank n2-1=1 in the two-layer decomposition image F2. For ease of explanation, FIG. 5 shows allocation block A only for the high frequency component images LLHL, HLHL, LHHL, and HHHL. Then, the high frequency component allocation unit 42 allocates allocation block A in the horizontal low frequency/vertical high frequency component images (LLHL, HLHL, LHHL, HHHL) in each frequency component image of the decomposition rank 1 in the two-layer decomposition image F2 to the same spatial phase position as the divided block B in the horizontal low frequency/vertical high frequency component image (HL) of the one-layer decomposition image F1. In FIG. 5, this allocation is indicated by four solid arrows.

同様に、高周波成分割付部42は、2階層分解画像F2のうち、分解階数1の各周波数成分画像における水平高周波・垂直低周波成分画像(LLLH,HLLH,LHLH,HHLH)内の割付ブロックAを、1階層分解画像F1の水平高周波・垂直低周波成分画像(LH)内において分割ブロックBと同じ空間位相位置に割り付ける。同様に、高周波成分割付部42は、2階層分解画像F2のうち、分解階数1の各周波数成分画像における水平高周波・垂直高周波成分画像(LLHH,HLHH,LHHH,HHHH)内の割付ブロックAを、1階層分解画像F1の水平高周波・垂直高周波成分画像(HH)内において分割ブロックBと同じ空間位相位置に割り付ける。 Similarly, the high frequency component allocation unit 42 allocates allocation block A in the horizontal high frequency and vertical low frequency component images (LLLH, HLLH, LHLH, HHLH) in each frequency component image of decomposition rank 1 in the two-layer decomposition image F2 to the same spatial phase position as divided block B in the horizontal high frequency and vertical low frequency component image (LH) of the one-layer decomposition image F1. Similarly, the high frequency component allocation unit 42 allocates allocation block A in the horizontal high frequency and vertical high frequency component images (LLHH, HLHH, LHHH, HHHH) in each frequency component image of decomposition rank 1 in the two-layer decomposition image F2 to the same spatial phase position as divided block B in the horizontal high frequency and vertical high frequency component image (HH) of the one-layer decomposition image F1.

高周波成分割付部42は、割り付けの確度判定を行い、確度が高い場合にのみ割り付けを行うようにしてもよい。 The high frequency component allocation unit 42 may determine the accuracy of the allocation and perform the allocation only if the accuracy is high.

高周波成分割付部42が確度判定を行う場合の処理について説明する。高周波成分割付部42は、n2階層分解画像を分解階数がn2よりも1小さい階層における高周波成分画像と低周波成分画像に分類し、低周波成分画像内で類似ブロックと同じ空間位相位置のブロックを比較ブロックとして特定し、高周波成分画像内の割付ブロックの画素値と、低周波成分画像内の比較ブロックとの差分が第1割付閾値を超える場合にのみ、割り付けの確度が高いと判定して割付ブロックを割り付ける。すなわち、該差分が第1割付閾値を超える場合には、割り付けの確度が低いと判定して割付ブロックを割り付けない。この比較は、分解階数がn2よりも1小さい階層における分解画像ごとに行ってもよい。高周波成分割付部42は、画素値の差分として、SAD又はSSDを算出してもよい。 The high frequency component allocation unit 42 performs the process of determining the accuracy. The high frequency component allocation unit 42 classifies the n2-layer decomposition image into a high frequency component image and a low frequency component image in a layer where the decomposition level is one less than n2, identifies a block in the low frequency component image that has the same spatial phase position as the similar block as a comparison block, and determines that the accuracy of the allocation is high and allocates the allocation block only when the difference between the pixel value of the allocation block in the high frequency component image and the comparison block in the low frequency component image exceeds the first allocation threshold. In other words, when the difference exceeds the first allocation threshold, the accuracy of the allocation is determined to be low and the allocation block is not allocated. This comparison may be performed for each decomposition image in a layer where the decomposition level is one less than n2. The high frequency component allocation unit 42 may calculate the SAD or SSD as the difference in pixel values.

図6を参照して、割り付けの確度判定の第1の例を説明する。ここでは図4及び図5と同様に、n1=1であり、n2=2である。高周波成分割付部42は、2階層分解画像F2を、分解階数がn2よりも1小さいn3階層の各周波数成分画像における高周波成分画像(図6では背景を濃く表示)と低周波成分画像(図6では背景を薄く表示)に分類し、各低周波成分画像内で類似ブロックSと同じ空間位相位置のブロックを比較ブロックCとして特定する。そして、高周波成分割付部42は、n3階層の各周波数成分画像(HL,LH,HH)内で、割付ブロックAの画素値と比較ブロックCの画素値との差分を求め、該差分が第1割付閾値T1を超える場合に、該割付ブロックAを割り付ける。なお、周波数成分画像LLには比較ブロックCが存在しないため、この確度判定は行われない。 With reference to FIG. 6, a first example of the accuracy judgment of the allocation will be described. Here, as in FIG. 4 and FIG. 5, n1=1 and n2=2. The high frequency component allocation unit 42 classifies the two-layer decomposition image F2 into high frequency component images (in FIG. 6, the background is displayed dark) and low frequency component images (in FIG. 6, the background is displayed light) in each frequency component image of n3 layers, where the decomposition rank is 1 less than n2, and specifies a block in each low frequency component image at the same spatial phase position as the similar block S as a comparison block C. Then, the high frequency component allocation unit 42 calculates the difference between the pixel value of the allocation block A and the pixel value of the comparison block C in each frequency component image (HL, LH, HH) of the n3 layers, and allocates the allocation block A when the difference exceeds the first allocation threshold T1. Note that since there is no comparison block C in the frequency component image LL, this accuracy judgment is not performed.

図7を参照して、割り付けの確度判定の第2の例を説明する。ここでは図4から図6と同様に、n1=1であり、n2=2である。高周波成分割付部42は、第1の例と同様に比較ブロックCを特定する。そして、高周波成分割付部42は、類似ブロックSの画素値と比較ブロックCの画素値との差分を求め、該差分が第2割付閾値T2を超える場合に、n3階層において該比較ブロックCと同一の周波数成分画像内の割付ブロックAを割り付ける。例えば、1階層分解画像HLにおいて、該差分が第2割付閾値T2を超える場合には、1階層分解画像HL内の3つの割付ブロックAを割り付ける。なお、周波数成分画像LLには比較ブロックCが存在しないため、この確度判定は行われない。また、高周波成分割付部42は、確度判定の第1の例及び第2の例を組み合わせ、双方の条件を満たす場合に割付ブロックAを割り付けるようにしてもよい。 With reference to FIG. 7, a second example of the accuracy judgment of the allocation will be described. Here, as in FIG. 4 to FIG. 6, n1=1 and n2=2. The high frequency component allocation unit 42 identifies the comparison block C in the same manner as in the first example. Then, the high frequency component allocation unit 42 obtains the difference between the pixel value of the similar block S and the pixel value of the comparison block C, and if the difference exceeds the second allocation threshold T2, allocates the allocation block A in the same frequency component image as the comparison block C in the n3 layer. For example, in the first layer decomposition image HL, if the difference exceeds the second allocation threshold T2, three allocation blocks A in the first layer decomposition image HL are allocated. Note that since there is no comparison block C in the frequency component image LL, this accuracy judgment is not performed. In addition, the high frequency component allocation unit 42 may combine the first and second examples of the accuracy judgment and allocate the allocation block A when both conditions are satisfied.

鮮鋭化再構成部43は、高周波成分割付部42から入力した高周波成分割付画像に対して多重解像度再構成を行って、参照フレームの高周波成分を鮮鋭化したフィルタ処理フレーム(鮮鋭化参照フレーム)を生成する。鮮鋭化再構成部43は、例えば、n1階層分解画像が参照フレームに対して分解階数n1のウェーブレットパケット分解により生成された画像である場合には、高周波成分割付画像に対して分解階数n1のウェーブレットパケット再構成を行う。 The sharpening reconstruction unit 43 performs multi-resolution reconstruction on the high frequency component allocated image input from the high frequency component allocation unit 42 to generate a filter processing frame (sharpened reference frame) in which the high frequency components of the reference frame are sharpened. For example, when the n1 hierarchical decomposition image is an image generated by wavelet packet decomposition of decomposition rank n1 on the reference frame, the sharpening reconstruction unit 43 performs wavelet packet reconstruction of decomposition rank n1 on the high frequency component allocated image.

<<ぼやけ画像生成部>>
次に、ぼやけ画像生成部50の詳細について説明する。図8は、ぼやけ画像生成部50の構成例を示すブロック図である。図8に示すぼやけ画像生成部50は、高周波成分抑制部51と、ぼやけ再構成部52と、を備える。
<<Blurred image generation unit>>
Next, a description will be given of the details of the blurred image generating unit 50. Fig. 8 is a block diagram showing an example of the configuration of the blurred image generating unit 50. The blurred image generating unit 50 shown in Fig. 8 includes a high frequency component suppression unit 51 and a blur reconstruction unit 52.

高周波成分抑制部51は、多重解像度分解部30から入力したn1階層分解画像の高周波成分を抑制した高周波成分抑制画像を生成し、ぼやけ再構成部52に出力する。 The high-frequency component suppression unit 51 generates a high-frequency component suppressed image by suppressing the high-frequency components of the n1-layer decomposition image input from the multi-resolution decomposition unit 30, and outputs the image to the blur reconstruction unit 52.

図9は、高周波成分抑制部51による高周波成分抑制処理の一例を示す図である。高周波成分抑制部51は、n1階層分解画像の高周波成分画像(HL,LH,HH)の画素値にぼやけ係数γを乗算して高周波成分抑制画像を生成する。ぼやけ係数γは1より小さい値であり、例えはγ=0.9とする。高周波成分抑制部51は、ぼやけ係数γの情報を外部から取得してもよい。 Figure 9 is a diagram showing an example of high frequency component suppression processing by the high frequency component suppression unit 51. The high frequency component suppression unit 51 multiplies the pixel values of the high frequency component image (HL, LH, HH) of the n1 hierarchical decomposition image by the blur coefficient γ to generate a high frequency component suppressed image. The blur coefficient γ is a value smaller than 1, for example, γ = 0.9. The high frequency component suppression unit 51 may obtain information on the blur coefficient γ from an external source.

ぼやけ再構成部52は、高周波成分抑制部51から入力した高周波成分抑制画像に対して多重解像度再構成を行って、参照フレームの高周波成分をぼかしたフィルタ処理フレーム(ぼやけ参照フレーム)を生成する。ぼやけ再構成部52は、例えば、n1階層分解画像が参照フレームに対して分解階数n1のウェーブレットパケット分解により生成された画像である場合には、高周波成分抑制画像に対して分解階数n1のウェーブレットパケット再構成を行う。 The blur reconstruction unit 52 performs multi-resolution reconstruction on the high-frequency component suppressed image input from the high-frequency component suppression unit 51 to generate a filter processing frame (blurred reference frame) in which the high-frequency components of the reference frame are blurred. For example, if the n1-hierarchical decomposition image is an image generated by wavelet packet decomposition of decomposition rank n1 on the reference frame, the blur reconstruction unit 52 performs wavelet packet reconstruction of decomposition rank n1 on the high-frequency component suppressed image.

<<鮮鋭化画像生成部の変形例>>
次に、鮮鋭化画像生成部40の変形例について説明する。鮮鋭化画像生成部40は、ぼやけ画像生成部50と同様に係数を乗算することにより、高周波成分を増加させてもよい。つまり、鮮鋭化画像生成部40は、変形例では、n1階層分解画像の高周波成分画像(HL,LH,HH)の画素値に鮮鋭化係数γ’を乗算して高周波成分増加画像を生成する。鮮鋭化係数γ’は1より大きい値であり、例えはγ’=1.1とする。鮮鋭化画像生成部40は、鮮鋭化係数γ’の情報を外部から取得してもよい。そして、鮮鋭化画像生成部40は、高周波成分増加画像に対して多重解像度再構成を行って、参照フレームの高周波成分を鮮鋭化したフィルタ処理フレーム(鮮鋭化参照フレーム)を生成する。
<<Modifications of the sharpened image generating unit>>
Next, a modified example of the sharpened image generating unit 40 will be described. The sharpened image generating unit 40 may increase high-frequency components by multiplying coefficients in the same manner as the blurred image generating unit 50. That is, in the modified example, the sharpened image generating unit 40 multiplies the pixel values of the high-frequency component images (HL, LH, HH) of the n1-layer decomposition image by the sharpening coefficient γ' to generate an image with increased high-frequency components. The sharpening coefficient γ' is a value greater than 1, and for example, γ'=1.1. The sharpened image generating unit 40 may obtain information on the sharpening coefficient γ' from an external source. Then, the sharpened image generating unit 40 performs multi-resolution reconstruction on the image with increased high-frequency components to generate a filter processing frame (sharpened reference frame) in which the high-frequency components of the reference frame are sharpened.

<画像処理部の変形例>
次に、画像処理部10の変形例について説明する。図10は、画像処理部10の変形例である画像処理部10aの構成例を示すブロック図である。画像処理部10aは、幾何変換部60と、多重解像度分解部30と、鮮鋭化画像生成部40と、ぼやけ画像生成部50と、を備える。画像処理部10aは、画像処理部10と比較して、幾何変換部60を更に備える点が相違する。
<Modifications of Image Processing Section>
Next, a modified example of the image processing unit 10 will be described. Fig. 10 is a block diagram showing a configuration example of an image processing unit 10a which is a modified example of the image processing unit 10. The image processing unit 10a includes a geometric transformation unit 60, a multi-resolution decomposition unit 30, a sharpened image generation unit 40, and a blurred image generation unit 50. The image processing unit 10a differs from the image processing unit 10 in that it further includes a geometric transformation unit 60.

幾何変換部60は、フレームメモリ21から参照フレームを入力し、参照フレームに対して幾何変換を行い、幾何変換後の参照フレームを1以上生成する。そして、幾何変換部60は、1以上の幾何変換後の参照フレーム(幾何変換画像群)を多重解像度分解部30に出力する。例えば、幾何変換部60は、幾何変換としてアフィン変換を行う。幾何変換パラメータは拡大・縮小a={0.9,1.0,1.1}、回転θ={1/16π,0,-1/16π}、スキューなし、とする。このアフィン変換を行った場合には、各参照フレームに対して9枚の幾何変換画像群が生成される。 The geometric transformation unit 60 inputs a reference frame from the frame memory 21, performs a geometric transformation on the reference frame, and generates one or more reference frames after the geometric transformation. The geometric transformation unit 60 then outputs one or more reference frames after the geometric transformation (a group of geometrically transformed images) to the multi-resolution decomposition unit 30. For example, the geometric transformation unit 60 performs an affine transformation as the geometric transformation. The geometric transformation parameters are enlargement/reduction a = {0.9, 1.0, 1.1}, rotation θ = {1/16π, 0, -1/16π}, and no skew. When this affine transformation is performed, a group of nine geometrically transformed images is generated for each reference frame.

多重解像度分解部30は、幾何変換後の参照フレームに対して多重解像度分解を行う。その他の処理は画像処理部10と同じであるため、説明を省略する。 The multi-resolution decomposition unit 30 performs multi-resolution decomposition on the reference frame after the geometric transformation. The other processes are the same as those of the image processing unit 10, so the explanation is omitted.

<プログラム>
上述した符号化装置1として機能させるために、プログラム命令を実行可能なコンピュータを用いることも可能である。ここで、コンピュータは、汎用コンピュータ、専用コンピュータ、ワークステーション、PC(Personal Computer)、電子ノートパッドなどであってもよい。プログラム命令は、必要なタスクを実行するためのプログラムコード、コードセグメントなどであってもよい。
<Program>
A computer capable of executing program instructions can be used to function as the above-mentioned encoding device 1. Here, the computer may be a general-purpose computer, a special-purpose computer, a workstation, a personal computer (PC), an electronic notepad, etc. The program instructions may be program code, code segments, etc. for performing the necessary tasks.

コンピュータは、プロセッサと、記憶部と、入力部と、出力部と、通信インターフェースとを備える。プロセッサは、具体的にはCPU(Central Processing Unit)、MPU(Micro Processing Unit)、GPU(Graphics Processing Unit)、DSP(Digital Signal Processor)、SoC(System on a Chip)などであり、同種又は異種の複数のプロセッサにより構成されてもよい。プロセッサは、記憶部からプログラムを読み出して実行することで、上記各構成の制御及び各種の演算処理を行う。 The computer includes a processor, a storage unit, an input unit, an output unit, and a communication interface. The processor is specifically a CPU (Central Processing Unit), an MPU (Micro Processing Unit), a GPU (Graphics Processing Unit), a DSP (Digital Signal Processor), a SoC (System on a Chip), etc., and may be composed of multiple processors of the same or different types. The processor reads and executes a program from the storage unit to control each of the above components and perform various calculations.

プログラムは、コンピュータが読み取り可能な記録媒体に記録されていてもよい。このような記録媒体を用いれば、プログラムをコンピュータにインストールすることが可能である。ここで、プログラムが記録された記録媒体は、非一過性(non-transitory)の記録媒体であってもよい。非一過性の記録媒体は、特に限定されるものではないが、例えば、CD-ROM、DVD-ROM、USB(Universal Serial Bus)メモリなどであってもよい。また、このプログラムは、ネットワークを介して外部装置からダウンロードされる形態としてもよい。 The program may be recorded on a computer-readable recording medium. Using such a recording medium, the program can be installed on a computer. Here, the recording medium on which the program is recorded may be a non-transitory recording medium. The non-transitory recording medium is not particularly limited, and may be, for example, a CD-ROM, a DVD-ROM, or a USB (Universal Serial Bus) memory. In addition, the program may be in a form that is downloaded from an external device via a network.

以上説明したように、本発明では、フレームメモリ21から取得した参照フレームに対して画像処理を行って、周波数成分を変化させたフィルタ処理フレームを1以上生成し、フィルタ処理フレームを参照して、符号化対象フレームに対する画面間予測画像を生成する。このため、従来の符号化方法よりも画面間予測において参照するフレームが増加するため、符号化の精度が向上し、符号化効率を向上させることが可能となる。 As described above, in the present invention, image processing is performed on a reference frame obtained from the frame memory 21 to generate one or more filter processed frames with changed frequency components, and an inter-prediction image for the frame to be encoded is generated by referring to the filter processed frame. As a result, the number of frames referenced in inter-prediction increases compared to conventional encoding methods, which makes it possible to improve encoding accuracy and encoding efficiency.

フィルタ処理フレームは、参照フレームの高周波成分をぼかした鮮鋭化参照フレーム、及び/又は参照フレームの高周波成分をぼかしたぼやけ参照フレームとすることが望ましい。画面間で相関性の低い画像を符号化する場合でも、鮮鋭化参照フレーム又はぼやけ参照フレームを用いることで、符号化対象フレームとの相関性が向上することが期待される。 It is desirable that the filter processing frame be a sharpened reference frame in which the high frequency components of the reference frame are blurred, and/or a blurred reference frame in which the high frequency components of the reference frame are blurred. Even when encoding an image with low correlation between frames, the use of a sharpened reference frame or a blurred reference frame is expected to improve the correlation with the frame to be encoded.

また、参照フレームに対して幾何変換を行った後にフィルタ処理を行ったり、符号化対象フレームの前フレーム又は後フレームに対してもフィルタ処理を行ったりすることにより、フィルタ処理フレームの枚数を増やすことができる。この場合には、画面間予測において参照するフレームの枚数がさらに増加するため、符号化効率を更に向上せることが可能となる。 In addition, the number of frames to be filtered can be increased by performing a geometric transformation on the reference frame before filtering, or by performing filtering on the previous or next frame of the frame to be coded. In this case, the number of frames to be referenced in inter prediction is further increased, making it possible to further improve coding efficiency.

上述の実施形態は代表的な例として説明したが、本発明の趣旨及び範囲内で、多くの変更及び置換ができることは当業者に明らかである。したがって、本発明は、上述の実施形態によって制限するものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形又は変更が可能である。例えば、実施形態の構成図に記載の複数の構成ブロックを統合したり、1つの構成ブロックを分割したりすることが可能である。 The above-mentioned embodiment has been described as a representative example, but it will be apparent to those skilled in the art that many modifications and substitutions can be made within the spirit and scope of the present invention. Therefore, the present invention should not be interpreted as being limited by the above-mentioned embodiment, and various modifications or alterations are possible without departing from the scope of the claims. For example, it is possible to integrate multiple configuration blocks shown in the configuration diagram of the embodiment, or to divide one configuration block.

1 符号化装置
10,10a 画像処理部
11 ブロック分割部
12 減算部
13 変換部
14 ビジュアルアクティビティ算出部
15 QP決定部
16 量子化部
17 逆量子化部
18 逆変換部
19 加算部
20 画面内予測部
21 フレームメモリ
22 画面間予測部
23 切替部
24 エントロピー符号化部
30 多重解像度分解部
40 鮮鋭化画像生成部
41 レジストレーション部
42 高周波成分割付部
43 鮮鋭化再構成部
50 ぼやけ画像生成部
51 高周波成分抑制部
52 ぼやけ再構成部
60 幾何変換部
REFERENCE SIGNS LIST 1 Encoding device 10, 10a Image processing unit 11 Block division unit 12 Subtraction unit 13 Transformation unit 14 Visual activity calculation unit 15 QP determination unit 16 Quantization unit 17 Inverse quantization unit 18 Inverse transformation unit 19 Addition unit 20 Intra-frame prediction unit 21 Frame memory 22 Inter-frame prediction unit 23 Switching unit 24 Entropy encoding unit 30 Multi-resolution decomposition unit 40 Sharpened image generation unit 41 Registration unit 42 High-frequency component allocation unit 43 Sharpening reconstruction unit 50 Blurred image generation unit 51 High-frequency component suppression unit 52 Blur reconstruction unit 60 Geometric transformation unit

Claims (6)

原画像を符号化する符号化装置であって、
前記原画像を局所復号したフレームを記憶するフレームメモリと、
前記フレームメモリから取得した参照フレームに対して画像処理を行って、周波数成分を変化させたフィルタ処理フレームを1以上生成する画像処理部と、
前記1以上のフィルタ処理フレームを参照して、符号化対象フレームに対する画面間予測画像を生成する画面間予測部と、
を備え
前記画像処理部は、
前記参照フレームに対して多重解像度分解を行って、分解階数をn1とするn1階層分解画像、及び分解階数をn1よりも大きいn2とするn2階層分解画像を生成する多重解像度分解部と、
前記n1階層分解画像の最低周波数成分画像の分割ブロックごとに、前記n2階層分解画像の最低周波数成分画像内で最も類似度が高い類似ブロックを決定し、該類似ブロックの位置を示すレジストレーション情報を生成するレジストレーション部と、
前記レジストレーション情報に従って前記類似ブロックの位置を特定し、前記n2階層分解画像の各周波数成分画像内で、前記類似ブロックと同じ空間位相位置のブロックを割付ブロックとして特定し、該割付ブロックを前記n1階層分解画像の高周波成分内における前記分割ブロックと同じ空間位相位置に割り付けた高周波成分割付画像を生成する高周波成分割付部と、
前記高周波成分割付画像に対して多重解像度再構成を行って、前記参照フレームの高周波成分を鮮鋭化した前記フィルタ処理フレームを生成する鮮鋭化再構成部と、
を備え、
前記高周波成分割付部は、前記n2階層分解画像を、分解階数がn2よりも1小さいn3階層の各周波数成分画像内で高周波成分画像と低周波成分画像に分類し、前記低周波成分画像内で前記類似ブロックと同じ空間位相位置のブロックを比較ブロックとして特定し、前記n3階層の各周波数成分画像内で、前記割付ブロックの画素値と前記比較ブロックの画素値との差分が第1割付閾値を超える場合に、該割付ブロックを割り付ける、符号化装置。
An encoding device for encoding an original image, comprising:
a frame memory for storing a frame obtained by locally decoding the original image;
an image processing unit that performs image processing on the reference frame acquired from the frame memory to generate one or more filter processed frames in which frequency components are changed;
an inter prediction unit that generates an inter prediction image for a frame to be coded by referring to the one or more filter processed frames;
Equipped with
The image processing unit includes:
a multi-resolution decomposition unit that performs multi-resolution decomposition on the reference frame to generate an n1-layer decomposition image having a decomposition rank of n1 and an n2-layer decomposition image having a decomposition rank of n2 greater than n1;
a registration unit that determines a similar block having the highest similarity in the lowest frequency component image of the n2 hierarchical decomposition image for each divided block of the lowest frequency component image of the n1 hierarchical decomposition image, and generates registration information indicating a position of the similar block;
a high frequency component allocation unit that identifies a position of the similar block according to the registration information, identifies a block having the same spatial phase position as the similar block in each frequency component image of the n2 hierarchical decomposition image as an allocation block, and generates a high frequency component allocation image in which the allocation block is allocated to the same spatial phase position as the divided block in the high frequency component of the n1 hierarchical decomposition image;
a sharpening reconstruction unit that performs multi-resolution reconstruction on the high-frequency component allocated image to generate the filtered frame in which the high-frequency components of the reference frame are sharpened;
Equipped with
the high frequency component allocation unit classifies the n2 hierarchical decomposition image into high frequency component images and low frequency component images within each frequency component image of n3 hierarchical levels, the decomposition rank of which is one less than n2, identifies a block within the low frequency component image that has the same spatial phase position as the similar block as a comparison block, and allocates the allocation block when a difference between pixel values of the allocation block and pixel values of the comparison block within each frequency component image of the n3 hierarchical levels exceeds a first allocation threshold .
原画像を符号化する符号化装置であって、
前記原画像を局所復号したフレームを記憶するフレームメモリと、
前記フレームメモリから取得した参照フレームに対して画像処理を行って、周波数成分を変化させたフィルタ処理フレームを1以上生成する画像処理部と、
前記1以上のフィルタ処理フレームを参照して、符号化対象フレームに対する画面間予測画像を生成する画面間予測部と、
を備え、
前記画像処理部は、
前記参照フレームに対して多重解像度分解を行って、分解階数をn1とするn1階層分解画像、及び分解階数をn1よりも大きいn2とするn2階層分解画像を生成する多重解像度分解部と、
前記n1階層分解画像の最低周波数成分画像の分割ブロックごとに、前記n2階層分解画像の最低周波数成分画像内で最も類似度が高い類似ブロックを決定し、該類似ブロックの位置を示すレジストレーション情報を生成するレジストレーション部と、
前記レジストレーション情報に従って前記類似ブロックの位置を特定し、前記n2階層分解画像の各周波数成分画像内で、前記類似ブロックと同じ空間位相位置のブロックを割付ブロックとして特定し、該割付ブロックを前記n1階層分解画像の高周波成分内における前記分割ブロックと同じ空間位相位置に割り付けた高周波成分割付画像を生成する高周波成分割付部と、
前記高周波成分割付画像に対して多重解像度再構成を行って、前記参照フレームの高周波成分を鮮鋭化した前記フィルタ処理フレームを生成する鮮鋭化再構成部と、
を備え、
前記高周波成分割付部は、前記n2階層分解画像を、分解階数がn2よりも1小さいn3階層の各周波数成分画像内で高周波成分画像と低周波成分画像に分類し、前記低周波成分画像内で前記類似ブロックと同じ空間位相位置のブロックを比較ブロックとして特定し、前記類似ブロックの画素値と前記比較ブロックの画素値との差分が第2割付閾値を超える場合に、前記n3階層において該比較ブロックと同一の周波数成分画像内の前記割付ブロックを割り付ける、符号化装置。
An encoding device for encoding an original image, comprising:
a frame memory for storing a frame obtained by locally decoding the original image;
an image processing unit that performs image processing on the reference frame acquired from the frame memory to generate one or more filter processed frames in which frequency components are changed;
an inter prediction unit that generates an inter prediction image for a frame to be coded by referring to the one or more filter processed frames;
Equipped with
The image processing unit includes:
a multi-resolution decomposition unit that performs multi-resolution decomposition on the reference frame to generate an n1-layer decomposition image having a decomposition rank of n1 and an n2-layer decomposition image having a decomposition rank of n2 greater than n1;
a registration unit that determines a similar block having the highest similarity in the lowest frequency component image of the n2 hierarchical decomposition image for each divided block of the lowest frequency component image of the n1 hierarchical decomposition image, and generates registration information indicating a position of the similar block;
a high frequency component allocation unit that identifies a position of the similar block according to the registration information, identifies a block having the same spatial phase position as the similar block in each frequency component image of the n2 hierarchical decomposition image as an allocation block, and generates a high frequency component allocation image in which the allocation block is allocated to the same spatial phase position as the divided block in the high frequency component of the n1 hierarchical decomposition image;
a sharpening reconstruction unit that performs multi-resolution reconstruction on the high-frequency component allocated image to generate the filtered frame in which the high-frequency components of the reference frame are sharpened;
Equipped with
the high frequency component allocation unit classifies the n2 hierarchical decomposition image into high frequency component images and low frequency component images within each frequency component image of n3 hierarchical layers, the decomposition rank of which is one less than n2, identifies a block in the low frequency component image that has the same spatial phase position as the similar block as a comparison block, and when a difference between pixel values of the similar block and the comparison block exceeds a second allocation threshold, allocates the allocation block in the same frequency component image as the comparison block in the n3 hierarchical layers.
前記レジストレーション部は、前記分割ブロックの画素値と前記類似ブロックの画素値との差分がレジストレーション閾値を超える場合に、前記レジストレーション情報を生成する、請求項1又は2に記載の符号化装置。 The encoding device according to claim 1 , wherein the registration unit generates the registration information when a difference between pixel values of the divided block and pixel values of the similar block exceeds a registration threshold. 前記参照フレームに対して幾何変換を行い、幾何変換後の参照フレームを1以上生成する幾何変換部を更に備え、
前記画像処理部は、前記幾何変換後の参照フレームに対して画像処理を行う、
請求項1からのいずれか一項に記載の符号化装置。
A geometric transformation unit that performs a geometric transformation on the reference frame to generate one or more reference frames after the geometric transformation,
The image processing unit performs image processing on the reference frame after the geometric transformation.
An encoding device according to any one of claims 1 to 3 .
前記参照フレームは、前記符号化対象フレームの時間的に前に位置する1以上のフレーム、又は前記符号化対象フレームの時間的に後に位置する1以上のフレームを更に含む、請求項1からのいずれか一項に記載の符号化装置。 The encoding device according to claim 1 , wherein the reference frames further include one or more frames located temporally before the encoding target frame, or one or more frames located temporally after the encoding target frame. コンピュータを、請求項1からのいずれか一項に記載の符号化装置として機能させるためのプログラム。 A program for causing a computer to function as the encoding device according to any one of claims 1 to 5 .
JP2021064985A 2021-04-06 2021-04-06 Encoding device and program Active JP7686426B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021064985A JP7686426B2 (en) 2021-04-06 2021-04-06 Encoding device and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021064985A JP7686426B2 (en) 2021-04-06 2021-04-06 Encoding device and program

Publications (2)

Publication Number Publication Date
JP2022160316A JP2022160316A (en) 2022-10-19
JP7686426B2 true JP7686426B2 (en) 2025-06-02

Family

ID=83657730

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021064985A Active JP7686426B2 (en) 2021-04-06 2021-04-06 Encoding device and program

Country Status (1)

Country Link
JP (1) JP7686426B2 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008048489A2 (en) 2006-10-18 2008-04-24 Thomson Licensing Method and apparatus for video coding using prediction data refinement
JP2009065332A (en) 2007-09-05 2009-03-26 Sony Corp Image processing apparatus, image processing method, and computer program
JP2018137678A (en) 2017-02-23 2018-08-30 日本放送協会 Super-resolution complementary post-filter device and program
JP2019195214A (en) 2019-07-10 2019-11-07 ホアウェイ・テクノロジーズ・カンパニー・リミテッド Device and method for video motion compensation

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3165296B2 (en) * 1992-12-25 2001-05-14 三菱電機株式会社 Inter-frame coding processing method, inter-frame coding processing method, and coding control method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008048489A2 (en) 2006-10-18 2008-04-24 Thomson Licensing Method and apparatus for video coding using prediction data refinement
JP2009065332A (en) 2007-09-05 2009-03-26 Sony Corp Image processing apparatus, image processing method, and computer program
JP2018137678A (en) 2017-02-23 2018-08-30 日本放送協会 Super-resolution complementary post-filter device and program
JP2019195214A (en) 2019-07-10 2019-11-07 ホアウェイ・テクノロジーズ・カンパニー・リミテッド Device and method for video motion compensation

Also Published As

Publication number Publication date
JP2022160316A (en) 2022-10-19

Similar Documents

Publication Publication Date Title
CN103650510B (en) Context modeling techniques for transform coefficient-level coding
CN103548356B (en) Image decoding method using skip mode and device using same
US20090110070A1 (en) Image encoding device and encoding method, and image decoding device and decoding method
US20090010337A1 (en) Picture decoding using same-picture reference for pixel reconstruction
JP2022036084A (en) Coding device, decoding device, coding method, and decoding method
CN111213380B (en) Inter-frame prediction device, method, encoding and decoding device and readable medium
JP7498297B2 (en) METHOD AND APPARATUS FOR VIDEO FILTERING - Patent application
JP2009177417A (en) Image encoding apparatus and method, image decoding apparatus and method, and program
JP6042001B2 (en) Moving picture coding apparatus and moving picture coding method
CN115836525B (en) Video encoding and decoding methods and devices for prediction from multiple cross components
US12170794B2 (en) Image encoding device, image encoding method and storage medium, image decoding device, and image decoding method and storage medium
US12231646B2 (en) Apparatus and method for applying artificial intelligence-based filtering to image
US10349071B2 (en) Motion vector searching apparatus, motion vector searching method, and storage medium storing motion vector searching program
JP7686426B2 (en) Encoding device and program
JP7460384B2 (en) Prediction device, encoding device, decoding device, and program
CN102804769A (en) Image filtering method and device using pseudo-random number filter
JP2019057900A (en) Encoder and program, decoder and program, and image processing system
JP6176044B2 (en) Block structure determination circuit and information compression circuit
JP5832263B2 (en) Image coding apparatus and image coding method
JP6823492B2 (en) Super-resolution complementary post-filter device and program
TW202038612A (en) Image encoding device, image encoding method, image decoding device, image decoding method
WO2014156647A1 (en) Method for encoding a plurality of input images and storage medium and device for storing program
WO2022191947A1 (en) State based dependent quantization and residual coding in video coding
JP7703392B2 (en) Apparatus and program for generating super-resolution auxiliary data
JP6864557B2 (en) Encoding device, decoding device, and program

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20240229

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240306

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20250130

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20250204

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20250327

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20250422

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20250521

R150 Certificate of patent or registration of utility model

Ref document number: 7686426

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150