JP7361838B2 - Video encoding device, video decoding device, and these programs - Google Patents
Video encoding device, video decoding device, and these programs Download PDFInfo
- Publication number
- JP7361838B2 JP7361838B2 JP2022080144A JP2022080144A JP7361838B2 JP 7361838 B2 JP7361838 B2 JP 7361838B2 JP 2022080144 A JP2022080144 A JP 2022080144A JP 2022080144 A JP2022080144 A JP 2022080144A JP 7361838 B2 JP7361838 B2 JP 7361838B2
- Authority
- JP
- Japan
- Prior art keywords
- difference vector
- sign
- block
- vector
- positive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
本発明は、動き補償予測を用いた映像符号化方式における映像符号化装置、映像復号装置、及びこれらのプログラムに関する。 The present invention relates to a video encoding device, a video decoding device, and programs thereof in a video encoding method using motion compensation prediction.
一般的に、動き補償予測を用いた映像符号化方式では、動きベクトルや差分ベクトルの正負符号(+,-)は、出現頻度に偏りがないため圧縮符号化を行う意義が無いとされ、圧縮(可逆圧縮)を行わないものとなっている。 In general, in video encoding methods that use motion compensation prediction, it is considered that there is no point in compression encoding the positive and negative signs (+, -) of motion vectors and difference vectors because their appearance frequency is not biased. (Reversible compression) is not performed.
例えば、MPEG-H HEVC/H.265方式においては、動きベクトルは予測ベクトル(PMV)と差分ベクトル(MVD)の和として表現される(例えば、非特許文献1参照)。 For example, in the MPEG-H HEVC/H.265 system, a motion vector is expressed as the sum of a predicted vector (PMV) and a difference vector (MVD) (see, for example, Non-Patent Document 1).
差分ベクトルは、ベクトルの絶対値が0の場合と、0以外の場合で表現が異なり、これはabs_mvd_greater0_flagで表され、abs_mvd_greater0_flagが0の場合、差分ベクトルは0となる。一方、abs_mvd_greater0_flagが1の場合、差分ベクトルは、差分ベクトルの絶対値と、mvd_sign_flagと呼ばれる差分ベクトルの正負符号の組合せで表現される。この正負符号の+と-は、一般に出現頻度に偏りがないため、mvd_sign_flagは可逆圧縮を行わずに、正負符号の+/-を1/0のビット表現とし、可逆圧縮を行わないバイパスモードで算術符号化して当該差分ベクトルの絶対値に対応付けて伝送している。即ち、MPEG-H HEVC/H.265方式では差分ベクトルの正負符号は全く圧縮が行われていない。 The difference vector is expressed differently depending on whether the absolute value of the vector is 0 or other than 0. This is represented by abs_mvd_greater0_flag, and when abs_mvd_greater0_flag is 0, the difference vector is 0. On the other hand, when abs_mvd_greater0_flag is 1, the difference vector is expressed by a combination of the absolute value of the difference vector and the sign of the difference vector called mvd_sign_flag. Since the positive and negative signs (+ and -) generally have no bias in their frequency of appearance, mvd_sign_flag uses bypass mode that does not perform reversible compression and expresses the positive and negative signs (+/-) as 1/0 bits without performing reversible compression. It is arithmetic encoded and transmitted in association with the absolute value of the difference vector. That is, in the MPEG-H HEVC/H.265 system, the positive and negative signs of the difference vector are not compressed at all.
上述したように、MPEG-H HEVC/H.265方式等で代表される一般的な映像符号化方式では、差分ベクトルの正負符号の出現頻度に偏りがないため圧縮符号化を行う意義が無いとされ、圧縮(可逆圧縮)を行わないものとなっている。 As mentioned above, in general video encoding methods such as MPEG-H HEVC/H.265, there is no bias in the appearance frequency of the positive and negative signs of the difference vector, so there is no point in performing compression encoding. and does not perform compression (reversible compression).
しかしながら、フレーム内の着目ブロックの位置によっては、差分ベクトルの正負符号(+,-)についても発生確率に偏りが生じる場合があり、このためコンテキスト適応型の可逆圧縮により圧縮が可能となる場合がある。このため、差分ベクトルの正負符号(+,-)について圧縮(可逆圧縮)を可能とし、映像符号化に係る圧縮効率をより向上させる技法が望まれる。 However, depending on the position of the block of interest within the frame, there may be a bias in the probability of occurrence of the positive or negative sign (+, -) of the difference vector, so compression may be possible using context-adaptive reversible compression. be. Therefore, a technique is desired that enables compression (reversible compression) of the positive and negative signs (+, -) of the difference vector and further improves the compression efficiency related to video encoding.
そこで、本発明の目的は、上述の問題に鑑みて、動き補償予測を用いた映像符号化方式における差分ベクトルの正負符号(+,-)に係る圧縮効率を向上可能に構成した映像符号化装置、映像復号装置、及びこれらのプログラムを提供することにある。 SUMMARY OF THE INVENTION In view of the above-mentioned problems, an object of the present invention is to provide a video encoding device configured to improve the compression efficiency related to the positive and negative signs (+, -) of a difference vector in a video encoding method using motion compensation prediction. , a video decoding device, and programs thereof.
本発明の映像符号化装置は、動き補償予測を用いた映像符号化方式における映像符号化装置であって、フレーム内の所定のブロックについて動き補償予測に基づく差分ベクトルを生成する差分ベクトル生成手段と、前記所定のブロックに関する情報、前記差分ベクトルの絶対値、及び前記差分ベクトルに係る予測ベクトルを基にした予め定めた規則に従って前記差分ベクトルの正負符号を推定することにより、前記差分ベクトルの推定符号を決定する差分ベクトル符号推定手段と、前記差分ベクトル生成手段から得られる前記差分ベクトルの正負符号と、前記差分ベクトル符号推定手段から得られる前記差分ベクトルの推定符号とを比較して、両者が等しい場合は真、異なる場合は偽を示す正誤フラグを生成する正誤フラグ生成手段と、前記正誤フラグ生成手段によって生成した前記正誤フラグに対し、前記所定のブロックの位置に応じたコンテキストに適応させた可逆圧縮処理を施すコンテキスト適応型の可逆圧縮手段と、当該可逆圧縮処理を施した前記正誤フラグを前記差分ベクトルの絶対値に対応付けて伝送するためのストリームを生成するストリーム生成手段と、を備えることを特徴とする。 The video encoding device of the present invention is a video encoding device in a video encoding method using motion compensation prediction, and includes difference vector generation means for generating a difference vector based on motion compensation prediction for a predetermined block within a frame. , the estimated sign of the difference vector is estimated by estimating the sign of the difference vector according to a predetermined rule based on information regarding the predetermined block, the absolute value of the difference vector, and a predicted vector related to the difference vector. A difference vector sign estimating means that determines the sign of the difference vector obtained from the difference vector generating means and an estimated sign of the difference vector obtained from the difference vector sign estimating means are compared, and it is determined that the signs of the difference vector are equal. correct/incorrect flag generating means for generating a correct/incorrect flag indicating true if the case is true and false if different; and a reversible method that adapts the correct/incorrect flag generated by the correct/incorrect flag generating means to a context according to the position of the predetermined block. comprising a context-adaptive reversible compression means that performs compression processing, and a stream generation means that generates a stream for transmitting the correct/incorrect flag, which has undergone the reversible compression processing, in association with the absolute value of the difference vector. It is characterized by
また、本発明の映像符号化装置において、前記差分ベクトル符号推定手段は、前記所定のブロックに関する情報、前記差分ベクトルの絶対値、及び前記予測ベクトルを用いて正側及び負側の候補ベクトルを算出し、各候補ベクトルのそれぞれに対応するブロックの位置と前記フレームの画面端との位置関係に応じて、或いは前記所定のブロックの座標及び大きさ、前記正側及び負側の候補ベクトル、並びに前記フレームの画面幅の位置関係に応じて、場合分けした予め定めた規則に基づいて前記差分ベクトルの正負符号を推定することを特徴とする。 Further, in the video encoding device of the present invention, the difference vector code estimating means calculates positive side and negative side candidate vectors using information regarding the predetermined block, the absolute value of the difference vector, and the prediction vector. According to the positional relationship between the position of the block corresponding to each candidate vector and the screen edge of the frame, or the coordinates and size of the predetermined block, the positive side and negative side candidate vectors, and the The present invention is characterized in that the sign of the difference vector is estimated based on a predetermined rule that is divided into cases according to the positional relationship of the screen width of the frame.
また、本発明の映像符号化装置において、前記フレームにおける画面中央の領域と画面端の所定範囲内の領域とに分け、少なくとも前記画面端の所定範囲内の領域に前記所定のブロックが収まっている際に、前記正誤フラグ生成手段を作動させるよう制御する制御手段を更に備えることを特徴とする。 Further, in the video encoding device of the present invention, the frame is divided into an area at the center of the screen and an area within a predetermined range at the edge of the screen, and the predetermined block is contained in at least an area within the predetermined range at the edge of the screen. In this case, the present invention is characterized in that it further comprises a control means for controlling the operation of the correct/incorrect flag generating means.
また、本発明の映像符号化装置において、前記制御手段は、複数分割された前記画面端の所定範囲内の領域のうちいずれの領域に前記所定のブロックが収まっているかに基づいて、前記差分ベクトルの水平成分と垂直成分のそれぞれで前記正誤フラグを使用する成分を切り替えるように制御する手段を有することを特徴とする。 Further, in the video encoding device of the present invention, the control means may control the difference vector based on which region of the plurality of divided regions within a predetermined range of the edge of the screen the predetermined block fits. The present invention is characterized by comprising means for controlling to switch the component for which the correct/incorrect flag is used for each of the horizontal component and the vertical component.
また、本発明の映像符号化装置において、前記制御手段は、前記所定のブロックが前記フレームの画面の上下辺より左右辺に近い場合は、前記差分ベクトル符号推定手段に対し前記差分ベクトルの水平成分の正負符号を先に決定させ、前記所定のブロックが前記フレームの画面の左右辺より上下辺に近い場合は、前記差分ベクトル符号推定手段に対し前記差分ベクトルの垂直成分の正負符号を先に決定させ、前記所定のブロックが前記フレームの画面の左右辺及び上下辺から等距離にある場合は、前記差分ベクトル符号推定手段に対し予め定めた順序で差分ベクトルの水平成分及び垂直成分の正負符号を決定させるように制御する手段を有することを特徴とする。 In the video encoding device of the present invention, if the predetermined block is closer to the left and right sides of the screen of the frame than to the top and bottom sides, the control means controls the difference vector code estimating means to detect the horizontal component of the difference vector. If the predetermined block is closer to the top and bottom sides of the screen of the frame than to the left and right sides of the screen, the difference vector sign estimating means first determines the sign of the vertical component of the difference vector. and when the predetermined block is equidistant from the left and right sides and the top and bottom sides of the screen of the frame, the difference vector sign estimating means calculates the positive and negative signs of the horizontal and vertical components of the difference vector in a predetermined order. It is characterized by having means for controlling the determination.
更に、本発明の映像復号装置は、本発明の映像符号化装置によって伝送されるストリームを入力して読み込み、復号対象のフレーム内の所定のブロックについて前記差分ベクトルの絶対値及び前記可逆圧縮処理が施された正誤フラグを抽出するストリーム読込手段と、該所定のブロックに関する情報、前記差分ベクトルの絶対値、及び前記差分ベクトルに係る予測ベクトルを基にした予め定めた規則に従って前記差分ベクトルの正負符号を推定することにより、前記差分ベクトルの推定符号を決定する差分ベクトル符号推定手段と、前記可逆圧縮処理が施された正誤フラグに対し、当該所定のブロックの位置に応じたコンテキストに適応させた可逆復号処理を施すことにより復号した正誤フラグを生成するコンテキスト適応型の可逆復号手段と、当該復号した前記正誤フラグが真を示すときは、該差分ベクトルの推定符号を当該所定のブロックの差分ベクトルの正負符号とし、偽を示すときは、該差分ベクトルの推定符号を反転した符号を差分ベクトルの正負符号として決定する差分ベクトル符号決定手段と、当該所定のブロックの画像を復元するために、当該抽出した前記差分ベクトルの絶対値、及び前記差分ベクトル符号決定手段によって決定した差分ベクトルの正負符号を用いて、前記復号対象のフレーム内の当該所定のブロックの差分ベクトルを復元する差分ベクトル復元手段と、を備えることを特徴とする。 Furthermore, the video decoding device of the present invention inputs and reads the stream transmitted by the video encoding device of the present invention, and calculates the absolute value of the difference vector and the lossless compression process for a predetermined block in the frame to be decoded. a stream reading means for extracting correct/incorrect flags, and a sign of the difference vector according to a predetermined rule based on information regarding the predetermined block, the absolute value of the difference vector, and a predicted vector related to the difference vector. difference vector sign estimating means that determines the estimated sign of the difference vector by estimating; a context-adaptive reversible decoding means that generates a decoded correct/incorrect flag by performing a decoding process; and when the decoded correct/incorrect flag indicates true, the estimated code of the difference vector is converted to a difference vector sign determining means for determining a sign obtained by inverting the estimated sign of the difference vector as the sign of the difference vector when the sign is positive or negative; difference vector restoring means for restoring the difference vector of the predetermined block in the frame to be decoded using the absolute value of the difference vector determined by the difference vector and the sign of the difference vector determined by the difference vector sign determination means; It is characterized by having the following.
また、本発明の映像復号装置において、前記コンテキスト適応型の可逆復号手段は、当該所定のブロックの画面内の位置に応じてコンテキストとして参照するブロックとして予め定められた位置のブロックを参照して、前記可逆圧縮処理が施された正誤フラグに対し前記可逆復号処理を施すことを特徴とする。 Further, in the video decoding device of the present invention, the context adaptive reversible decoding means refers to a block at a predetermined position as a block to be referred to as a context according to the position of the predetermined block in the screen, The present invention is characterized in that the reversible decoding process is performed on the correctness flag that has been subjected to the reversible compression process.
また、本発明の映像復号装置において、前記コンテキスト適応型の可逆復号手段は、当該所定のブロックの画面内の位置に応じてコンテキストとして参照するブロックとして、当該所定のブロックが画面上下辺よりも画面左右辺に近い場合、当該所定のブロックの直上のブロックを参照し、当該所定のブロックが画面左右辺よりも画面上下辺に近い場合、当該所定のブロックの直左のブロックを参照し、当該所定のブロックが画面左右辺よりも画面上下辺から等距離にある場合、当該所定のブロックの直左、直左上、直上、及び直右上のうち予め定めた1以上のブロックを参照して、前記可逆圧縮処理が施された正誤フラグに対し前記可逆復号処理を施すことを特徴とする。 Further, in the video decoding device of the present invention, the context adaptive reversible decoding means may be configured to determine that the predetermined block is closer to the screen than the top and bottom sides of the screen as a block to be referred to as a context according to the position of the predetermined block in the screen. If it is close to the left and right sides, refer to the block directly above the predetermined block, and if the predetermined block is closer to the top and bottom sides of the screen than to the left and right sides of the screen, refer to the block immediately to the left of the predetermined block, and refer to the block directly above the predetermined block. If the block is equidistant from the top and bottom sides of the screen than from the left and right sides of the screen, the reversible block is The present invention is characterized in that the reversible decoding process is performed on the correctness flag that has been subjected to the compression process.
更に、本発明のプログラムは、コンピューターを、本発明の映像符号化装置として機能させるためのプログラムとして構成する。 Furthermore, the program of the present invention is configured as a program for causing a computer to function as the video encoding device of the present invention.
更に、本発明のプログラムは、コンピューターを、本発明の映像復号装置として機能させるためのプログラムとして構成する。 Furthermore, the program of the present invention is configured as a program for causing a computer to function as the video decoding device of the present invention.
本発明によれば、動き補償予測を用いた映像符号化方式における差分ベクトルの正負符号(+,-)に関して可逆圧縮が可能となり、少なくとも映像を構成するフレームの画面端に位置する予測対象の着目ブロックにおける差分ベクトルの正負符号(+,-)に係る圧縮効率が向上可能となる。 According to the present invention, it is possible to reversibly compress the positive and negative signs (+, -) of a difference vector in a video encoding method using motion compensated prediction, and at least focus on prediction targets located at the screen edges of frames constituting a video. Compression efficiency related to the positive and negative signs (+, -) of the difference vector in the block can be improved.
(用語の定義)
まず、動きベクトルに関して、MPEG-2/H.262方式のように動きベクトルそのものを伝送する場合や、MPEG-H HEVC/H.265方式のように予測ベクトルと差分ベクトルの和として伝送する場合などがある。そこで、本発明に係る映像符号化装置1及び映像復号装置2にて用いる動きベクトルに関して、一般化して述べるために、式(1)を満たすものとして説明する。
(Definition of terms)
First, regarding motion vectors, there are cases where the motion vector itself is transmitted as in the MPEG-2/H.262 system, and cases where it is transmitted as the sum of a predicted vector and a difference vector as in the MPEG-H HEVC/H.265 system. There is. Therefore, in order to generalize the motion vectors used in the
動きベクトル = 予測ベクトル + 差分ベクトル(1) Motion vector = predicted vector + difference vector (1)
式(1)の「予測ベクトル」は、そのベクトルそのものを伝送せずに、所定の番号等を伝送し、その番号等から予め定められた規則によりベクトルを算出するデータを意味する。また、式(1)の「差分ベクトル」は、ベクトルそのものを伝送するデータを意味する。 The "predicted vector" in Equation (1) means data that does not transmit the vector itself, but rather transmits a predetermined number or the like, and calculates a vector from the number or the like according to a predetermined rule. Furthermore, the "difference vector" in equation (1) means data that transmits the vector itself.
本発明は式(1)の予測ベクトルには直接関連せず、差分ベクトルの正負符号に直接関連するものであるため、図1及び図2を参照して後述する本発明による一実施形態の映像符号化装置1及び映像復号装置2では、差分ベクトルの正負符号の伝送に関する主要な構成要素のみを図示して説明する。
Since the present invention is not directly related to the predicted vector in equation (1), but directly related to the sign of the difference vector, an image of an embodiment according to the present invention, which will be described later with reference to FIGS. 1 and 2. In the
尚、MPEG-H HEVC/H.265方式の場合、式(1)の予測ベクトルはMPEG-H HEVC/H.265方式の予測ベクトル(PMV)、式(1)の差分ベクトルはMPEG-H HEVC/H.265方式の差分ベクトル(MVD)にそのまま対応し、本発明に係る映像符号化装置1及び映像復号装置2を適用可能である。
In the case of the MPEG-H HEVC/H.265 method, the predicted vector of equation (1) is the predicted vector (PMV) of the MPEG-H HEVC/H.265 method, and the difference vector of equation (1) is the MPEG-H HEVC The
また、予測ベクトルを用いない映像符号化方式の場合、式(1)の予測ベクトルを0、式(1)の差分ベクトルを当該方式の動きベクトルとして扱うことができ、一般性を失わずに、本発明に係る映像符号化装置1及び映像復号装置2を適用可能である。
In addition, in the case of a video encoding method that does not use a predictive vector, the predictive vector in equation (1) can be treated as 0, and the difference vector in equation (1) can be treated as the motion vector of the method, without loss of generality. The
また、近年では、動きベクトルを算出するために、予測ベクトル、差分ベクトルに加え、予測ベクトルの算出に関する第三のベクトルを加算する映像符号化方式についても検討されているが、この場合でも、式(1)の予測ベクトルを、当該方式の予測ベクトル+当該方式の第三のベクトルとし、式(1)の差分ベクトルを当該方式の差分ベクトルとして扱うことができ、一般性を失わずに、本発明に係る映像符号化装置1及び映像復号装置2を適用可能である。
In addition, in recent years, in order to calculate a motion vector, a video encoding method that adds a third vector related to calculating the predicted vector in addition to the predicted vector and the difference vector has been considered. The predicted vector of (1) can be set as the predicted vector of the method + the third vector of the method, and the difference vector of equation (1) can be treated as the difference vector of the method. The
以下、図1及び図2を参照して、本発明による一実施形態の映像符号化装置1及び映像復号装置2について説明する。
Hereinafter, a
(映像符号化装置)
図1は、本発明による一実施形態の映像符号化装置1の概略構成を示すブロック図である。映像符号化装置1は、画像符号化部10、差分ベクトル符号推定部13、正誤フラグ生成部14、コンテキスト適応型可逆圧縮部15、正負二値化部16、切替部17、設定制御部18、及びストリーム生成部19を備える。画像符号化部10は、動き補償予測部11及び差分ベクトル生成部12を含む。
(Video encoding device)
FIG. 1 is a block diagram showing a schematic configuration of a
画像符号化部10は、符号化対象の映像におけるフレーム画像を入力してブロック分割し、ブロック単位でイントラ予測及びインター予測を行う機能部である。本発明は、インター予測に係る動き補償予測に基づく差分ベクトルの正負符号の圧縮/復号に関する。そこで、図1では、簡潔に、画像符号化部10は、着目ブロックについて動き補償予測に基づく差分ベクトルを生成する機能を有するとして、動き補償予測部11及び差分ベクトル生成部12のみ図示し、予測ベクトルの伝送処理や局部復号処理を含むその他の処理の図示及びその説明は省略している。
The
尚、動き補償予測部11は、入力画像の着目ブロックと局部復号済の参照ブロックとを用いた動き検出に基づいて動き補償予測を行い、予測画像のブロックを生成し差分ベクトル生成部12に出力する。
Note that the motion
また、差分ベクトル生成部12は、当該動き検出によって生成される動きベクトルについて、式(1)に示したように、予測画像のブロックの位置を示す動きベクトルについてインデックス等の所定の番号で近似される予測ベクトルに対しベクトル加算する差分ベクトルを生成する。
Further, the difference
ここで、画像符号化部10は、差分ベクトル生成部12によって生成した差分ベクトルについて、その差分ベクトルの絶対値と差分ベクトルの正負符号とに分けて出力する。
Here, the
差分ベクトル符号推定部13は、画像符号化部10から、当該着目ブロックに関する着目ブロック情報(着目ブロックの位置、サイズ、及びフレーム画像のサイズを含む)、予測ベクトル、及び差分ベクトルの絶対値を入力し、予め定めた規則(即ち、後述する「差分ベクトルの正負符号の推定処理」)に基づいて、当該差分ベクトルの正負符号を推定し、その推定した正負符号を示す差分ベクトル推定符号を正誤フラグ生成部14に出力する。
The difference vector
正誤フラグ生成部14は、差分ベクトル符号推定部13から得られる差分ベクトル推定符号と、画像符号化部10から得られる差分ベクトルの正負符号とを比較して、両者が等しい場合は「真」、異なる場合は「偽」を示す正誤フラグを生成し、コンテキスト適応型可逆圧縮部15に出力する。
The correctness/incorrect flag generation unit 14 compares the difference vector estimation code obtained from the difference vector
コンテキスト適応型可逆圧縮部15は、画像符号化部10から当該着目ブロック情報を入力し、且つ正誤フラグ生成部14から正誤フラグを入力し、当該着目ブロック情報に基づいてコンテキストモデルを指定し、当該正誤フラグに対してコンテキスト適応型の可逆圧縮符号化処理を施すことにより、可逆圧縮した正誤フラグを生成し切替部17に出力する。尚、コンテキスト適応型の可逆圧縮符号化処理は、例えばMPEG-H HEVC/H.265方式に準じる映像符号化方式とする場合ではCABAC(Context-based Adaptive Binary Arithmetic Coding)を、AVC/H.264方式に準じる映像符号化方式とする場合ではCABAC又はCAVLC(Context-based Adaptive Variable Length Coding)を利用できる。即ち、コンテキスト適応型可逆圧縮部15は、コンテキストモデルに従い、当該着目ブロックの位置における周囲の状況(コンテキスト)に応じて適応的に2値化する符号化を行う。
The context adaptive
ただし、本実施形態における映像符号化装置1では、正誤フラグの可逆圧縮に係るコンテキストモデルとして、図9を参照して詳細は後述するが、着目ブロック周辺におけるどのブロックをコンテキストとして参照するかについての好適例がある。
However, in the
正負二値化部16は、従来技法と同様に、正負符号の+/-を1/0のビット表現とする二値化処理を行って切替部17に出力する。
Similar to the conventional technique, the positive/
切替部17は、設定制御部18の制御により、当該着目ブロックの差分ベクトルの正負符号の伝送について、コンテキスト適応型可逆圧縮部15によって可逆圧縮した正誤フラグにより伝送するか、正負二値化部16によって単純に二値化した正負符号により伝送するかを切り替えて、ストリーム生成部19に出力する機能部である。
Under the control of the setting
設定制御部18は、フレーム画像における当該着目ブロックの位置に応じて、本発明に係る「差分ベクトルの正負符号の推定処理」に係るコンテキストモデルを指定する領域と、従来技法と同様に正負符号の+/-を1/0のビット表現とする領域を予め定めた設定情報を有し、当該設定情報に基づいて切替部17における切り替えを制御する。本例では、設定制御部18が当該設定情報をストリーム生成部19に出力する例を説明するが、当該設定情報について映像符号化装置1及び映像復号装置2間で予め定めておくときは映像符号化装置1から映像復号装置2へと伝送する必要はない。
The setting
尚、図1において、設定制御部18は、切替部17における切り替えを制御しコンテキスト適応型可逆圧縮部15と正負二値化部16の出力の切り替えを行う構成例を示しているが、差分ベクトル符号推定部13、正誤フラグ生成部14及びコンテキスト適応型可逆圧縮部15の動作と、正負二値化部16の動作の切り替えを行うよう構成してもよい。
Note that in FIG. 1, a configuration example is shown in which the
ストリーム生成部19は、画像符号化部10から得られる当該着目ブロックに対応する差分ベクトルの絶対値に対し、切替部17から得られる当該可逆圧縮後の正誤フラグ又は当該単純に二値化した正負符号を対応付けて伝送するためのストリームを生成し外部に出力する。本例では、設定制御部18から得られる当該設定情報が、着目ブロック情報(着目ブロックの位置、サイズ、及びフレーム画像のサイズを含む)とともに、当該ストリーム中のヘッダ(スライス又はタイルのヘッダ、ピクチャのヘッダ、及びシーケンスのヘッダのいずれか1つ以上を含む)に埋め込まれる。尚、ストリーム中には予測ベクトル等の復号に必要な情報も含まれる。差分ベクトルの正負符号以外の伝送に関しては従来技法に基づく任意の方法が利用できるため、その説明は省略する。
The
このように、映像符号化装置1は、着目ブロックについて動き補償予測に基づく差分ベクトルを生成し、その差分ベクトルの正負符号について、着目ブロック情報、差分ベクトルの絶対値、及び差分ベクトルに係る予測ベクトルを基にした予め定めた規則(即ち、後述する「差分ベクトルの正負符号の推定処理」)に従って当該差分ベクトルの正負符号を推定する。そして、映像符号化装置1は、当該差分ベクトルについて推定した正負符号(差分ベクトル推定符号)が差分ベクトル生成時に得られる差分ベクトルの正負符号と等しければ真とし、異なっていれば偽とする正誤フラグを生成し、コンテキスト適応型の可逆圧縮処理を行って伝送する。
In this way, the
これにより、発生確率に偏りが生じるフレーム画像内の着目ブロックの場合に、その差分ベクトルの正負符号(+,-)について正誤フラグで表現し、その圧縮(可逆圧縮)が可能となり、より映像符号化に係る圧縮効率を向上させることが可能となる。 As a result, in the case of a block of interest in a frame image where the probability of occurrence is biased, the positive and negative signs (+, -) of the difference vector are expressed as true/false flags, and compression (reversible compression) becomes possible, which improves video encoding. It becomes possible to improve the compression efficiency related to
(映像復号装置)
図2は、本発明による一実施形態の映像復号装置2の概略構成を示すブロック図である。映像復号装置2は、ストリーム読込部20、画像復号部21、設定制御部24、切替部25、コンテキスト適応型可逆復号部26、差分ベクトル符号推定部27、差分ベクトル符号決定部28、及び正負決定部29を備える。画像復号部21は、差分ベクトル復元部22及び動き補償予測部23を含む。
(Video decoding device)
FIG. 2 is a block diagram showing a schematic configuration of a
ストリーム読込部20は、映像符号化装置1から伝送されたストリームを読み込み、着目ブロックにおける差分ベクトルの絶対値に関する信号については画像復号部21及び差分ベクトル符号推定部27に出力し、当該差分ベクトルの絶対値に対応付けて伝送されている、当該可逆圧縮後の正誤フラグ又は当該単純に二値化した正負符号については切替部25に出力する。
The
画像復号部21は、ブロック単位でイントラ予測及びインター予測を行って復号を行う機能部である。本発明は、インター予測に係る動き補償予測に基づく差分ベクトルの正負符号の圧縮/復号に関する。そこで、図2では、簡潔に、画像復号部21は、着目ブロックについて復元した差分ベクトル、予測ベクトル、及び復号済の参照ブロックを用いて動き補償予測を行い、伝送された画像を復元する機能を有するとして、差分ベクトル復元部22及び動き補償予測部23のみ図示し、予測ベクトルの復号処理を含むその他の処理の図示及びその説明は省略している。
The
尚、差分ベクトル復元部22は、ストリーム読込部20から入力される差分ベクトルの絶対値と、当該差分ベクトルの絶対値に対応付けて伝送されていた、当該可逆圧縮後の正誤フラグ又は当該単純に二値化した正負符号とを用いて、差分ベクトルを復元する。
Note that the difference
また、動き補償予測部23は、差分ベクトル復元部22によって復元した差分ベクトル、伝送される予測ベクトル、及び復号済の参照ブロックを用いて動き補償予測を行い、当該着目ブロックの画像を復元する。
Further, the motion
設定制御部24は、フレーム画像における当該着目ブロックの位置に応じて、本発明に係る「差分ベクトルの正負符号の推定処理」に係るコンテキストモデルを指定する領域と、従来技法と同様に正負符号の+/-を1/0のビット表現とする領域を予め定めた設定情報に基づいて切替部25における切り替えを制御する。本例では、当該設定情報が当該ストリーム中のヘッダ(スライス又はタイルのヘッダ、ピクチャのヘッダ、及びシーケンスのヘッダのいずれか1つ以上を含む)に埋め込まれている。そこで、設定制御部24は、当該設定情報を抽出し、その抽出した設定情報に基づいて、切替部25における切り替えを制御する。尚、当該設定情報について映像符号化装置1及び映像復号装置2間で予め定めておくときは映像符号化装置1から映像復号装置2へと伝送する必要はなく、当該設定情報をヘッダに埋め込む必要もない。
The setting
切替部25は、設定制御部24の制御により、可逆圧縮した正誤フラグと単純に二値化した差分ベクトルの正負符号を切り替えて、それぞれコンテキスト適応型可逆復号部26及び正負決定部29に出力する機能部である。
Under the control of the setting
本例では、図2において、設定制御部24は、切替部25における切り替えを制御し、それぞれ後述するコンテキスト適応型可逆復号部16と正負決定部29への入力の切り替えを行う構成例を示しているが、それぞれ後述するコンテキスト適応型可逆復号部26、差分ベクトル符号推定部27、及び差分ベクトル符号決定部28の動作と、正負決定部29の動作の切り替えを行うよう構成してもよい。
In this example, FIG. 2 shows a configuration example in which the
コンテキスト適応型可逆復号部26は、ストリーム読込部20から、当該着目ブロック情報、及び切替部25を介して映像符号化装置1側で可逆圧縮された正誤フラグを入力し、当該着目ブロック情報に基づいてコンテキストモデルを指定し、当該正誤フラグに対してコンテキスト適応型の可逆復号処理を施すことにより、復号した正誤フラグを生成し差分ベクトル符号決定部28に出力する。尚、コンテキスト適応型の可逆復号処理は、例えば、MPEG-H HEVC/H.265方式に準じる映像符号化方式とする場合ではCABACを利用でき、一方、AVC/H.264方式に準じる映像符号化方式とする場合ではCABAC又はCAVLCを利用できる。即ち、コンテキスト適応型可逆復号部26は、コンテキストモデルに従い、当該着目ブロックの位置における周囲の状況(コンテキスト)に応じて適応的に2値化する復号を行う。また、当該着目ブロック情報(着目ブロックの位置、サイズ、及びフレーム画像のサイズを含む)は、当該ストリーム中のヘッダ(スライス又はタイルのヘッダ、ピクチャのヘッダ、及びシーケンスのヘッダのいずれか1つ以上を含む)に埋め込まれている。
The context adaptive
ただし、本実施形態における映像復号装置2では、正誤フラグの可逆圧縮に係るコンテキストモデルとして、図9を参照して詳細は後述するが、着目ブロック周辺におけるどのブロックをコンテキストとして参照するかについての好適例がある。
However, in the
差分ベクトル符号推定部27は、映像符号化装置1側の差分ベクトル符号推定部13と同様の処理を行う。差分ベクトル符号推定部27は、ストリーム読込部20から当該着目ブロック情報及び差分ベクトルの絶対値を入力し、画像復号部21から予測ベクトルを入力し、当該予め定めた規則(即ち、後述する「差分ベクトルの正負符号の推定処理」)に基づいて、当該差分ベクトルの正負符号を推定し、その推定した正負符号を示す差分ベクトル推定符号を差分ベクトル符号決定部28に出力する。
The difference vector
差分ベクトル符号決定部28は、コンテキスト適応型可逆復号部26から得られる正誤フラグが「真」を示すときは、差分ベクトル符号推定部27から得られる差分ベクトル推定符号をそのまま差分ベクトルの正負符号として決定して画像復号部21に出力し、当該正誤フラグが「偽」を示すときは、差分ベクトル推定符号を反転した符号を差分ベクトルの正負符号として決定して画像復号部21に出力する。
When the correctness flag obtained from the context adaptive
正負決定部29は、切替部25を介して得られる単純に二値化された差分ベクトルの正負符号の0/1のビット表現に対応して、従来技法と同様に、当該差分ベクトルの正負符号の+/-を決定し、画像復号部21に出力する。
In response to the 0/1 bit representation of the sign of the simply binarized difference vector obtained via the switching unit 25, the
これにより、画像復号部21における差分ベクトル復元部22は、ストリーム読込部20から入力される差分ベクトルの絶対値と、当該差分ベクトルの絶対値に対応付けて伝送されていた、当該可逆圧縮後の正誤フラグ又は当該単純に二値化した正負符号とを用いて、差分ベクトルを復元する。
As a result, the difference
このように、映像復号装置2は、ストリームから読み込んだ着目ブロックに関する差分ベクトルの正負符号について、当該予め定めた規則(即ち、後述する「差分ベクトルの正負符号の推定処理」)に基づいて当該差分ベクトルの正負符号を推定し、ストリームから読み込んだコンテキスト適応型の可逆圧縮が施された正誤フラグを可逆復号する。そして、映像復号装置2は、当該正誤フラグが真を示すときは、当該推定した正負符号(差分ベクトル推定符号)を差分ベクトルの正負符号とし、偽を示すときは、当該推定した正負符号(差分ベクトル推定符号)を反転した符号を差分ベクトルの正負符号として決定する。
In this way, the
これにより、発生確率に偏りが生じるフレーム画像内の着目ブロックの場合に、その差分ベクトルの正負符号(+,-)について圧縮(可逆圧縮)された正誤フラグの復号(可逆復号)が可能となり、映像符号化に係る圧縮効率をより向上させることが可能となる。 As a result, in the case of a block of interest in a frame image where the probability of occurrence is biased, it becomes possible to decode (reversible decoding) the correct/incorrect flag compressed (reversible compression) for the positive/negative sign (+, -) of the difference vector. It becomes possible to further improve the compression efficiency related to video encoding.
(実施例1:差分ベクトルの正負符号の推定処理)
図3は、本発明による一実施形態の映像符号化装置1(差分ベクトル符号推定部13)、及び映像復号装置2(差分ベクトル符号推定部27)における実施例1の差分ベクトルの正負符号の推定処理を示すフローチャートである。
(Example 1: Estimating the sign of the difference vector)
FIG. 3 shows estimation of the positive and negative signs of the difference vector in Example 1 in the video encoding device 1 (difference vector code estimating unit 13) and the video decoding device 2 (difference vector code estimating unit 27) according to an embodiment of the present invention. 3 is a flowchart showing processing.
まず、差分ベクトル符号推定部13,27は、着目ブロックについて、差分ベクトルの絶対値を入力(読み込み)(ステップS11)、差分ベクトルの絶対値=0であるか否かを判定する(ステップS12)。
First, the difference vector sign
差分ベクトルの絶対値のビットストリームからの読み込み方法については、従来技法と同様の方法を用いればよい。例えば、ビットストリームからゴロム符号化された差分ベクトルの絶対値を読み込むことや、HEVC/H.265方式のように差分ベクトルの絶対値が0より大きいことを示すフラグ、1より大きいことを示すフラグ、ゴロム符号化された差分ベクトルの絶対値などの組合せで読み込んでもよい。 As for the method of reading the absolute value of the difference vector from the bit stream, a method similar to the conventional technique may be used. For example, reading the absolute value of a Golomb-encoded difference vector from a bitstream, a flag indicating that the absolute value of the difference vector is greater than 0, or a flag indicating that it is greater than 1, as in the HEVC/H.265 system. , the absolute value of the Golomb-encoded difference vector, etc. may be read in combination.
差分ベクトルの絶対値=0であるとき(ステップS12:Y)、差分ベクトル符号推定部13,27は、差分ベクトルの正負符号なしとして推定処理を終了する(ステップS13)。読み込んだ差分ベクトルの絶対値が0の場合は正負符号を決める必要がないため、これ以降の処理は行わずに、差分ベクトル=0となり、差分ベクトルの正負符号なしとして推定処理を終了する。
When the absolute value of the difference vector is 0 (step S12: Y), the difference vector
一方、差分ベクトルの絶対値≠0であるとき(ステップS12:N)、差分ベクトル符号推定部13,27は、まず、当該着目ブロックに関する正側及び負側の候補ベクトルVA,VBを算出する(ステップS14)。
候補ベクトルVA=予測ベクトル+差分ベクトルの絶対値
候補ベクトルVB=予測ベクトル-差分ベクトルの絶対値
On the other hand, when the absolute value of the difference vector≠0 (step S12: N), the difference vector
Candidate vector V A = Predicted vector + absolute value of difference vector Candidate vector V B = Predicted vector - absolute value of difference vector
尚、予測ベクトルはHEVC/H.265方式等の従来技法通りの方法で求めることができる。予測ベクトルは、差分ベクトルの絶対値や正誤フラグより先に求めてもよい。 Note that the predicted vector can be obtained using a conventional method such as the HEVC/H.265 method. The predicted vector may be obtained before the absolute value of the difference vector or the correct/incorrect flag.
続いて、差分ベクトル符号推定部13,27は、着目ブロックBKnを候補ベクトルVA、候補ベクトルVBにそれぞれ移動したブロックBKA、ブロックBKBを算出する(ステップS15)。 Subsequently, the difference vector sign estimating units 13 and 27 calculate a block BKA and a block BK B obtained by moving the block of interest BKn to the candidate vector V A and the candidate vector V B , respectively (step S15).
続いて、差分ベクトル符号推定部13,27は、ブロックBKA,BKBが双方とも完全に画面内であるかを判定する(ステップS16)。
Subsequently, the difference vector sign
ブロックBKA,BKBが双方とも完全に画面内であるとき(ステップS16:Y)、差分ベクトル符号推定部13,27は、差分ベクトルの正負符号をデフォルト値として推定し、差分ベクトル推定符号=デフォルト値として決定する(ステップS17)。本例では“正”をデフォルト値として説明するが、“負”をデフォルト値としてもよい。
When both blocks BK A and BK B are completely within the screen (step S16: Y), the difference vector sign
尚、ステップS17に係る差分ベクトル推定符号のデフォルト値は、本例では設定情報として、ストリーム中のヘッダ(スライス又はタイルのヘッダ、ピクチャのヘッダ、及びシーケンスのヘッダのいずれか1つ以上を含む)に埋め込まれる。ただし、当該デフォルト値について映像符号化装置1及び映像復号装置2間で予め定めておくときは映像符号化装置1から映像復号装置2へと伝送する必要はなく、当該設定情報をヘッダに埋め込む必要もない。
In addition, in this example, the default value of the difference vector estimation code related to step S17 is set to the header in the stream (including any one or more of a slice or tile header, a picture header, and a sequence header) as setting information. embedded in. However, if the default value is determined in advance between the
ブロックBKA,BKBが双方とも完全に画面内でないとき(ステップS16:N)、差分ベクトル符号推定部13,27は、続いてブロックBKA,BKBが双方とも完全に画面外であるかを判定する(ステップS18)。
When both blocks BK A and BK B are not completely within the screen (step S16: N), the difference vector sign
ブロックBKA,BKBが双方とも完全に画面外であるとき(ステップS18:Y)、差分ベクトル符号推定部13,27は、「ブロックBKAとその最近接の画面端との距離」と、「ブロックBKBとその最近接の画面端との距離」とを比較する(ステップS19)。
When both blocks BK A and BK B are completely outside the screen (step S18: Y), the difference vector
ブロックBKAとその最近接の画面端との距離が、ブロックBKBとその最近接の画面端との距離より大きいとき(ステップS19:Y)、差分ベクトル符号推定部13,27は、差分ベクトル推定符号=負として決定する(ステップS21)。
When the distance between block BK A and its nearest screen edge is greater than the distance between block BK B and its nearest screen edge (step S19: Y), the difference vector sign
また、ブロックBKAとその最近接の画面端との距離が、ブロックBKBとその最近接の画面端との距離より小さいとき(ステップS19:N)、差分ベクトル符号推定部13,27は、差分ベクトル推定符号=正として決定する(ステップS20)。
Further, when the distance between block BK A and its nearest screen edge is smaller than the distance between block BK B and its nearest screen edge (step S19: N), the difference vector
例えば図4(a)に示すように、差分ベクトルの正符号が右方向、差分ベクトルの負符号が左方向を示すとして、候補ベクトルVAに対応するブロックBKAと候補ベクトルVBに対応するブロックBKBが双方とも画面外にある例を説明する。ブロックBKAとその最近接の画面端との距離DAが、候補ベクトルVBに対応するブロックBKBとその最近接の画面端との距離DBより小さいときには、差分ベクトル推定符号=正として決定することで、ブロックBKAの方がブロックBKBよりも予測確度が高いとして判断する。 For example, as shown in FIG. 4A, assuming that the positive sign of the difference vector indicates the right direction and the negative sign of the difference vector indicates the left direction, the block BK A corresponding to the candidate vector V A corresponds to the candidate vector V B. An example in which both blocks BKB and B are outside the screen will be explained. When the distance D A between block BK A and its nearest screen edge is smaller than the distance D B between block BK B corresponding to candidate vector V B and its nearest screen edge, the difference vector estimation sign is assumed to be positive. By making this determination, it is determined that block BK A has higher prediction accuracy than block BK B.
また、ブロックBKAとその最近接の画面端との距離が、ブロックBKBとその最近接の画面端との距離と等しいとき、差分ベクトル符号推定部13,27は、差分ベクトル推定符号=正又は負の予め指定された方(図3に示すステップS19では差分ベクトル推定符号=正)として決定する。
Further, when the distance between block BK A and its nearest screen edge is equal to the distance between block BKB and its nearest screen edge, the difference vector
尚、ステップS19に係る比較で、差分ベクトル推定符号=正又は負の予め指定された方として決定するにあたり、第2のデフォルト値として(或いは共通に用いるデフォルト値として)示す設定情報を、ストリーム中のヘッダ(スライス又はタイルのヘッダ、ピクチャのヘッダ、及びシーケンスのヘッダのいずれか1つ以上を含む)に埋め込んで伝送する形態とすることもできる。ただし、当該第2のデフォルト値について映像符号化装置1及び映像復号装置2間で予め定めておくときは映像符号化装置1から映像復号装置2へと伝送する必要はなく、当該設定情報をヘッダに埋め込む必要もない。
In addition, in the comparison related to step S19, when determining the difference vector estimation sign as the prespecified positive or negative one, setting information indicated as the second default value (or as a commonly used default value) is set in the stream. It may also be transmitted by being embedded in a header (including any one or more of a slice or tile header, a picture header, and a sequence header). However, when the second default value is determined in advance between the
一方、ブロックBKA,BKBが双方とも完全に画面内でも画面外でもないとき(ステップS18:N)、即ち、ブロックBKA,BKBのうち少なくとも一方が部分的に画面外であるとき、差分ベクトル符号推定部13,27は、ブロックBKA, BKBの画面外の領域の面積を算出する(ステップS22)。
面積SA=ブロックBKAの画面外にはみ出す面積
面積SB=ブロックBKBの画面外にはみ出す面積
On the other hand, when both blocks BK A and BK B are neither completely within the screen nor completely outside the screen (step S18: N), that is, when at least one of the blocks BK A and BK B is partially outside the screen, The difference vector sign
Area S A = Area of block BK A that protrudes from the screen Area S B = Area of block BK B that protrudes from the screen
続いて、差分ベクトル符号推定部13,27は、面積SAと面積SBとを比較する(ステップS23)。
Subsequently, the difference vector sign
面積SAが、面積SBより大きいとき(ステップS23:Y)、差分ベクトル符号推定部13,27は、差分ベクトル推定符号=負として決定する(ステップS25)。
When the area S A is larger than the area S B (step S23: Y), the difference vector sign
面積SAが、面積SBより小さいとき(ステップS23:N)、差分ベクトル符号推定部13,27は、差分ベクトル推定符号=正として決定する(ステップS24)。
When the area SA is smaller than the area S B (step S23: N), the difference vector
例えば図4(b)に示すように、差分ベクトルの正符号が右方向、差分ベクトルの負符号が左方向を示すとして、候補ベクトルVAに対応するブロックBKAと候補ベクトルVBに対応するブロックBKBとの双方の一部が画面外にある例を説明する。面積SBが、面積SAより大きいときには、差分ベクトル推定符号=正として決定することで、ブロックBKAの方がブロックBKBよりも予測確度が高いとして判断する。 For example, as shown in FIG. 4(b), assuming that the positive sign of the difference vector indicates the right direction and the negative sign of the difference vector indicates the left direction, the block BK A corresponding to the candidate vector V A corresponds to the candidate vector V B. An example in which a portion of both blocks BK and B is outside the screen will be described. When the area S B is larger than the area S A , the difference vector estimation sign is determined to be positive, thereby determining that the prediction accuracy of the block BK A is higher than that of the block BK B.
面積SAが、面積SBと等しいとき、差分ベクトル符号推定部13,27は、差分ベクトル推定符号=正又は負の予め指定された方(図3に示すステップS23では差分ベクトル推定符号=正)として決定する。
When the area S A is equal to the area S B , the difference vector
尚、ステップS23に係る比較で、差分ベクトル推定符号=正又は負の予め指定された方として決定するにあたり、第3のデフォルト値として(或いは共通に用いるデフォルト値として)示す設定情報を、ストリーム中のヘッダ(スライス又はタイルのヘッダ、ピクチャのヘッダ、及びシーケンスのヘッダのいずれか1つ以上を含む)に埋め込んで伝送する形態とすることもできる。ただし、当該第3のデフォルト値について映像符号化装置1及び映像復号装置2間で予め定めておくときは映像符号化装置1から映像復号装置2へと伝送する必要はなく、当該設定情報をヘッダに埋め込む必要もない。
In addition, in the comparison related to step S23, when determining the difference vector estimation sign as the prespecified positive or negative one, setting information indicated as the third default value (or as a commonly used default value) is set in the stream. It may also be transmitted by being embedded in a header (including any one or more of a slice or tile header, a picture header, and a sequence header). However, when the third default value is determined in advance between the
ステップS17,S20,S21,S24,S25を経て決定した差分ベクトル推定符号は、図1に示す映像符号化装置1側では正誤フラグ14へ、図2に示す映像復号装置2側では差分ベクトル符号決定部28へ出力される(ステップS26)。
The difference vector estimation code determined through steps S17, S20, S21, S24, and S25 is sent to the correctness flag 14 on the
このようにして、差分ベクトル符号推定部13,27は、当該着目ブロック情報、差分ベクトルの絶対値、及び予測ベクトルを用いて、正側及び負側の候補ベクトルVA,VBを算出し、候補ベクトルVA,VBのそれぞれに対応するブロックBKA,BKBの位置と画面端との位置関係に応じて場合分けした予め定めた規則に基づいて差分ベクトルの正負符号を推定し、差分ベクトル推定符号を決定する。
In this way, the difference vector
そして、映像符号化装置1側では、正誤フラグ生成部14は、差分ベクトル符号推定部13から得られる差分ベクトル推定符号と、画像符号化部10から得られる差分ベクトルの正負符号とを比較して、両者が等しい場合は「真」、異なる場合は「偽」を示す正誤フラグを生成する。
Then, on the
また、映像復号装置2側では、差分ベクトル符号決定部28は、正誤フラグが「真」を示すときは当該差分ベクトル推定符号をそのまま差分ベクトルの正負符号として決定し、「偽」を示すときは、当該差分ベクトル推定符号を反転した符号を差分ベクトルの正負符号として決定する。
Furthermore, on the
(本発明の原理)
ここで、実施例1の差分ベクトルの正負符号の推定処理に係る原理を説明する。図5(a),(b),(c)は、本発明による一実施形態の映像復号装置2における実施例1の差分ベクトルの正負符号の推定処理に係る着目ブロックBKnと候補ベクトルVA,VB、及び候補ベクトルVA,VBにそれぞれ対応するブロックBKA,BKBに関する説明図である。
(Principle of the present invention)
Here, the principle related to the process of estimating the sign of the difference vector in the first embodiment will be explained. FIGS. 5(a), (b), and (c) show a block of interest BKn and candidate vectors V A , FIG. 3 is an explanatory diagram regarding blocks BK A and BK B corresponding to V B and candidate vectors V A and V B , respectively.
図5を参照して本発明の原理説明を簡単にするために、予測ベクトル=0とし、更に差分ベクトルのうち水平成分の符号のみに着目し、映像復号装置2により差分ベクトルの正負符号を求める復号動作と、本発明の効果を説明する。図5に示す説明では、差分ベクトルの正符号が右方向、差分ベクトルの負符号が左方向を示すとする。
In order to simplify the explanation of the principle of the present invention with reference to FIG. 5, the predicted vector is set to 0, and further, focusing only on the sign of the horizontal component of the difference vector, the
図5(a)に示すように、着目ブロックBKnが画面内における画面端に存在するとする。この着目ブロックBKnに対して、所定長さを有する差分ベクトルの絶対値を入力(読み込み)したとする。 As shown in FIG. 5A, it is assumed that the block of interest BKn exists at the edge of the screen. Assume that the absolute value of a difference vector having a predetermined length is input (read) to this block of interest BKn.
図5(b)に示すように、まず、差分ベクトル符号推定部13,27は、当該着目ブロックBKnに関する正側及び負側の候補ベクトルVA,VBを算出する(図3:ステップS14)。
As shown in FIG. 5B, first, the difference vector
図5(c)に示すように、次に、差分ベクトル符号推定部13,27は、着目ブロックBKnを候補ベクトルVA、候補ベクトルVBにそれぞれ移動したブロックBKA、ブロックBKBを算出する(図3:ステップS15)。
As shown in FIG. 5(c), next, the difference vector
図5(c)に示す例では、ブロックBKAは画面内、ブロックBKBは画面外に位置しているため、差分ベクトル符号推定部13,27は、ブロックBKA, BKBの画面外の領域の面積SA,SBを算出する(図3:ステップS22)。
In the example shown in FIG. 5(c), the block BK A is located within the screen and the block BK B is located outside the screen, so the difference vector
そして、差分ベクトル符号推定部13,27は、面積SAと、面積SBとを比較する(図3:ステップS23)。図5(c)に示す例では、ブロックBKBの画面外にはみ出す面積SB(=ブロックBKBの面積)が、ブロックBKAの画面外にはみ出す面積SA(=0)より大きいため、この着目ブロックBKnの差分ベクトル推定符号は“正”となる(図3:ステップS24)。
Then, the difference vector sign
映像符号化装置1側では、差分ベクトル符号推定部13による推定処理で得られた当該差分ベクトル推定符号が、実際の当該差分ベクトルの正負符号と等しければ真とし、異なっていれば偽とする正誤フラグを生成し、コンテキスト適応型の可逆圧縮処理を行って伝送する。例えば映像符号化装置1は、真を示す正誤フラグを映像復号装置2に伝送する。
On the
映像復号装置2側では、当該正誤フラグが真を示すときは、当該差分ベクトル推定符号を差分ベクトルの正負符号とし、偽を示すときは、当該推定した正負符号を反転した符号を差分ベクトルの正負符号として決定する。例えば映像符号化装置1が真を示す正誤フラグを映像復号装置2に伝送していた場合、映像復号装置2は、当該差分ベクトル推定符号を差分ベクトルの正負符号とする。このため、図5を参照した本例では、映像復号装置2は、最終的にこの着目ブロックBKnの差分ベクトルの正負符号は正と決定する。
On the
このように、本発明に係る映像符号化装置1及び映像復号装置2では、差分ベクトルの正負符号を正誤フラグで表現しており、以下に示す2つの理由により、コンテキスト適応型の可逆圧縮により圧縮が可能である。
In this way, in the
第1の理由として、一般に、候補ベクトルが示すブロックが画面外にはみ出すとき、その画面外にはみ出す面積が大きいと動き補償予測の効果が低下する。このため、多くの動きベクトルは画面外を指さない場合が多い。そこで、本発明に係る「差分ベクトルの正負符号の推定処理」では、着目ブロックBKnの差分ベクトルの正負符号が“正”と仮定した場合(候補ベクトルVA,ブロックBKA)と、“負”と仮定した場合(候補ベクトルVB,ブロックBKB)とを比較し、各ブロックBKA, BKBの画面外にはみ出す面積が少ない方の符号を推定符号とする。このため、推定符号の正誤を表す正誤フラグは「真」となる確率が高くなり、圧縮(可逆圧縮)が可能となる。 The first reason is that, in general, when a block indicated by a candidate vector protrudes outside the screen, the effect of motion compensation prediction decreases if the area of the block that protrudes outside the screen is large. For this reason, many motion vectors often do not point outside the screen. Therefore, in the "estimation process of the sign of the difference vector" according to the present invention, in the case where it is assumed that the sign of the difference vector of the block of interest BKn is "positive" (candidate vector V A , block BK A ), and when it is assumed that the sign is "negative" (candidate vector V B , block BK B ), and the code with the smaller area protruding outside the screen of each block BK A , BK B is set as the estimated code. Therefore, the probability that the correct/incorrect flag representing the correctness of the estimated code becomes "true" becomes high, and compression (reversible compression) becomes possible.
第2の理由として、上記の第1の理由における「多くの動きベクトルは画面外を指さない場合が多い」とする仮定が成り立たないシーンの場合も、圧縮(可逆圧縮)が可能であり、その例を図6に示す。 The second reason is that compression (reversible compression) is possible even in scenes where the assumption in the first reason above that "many motion vectors often do not point outside the screen" does not hold. An example is shown in FIG.
図6はカメラをパンした映像の例であり、被写体に対し着目フレームFNが前フレームFN-1に対し相対的に画像が全体的に左方シフトした様子を示している。着目フレームFNにて例えば図示するように画面端に位置する着目ブロックBKnに対し、この着目ブロックBKnの動き補償予測の参照先として適切なブロックは、前フレームFN-1におけるブロックBKAである。即ち、着目ブロックBKnの動きベクトルは画面外を指し示している。説明を簡単にするために、予測ベクトルを全て0とすると、差分ベクトルの正負符号は正となる。 FIG. 6 is an example of an image obtained by panning the camera, and shows how the frame of interest F N of the object is shifted to the left as a whole relative to the previous frame F N-1 . For the target block BKn located at the edge of the screen in the target frame FN , for example, as shown in the figure, the appropriate block as a reference destination for motion compensation prediction of this target block BKn is the block BKA in the previous frame FN-1. be. That is, the motion vector of the block of interest BKn points outside the screen. To simplify the explanation, if all predicted vectors are assumed to be 0, the sign of the difference vector will be positive.
本発明に係る「差分ベクトルの正負符号の推定処理」では、差分ベクトル符号推定部13,27は、正側及び負側の候補ベクトルVA,VBを算出し(図3:ステップS14)、着目ブロックBKnを候補ベクトルVA、候補ベクトルVBにそれぞれ移動したブロックBKA、ブロックBKBを算出する(図3:ステップS15)。
In the "estimation process for the sign of the difference vector" according to the present invention, the difference vector
このとき、ブロックBKAは画面外にはみ出す領域を持つのに対し、ブロックBKBは画面内に留まるため、差分ベクトル符号推定部13,27は、差分ベクトル符号推定部13,27は、ブロックBKA, BKBの画面外の領域の面積SA,SBを算出する(図3:ステップS22)。 At this time, block BK A has an area that protrudes outside the screen, whereas block BK B remains within the screen. The areas S A and S B of the areas outside the screen of A and BKB are calculated (FIG. 3: Step S22).
続いて、差分ベクトル符号推定部13,27は、面積SAと、面積SBとを比較する(図3:ステップS23)。図6に示す例では、ブロックBKBの画面外にはみ出す面積SBが、ブロックBKAの画面外にはみ出す面積SAより小さいため、この着目ブロックBKnの差分ベクトル推定符号は“負” (候補ベクトルVB,ブロックBKB)となる(図3:ステップS25)。
Subsequently, the difference vector sign
従って、映像符号化装置1側では、差分ベクトル符号推定部13による推定処理で得られた当該差分ベクトル推定符号が、実際の当該差分ベクトルの正負符号と異なっているため、「偽」とする正誤フラグを生成しコンテキスト適応型の可逆圧縮処理を行って伝送する。
Therefore, on the
そして、映像復号装置2側では、当該正誤フラグが「偽」を示すため、同様に推定した“負”を示す当該差分ベクトル推定符号を反転し、最終的にこの着目ブロックBKnの差分ベクトルの正負符号は“正” (候補ベクトルVA,ブロックBKA)と決定する。
Then, on the
このように、着目フレームFNにおける着目ブロックBKnに対し、差分ベクトルの正負符号として、最終的には正確な “正”(候補ベクトルVA,ブロックBKA)を決定しつつ、差分ベクトル推定符号としては各ブロックBKA, BKBの画面外にはみ出す面積が少ない方の符号である“負” (候補ベクトルVB,ブロックBKB)を推定符号とし、正誤フラグは「偽」としている。 In this way, for the block of interest BKn in the frame of interest FN , while ultimately determining the correct "positive" (candidate vector V A , block BK A ) as the sign of the difference vector, the estimated sign of the difference vector is determined. As such, "negative" (candidate vector V B , block BKB ), which is the code with the smaller area protruding from the screen of each block BK A and BK B , is set as the estimated code, and the correct/incorrect flag is set as "false".
同様に、着目フレームFNにて画面端に位置する着目ブロックBKnの上方に位置するブロックBKn(1),BKn(2),BKn(3),BKn(4)を着目ブロックとするときも、それぞれの動きベクトルは画面外を指し、いずれも正誤フラグは「偽」となる。 Similarly, when the blocks BKn(1), BKn(2), BKn(3), and BKn(4) located above the block of interest BKn located at the edge of the screen in the frame of interest FN are set as blocks of interest, Each motion vector points outside the screen, and the correct/incorrect flag for each is "false".
そして、映像符号化装置1及び映像復号装置2では着目ブロックBKnに関する差分ベクトルの正負符号に係る正誤フラグに対しコンテキスト適用型の可逆圧縮/復号処理を施す。コンテキスト適用型の可逆圧縮/復号処理では、着目ブロックBKnの周辺(例えば、直上、右上、左上のブロックなど予め定めたコンテキストモデルに従う)の値(即ち、正誤フラグの値)に応じて適応的にビット値を決定することで可逆圧縮符号化/復号を行う。図6に示す例では、周辺に「偽」となる正誤フラグのブロックが多数並んでいるため、正誤フラグは「偽」の方が圧縮の効果が高まり、圧縮(可逆圧縮)が可能となる。特に、映像復号装置2側では、コンテキスト適用型の可逆復号処理により当該着目ブロックBKnについて正誤フラグが「偽」である旨を復元でき、最終的には正確な “正”(候補ベクトルVA,ブロックBKA)を決定することができる。
Then, the
従って、本発明に係る映像符号化装置1及び映像復号装置2によれば、正誤フラグが「真」となる確率が高まることにより正誤フラグの可逆圧縮が可能になるか、或いは、多数の「偽」が出現する場合では周辺に「偽」となるブロックが集まる傾向があるためコンテキスト適応型の可逆圧縮により正誤フラグの圧縮が可能となる。
Therefore, according to the
特に、図3に示す実施例1における差分ベクトルの正負符号の推定処理では、着目ブロックBKnを動きベクトルで動き補償した位置が画面外にはみ出る際のはみ出し具合の比較(実施例1では、はみ出る面積SA, SBの比較)を利用していることに相当するため、画面端の周辺に位置するブロックに限定して適用すると圧縮効果の観点で有効である。 In particular, in the process of estimating the sign of the difference vector in Example 1 shown in FIG. Since this corresponds to using a comparison of S A and S B ), it is effective from the viewpoint of compression effect if it is applied only to blocks located around the edge of the screen.
(フレーム画像内で正誤フラグを使用する領域)
本実施形態の映像符号化装置1及び映像復号装置2の一実施例として、映像符号化装置1における設定制御部18、及び映像復号装置2における設定制御部24は、フレーム画像における当該着目ブロックの位置に応じて、正誤フラグを使用する領域と、従来技法と同様に正負符号の+/-を1/0のビット表現とする領域を、予め定めた設定情報に基づいて制御することができる。
(Area where correct/incorrect flags are used in the frame image)
As an example of the
そして、上述したように、本実施形態の映像符号化装置1及び映像復号装置2では、当該設定情報に基づいて当該可逆圧縮後の正誤フラグ又は当該単純に二値化した正負符号を切り替えることができる。
As described above, in the
以下、より具体的に、一実施例として、映像符号化装置1における設定制御部18、及び映像復号装置2における設定制御部24は、当該設定情報に従い、着目ブロックBKnが画面端の領域AR1~AR8のいずれかに収まっているか否かに基づいて、差分ベクトルの正負符号の表現について正誤フラグ又は当該単純に二値化した正負符号を切り替える動作を説明する。
More specifically, as an example below, the setting
図7は、本発明による一実施形態の映像符号化装置1及び映像復号装置2に係る正誤フラグを利用する領域と、従来技法と同様に正負符号の+/-を1/0のビット表現とする領域を持つフレーム画像の説明図である。
FIG. 7 shows areas in which correct/incorrect flags are used in the
図7に示すように、フレーム画像を構成するフレームFNは、画面中央の領域AR0と、画面端の所定範囲内の領域AR1~AR8の領域に分離できる。領域AR0は、従来技法と同様に正負符号の+/-を1/0のビット表現とする領域である。画面端の領域AR1~AR8の領域は、正誤フラグのコンテキスト適用型の可逆圧縮/復号処理を行う領域である。また、画面端の領域AR1~AR8の領域ごとに、異なるコンテキストモデルが設定される。 As shown in FIG. 7, the frame FN constituting the frame image can be separated into an area AR0 at the center of the screen and areas AR1 to AR8 within a predetermined range at the edge of the screen. The area AR0 is an area in which the plus/minus sign +/- is represented by bits of 1/0 as in the conventional technique. The areas AR1 to AR8 at the edges of the screen are areas where reversible compression/decoding processing based on the context of correct/incorrect flags is performed. Furthermore, different context models are set for each of the areas AR1 to AR8 at the edge of the screen.
これらの領域は、フレームFNのサイズや符号化処理を行う基本単位(マクロブロックやCTUなどと呼ばれるブロック)のサイズに応じて可変とするか、又は固定とする幅D1,D2,D3,D4の指定で特定でき、映像符号化装置1及び映像復号装置2間で予め定めておくか、設定情報を伝送する形態では、その設定情報によって指定する構成とすることもできる。また、D1,D2,D3,D4はそれぞれ異なる値としてもよいし、同一値としてもよい。尚、幅D1,D2,D3,D4は、「真」又は「偽」を示す正誤フラグが集まりやすい領域として、符号化処理を行う基本単位(マクロブロックやCTUなどと呼ばれるブロック)のサイズに対し1~3倍の幅とするのが好適である。
These areas have widths D1, D2, D3, and D4 that are variable or fixed depending on the size of the frame FN and the size of the basic unit (block called macroblock, CTU, etc.) that performs encoding processing. It can be specified by designating the
差分ベクトルは2次元ベクトルのため、水平成分と垂直成分の2つのベクトルで表現される。そこで、映像符号化装置1における設定制御部18、及び映像復号装置2における設定制御部24は、当該設定情報の一実施例として、着目ブロックBKnが画面端の領域AR1~AR8のいずれかに収まっているか否かに基づいて、差分ベクトルの成分ごとに、当該可逆圧縮後の正誤フラグ又は当該単純に二値化した正負符号を切り替えることができる。
Since the difference vector is a two-dimensional vector, it is expressed by two vectors: a horizontal component and a vertical component. Therefore, the setting
例えば、映像符号化装置1における設定制御部18は、着目ブロックBKnが画面の左右辺近傍の領域AR3,AR4にある場合、差分ベクトルの水平成分のみ正誤フラグを使用しコンテキスト適応型の可逆圧縮処理を行い、垂直方向の正負符号は従来技法と同様に正負符号の+/-を1/0のビット表現とするように制御する。
For example, when the block of interest BKn is located in areas AR3 and AR4 near the left and right sides of the screen, the setting
また、映像符号化装置1における設定制御部18は、映像符号化装置1における設定制御部18は、着目ブロックBKnが画面の上下辺近傍の領域AR1,AR2にある場合、差分ベクトルの垂直成分のみ正誤フラグを使用しコンテキスト適応型の可逆圧縮処理を行い、水平方向の正負符号は従来技法と同様に正負符号の+/-を1/0のビット表現とするように制御する。
Furthermore, when the block of interest BKn is located in the areas AR1 and AR2 near the top and bottom sides of the screen, the setting
また、映像符号化装置1における設定制御部18は、着目ブロックBKnが画面の四隅の領域AR5,AR6,AR7,AR8にある場合、水平成分、及び垂直成分ともに正誤フラグを使用しコンテキスト適応型の可逆圧縮処理を行うように制御する。
Furthermore, when the target block BKn is in the four corner areas AR5, AR6, AR7, AR8 of the screen, the setting
映像復号装置2における設定制御部24においても同様に、着目ブロックBKnが画面端の領域AR1~AR8のいずれかの領域に収まっているか否かに基づいて、差分ベクトルの成分ごとに、当該可逆圧縮後の正誤フラグ又は当該単純に二値化した正負符号を切り替えることができる。
Similarly, the setting
例えば、図8を参照して、映像復号装置2における設定制御部24により、一実施例の差分ベクトルの正負符号の決定処理を説明する。図8は、本発明による一実施形態の映像復号装置2における一実施例の差分ベクトルの正負符号の決定処理を示すフローチャートである。
For example, with reference to FIG. 8, a process of determining the sign of the difference vector in one embodiment by the setting
まず、設定制御部24は、着目ブロックBKnが、画面左右端の所定範囲内(即ち、図7に示す画面の左右辺近傍の領域AR3,AR4,AR5,AR6,AR7,AR8内)に収まっているかを判定する(ステップS31)。
First, the setting
そして、着目ブロックBKnが画面左右端の所定範囲内(領域AR3,AR4,AR5,AR6,AR7,AR8内)に収まっていないとき(ステップS31:N)、従来技法と同様に当該単純に二値化した正負符号とするように差分ベクトルの水平成分の正負符号を決定する(ステップS32)。 Then, when the block of interest BKn does not fall within a predetermined range (within areas AR3, AR4, AR5, AR6, AR7, AR8) at the left and right ends of the screen (step S31: N), the block BKn is simply converted into a binary value as in the conventional technique. The positive/negative sign of the horizontal component of the difference vector is determined so as to have the positive/negative sign of the difference vector (step S32).
一方、着目ブロックBKnが画面左右端の所定範囲内(領域AR3,AR4,AR5,AR6,AR7,AR8内)に収まっているとき(ステップS31:Y)、本発明に係る「差分ベクトルの正負符号の推定処理」により差分ベクトルの水平成分の正負符号を推定し、正誤フラグを用いて、差分ベクトルの水平成分の正負符号を決定する(ステップS33)。 On the other hand, when the block of interest BKn falls within a predetermined range (within areas AR3, AR4, AR5, AR6, AR7, AR8) at the left and right ends of the screen (step S31: Y), the "sign of difference vector" according to the present invention is determined. The sign of the horizontal component of the difference vector is estimated by the ``estimation process'', and the sign of the horizontal component of the difference vector is determined using the correctness flag (step S33).
続いて、設定制御部24は、着目ブロックBKnが、画面上下端の所定範囲内(即ち、図7に示す画面の左右辺近傍の領域AR1,AR2,AR5,AR6,AR7,AR8内)に収まっているかを判定する(ステップS34)。
Next, the setting
そして、着目ブロックBKnが画面左右端の所定範囲内(領域AR3,AR4,AR5,AR6,AR7,AR8内)に収まっていないとき(ステップS34:N)、従来技法と同様に当該単純に二値化した正負符号とするように差分ベクトルの水平成分の正負符号を決定する(ステップS35)。 Then, when the block of interest BKn is not within a predetermined range (within areas AR3, AR4, AR5, AR6, AR7, AR8) at the left and right ends of the screen (step S34: N), the block BKn is simply converted into a binary value as in the conventional technique. The positive/negative sign of the horizontal component of the difference vector is determined so as to have the positive/negative sign of the difference vector (step S35).
一方、着目ブロックBKnが画面左右端の所定範囲内(領域AR3,AR4,AR5,AR6,AR7,AR8内)に収まっているとき(ステップS34:Y)、本発明に係る「差分ベクトルの正負符号の推定処理」により差分ベクトルの水平成分の正負符号を推定し、正誤フラグを用いて、差分ベクトルの水平成分の正負符号を決定する(ステップS36)。 On the other hand, when the block of interest BKn falls within a predetermined range (within areas AR3, AR4, AR5, AR6, AR7, AR8) at the left and right ends of the screen (step S34: Y), the "sign of difference vector" according to the present invention is determined. The sign of the horizontal component of the difference vector is estimated by the ``estimation process'', and the sign of the horizontal component of the difference vector is determined using the correctness flag (step S36).
従って、差分ベクトルの水平成分と垂直成分のいずれか片方のみに正誤フラグを使用するブロックの場合はビットストリームから正誤フラグを1つ読み込み、水平成分と垂直成分の両方に正誤フラグを使用するブロック場合は正誤フラグを2つ読み込むことになる。 Therefore, in the case of a block that uses the correct/incorrect flag for only one of the horizontal and vertical components of the difference vector, one correct/incorrect flag is read from the bitstream, and in the case of a block that uses the correct/incorrect flag for both the horizontal and vertical components. reads two correct/incorrect flags.
尚、図8に示す例では、差分ベクトルの水平成分の正負符号を決定した後、差分ベクトルの垂直成分の正負符号を決定するように制御する例を説明したが、垂直成分の正負符号の決定後、水平成分の正負符号を決定するように制御する構成とすることもできる。 In the example shown in FIG. 8, an example was explained in which the sign of the horizontal component of the difference vector is determined and then the sign of the vertical component of the difference vector is determined. It is also possible to adopt a configuration in which control is performed such that the sign of the horizontal component is then determined.
このように、着目ブロックBKnが画面端の領域AR1~AR8のうちいずれかに収まっているかに基づいて、差分ベクトルの水平成分と垂直成分のそれぞれで、正誤フラグを使用する成分を切り替える構成とすることができる。差分ベクトルの水平成分と垂直成分のそれぞれで、正誤フラグを使用する成分を映像符号化装置1及び映像復号装置2間で予め定めておくか、又は当該設定情報に含めるようにして、当該ストリーム中のヘッダ(スライス又はタイルのヘッダ、ピクチャのヘッダ、及びシーケンスのヘッダのいずれか1つ以上を含む)に埋め込み、映像符号化装置1から映像復号装置2へ伝送する構成とすることができる。
In this way, the component for which the correct/incorrect flag is used is switched for each of the horizontal and vertical components of the difference vector based on whether the block of interest BKn falls within one of the areas AR1 to AR8 at the edge of the screen. be able to. For each of the horizontal and vertical components of the difference vector, the components for which correct/incorrect flags are used are determined in advance between the
尚、着目ブロックBKnが画面端の領域AR1~AR8の領域内にあるときに、着目ブロックBKnの位置に応じて、差分ベクトルの水平又は垂直成分の決定順序を指定するように当該設定情報に定めておくこともできる。これは、当該可逆圧縮後の正誤フラグ又は当該単純に二値化した正負符号の切り替えに関係して、着目ブロックBKnの位置に応じて正誤フラグが使用されている成分を一意に判別でき、逐次いずれが用いられているかを判別するような余分な処理を省くことができ、処理動作が速くなる利点がある。 Note that when the block of interest BKn is within the areas AR1 to AR8 at the edge of the screen, the setting information specifies the order in which the horizontal or vertical components of the difference vector are determined depending on the position of the block of interest BKn. You can also leave it there. This is related to the switching of the true/false flag after the reversible compression or the simply binarized positive/negative sign, and it is possible to uniquely identify the component in which the true/false flag is used according to the position of the block of interest BKn, and sequentially This has the advantage that extra processing such as determining which one is being used can be omitted, resulting in faster processing operations.
例えば、映像符号化装置1における設定制御部18、及び映像復号装置2における設定制御部24は、差分ベクトルの正負符号の推定処理として、着目ブロックBKnが画面端の領域AR1~AR8の領域内に収まっているときに、画面の上下辺より左右辺に近い場合は、まず差分ベクトルの水平成分の正負符号を決定した後に、垂直成分の正負符号を決定するように制御する。
For example, the setting
また、映像符号化装置1における設定制御部18、及び映像復号装置2における設定制御部24は、差分ベクトルの正負符号の推定処理として、着目ブロックBKnが画面端の領域AR1~AR8の領域内に収まっているときに、着目ブロックBKnが画面の左右辺より上下辺に近い場合は、まず差分ベクトルの垂直成分の正負符号を決定した後に、水平成分の正負符号を決定するように制御する。
In addition, the setting
また、映像符号化装置1における設定制御部18、及び映像復号装置2における設定制御部24は、差分ベクトルの正負符号の推定処理として、着目ブロックBKnが画面端の領域AR1~AR8の領域内に収まっているときに、着目ブロックが、画面の左右辺及び上下辺から等距離にある場合は、予め定めた順序(例えば、先に水平成分の符号を先に求めた後に、垂直成分の符号を求める)で差分ベクトルの水平成分及び垂直成分の正負符号を決定するように制御する。
In addition, the setting
また、さらなる変形として、画面端の所定範囲のかわりに、着目ブロックBKnが画面上下左右辺に隣接するか否かに基づいて、差分ベクトルの成分ごとに、当該可逆圧縮後の正誤フラグ又は当該単純に二値化した正負符号を切り替えることができる。特に、着目ブロックBKnが画面上辺のみに接している場合はAR1、画面下辺のみに接している場合はAR2、画面左辺のみに接している場合はAR3、画面右辺のみに接している場合はAR4、画面上辺および左辺の両方に接している場合はAR5、画面上辺および右辺の両方に接している場合はAR6、画面下辺および左辺の両方に接している場合はAR7、画面下辺および右辺の両方に接している場合はAR8、それ以外の場合はAR0の領域内に収まっているブロックとして制御すると好適である。 In addition, as a further modification, instead of the predetermined range of the screen edge, based on whether the block of interest BKn is adjacent to the top, bottom, left, and right sides of the screen, for each component of the difference vector, the true/false flag after the reversible compression or the simple You can switch the positive and negative signs of the binarized data. In particular, if the block of interest BKn touches only the top side of the screen, AR1, if it touches only the bottom side of the screen, AR2, if it touches only the left side of the screen, AR3, and if it touches only the right side of the screen, AR4, AR5 if it touches both the top and left sides of the screen, AR6 if it touches both the top and right sides of the screen, AR7 if it touches both the bottom and left sides of the screen, and AR7 if it touches both the bottom and right sides of the screen. It is preferable to control the block as a block that falls within the area of AR8 if it is within the area of AR8, and otherwise as a block that falls within the area of AR0.
(コンテキストとして参照するブロック)
上述したように、本実施形態の映像符号化装置1及び映像復号装置2では、フレーム画像における当該着目ブロックの位置に応じて、正誤フラグを使用する領域と、従来技法と同様に正負符号の+/-を1/0のビット表現とする領域を、予め定めた設定情報に基づいて制御することができる。そして、正誤フラグの伝送には、コンテキスト適応型の可逆圧縮/復号処理を適用する。
(block referenced as context)
As described above, in the
即ち、上述したように、本実施形態の映像符号化装置1におけるコンテキスト適応型可逆圧縮部15、及び映像復号装置2におけるコンテキスト適応型可逆復号部26は、着目ブロック情報に基づいてコンテキストモデルを指定し、当該正誤フラグに対してコンテキスト適応型の可逆圧縮符号化/復号処理を施す。
That is, as described above, the context adaptive
コンテキスト適応型の可逆圧縮符号化/復号処理は、例えばMPEG-H HEVC/H.265方式に準じる映像符号化方式とする場合ではCABACを、AVC/H.264方式に準じる映像符号化方式とする場合ではCABAC又はCAVLCを利用できる。 In the context-adaptive reversible compression encoding/decoding process, for example, when using a video encoding method according to the MPEG-H HEVC/H.265 method, CABAC is used as a video encoding method according to the AVC/H.264 method. In some cases, CABAC or CAVLC can be used.
ただし、本実施形態に係る正誤フラグの可逆圧縮/復号に係るコンテキストモデルは、着目ブロック周辺におけるどのブロックをコンテキストとして参照するかについて好適例がある。 However, in the context model related to lossless compression/decoding of the correct/incorrect flag according to the present embodiment, there is a preferable example regarding which block around the block of interest is referred to as a context.
即ち、本実施形態に係るコンテキストモデルにおいて、着目ブロックBKnの画面内の位置に応じてコンテキストとして参照するブロックの位置を予め定めておくようにする。これにより、より圧縮効率の向上が期待できる。 That is, in the context model according to this embodiment, the position of a block to be referred to as a context is determined in advance according to the position of the block of interest BKn in the screen. This can be expected to further improve compression efficiency.
より具体的には、着目ブロックBKnの画面内の位置に応じてコンテキストとして参照するブロックとして、着目ブロックBKnが画面上下辺よりも画面左右辺に近い場合、当該着目ブロックBKnの直上のブロックを参照する。例えば、図9(a)に示すように、着目ブロックBKnが画面下辺(距離d2)よりも画面左辺(距離d1)に近い場合(d1<d2)、当該着目ブロックBKnの直上のブロックRBKを参照する。 More specifically, if the target block BKn is closer to the left and right sides of the screen than the top and bottom sides of the screen, the block directly above the target block BKn is referred to as a block to be referred to as a context depending on the position of the target block BKn on the screen. do. For example, as shown in FIG. 9(a), if the block of interest BKn is closer to the left side of the screen (distance d1) than the bottom edge of the screen (distance d2) (d1<d2), refer to the block RBK directly above the block of interest BKn. do.
また、着目ブロックBKnの画面内の位置に応じてコンテキストとして参照するブロックとして、着目ブロックBKnが画面左右辺よりも画面上下辺に近い場合、当該着目ブロックBKnの直左のブロックを参照する。例えば、図9(b)に示すように、着目ブロックBKnが画面左辺(距離d1)よりも画面下辺(距離d2)に近い場合(d1>d2)、当該着目ブロックBKnの直左のブロックRBKを参照する。 Further, as a block to be referred to as a context depending on the position of the target block BKn in the screen, if the target block BKn is closer to the top and bottom sides of the screen than to the left and right sides of the screen, the block immediately to the left of the target block BKn is referred to. For example, as shown in FIG. 9B, if the block of interest BKn is closer to the bottom edge of the screen (distance d2) than the left edge of the screen (distance d1) (d1>d2), the block RBK immediately to the left of the block of interest BKn is refer.
また、着目ブロックBKnの画面内の位置に応じてコンテキストとして参照するブロックとして、着目ブロックBKnが画面左右辺よりも画面上下辺から等距離にある場合、当該着目ブロックBKnの直左、直左上、直上、及び直右上のうち予め定めた1以上のブロックを参照する。例えば、図9(c)に示すように、着目ブロックBKnが画面左辺(距離d1)と画面下辺(距離d2)から等距離にある場合(d1=d2)、当該着目ブロックBKnの直左のブロックRBK1、直左上のブロックRBK2、直上のブロックRBK3、及び直右上のブロックRBK4のうち予め定めた1以上のブロックを参照する。 In addition, when the target block BKn is located at an equal distance from the top and bottom sides of the screen than from the left and right sides of the screen, the blocks to be referred to as a context depending on the position of the target block BKn on the screen are the right left, right upper left, right upper left of the target block BKn, Reference is made to one or more predetermined blocks immediately above and immediately above to the right. For example, as shown in FIG. 9(c), when the block of interest BKn is equidistant from the left side of the screen (distance d1) and the bottom side of the screen (distance d2) (d1=d2), the block immediately to the left of the block of interest BKn Reference is made to one or more predetermined blocks among RBK1, the block RBK2 immediately above the left, the block RBK3 immediately above, and the block RBK4 immediately above the right.
このように当該可逆圧縮/復号処理に係るコンテキストとして1つ又は複数のブロックを参照し、参照した各ブロックの値(即ち、正誤フラグの値)に応じて、CABAC又はCAVLCの方式に準じて適応的に可逆圧縮/復号を行うことができる。 In this way, one or more blocks are referenced as a context related to the lossless compression/decoding process, and adaptation is performed according to the CABAC or CAVLC method according to the value of each referenced block (i.e., the value of the correct/incorrect flag). It is possible to perform lossless compression/decoding.
(実施例2:差分ベクトルの正負符号の推定処理)
図3に示す実施例1の「差分ベクトルの正負符号の推定処理」では、差分ベクトル符号推定部13,27が、着目ブロックBKnに関する正側及び負側の候補ベクトルVA,VBを算出し、これらに対応するブロックBKA、ブロックBKBを算出して、その位置関係や画面外にはみ出す面積SA,SBを基に差分ベクトル推定符号を決定する例を説明した。
(Example 2: Estimating the sign of the difference vector)
In the "process for estimating the sign of the difference vector" in the first embodiment shown in FIG. , an example has been described in which the corresponding blocks BK A and BK B are calculated, and the difference vector estimation code is determined based on their positional relationship and the areas S A and S B that protrude outside the screen.
この変形例として、ブロックの座標のみを用いて差分ベクトルの正負符号の推定処理を行い、これにより、その処理をより高速かつ処理負担を軽減することもできる。以下、図10を参照して、処理負担を軽減し、より高速化することができる。図10は、本発明による一実施形態の映像符号化装置1及び映像復号装置2における実施例2の差分ベクトルの正負符号の推定処理を示すフローチャートである。
As a modification of this example, the sign of the difference vector can be estimated using only the coordinates of the block, thereby making the process faster and reducing the processing load. Hereinafter, referring to FIG. 10, the processing load can be reduced and the processing speed can be further increased. FIG. 10 is a flowchart showing a process for estimating the sign of the difference vector in Example 2 in the
ここでは、差分ベクトルの水平成分の正負符号の推定処理について説明する。 Here, a process for estimating the sign of the horizontal component of the difference vector will be described.
まず、実施例2に係る差分ベクトル符号推定部13,27は、実施例1と同様に、着目ブロックについて、差分ベクトルの絶対値を入力(読み込み)(ステップS11)、差分ベクトルの絶対値=0であるか否かを判定する(ステップS12)。
First, as in the first embodiment, the difference vector sign
差分ベクトルの絶対値=0であるとき(ステップS12:Y)、実施例2に係る差分ベクトル符号推定部13,27は、実施例1と同様に、差分ベクトルの正負符号なしとして推定処理を終了する(ステップS13)。
When the absolute value of the difference vector is 0 (step S12: Y), the difference vector sign
一方、差分ベクトルの絶対値≠0であるとき(ステップS12:N)、実施例2に係る差分ベクトル符号推定部13,27は、実施例1と同様に、当該着目ブロックに関する正側及び負側の候補ベクトルVA,VBを算出する(ステップS14)。
候補ベクトルVA=予測ベクトル+差分ベクトルの絶対値
候補ベクトルVB=予測ベクトル-差分ベクトルの絶対値
On the other hand, when the absolute value of the difference vector≠0 (step S12: N), the difference vector sign
Candidate vector V A = Predicted vector + absolute value of difference vector Candidate vector V B = Predicted vector - absolute value of difference vector
続いて、実施例2に係る差分ベクトル符号推定部13,27は、実施例1における正側及び負側の候補ベクトルVA,VBにそれぞれ対応するブロックBKA,BKBを算出する代わりに、着目ブロックBKnの左上画素の座標x、着目ブロックBKnの幅w、フレーム画像の幅(画面幅)Wを設定する(ステップS15’)。
Subsequently, the difference vector
続いて、実施例2に係る差分ベクトル符号推定部13,27は、『x+VA≧0、且つx+w+VA≦W、且つx+VB≧0、且つx+w+VB≦W』を満たすかを判定する(ステップS16’)。この処理は、実施例1におけるブロックBKA,BKBが双方とも完全に画面内であるかの判定(図3:ステップS16)に対応する代替処理である。
Subsequently, the difference vector sign
『x+VA≧0、且つx+w+VA≦W、且つx+VB≧0、且つx+w+VB≦W』を満たすとき(ステップS16’:Y)、実施例2に係る差分ベクトル符号推定部13,27は、差分ベクトルの正負符号をデフォルト値として推定し、差分ベクトル推定符号=デフォルト値として決定する(ステップS17)。本例では“正”をデフォルト値として説明するが、“負”をデフォルト値としてもよい。
When "x+V A ≧0, x+w+V A ≦W, and x+V B ≧0, and x+w+V B ≦W" is satisfied (step S16': Y), the difference vector sign
『x+VA≧0、且つx+w+VA≦W、且つx+VB≧0、且つx+w+VB≦W』を満たさないとき(ステップS16’:N)、実施例2に係る差分ベクトル符号推定部13,27は、続いて『“x+w+VA≦0、又はx+VA≧W”、且つ“x+w+VB≦0、又はx+VB≧W”』を満たすかを判定する(ステップS18’)。この処理は、実施例1におけるブロックBKA,BKBが双方とも完全に画面外であるかの判定(図3:ステップS18)に対応する代替処理である。
When "x+V A ≧0, x+w+V A ≦W, and x+V B ≧0, and x+w+V B ≦W" is not satisfied (step S16': N), the difference vector sign
『“x+w+VA≦0、又はx+VA≧W”、且つ“x+w+VB≦0、又はx+VB≧W”』を満たすとき(ステップS18’:Y)、実施例2に係る差分ベクトル符号推定部13,27は、「min(abs(x+w+VA), abs(x+VA-W))」と、「min(abs(x+w+VB), abs(x+VB-W)」とを比較する(ステップS19’)。abs()は絶対値を算出する関数であり、min()は最小値を算出する関数である。この処理は、実施例1における「ブロックBKAとその最近接の画面端との距離」、及び、「ブロックBKBとその最近接の画面端との距離」の比較(図3:ステップS19)に対応する代替処理である。
When "x+w+V A ≦0, or x+V A ≧W" and "x+w+V B ≦0, or x+V B ≧W" is satisfied (step S18': Y), the difference vector
「min(abs(x+w+VA), abs(x+VA-W))」が、「min(abs(x+w+VB), abs(x+VB-W)」より大きいとき(ステップS19’:Y)、実施例2に係る差分ベクトル符号推定部13,27は、差分ベクトル推定符号=負として決定する(ステップS21)。
When "min(abs(x+w+V A ), abs(x+V A -W))" is larger than "min(abs(x+w+V B ), abs(x+V B -W)" (step S19': Y), the embodiment The difference vector
また、「min(abs(x+w+VA), abs(x+VA-W))」が、「min(abs(x+w+VB), abs(x+VB-W)」より小さいとき(ステップS19’:N)、実施例2に係る差分ベクトル符号推定部13,27は、差分ベクトル推定符号=正として決定する(ステップS20)。
Further, when "min(abs(x+w+V A ), abs(x+V A -W))" is smaller than "min(abs(x+w+V B ), abs(x+V B -W)" (step S19': N), The difference vector sign
また、「min(abs(x+w+VA), abs(x+VA-W))」が、「min(abs(x+w+VB), abs(x+VB-W)」と等しいとき、実施例2に係る差分ベクトル符号推定部13,27は、差分ベクトル推定符号=正又は負の予め指定された方(図10に示す例では差分ベクトル推定符号=正)として決定する。
Further, when "min(abs(x+w+V A ), abs(x+V A -W))" is equal to "min(abs(x+w+V B ), abs(x+V B -W)"), the difference vector according to the second embodiment The
尚、ステップS19’に係る比較で、差分ベクトル推定符号=正又は負の予め指定された方として決定するにあたり、第2のデフォルト値として(或いは共通に用いるデフォルト値として)示す設定情報を、ストリーム中のヘッダ(スライス又はタイルのヘッダ、ピクチャのヘッダ、及びシーケンスのヘッダのいずれか1つ以上を含む)に埋め込んで伝送する形態とすることができる。ただし、当該第2のデフォルト値について映像符号化装置1及び映像復号装置2間で予め定めておくときは映像符号化装置1から映像復号装置2へと伝送する必要はなく、当該設定情報をヘッダに埋め込む必要もない。
In addition, in the comparison related to step S19', when determining the difference vector estimation sign as the prespecified positive or negative one, the setting information indicated as the second default value (or as the commonly used default value) is set in the stream. It can be transmitted by being embedded in a header (including any one or more of a slice or tile header, a picture header, and a sequence header). However, when the second default value is determined in advance between the
一方、ステップS16’,17’の双方を満たさないとき、実施例2に係る差分ベクトル符号推定部13,27は、「max(abs(min(0, x+VA)), max(W, x+w+VA)-W)」と、「max(abs(min(0, x+VB)), max(W, x+w+VB)-W)」とを比較する(ステップS23’)。max()は最大値を算出する関数である。この処理は、実施例1における面積SAと面積SBとの比較(図3:ステップS23)に対応する代替処理である。
On the other hand, when both steps S16' and 17' are not satisfied, the difference vector
「max(abs(min(0, x+VA)), max(W, x+w+VA)-W)」が、「max(abs(min(0, x+VB)), max(W, x+w+VB)-W)」より大きいとき(ステップS23’:Y)、実施例2に係る差分ベクトル符号推定部13,27は、差分ベクトル推定符号=負として決定する(ステップS25)。
"max(abs(min(0, x+V A )), max(W, x+w+V A )-W)" becomes "max(abs(min(0, x+V B )), max(W, x+w+V B )-W )" (step S23': Y), the difference vector sign
「max(abs(min(0, x+VA)), max(W, x+w+VA)-W)」が、「max(abs(min(0, x+VB)), max(W, x+w+VB)-W)」より小さいとき(ステップS23’:N)、実施例2に係る差分ベクトル符号推定部13,27は、差分ベクトル推定符号=正として決定する(ステップS24)。
"max(abs(min(0, x+V A )), max(W, x+w+V A )-W)" becomes "max(abs(min(0, x+V B )), max(W, x+w+V B )-W )" (step S23': N), the difference vector sign
「max(abs(min(0, x+VA)), max(W, x+w+VA)-W)」が、「max(abs(min(0, x+VB)), max(W, x+w+VB)-W)」と等しいとき、実施例2に係る差分ベクトル符号推定部13,27は、差分ベクトル推定符号=正又は負の予め指定された方(図10に示す例では差分ベクトル推定符号=正)として決定する。
"max(abs(min(0, x+V A )), max(W, x+w+V A )-W)" becomes "max(abs(min(0, x+V B )), max(W, x+w+V B )-W )'', the difference vector
尚、ステップS23’に係る比較で、差分ベクトル推定符号=正又は負の予め指定された方として決定するにあたり、第3のデフォルト値として(或いは共通に用いるデフォルト値として)示す設定情報を、ストリーム中のヘッダ(スライス又はタイルのヘッダ、ピクチャのヘッダ、及びシーケンスのヘッダのいずれか1つ以上を含む)に埋め込んで伝送する形態とすることができる。ただし、当該第3のデフォルト値について映像符号化装置1及び映像復号装置2間で予め定めておくときは映像符号化装置1から映像復号装置2へと伝送する必要はなく、当該設定情報をヘッダに埋め込む必要もない。
In addition, in the comparison related to step S23', when determining the difference vector estimation sign as the prespecified positive or negative one, the setting information indicated as the third default value (or as the commonly used default value) is set in the stream. It can be transmitted by being embedded in a header (including any one or more of a slice or tile header, a picture header, and a sequence header). However, when the third default value is determined in advance between the
ステップS17,S20,S21,S24,S25を経て決定した差分ベクトル推定符号は、図1に示す映像符号化装置1側では正誤フラグ14へ、図2に示す映像復号装置2側では差分ベクトル符号決定部28へ出力される(ステップS26)。
The difference vector estimation code determined through steps S17, S20, S21, S24, and S25 is sent to the correctness flag 14 on the
このようにして、実施例2に係る差分ベクトル符号推定部13,27は、差分ベクトルの絶対値と予測ベクトルとを用いて、正側及び負側の候補ベクトルVA,VBを算出し、着目ブロックBKnの座標及び大きさ、候補ベクトルVA,VB、及び画面幅の位置関係に応じて場合分けした予め定めた規則に基づいて差分ベクトルの正負符号を推定し、差分ベクトル推定符号を決定する。そして、実施例1と比較して、実施例2では、面積を求める代わりに座標計算で済むため、当該規則を簡素化できる。尚、図10において、関数abs()、min()及びmax()を用いる代わりにif文で分類する構成としてもよい。
In this way, the difference vector sign
そして、映像符号化装置1側では、正誤フラグ生成部14は、差分ベクトル符号推定部13から得られる差分ベクトル推定符号と、画像符号化部10から得られる差分ベクトルの正負符号とを比較して、両者が等しい場合は「真」、異なる場合は「偽」を示す正誤フラグを生成する。
Then, on the
また、映像復号装置2側では、差分ベクトル符号決定部28は、正誤フラグが「真」を示すときは当該差分ベクトル推定符号をそのまま差分ベクトルの正負符号として決定し、「偽」を示すときは、当該差分ベクトル推定符号を反転した符号を差分ベクトルの正負符号として決定する。
Furthermore, on the
従って、実施例2に係る差分ベクトル符号推定部13,27をそれぞれ備える映像符号化装置1及び映像復号装置2は、実施例1に係る差分ベクトル符号推定部13,27をそれぞれ備える映像符号化装置1及び映像復号装置2と同様の作用・効果を得ることができる。
Therefore, the
(実施例3:差分ベクトルの正負符号の推定処理)
実施例2の更なる変形例として、図11に示すように、図10のステップS16’,S18’,S19’をスキップし、ステップS15’の直後にステップS23’を実行して処理を簡略化しても、多くの場合、差分ベクトルの正負符号に関する可逆圧縮/復号として同様の効果を得ることができる。
(Example 3: Estimating the sign of the difference vector)
As a further modification of the second embodiment, as shown in FIG. 11, steps S16', S18', and S19' in FIG. 10 are skipped, and step S23' is executed immediately after step S15' to simplify the process. However, in many cases, the same effect can be obtained as reversible compression/decoding regarding the sign of the difference vector.
以上の各実施形態における映像符号化装置1、又は映像復号装置2は、コンピューターにより構成することができ、映像符号化装置1、又は映像復号装置2の各処理部を機能させるためのプログラムを好適に用いることができる。具体的には、映像符号化装置1、又は映像復号装置2の各処理部を制御するための制御部をコンピューター内の中央演算処理装置(CPU)で構成でき、且つ、各処理部を動作させるのに必要となるプログラムを適宜記憶する記憶部を少なくとも1つのメモリで構成させることができる。即ち、そのようなコンピューターに、CPUによって該プログラムを実行させることにより、映像符号化装置1、又は映像復号装置2の各処理部の有する機能を実現させることができる。更に、映像符号化装置1、又は映像復号装置2の各処理部の有する機能を実現させるためのプログラムを、前述の記憶部(メモリ)の所定の領域に格納させることができる。そのような記憶部は、装置内部のRAM又はROMなどで構成させることができ、或いは又、外部記憶装置(例えば、ハードディスク)で構成させることもできる。また、そのようなプログラムは、コンピューターで利用されるOS上のソフトウェア(ROM又は外部記憶装置に格納される)の一部で構成させることができる。更に、そのようなコンピューターに、映像符号化装置1、又は映像復号装置2の各処理部として機能させるためのプログラムは、コンピューター読取り可能な記録媒体に記録することができる。また、映像符号化装置1、又は映像復号装置2の各処理部をハードウェア又はソフトウェアの一部として構成させ、各々を組み合わせて実現させることもできる。
The
以上、特定の実施形態の例を挙げて本発明を説明したが、本発明は前述の実施形態の例に限定されるものではなく、その技術思想を逸脱しない範囲で種々変形可能である。例えば、上述した実施形態の例では、差分ベクトル符号推定処理に関する規則について、特定の順序・計算方法を例示して説明したが、順序の入れ替えやより簡易な演算式(if文等)、或いはより高精度の演算式(座標・面積の組み合わせ等)など種々の変形例が想定される。 Although the present invention has been described above with reference to specific embodiments, the present invention is not limited to the above-described embodiments, and can be modified in various ways without departing from the technical idea thereof. For example, in the above-described embodiment, rules regarding differential vector sign estimation processing are explained by exemplifying a specific order and calculation method. Various modifications such as high-precision arithmetic expressions (combination of coordinates and area, etc.) are envisioned.
また、上述した実施形態の例では、画面中央(図7:領域AR0)については従来技法の正負符号の+/-を1/0のビット表現とする二値化処理を行い、切り替えを行う例を説明したが、画面中央(図7:領域AR0)についても本発明に係る正誤フラグを用いた圧縮伝送としてもよい。即ち、画面中央(図7:領域AR0)について正誤フラグを用いた圧縮伝送としても発生確率に偏りが生じにくいことが多いと想定されることから圧縮効率の向上が望めない可能性があるが、換言すると著しい悪化もしない。その代わり、差分ベクトルの正負符号の伝送に関して統一した処理となる点で処理の簡単化(実装容量の低減)等の利点が生じる。従って、本発明に係る映像符号化装置及び映像復号装置は、上述した実施形態の例に限定されるものではなく、特許請求の範囲の記載によってのみ制限される。 In addition, in the example of the embodiment described above, for the center of the screen (FIG. 7: area AR0), the conventional technique performs a binarization process in which +/- of the plus/minus sign is represented by 1/0 bits, and switching is performed. However, the center of the screen (FIG. 7: area AR0) may also be compressed and transmitted using the correct/incorrect flag according to the present invention. In other words, even if compressed transmission is performed using correct/incorrect flags in the center of the screen (Fig. 7: area AR0), it is assumed that the probability of occurrence is unlikely to be biased in many cases, so improvement in compression efficiency may not be expected. In other words, there is no significant deterioration. Instead, there are advantages such as simplification of processing (reduction of mounting capacity) because the processing is unified regarding the transmission of the positive and negative signs of the difference vector. Therefore, the video encoding device and video decoding device according to the present invention are not limited to the above-described embodiments, but are limited only by the claims.
本発明によれば、動き補償予測を用いた映像符号化方式における差分ベクトルの正負符号(+,-)に関して可逆圧縮が可能となり圧縮効率が向上するようになるので、映像符号化装置及び映像復号装置の用途に有用である。 According to the present invention, reversible compression is possible with respect to the positive and negative signs (+, -) of a difference vector in a video encoding method using motion compensation prediction, and compression efficiency is improved. Useful for device applications.
1 映像符号化装置
10 画像符号化部
11 動き補償予測部
12 差分ベクトル生成部
13 差分ベクトル符号推定部
14 正誤フラグ生成部
15 コンテキスト適応型可逆圧縮部
16 正負二値化部
17 切替部
18 設定制御部
19 ストリーム生成部
20 ストリーム読込部
21 画像復号部
22 差分ベクトル復元部
23 動き補償予測部
24 設定制御部
25 切替部
26 コンテキスト適応型可逆復号部
27 差分ベクトル符号推定部
28 差分ベクトル符号決定部
29 正負決定部
1
Claims (6)
前記映像のフレーム内の所定のブロックについて動き補償予測に基づく差分ベクトルを生成する差分ベクトル生成手段と、
前記所定のブロック、前記差分ベクトルの絶対値、及び前記差分ベクトルに係る予測ベクトルを基にした予め定めた規則に従って前記差分ベクトルの正負符号を推定することにより、前記差分ベクトルの推定符号を決定する差分ベクトル符号推定手段と、
前記差分ベクトルの正負符号と前記差分ベクトルの推定符号とを比較して、両者が一致しているか否かを示す正誤フラグを生成する正誤フラグ生成手段と、
前記正誤フラグに対し、可逆圧縮処理を施すコンテキスト適応型の可逆圧縮手段と、を備え、
前記差分ベクトル符号推定手段は、
前記差分ベクトルの符号が正である場合の第1候補ベクトルに応じて前記所定のブロックの領域を移動した第1ブロックの領域と、前記差分ベクトルの符号が負である場合の第2候補ベクトルに応じて前記所定のブロックの領域を移動した第2ブロックの領域とを算出し、
前記第1ブロックの領域及び前記第2ブロックの領域のそれぞれについて前記フレーム外にはみ出す領域を持つか否かを判定した結果に応じて、前記差分ベクトルの推定符号を決定する
ことを特徴とする映像符号化装置。 A video encoding device that encodes a video using a video encoding method using motion compensated prediction,
Difference vector generation means for generating a difference vector based on motion compensated prediction for a predetermined block within the frame of the video;
Determining the estimated sign of the difference vector by estimating the sign of the difference vector according to a predetermined rule based on the predetermined block, the absolute value of the difference vector, and a predicted vector related to the difference vector. a difference vector sign estimation means for
correct/incorrect flag generating means for comparing the positive/negative sign of the difference vector with the estimated sign of the difference vector to generate a correct/incorrect flag indicating whether the two match;
a context-adaptive reversible compression means for performing reversible compression processing on the correct/incorrect flag ;
The difference vector sign estimating means is
The area of the first block is moved according to the first candidate vector when the sign of the difference vector is positive, and the second candidate vector when the sign of the difference vector is negative. and a second block area obtained by moving the area of the predetermined block accordingly;
An estimated sign of the difference vector is determined in accordance with a result of determining whether each of the first block region and the second block region has a region that protrudes outside the frame.
A video encoding device characterized by:
該所定のブロック、前記差分ベクトルの絶対値、及び前記差分ベクトルに係る予測ベクトルを基にした予め定めた規則に従って前記差分ベクトルの正負符号を推定することにより、前記差分ベクトルの推定符号を決定する差分ベクトル符号推定手段と、
前記可逆圧縮処理が施された正誤フラグに対し、可逆復号処理を施すことにより復号した正誤フラグを生成するコンテキスト適応型の可逆復号手段と、
当該復号した前記正誤フラグが、前記正負符号と前記推定符号との一致を示すときは、該推定符号を当該所定のブロックの差分ベクトルの正負符号とし、前記正負符号と前記推定符号との不一致を示すときは、該推定符号を反転した符号を差分ベクトルの正負符号として決定する差分ベクトル符号決定手段と、
当該所定のブロックの画像を復元するために、当該抽出した前記差分ベクトルの絶対値、及び前記決定した差分ベクトルの正負符号を用いて、前記復号対象のフレーム内の当該所定のブロックの差分ベクトルを復元する差分ベクトル復元手段と、を備え、
前記差分ベクトル符号推定手段は、
前記差分ベクトルの符号が正である場合の第1候補ベクトルに応じて前記所定のブロックの領域を移動した第1ブロックの領域と、前記差分ベクトルの符号が負である場合の第2候補ベクトルに応じて前記所定のブロックの領域を移動した第2ブロックの領域とを算出し、
前記第1ブロックの領域及び前記第2ブロックの領域のそれぞれについて前記フレーム外にはみ出す領域を持つか否かを判定した結果に応じて、前記差分ベクトルの推定符号を決定する
ことを特徴とする映像復号装置。 a stream reading means for inputting and reading a stream and extracting an absolute value of a difference vector and a correct/incorrect flag subjected to reversible compression processing for a predetermined block in a frame to be decoded;
Determining the estimated sign of the difference vector by estimating the sign of the difference vector according to a predetermined rule based on the predetermined block, the absolute value of the difference vector, and a predicted vector related to the difference vector. a difference vector sign estimation means for
context-adaptive reversible decoding means for generating a decoded correct/incorrect flag by performing reversible decoding processing on the correct/incorrect flag subjected to the reversible compression processing;
When the decoded correct/incorrect flag indicates a match between the positive/negative sign and the estimated code, the estimated code is used as the positive/negative sign of the difference vector of the predetermined block, and the mismatch between the positive/negative sign and the estimated code is determined. When indicated, a difference vector sign determining means for determining a sign obtained by inverting the estimated sign as the positive or negative sign of the difference vector;
In order to restore the image of the predetermined block, the difference vector of the predetermined block in the frame to be decoded is calculated using the absolute value of the extracted difference vector and the sign of the determined difference vector. A difference vector restoring means for restoring ,
The difference vector sign estimating means is
The area of the first block is moved according to the first candidate vector when the sign of the difference vector is positive, and the second candidate vector when the sign of the difference vector is negative. and a second block area obtained by moving the area of the predetermined block accordingly;
An estimated sign of the difference vector is determined in accordance with a result of determining whether each of the first block region and the second block region has a region that protrudes outside the frame.
A video decoding device characterized by:
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2022080144A JP7361838B2 (en) | 2018-02-15 | 2022-05-16 | Video encoding device, video decoding device, and these programs |
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2018024701A JP7076221B2 (en) | 2018-02-15 | 2018-02-15 | Video coding device, video decoding device, and their programs |
| JP2022080144A JP7361838B2 (en) | 2018-02-15 | 2022-05-16 | Video encoding device, video decoding device, and these programs |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2018024701A Division JP7076221B2 (en) | 2018-02-15 | 2018-02-15 | Video coding device, video decoding device, and their programs |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2022103284A JP2022103284A (en) | 2022-07-07 |
| JP7361838B2 true JP7361838B2 (en) | 2023-10-16 |
Family
ID=67694563
Family Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2018024701A Expired - Fee Related JP7076221B2 (en) | 2018-02-15 | 2018-02-15 | Video coding device, video decoding device, and their programs |
| JP2022080144A Active JP7361838B2 (en) | 2018-02-15 | 2022-05-16 | Video encoding device, video decoding device, and these programs |
Family Applications Before (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2018024701A Expired - Fee Related JP7076221B2 (en) | 2018-02-15 | 2018-02-15 | Video coding device, video decoding device, and their programs |
Country Status (1)
| Country | Link |
|---|---|
| JP (2) | JP7076221B2 (en) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20250142111A1 (en) * | 2021-12-28 | 2025-05-01 | Kt Corporation | Video signal encoding/decoding method, and recording medium on which bitstream is stored |
| CN120303926A (en) * | 2022-12-06 | 2025-07-11 | 现代自动车株式会社 | Video coding method and apparatus using template adjustment for displacement sign prediction |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2019150411A1 (en) | 2018-01-30 | 2019-08-08 | 富士通株式会社 | Video encoding device, video encoding method, video decoding device, and video decoding method, and video encoding system |
-
2018
- 2018-02-15 JP JP2018024701A patent/JP7076221B2/en not_active Expired - Fee Related
-
2022
- 2022-05-16 JP JP2022080144A patent/JP7361838B2/en active Active
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2019150411A1 (en) | 2018-01-30 | 2019-08-08 | 富士通株式会社 | Video encoding device, video encoding method, video decoding device, and video decoding method, and video encoding system |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2019140630A (en) | 2019-08-22 |
| JP7076221B2 (en) | 2022-05-27 |
| JP2022103284A (en) | 2022-07-07 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US12375711B2 (en) | Encoder-side search ranges having horizontal bias or vertical bias | |
| RU2683495C1 (en) | Innovations in block vector prediction and estimation of reconstructed sample values within an overlap area | |
| US10567754B2 (en) | Hash table construction and availability checking for hash-based block matching | |
| US10368092B2 (en) | Encoder-side decisions for block flipping and skip mode in intra block copy prediction | |
| US10200699B2 (en) | Apparatus and method for encoding moving picture by transforming prediction error signal in selected color space, and non-transitory computer-readable storage medium storing program that when executed performs method | |
| US20160057433A1 (en) | Block size determination method, video encoding apparatus, and program | |
| JP5216710B2 (en) | Decryption processing method | |
| JP7361838B2 (en) | Video encoding device, video decoding device, and these programs | |
| KR20250048380A (en) | Methods and systems of exponential partitioning | |
| KR102570374B1 (en) | Video encoding apparatus, video encoding method, video encoding program, video decoding apparatus, video decoding method, and video decoding program | |
| WO2016116984A1 (en) | Moving image encoding device, moving image encoding method, and moving image encoding program | |
| WO2019150411A1 (en) | Video encoding device, video encoding method, video decoding device, and video decoding method, and video encoding system | |
| US20170201767A1 (en) | Video encoding device and video encoding method | |
| JP2021077957A (en) | Video image encoding device and method of operating the same | |
| JP4415186B2 (en) | Moving picture coding apparatus, moving picture decoding apparatus, codec apparatus, and program | |
| US9948932B2 (en) | Image processing apparatus and control method of image processing apparatus | |
| WO2025222584A1 (en) | Method and apparatus for intra block copy fusion, and encoder/decoder including the same | |
| JP4385869B2 (en) | Motion vector detection device, moving image encoding device, and program | |
| JP2006191287A (en) | Image coding apparatus, image coding method, and image coding program | |
| JP5957513B2 (en) | Video decoding method | |
| WO2022196133A1 (en) | Encoding device and method | |
| JP2022145499A (en) | Encoder and method |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220615 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220615 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230509 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230707 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230919 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231003 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7361838 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |