JP7812966B2 - 画像符号化装置、画像復号装置、及びプログラム - Google Patents
画像符号化装置、画像復号装置、及びプログラムInfo
- Publication number
- JP7812966B2 JP7812966B2 JP2025108304A JP2025108304A JP7812966B2 JP 7812966 B2 JP7812966 B2 JP 7812966B2 JP 2025108304 A JP2025108304 A JP 2025108304A JP 2025108304 A JP2025108304 A JP 2025108304A JP 7812966 B2 JP7812966 B2 JP 7812966B2
- Authority
- JP
- Japan
- Prior art keywords
- unit
- image
- orthogonal transform
- prediction
- transform
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
本発明は、画像符号化装置、画像復号装置、及びプログラムに関する。
従来、フレーム単位の現画像を分割して得られたブロック単位の対象画像を符号化する画像符号化装置において、複数の参照画像を用いて対象画像を予測して予測画像を生成し、対象画像と予測画像との間の差分を示す予測残差に対して直交変換処理を行って変換係数を算出し、変換係数を量子化及びエントロピー符号化して符号化データを出力する方法が知られている。
また、画像符号化装置と同様に、画像復号装置は、複数の参照画像を用いて対象画像を予測して予測画像を生成する。画像復号装置は、符号化データを復号して変換係数を取得するとともに逆量子化し、逆量子化後の変換係数に対して逆直交変換処理を行って予測残差を算出し、予測画像と予測残差とを合成することにより対象画像を復号する。
HEVCでは、変換処理(直交変換処理及び逆直交変換処理)に適用可能な直交変換として、DCT-2及びDST-7の2種類が規定されている(非特許文献1参照)。具体的には、HEVCでは、対象画像のブロックサイズや、対象画像に適用するイントラ予測のモードに基づいて、2種類の直交変換のうちどちらの種類の直交変換を適用するかを決定する。
Recommendation ITU-T H.265,(12/2016), "High efficiency video coding", International Telecommunication Union
しかしながら、対象画像のブロックサイズや対象画像に適用するイントラ予測のモードに基づいて直交変換の種類を決定するだけでは、予測残差におけるエネルギー分布に応じた最適な種類の直交変換を適用することができない。例えば、本来DCT-2の方が効率的に予測残差のエネルギーを集中させる場合であっても、適用する直交変換としてDST-7を決定してしまう場合があるため、符号化効率が低下してしまう問題がある。
また、予測残差のエネルギーをより効率的に集中させる直交変換の方法としてKLTが挙げられるが、画像符号化装置で行ったKLTの逆処理のための情報を画像復号装置側で必要とすることから、伝送すべき情報量が増大してしまい、符号化効率が低下してしまう問題がある。
そこで、本発明は、符号化効率を改善できる画像符号化装置、画像復号装置、及びプログラムを提供することを目的とする。
第1の特徴に係る画像符号化装置は、フレーム単位の現画像を分割して得られたブロック単位の対象画像を符号化する画像符号化装置であって、複数の参照画像を用いて前記対象画像を予測して予測画像を生成する予測部と、前記複数の参照画像間の類似度を画素単位で評価することにより、前記予測画像における誤差の分布を示すマップ情報を生成する評価部と、前記対象ブロックと前記予測画像との差分を示す予測残差を画素単位で算出する減算部と、前記予測残差に適用する直交変換を前記マップ情報に基づいて決定する決定部と、前記決定された直交変換によって前記予測残差に対する直交変換処理を行う変換部と、を備えることを要旨とする。他の特徴に係る画像符号化装置は、フレーム単位の現画像を分割して得られたブロック単位の対象画像を符号化する画像符号化装置であって、複数の参照画像を用いて前記対象画像を予測して予測画像を生成する予測部と、前記複数の参照画像間の類似度を示す差分絶対値和を前記ブロックよりも小さい領域単位であって複数の画素からなる前記領域単位で算出する評価部と、を備え、前記評価部が前記領域単位で算出した前記差分絶対値和に基づいて符号化の処理を制御することを要旨とする。
第2の特徴に係る画像復号装置は、フレーム単位の現画像を分割して得られたブロック単位の対象画像を復号する画像復号装置であって、符号化データを復号することにより変換係数を取得する復号部と、複数の参照画像を用いて前記対象画像を予測して予測画像を生成する予測部と、前記複数の参照画像間の類似度を画素単位で評価することにより、前記予測画像における誤差の分布を示すマップ情報を生成する評価部と、前記変換係数に適用する逆直交変換を前記マップ情報に基づいて決定する決定部と、前記決定された逆直交変換によって前記変換係数に対する逆直交変換処理を行う逆変換部と、を備えることを要旨とする。他の特徴に係る画像復号装置は、フレーム単位の現画像を分割して得られたブロック単位の対象画像を復号する画像復号装置であって、複数の参照画像を用いて前記対象画像を予測して予測画像を生成する予測部と、前記複数の参照画像間の類似度を示す差分絶対値和を前記ブロックよりも小さい領域単位であって複数の画素からなる前記領域単位で算出する評価部と、を備え、前記評価部が前記領域単位で算出した前記差分絶対値和に基づいて復号の処理を制御することを要旨とする。
第3の特徴に係るプログラムは、コンピュータを第1の特徴に係る画像符号化装置として機能させることを要旨とする。
第4の特徴に係るプログラムは、コンピュータを第2の特徴に係る画像復号装置として機能させることを要旨とする。
本発明によれば、符号化効率を改善できる画像符号化装置、画像復号装置、及びプログラムを提供できる。
図面を参照して、実施形態に係る画像符号化装置及び画像復号装置について説明する。以下の図面の記載において、同一又は類似の部分には同一又は類似の符号を付している。
<第1実施形態>
第1実施形態に係る画像符号化装置及び画像復号装置について説明する。第1実施形態に係る画像符号化装置及び画像復号装置は、MPEGに代表される動画の符号化及び復号を行う。
第1実施形態に係る画像符号化装置及び画像復号装置について説明する。第1実施形態に係る画像符号化装置及び画像復号装置は、MPEGに代表される動画の符号化及び復号を行う。
(画像符号化装置)
図1は、第1実施形態に係る画像符号化装置1の構成を示す図である。図1に示すように、画像符号化装置1は、ブロック分割部100と、減算部110と、変換・量子化部120と、エントロピー符号化部130と、逆量子化・逆変換部140と、合成部150と、メモリ160と、予測部170と、評価部180と、決定部190とを備える。
図1は、第1実施形態に係る画像符号化装置1の構成を示す図である。図1に示すように、画像符号化装置1は、ブロック分割部100と、減算部110と、変換・量子化部120と、エントロピー符号化部130と、逆量子化・逆変換部140と、合成部150と、メモリ160と、予測部170と、評価部180と、決定部190とを備える。
ブロック分割部100は、動画像を構成するフレーム(或いはピクチャ)単位の入力画像をブロック状の小領域に分割し、分割により得たブロックを減算部110に出力する。ブロックのサイズは、例えば32×32画素、16×16画素、8×8画素、又は4×4画素等である。ブロックの形状は正方形に限らず、長方形であってもよい。ブロックは、画像符号化装置1が符号化を行う単位及び画像復号装置2が復号を行う単位である。
減算部110は、ブロック分割部100から入力されたブロックと当該ブロックを予測部170が予測して得た予測画像(予測ブロック)との間の画素単位での差分を示す予測残差を算出する。具体的には、減算部110は、ブロックの各画素値から予測画像の各画素値を減算することにより予測残差を算出し、算出した予測残差を変換・量子化部120に出力する。
変換・量子化部120は、ブロック単位で直交変換処理及び量子化処理を行う。変換・量子化部120は、変換部121と、量子化部122とを備える。
変換部121は、減算部110から入力された予測残差に対して直交変換処理を行って変換係数を算出し、算出した変換係数を量子化部122に出力する。直交変換とは、例えば、離散コサイン変換(DCT:Discrete Cosine Transform)や離散サイン変換(DST:Discrete Sine Transform)、カルーネンレーブ変換(KLT: Karhunen Loeve Transform)等をいう。第1実施形態において、変換部121は、KLTにより直交変換処理を行う。
量子化部122は、変換部121から入力された変換係数を量子化パラメータ(Qp)及び量子化行列を用いて量子化し、量子化した変換係数をエントロピー符号化部130及び逆量子化・逆変換部140に出力する。なお、量子化パラメータ(Qp)は、ブロック内の各変換係数に対して共通して適用されるパラメータであって、量子化の粗さを定めるパラメータである。量子化行列は、各変換係数を量子化する際の量子化値を要素として有する行列である。
エントロピー符号化部130は、量子化部122から入力された変換係数に対してエントロピー符号化を行い、データ圧縮を行って符号化データ(ビットストリーム)を生成し、符号化データを画像符号化装置1の外部に出力する。エントロピー符号化には、ハフマン符号やCABAC(Context-based Adaptive Binary Arithmetic Coding;コンテキスト適応型2値算術符号)等を用いることができる。なお、エントロピー符号化部130は、予測部170から予測に関する制御情報が入力され、入力された制御情報のエントロピー符号化も行う。
逆量子化・逆変換部140は、ブロック単位で逆量子化処理及び逆直交変換処理を行う。逆量子化・逆変換部140は、逆量子化部141と、逆変換部142とを備える。
逆量子化部141は、量子化部122が行う量子化処理に対応する逆量子化処理を行う。具体的には、逆量子化部141は、量子化部122から入力された変換係数を、量子化パラメータ(Qp)及び量子化行列を用いて逆量子化することにより変換係数を復元し、復元した変換係数を逆変換部142に出力する。
逆変換部142は、変換部121が行う直交変換処理に対応する逆直交変換処理を行う。例えば、変換部121が離散コサイン変換を行った場合には、逆変換部142は逆離散コサイン変換を行う。逆変換部142は、逆量子化部141から入力された変換係数に対して逆直交変換処理を行って予測残差を復元し、復元した予測残差である復元予測残差を合成部150に出力する。
合成部150は、逆変換部142から入力された復元予測残差を、予測部170から入力された予測画像と画素単位で合成する。合成部150は、復元予測残差の各画素値と予測画像の各画素値を加算してブロックを再構成(復号)し、復号したブロック単位の復号画像をメモリ160に出力する。かかる復号画像は、再構成画像と称されることがある。
メモリ160は、合成部150から入力された復号画像を記憶する。メモリ160は、復号画像をフレーム単位で記憶する。メモリ160は、記憶している復号画像を予測部170に出力する。なお、合成部150とメモリ160との間にループフィルタが設けられてもよい。
予測部170は、ブロック単位で予測を行う。予測部170は、イントラ予測部171と、インター予測部172と、切替部173とを備える。
イントラ予測部171は、メモリ160に記憶された復号画像のうち、予測対象のブロックの周辺にある復号画素値を参照してイントラ予測画像を生成し、生成したイントラ予測画像を切替部173に出力する。また、イントラ予測部171は、複数のイントラ予測モードの中から、対象ブロックに適用する最適なイントラ予測モードを選択し、選択したイントラ予測モードを用いてイントラ予測を行う。イントラ予測部171は、選択したイントラ予測モードに関する制御情報をエントロピー符号化部130に出力する。なお、イントラ予測モードには、Planar予測、DC予測、及び方向性予測がある。
インター予測部172は、メモリ160に記憶された復号画像を参照画像として用いて、ブロックマッチングなどの手法により動きベクトルを算出し、予測対象のブロックを予測してインター予測画像を生成し、生成したインター予測画像を切替部173に出力する。インター予測部172は、複数の参照画像を用いるインター予測(典型的には、双予測)や、1つの参照画像を用いるインター予測(片方向予測)の中から最適なインター予測方法を選択し、選択したインター予測方法を用いてインター予測を行う。インター予測部172は、インター予測に関する制御情報(インター予測方法や動きベクトルの情報等)をエントロピー符号化部130に出力する。インター予測部172は、インター予測画像を生成するために複数の参照画像を用いる場合に、当該複数の参照画像を評価部180に出力する。
なお、複数の参照画像を用いて行う予測は、インター予測における双予測が代表的なものであるが、これに限定されない。予測部170は、複数の参照画像を用いてイントラブロックコピーによる予測を行ってもよい。イントラブロックコピーでは、現フレームと同じフレーム内の参照画像が現フレーム内のブロックの予測に用いられる。複数の参照画像を用いてイントラブロックコピーによる予測を行う場合、予測部170は、当該複数の参照画像を評価部180に出力する。
切替部173は、イントラ予測部171から入力されるイントラ予測画像とインター予測部172から入力されるインター予測画像とを切り替えて、いずれかの予測画像を減算部110及び合成部150に出力する。
評価部180は、予測部170から入力された複数の参照画像間の類似度を画素単位で評価することにより、当該複数の参照画像を用いて生成された予測画像における誤差の分布を示すマップ情報を生成し、生成したマップ情報を決定部190に出力する。評価部180の詳細については後述する。
決定部190は、評価部180から入力されたマップ情報に基づいて、評価部180により予測精度が評価された予測画像に対応する予測残差に適用する直交変換を決定し、決定した直交変換を変換部121及び逆変換部142に出力する。第1実施形態において、決定部190は、マップ情報に基づいて垂直方向の直交変換及び水平方向の直交変換を生成する適応変換生成部191を備える。変換部121は、決定部190から入力された直交変換に従って直交変換処理を行う。逆変換部142は、決定部190から入力された直交変換に従って直交変換処理を行う。適応変換生成部191の詳細については後述する。
(インター予測の一例)
図2は、インター予測の一例を示す図である。図2(a)はインター予測の一例としての双予測を示し、図2(b)は双予測により生成される予測画像の一例を示す。
図2は、インター予測の一例を示す図である。図2(a)はインター予測の一例としての双予測を示し、図2(b)は双予測により生成される予測画像の一例を示す。
図2(a)に示すように、双予測は、対象フレーム(現フレーム)に対して時間的に前及び後のフレームを参照する。図2(a)の例では、tフレーム目の画像中のブロックの予測を、t-1フレーム目とt+1フレーム目とを参照して行う。動き検出では、t-1及びt+1フレーム目の参照フレーム内から、対象画像ブロックと類似する箇所(ブロック)をシステムで設定された探索範囲の中から検出する。
検出された箇所が参照画像である。対象画像ブロックに対する参照画像の相対位置を示す情報が図中に示す矢印であり、動きベクトルと呼ばれる。動きベクトルの情報は、画像符号化装置1において、参照画像のフレーム情報とともにエントロピー符号化によって符号化される。一方、画像復号装置は、画像符号化装置1により生成された動きベクトルの情報に基づいて参照画像を検出する。
図2(a)及び図2(b)に示すように、動き検出によって検出された参照画像1及び2は、対象画像ブロックに対し、参照するフレーム内で位置合わせされた類似する部分画像であるため、対象画像ブロック(符号化対象画像)に類似した画像となる。図2(b)の例では、対象画像ブロックは、星の絵柄と部分的な円の絵柄とを含んでいる。参照画像1は、星の絵柄と全体的な円の絵柄とを含んでいる。参照画像2は、星の絵柄を含むが、円の絵柄を含んでいない。
かかる参照画像1及び2から予測画像を生成する。なお、予測処理は、一般的に、特徴は異なるが部分的に類似する参照画像1及び2を平均化することによって、それぞれの参照画像の特徴を備えた予測画像を生成する。但し、より高度な処理、例えば、ローパスフィルタやハイパスフィルタ等による信号強調処理を併用して予測画像を生成してもよい。ここで、参照画像1は円の絵柄を含み、参照画像2は円の絵柄を含まないため、参照画像1及び2を平均化して予測画像を生成すると、予測画像における円の絵柄は、参照画像1に比べて信号が半減する。
参照画像1及び2から得られた予測画像と対象画像ブロック(符号化対象画像)との差分が予測残差である。図2(b)に示す予測残差において、星の絵柄のエッジのずれ部分と丸の絵柄のずれた部分(斜線部)とにのみ大きな差分が生じているが、それ以外の部分については、精度よく予測が行えており、差分が少なくなる(図2(b)の例では差分が生じていない)。
差分が生じていない部分(星の絵柄の非エッジ部分及び背景部分)は、参照画像1と参照画像2との間の類似度が高い部分であって、高精度な予測が行われた部分である。一方、大きな差分が生じている部分は、各参照画像に特有な部分、すなわち、参照画像1と参照画像2との間の類似度が著しく低い部分である。よって、参照画像1と参照画像2との間の類似度が著しく低い部分は、予測の精度が低く、大きな差分(残差)を生じさせることが分かる。
このように差分が大きい部分と差分が無い部分とが混在した予測残差を直交変換し、量子化による変換係数の劣化が生じると、かかる変換係数の劣化が逆量子化及び逆直交変換を経て画像(ブロック)内に全体的に伝搬する。そして、逆量子化及び逆直交変換によって復元された予測残差(復元予測残差)を予測画像に合成して対象画像ブロックを再構成すると、図2(b)に示す星の絵柄の非エッジ部分及び背景部分のように高精度な予測が行われた部分にも画質の劣化が伝搬してしまう。
(評価部)
図3は、評価部180の構成の一例を示す図である。図3に示すように、評価部180は、差分算出部(減算部)180aと、正規化部180bと、調整部180cとを備える。
図3は、評価部180の構成の一例を示す図である。図3に示すように、評価部180は、差分算出部(減算部)180aと、正規化部180bと、調整部180cとを備える。
差分算出部180aは、参照画像1と参照画像2との間の差分値(差の絶対値)を画素単位で算出し、算出した差分値を正規化部180bに出力する。かかる差分値は、類似度を示す値の一例である。差分値が小さいほど類似度が高く、差分値が大きいほど類似度が低いといえる。差分算出部180aは、各参照画像に対してフィルタ処理を行ったうえで差分値を算出してもよい。差分算出部180aは、二乗誤差等の統計量を算出し、かかる統計量を類似度として用いてもよい。
正規化部180bは、差分算出部180aから入力された差分値を、ブロック内で最大となる差分値(すなわち、ブロック内の差分値の最大値)で正規化して出力する。かかる差分値が小さいほど類似度が高く、予測精度も高くなる。一方、差分値が大きいほど類似度が低く、予測精度も低くなる(予測誤差が大きくなる)。
正規化部180bは、差分算出部180aから入力された各画素の差分値を、ブロック内で差分値が最大となる画素の差分値(すなわち、ブロック内の差分値の最大値)で正規化し、正規化した差分値である正規化差分値を出力する。かかる正規化差分値は、予測誤差の大きさを表す推定値として用いることができる。
調整部180cは、量子化の粗さを定める量子化パラメータ(Qp)に基づいて、正規化部180bから入力された正規化差分値を調整し、調整した正規化差分値を出力する。量子化の粗さが大きいほど復元予測残差の劣化度が高いため、調整部180cは、量子化パラメータ(Qp)に基づいて正規化差分値(重み)を調整する。
評価部180が出力する各画素位置(ij)における予測誤差の推定値Rijは、例えば下記の式(1)のように表現することができる。
Rij = (abs(Xij-Yij)/maxD × Scale(Qp)) ・・・(1)
式(1)において、Xijは参照画像1の画素ijの画素値であり、Yijは参照画像2の画素ijの画素値であり、absは絶対値を得る関数である。差分算出部180aでは、abs(Xij-Yij)を出力する。
また、式(1)において、maxDは、ブロック内の差分値abs(Xij-Yij)の最大値である。maxDを求めるために、ブロック内のすべての画素について差分値を求める必要があるが、この処理を省略するためにすでに符号化処理済みの隣接するブロックの最大値などで代用してもよい。或いは、量子化パラメータ(Qp)とmaxDとの対応関係を定めるテーブルを用いて、量子化パラメータ(Qp)からmaxDを求めてもよい。或いは、予め仕様で規定された固定値をmaxDとして用いてもよい。正規化部180bは、abs(Xij-Yij)/maxDを出力する。
また、式(1)において、Scale(Qp)は、量子化パラメータ(Qp)に応じて乗じられる係数である。Scale(Qp)は、Qpが大きい場合に1.0に近づき、小さい場合に0に近づくように設計され、その度合いはシステムによって調整するものとする。或いは、予め仕様で規定された固定値をScale(Qp)として用いてもよい。さらに、処理を簡略化するため、Scale(Qp)を1.0などシステムに応じて設計された固定値としてもよい。
調整部180cは、abs(Xij-Yij)/maxD×Scale(Qp)を誤差推定値Rijとして出力する。また、このRijは、システムに応じて設計される感度関数によって調整された重み付けを出力してもよい。例えば、abs(Xij-Yij)/maxD×Scale(Qp)=Rijとし、Rij=Clip(Rij,1.0,0.0)とする、又はRij=Clip(Rij+offset,1.0,0.0)とオフセットをつけて感度を調整してもよい。なお、Clip(x,max,min)は、xがmaxを超える場合はmaxで、xがminを下回る場合はminでクリップする処理を示す。
このようにして算出された画素位置ごとの誤差推定値Rijは、0から1.0までの範囲内の値となる。基本的には、誤差推定値Rijは、参照画像間の画素位置ijの差分値が大きい(すなわち、予測精度が低い)場合に1.0に近づき、参照画像間の画素位置ijの差分値が小さい(すなわち、予測精度が高い)場合に0に近づく。評価部180は、ブロック内の各画素位置ijの誤差推定値Rijからなる2次元のマップ情報(以下、「誤差マップ」と称する)を出力する。
(適応変換生成部)
図4は、第1実施形態に係る適応変換生成部191の動作を示す図である。適応変換生成部191は、評価部180から入力された誤差マップを用いて、予測残差に対して垂直方向に適用する垂直適応直交変換及び水平方向に適用する水平適応直交変換を主成分分析により生成する。
図4は、第1実施形態に係る適応変換生成部191の動作を示す図である。適応変換生成部191は、評価部180から入力された誤差マップを用いて、予測残差に対して垂直方向に適用する垂直適応直交変換及び水平方向に適用する水平適応直交変換を主成分分析により生成する。
具体的には、適応変換生成部191は、誤差マップを列ベクトルの集合とみなして共分散行列を生成し、生成した共分散行列の固有ベクトルを算出する。適応変換生成部191は、得られた固有ベクトルを垂直適応直交変換として出力する。また、適応変換生成部191は、生成した垂直適応直交変換を垂直方向に適用して得られた行列を行ベクトルの集合とみなして共分散行列を生成し、その固有ベクトルを算出する。適応変換生成部191は、得られた固有ベクトルを水平適応直交変換として出力する。
図4(a)に示すように、適応変換生成部191は、誤差マップが幅w高さhであるとき、誤差マップをw個のh×1の列ベクトルとみなして、共分散行列Λhを算出する。適応変換生成部191は、得られた共分散行列を対角化することで固有ベクトルを算出する。ここで、共分散行列の対角化には、例えばJacobi法などを用いて反復演算により算出する。適応変換生成部191は、得られた固有ベクトルe0からeh変換の結合によりh×hの行列を垂直適応直交変換として出力する。
さらに、図4(b)に示すように、適応変換生成部191は、誤差マップをh個の1×wの行ベクトルとみなして、共分散行列Λhを算出する。適応変換生成部191は、得られた共分散行列を対角化することで固有ベクトルを算出する。適応変換生成部191は、得られた固有ベクトルの結合によりw×wの行列を水平適応直交変換として出力する。
HEVC(非特許文献1参照)や、国際標準化団体で検討中の最新の映像符号化技術(JEM)などの映像符号化手法では、変換処理を高速かつ軽量に行う目的で、整数精度の変換係数及びビットシフトにより実現している。本実施形態に係る適応変換生成部191においても、得られた固有ベクトルを整数係数に近似し、変換係数のダイナミックレンジが拡大しないようなビットシフト量を予め画像符号化装置及び画像復号装置で規定してもよい。
なお、図1に示すように、変換部121は、適応変換生成部191から入力された垂直適応直交変換及び水平適応直交変換を用いて、減算部110により生成された予測残差に対し垂直及び水平方向に直交変換処理を行うことにより変換係数を算出し、算出した変換係数を量子化部122に出力する。
また、逆変換部142は、適応変換生成部191から入力された垂直適応直交変換及び水平適応直交変換を用いて、逆量子化部141から入力された変換係数に対して、変換部121が行う直交変換処理に対応する逆直交変換処理を行う。
(画像復号装置)
図5は、第1実施形態に係る画像復号装置2の構成を示す図である。図5に示すように、画像復号装置2は、エントロピー符号復号部200と、逆量子化・逆変換部210と、合成部220と、メモリ230と、予測部240と、評価部250と、決定部260とを備える。
図5は、第1実施形態に係る画像復号装置2の構成を示す図である。図5に示すように、画像復号装置2は、エントロピー符号復号部200と、逆量子化・逆変換部210と、合成部220と、メモリ230と、予測部240と、評価部250と、決定部260とを備える。
エントロピー符号復号部200は、画像符号化装置1により生成された符号化データを復号し、量子化された変換係数を逆量子化・逆変換部210に出力する。また、エントロピー符号復号部200は、予測(イントラ予測及びインター予測)に関する制御情報を取得し、取得した制御情報を予測部240に出力する。
逆量子化・逆変換部210は、ブロック単位で逆量子化処理及び逆直交変換処理を行う。逆量子化・逆変換部210は、逆量子化部211と、逆変換部212とを備える。
逆量子化部211は、画像符号化装置1の量子化部122が行う量子化処理に対応する逆量子化処理を行う。逆量子化部211は、エントロピー符号復号部200から入力された量子化変換係数を、量子化パラメータ(Qp)及び量子化行列を用いて逆量子化することにより、変換係数を復元し、復元した変換係数を逆変換部212に出力する。
逆変換部212は、画像符号化装置1の変換部121が行う直交変換処理に対応する逆直交変換処理を行う。逆変換部212は、逆量子化部211から入力された変換係数に対して逆直交変換処理を行って予測残差を復元し、復元した予測残差(復元予測残差)を合成部220に出力する。
合成部220は、逆変換部212から入力された予測残差と、予測部240から入力された予測画像とを画素単位で合成することにより、元のブロックを再構成(復号)し、ブロック単位の復号画像をメモリ230に出力する。
メモリ230は、合成部220から入力された復号画像を記憶する。メモリ230は、復号画像をフレーム単位で記憶する。メモリ230は、フレーム単位の復号画像を画像復号装置2の外部に出力する。なお、合成部220とメモリ230との間にループフィルタが設けられてもよい。
予測部240は、ブロック単位で予測を行う。予測部240は、イントラ予測部241と、インター予測部242と、切替部243とを備える。
イントラ予測部241は、メモリ230に記憶された復号画像を参照し、エントロピー符号復号部200から入力された制御情報に従ってイントラ予測を行うことによりイントラ予測画像を生成し、生成したイントラ予測画像を切替部243に出力する。
インター予測部242は、メモリ230に記憶された復号画像を参照画像として用いて予測対象のブロックを予測するインター予測を行う。インター予測部242は、エントロピー符号復号部200から入力された制御情報(インター予測方法や動きベクトル情報等)に従ってインター予測を行うことによりインター予測画像を生成し、生成したインター予測画像を切替部243に出力する。インター予測部242は、インター予測画像を生成するために複数の参照画像を用いる場合に、当該複数の参照画像を評価部250に出力する。
なお、複数の参照画像を用いて行う予測は、インター予測における双予測が代表的なものであるが、これに限定されない。予測部240は、複数の参照画像を用いてイントラブロックコピーによる予測を行ってもよい。複数の参照画像を用いてイントラブロックコピーによる予測を行う場合、予測部240は、当該複数の参照画像を評価部250に出力する。
切替部243は、イントラ予測部241から入力されるイントラ予測画像とインター予測部242から入力されるインター予測画像とを切り替えて、いずれかの予測画像を合成部220に出力する。
評価部250は、画像符号化装置1の評価部180(図3参照)と同様な動作を行う。評価部250は、予測部240から入力された複数の参照画像間の類似度を画素単位で評価することにより、当該複数の参照画像を用いて生成された予測画像における誤差の分布を示す誤差マップを生成し、生成した誤差マップを決定部260に出力する。
決定部260は、評価部250から入力された誤差マップに基づいて、評価部250により予測精度が評価された予測画像に対応する予測残差に適用する逆直交変換を決定し、決定した逆直交変換を逆変換部212に出力する。決定部260は、誤差マップに基づいて垂直方向の直交変換及び水平方向の直交変換を生成する適応変換生成部261を備える。適応変換生成部261は、画像符号化装置1の適応変換生成部191と同様な動作(図4参照)を行う。逆変換部212は、決定部260から入力された逆直交変換に従って逆直交変換処理を行う。
(第1実施形態のまとめ)
第1実施形態に係る画像符号化装置1は、フレーム単位の現画像を分割して得られたブロック単位の対象画像を符号化する。画像符号化装置1は、複数の参照画像を用いて対象画像を予測して予測画像を生成する予測部170と、当該複数の参照画像間の類似度を画素単位で評価することにより、予測画像における誤差の分布を示す誤差マップを生成する評価部180と、対象ブロックと予測画像との差分を示す予測残差を画素単位で算出する減算部110と、予測残差に適用する直交変換を誤差マップに基づいて決定する決定部190と、決定された直交変換によって予測残差に対する直交変換処理を行う変換部121とを備える。決定部190は、マップ情報に基づいて直交変換を生成する適応変換生成部191を備える。
第1実施形態に係る画像符号化装置1は、フレーム単位の現画像を分割して得られたブロック単位の対象画像を符号化する。画像符号化装置1は、複数の参照画像を用いて対象画像を予測して予測画像を生成する予測部170と、当該複数の参照画像間の類似度を画素単位で評価することにより、予測画像における誤差の分布を示す誤差マップを生成する評価部180と、対象ブロックと予測画像との差分を示す予測残差を画素単位で算出する減算部110と、予測残差に適用する直交変換を誤差マップに基づいて決定する決定部190と、決定された直交変換によって予測残差に対する直交変換処理を行う変換部121とを備える。決定部190は、マップ情報に基づいて直交変換を生成する適応変換生成部191を備える。
また、第1実施形態に係る画像復号装置2は、フレーム単位の現画像を分割して得られたブロック単位の対象画像を復号する。画像復号装置2は、符号化データを復号することにより変換係数を取得するエントロピー符号復号部200と、複数の参照画像を用いて対象画像を予測して予測画像を生成する予測部240と、当該複数の参照画像間の類似度を画素単位で評価することにより、予測画像における誤差の分布を示す誤差マップを生成する評価部250と、変換係数に適用する逆直交変換を誤差マップに基づいて決定する決定部260と、決定された逆直交変換によって変換係数に対する逆直交変換処理を行う逆変換部212とを備える。決定部260は、マップ情報に基づいて逆直交変換を生成する適応変換生成部261を備える。
このように、第1実施形態によれば、予測画像における誤差の分布を示す誤差マップに基づいて直交変換を生成することにより、予測残差におけるエネルギー分布に応じた最適な直交変換を適用することができる。
また、画像符号化装置1及び画像復号装置2のそれぞれが誤差マップに基づいて直交変換を生成可能であるため、画像符号化装置1で行った直交変換(KLT)の逆処理のための情報を画像復号装置2側で必要としない。よって、伝送すべき情報量の増大を抑制できる。
したがって、第1実施形態に係る画像符号化装置1及び画像復号装置2によれば、予測残差のエネルギーを効率的に集中させる適応直交変換を適用可能にし、符号化効率を改善できる。
<第2実施形態>
第2実施形態に係る画像符号化装置1及び画像復号装置2について、第1実施形態との相違点を主として説明する。
第2実施形態に係る画像符号化装置1及び画像復号装置2について、第1実施形態との相違点を主として説明する。
(画像符号化装置)
図6は、第2実施形態に係る画像符号化装置1の構成を示す図である。図6に示すように、第2実施形態に係る画像符号化装置1は、決定部190の構成が第1実施形態とは異なる。決定部190は、第1実施形態と同様に、誤差マップの主成分分析(図4参照)により直交変換を生成する適応変換生成部191を備える。第2実施形態において、決定部190は、候補選択部(第1選択部)192と、直交変換選択部(第2選択部)193とをさらに備える。
図6は、第2実施形態に係る画像符号化装置1の構成を示す図である。図6に示すように、第2実施形態に係る画像符号化装置1は、決定部190の構成が第1実施形態とは異なる。決定部190は、第1実施形態と同様に、誤差マップの主成分分析(図4参照)により直交変換を生成する適応変換生成部191を備える。第2実施形態において、決定部190は、候補選択部(第1選択部)192と、直交変換選択部(第2選択部)193とをさらに備える。
適応変換生成部191は、誤差マップに基づいて生成した適応直交変換(垂直適応直交変換及び水平適応直交変換)を候補選択部192に出力する。
候補選択部192は、予め規定された複数種類の直交変換の中から、適応変換生成部191から入力された適応直交変換との相関が高い順に1つ以上の直交変換候補を選択し、選択した1つ以上の直交変換候補を直交変換選択部263に出力する。予め規定された複数種類の直交変換は、画像符号化装置1及び画像復号装置2で共有されている。第2実施形態において、複数種類の直交変換として、DCT-2、DST-7、DCT-8、DST-1、及びDCT-5が予め規定されているものとする。
具体的には、候補選択部192は、適応変換生成部191から入力された水平適応直交変換と各直交変換(DCT-2、DST-7、DCT-8、DST-1、DCT-5)との相関を評価する。そして、候補選択部192は、相関評価の結果に基づいて、複数種類の直交変換のうち、相関の高い順に1つ以上の直交変換を適応直交変換候補として直交変換選択部193に出力する。
なお、候補選択部192が出力する適応直交変換候補の数は、画像符号化装置1及び画像復号装置2で同じ数とするように予め規定される。また、候補選択部192が出力する適応直交変換候補の数は、符号化対象の画像ブロックのブロックサイズや色成分(輝度成分、色差成分)などに応じて可変としてもよい。
さらに、候補選択部192は、水平方向と垂直方向とで適応直交変換候補を別々に選択してもよい。かかる場合、候補選択部192は、適応変換生成部191から入力された垂直適応直交変換と各直交変換(DCT-2、DST-7、DCT-8、DST-1、DCT-5)との相関をさらに評価し、適応水平直交変換候補に加えて適応垂直直交変換候補を直交変換選択部193に出力する。
直交変換選択部193は、候補選択部192から入力された1つ以上の直交変換候補の中から、予測残差に適用する直交変換を選択し、選択した直交変換を変換部121及び逆変換部142に出力する。また、直交変換選択部193は、選択した直交変換の種類を示すインデックスをエントロピー符号化部130に出力する。
例えば、直交変換選択部193は、各直交変換候補を適用した場合の符号化効率をシミュレーションにより算出し、かかるシミュレーションの結果に応じて最適な直交変換を選択する。なお、直交変換選択部193は、水平方向及び垂直方向で同一種類の直交変換を選択するよう構成してもよいし、水平方向及び垂直方向で別々の種類の直交変換を選択するよう構成してもよい。
エントロピー符号化部130は、直交変換選択部193から入力された適応直交変換インデックスをエントロピー符号化する。水平方向及び垂直方向で別々の種類の直交変換を選択する場合には、エントロピー符号化部130は、水平方向及び垂直方向で別々の適応直交変換インデックスをエントロピー符号化する。但し、適応直交変換候補が1種類の直交変換により構成されている場合には、画像復号装置2において一意に直交変換を特定できるため、かかるインデックスをエントロピー符号化しなくてもよい。
(画像復号装置)
図7は、第2実施形態に係る画像復号装置2の構成を示す図である。図7に示すように、第2実施形態に係る画像復号装置2は、決定部260の構成が第1実施形態とは異なる。決定部260は、第1実施形態と同様に、誤差マップの主成分分析(図4参照)により直交変換を生成する適応変換生成部261を備える。第2実施形態において、決定部260は、候補選択部(第1選択部)262と、直交変換選択部(第2選択部)263とをさらに備える。
図7は、第2実施形態に係る画像復号装置2の構成を示す図である。図7に示すように、第2実施形態に係る画像復号装置2は、決定部260の構成が第1実施形態とは異なる。決定部260は、第1実施形態と同様に、誤差マップの主成分分析(図4参照)により直交変換を生成する適応変換生成部261を備える。第2実施形態において、決定部260は、候補選択部(第1選択部)262と、直交変換選択部(第2選択部)263とをさらに備える。
適応変換生成部261は、誤差マップに基づいて生成した適応直交変換(垂直適応直交変換及び水平適応直交変換)を候補選択部262に出力する。
候補選択部262は、予め規定された複数種類の直交変換の中から、適応変換生成部261から入力された適応直交変換との相関が高い順に1つ以上の直交変換候補を選択し、選択した1つ以上の直交変換候補を直交変換選択部263に出力する。上述したように、複数種類の直交変換として、DCT-2、DST-7、DCT-8、DST-1、及びDCT-5が予め規定されているものとする。
具体的には、候補選択部262は、適応変換生成部261から入力された水平適応直交変換と各直交変換(DCT-2、DST-7、DCT-8、DST-1、DCT-5)との相関を評価する。そして、候補選択部262は、相関評価の結果に基づいて、複数種類の直交変換のうち、相関の高い順に1つ以上の直交変換を適応直交変換候補として直交変換選択部263に出力する。
上述したように、候補選択部262が出力する適応直交変換候補の数は、画像符号化装置1及び画像復号装置2で同じ数とするように予め規定される。また、候補選択部262が出力する適応直交変換候補の数は、復号対象の画像ブロックのブロックサイズや色成分(輝度成分、色差成分)などに応じて可変としてもよい。
さらに、候補選択部262は、水平方向と垂直方向とで適応直交変換候補を別々に選択してもよい。かかる場合、候補選択部262は、適応変換生成部261から入力された垂直適応直交変換と各直交変換(DCT-2、DST-7、DCT-8、DST-1、DCT-5)との相関をさらに評価し、適応水平直交変換候補に加えて適応垂直直交変換候補を直交変換選択部263に出力する。
一方、エントロピー符号復号部200は、1つ以上の直交変換候補の中から画像符号化装置1が選択した直交変換を示すインデックスを復号し、当該インデックスを直交変換選択部263に出力する。水平方向及び垂直方向で別々の種類の直交変換を選択する場合には、エントロピー符号復号部200は、水平方向及び垂直方向で別々の適応直交変換インデックスを復号する。
直交変換選択部263は、エントロピー符号復号部200から入力されたインデックスに基づいて、候補選択部262から入力された1つ以上の直交変換候補の中から変換係数に適用する逆直交変換を選択し、選択した逆直交変換を逆変換部212に出力する。なお、直交変換選択部263は、水平方向及び垂直方向で同一種類の直交変換を選択するよう構成してもよいし、水平方向及び垂直方向で別々の種類の直交変換を選択するよう構成してもよい。
(第2実施形態のまとめ)
第2実施形態に係る画像符号化装置1において、決定部190は、誤差マップの主成分分析により直交変換を生成する適応変換生成部191と、予め規定された複数種類の直交変換の中から、生成された直交変換との相関が高い順に1つ以上の直交変換候補を選択する候補選択部192と、1つ以上の直交変換候補の中から予測残差に適用する直交変換を選択する直交変換選択部193とを備える。エントロピー符号化部130は、1つ以上の直交変換候補の中から直交変換選択部193が選択した直交変換を示すインデックスを符号化する。
第2実施形態に係る画像符号化装置1において、決定部190は、誤差マップの主成分分析により直交変換を生成する適応変換生成部191と、予め規定された複数種類の直交変換の中から、生成された直交変換との相関が高い順に1つ以上の直交変換候補を選択する候補選択部192と、1つ以上の直交変換候補の中から予測残差に適用する直交変換を選択する直交変換選択部193とを備える。エントロピー符号化部130は、1つ以上の直交変換候補の中から直交変換選択部193が選択した直交変換を示すインデックスを符号化する。
また、第2実施形態に係る画像復号装置2において、決定部260は、誤差マップの主成分分析により直交変換を生成する適応変換生成部261と、予め規定された複数種類の直交変換の中から、生成された直交変換との相関が高い順に1つ以上の直交変換候補を選択する候補選択部262と、1つ以上の直交変換候補の中から変換係数に適用する逆直交変換を選択する直交変換選択部263とを備える。エントロピー符号復号部200は、1つ以上の直交変換候補の中から画像符号化装置1が選択した直交変換を示すインデックスを復号する。直交変換選択部263は、当該インデックスに基づいて、1つ以上の直交変換候補の中から変換係数に適用する逆直交変換を選択する。
このように、第2実施形態によれば、予め規定された複数種類の直交変換の中から、誤差マップの主成分分析により生成された直交変換(KLT)と相関の高い直交変換候補を選択し、当該直交変換候補の中から変換処理に適用する直交変換を選択する。予め規定された複数種類の直交変換(DCT-2、DST-7、DCT-8、DST-1、DCT-5)は、KLTに比べて演算処理量が少ない。
したがって、第2実施形態によれば、予測残差のエネルギーを効率的に集中させる直交変換を適用可能にして符号化効率を改善しつつ、第1実施形態に比べて変換処理の演算処理量を削減できる。
<第3実施形態>
第3実施形態に係る画像符号化装置1及び画像復号装置2について、第1実施形態及び第2実施形態との相違点を主として説明する。
第3実施形態に係る画像符号化装置1及び画像復号装置2について、第1実施形態及び第2実施形態との相違点を主として説明する。
上述した第2実施形態では、予め規定された複数種類の直交変換の中から、誤差マップの主成分分析により生成された直交変換(KLT)と相関の高い直交変換候補を選択していた。これに対し、第3実施形態では、予め規定された複数種類の直交変換の中から、誤差マップの特徴量評価によって直交変換候補を選択する。
(画像符号化装置)
図8は、第3実施形態に係る画像符号化装置1の構成を示す図である。図8に示すように、第3実施形態に係る画像符号化装置1は、決定部190が特徴量評価部191aを備える点で第2実施形態とは異なる。特徴量評価部191aは、評価部180から入力された誤差マップの特徴量を評価し、評価結果を候補選択部192に出力する。
図8は、第3実施形態に係る画像符号化装置1の構成を示す図である。図8に示すように、第3実施形態に係る画像符号化装置1は、決定部190が特徴量評価部191aを備える点で第2実施形態とは異なる。特徴量評価部191aは、評価部180から入力された誤差マップの特徴量を評価し、評価結果を候補選択部192に出力する。
図9は、特徴量評価部191aの動作を示す図である。図9に示すように、特徴量評価部191aは、誤差マップのエネルギー分布を評価するために、誤差マップを水平方向に4分割するとともに垂直方向に4分割し、分割された各領域について誤差推定値の合計値Exy(E00乃至E33)を算出する。特徴量評価部191aは、評価したエネルギー分布E00乃至E33を候補選択部192に出力する。
候補選択部192は、下記の条件に基づいて、予め規定された複数種類の直交変換(DCT-2、DST-7、DCT-8、DST-1、DCT-5)の中から適応直交変換候補を選択し、選択した適応直交変換候補を直交変換選択部193に出力する。
(a)候補選択部192は、水平方向について:
のとき、DCT-2及びDST-1を水平適応直交変換候補として選択し、
のとき、DCT-2及びDST-7を水平適応直交変換候補として選択し、
のとき、DCT-2及びDCT-5を水平適応直交変換候補として選択し、
いずれも当てはまらないとき、DCT-8及びDST-7を水平適応直交変換候補として選択する。
いずれも当てはまらないとき、DCT-8及びDST-7を水平適応直交変換候補として選択する。
(b)候補選択部192は、垂直方向について:
のとき、DCT-2及びDST-1を垂直適応直交変換候補として選択し、
のとき、DCT-2及びDST-7を垂直適応直交変換候補として選択し、
のとき、DCT-2及びDCT-5を垂直適応直交変換候補として選択し、
いずれも当てはまらないとき、DCT-8及びDST-7を垂直適応直交変換候補として選択する。
いずれも当てはまらないとき、DCT-8及びDST-7を垂直適応直交変換候補として選択する。
ここでは、候補選択部192が出力する適応直交変換候補の数は、水平方向及び垂直方向のそれぞれで2つであるが、候補選択部192が出力する適応直交変換候補の数は、符号化対象の画像ブロックのブロックサイズや色成分(輝度成分、色差成分)などに応じて可変としてもよい。
直交変換選択部193は、第2実施形態と同様に、候補選択部192から入力された直交変換候補の中から、予測残差に適用する直交変換を選択し、選択した直交変換を変換部121及び逆変換部142に出力する。また、直交変換選択部193は、選択した直交変換の種類を示すインデックスをエントロピー符号化部130に出力する。エントロピー符号化部130は、直交変換選択部193から入力された適応直交変換インデックスをエントロピー符号化する。
(画像復号装置)
図10は、第3実施形態に係る画像復号装置2の構成を示す図である。図10に示すように、第3実施形態に係る画像復号装置2は、決定部260が特徴量評価部261aを備える点で第2実施形態とは異なる。特徴量評価部261aは、画像符号化装置1の特徴量評価部191aと同様な動作を行う(図9参照)。
図10は、第3実施形態に係る画像復号装置2の構成を示す図である。図10に示すように、第3実施形態に係る画像復号装置2は、決定部260が特徴量評価部261aを備える点で第2実施形態とは異なる。特徴量評価部261aは、画像符号化装置1の特徴量評価部191aと同様な動作を行う(図9参照)。
特徴量評価部261aは、誤差マップのエネルギー分布を評価するために、誤差マップを水平方向に4分割するとともに垂直方向に4分割し、分割された各領域について誤差推定値の合計値Exy(E00乃至E33)を算出する。特徴量評価部261aは、評価したエネルギー分布E00乃至E33を候補選択部262に出力する。
候補選択部262は、画像符号化装置1の候補選択部192と同様な条件に基づいて、予め規定された複数種類の直交変換(DCT-2、DST-7、DCT-8、DST-1、DCT-5)の中から適応直交変換候補を選択し、選択した適応直交変換候補を直交変換選択部263に出力する。
一方、エントロピー符号復号部200は、直交変換候補の中から画像符号化装置1が選択した直交変換を示すインデックスを復号し、当該インデックスを直交変換選択部263に出力する。直交変換選択部263は、エントロピー符号復号部200から入力されたインデックスに基づいて、候補選択部262から入力された直交変換候補の中から変換係数に適用する逆直交変換を選択し、選択した逆直交変換を逆変換部212に出力する。
(第3実施形態のまとめ)
第3実施形態に係る画像符号化装置1において、決定部190は、誤差マップの特徴量を評価する特徴量評価部191aと、評価された特徴量に基づいて、予め規定された複数種類の直交変換の中から1つ以上の直交変換候補を選択する候補選択部192と、1つ以上の直交変換候補の中から予測残差に適用する直交変換を選択する直交変換選択部193とを備える。エントロピー符号化部130は、1つ以上の直交変換候補の中から直交変換選択部193が選択した直交変換を示すインデックスを符号化する。
第3実施形態に係る画像符号化装置1において、決定部190は、誤差マップの特徴量を評価する特徴量評価部191aと、評価された特徴量に基づいて、予め規定された複数種類の直交変換の中から1つ以上の直交変換候補を選択する候補選択部192と、1つ以上の直交変換候補の中から予測残差に適用する直交変換を選択する直交変換選択部193とを備える。エントロピー符号化部130は、1つ以上の直交変換候補の中から直交変換選択部193が選択した直交変換を示すインデックスを符号化する。
また、第3実施形態に係る画像復号装置2において、決定部260は、誤差マップの特徴量を評価する特徴量評価部261aと、評価された特徴量に基づいて、予め規定された複数種類の直交変換の中から1つ以上の直交変換候補を選択する候補選択部262と、1つ以上の直交変換候補の中から変換係数に適用する逆直交変換を選択する直交変換選択部263とを備える。エントロピー符号復号部200は、1つ以上の直交変換候補の中から画像符号化装置1が選択した直交変換を示すインデックスを復号する。直交変換選択部263は、当該インデックスに基づいて、1つ以上の直交変換候補の中から変換係数に適用する逆直交変換を選択する。
このように、第3実施形態によれば、誤差マップの特徴量をシンプルな演算処理により評価できるため、誤差マップの主成分分析により直交変換(KLT)を生成する第2実施形態に比べて演算処理量を削減できる。
したがって、第3実施形態によれば、予測残差のエネルギーを効率的に集中させる直交変換を適用可能にして符号化効率を改善しつつ、第2実施形態に比べて誤差マップの分析のための演算処理量を削減できる。
<その他の実施形態>
上述した第1乃至第3実施形態において、一次元の直交変換を用いて垂直方向及び垂直方向で別々に変換処理を行う一例について説明した。しかしながら、一次元の直交変換に代えて二次元の直交変換を用いて垂直方向及び垂直方向の変換処理をまとめて行ってもよい。
上述した第1乃至第3実施形態において、一次元の直交変換を用いて垂直方向及び垂直方向で別々に変換処理を行う一例について説明した。しかしながら、一次元の直交変換に代えて二次元の直交変換を用いて垂直方向及び垂直方向の変換処理をまとめて行ってもよい。
また、画像符号化装置1が行う各処理をコンピュータに実行させるプログラム及び画像復号装置2が行う各処理をコンピュータに実行させるプログラムにより提供されてもよい。また、プログラムは、コンピュータ読取り可能媒体に記録されていてもよい。コンピュータ読取り可能媒体を用いれば、コンピュータにプログラムをインストールすることが可能である。ここで、プログラムが記録されたコンピュータ読取り可能媒体は、非一過性の記録媒体であってもよい。非一過性の記録媒体は、特に限定されるものではないが、例えば、CD-ROMやDVD-ROM等の記録媒体であってもよい。
また、画像符号化装置1が行う各処理を実行する回路を集積化し、画像符号化装置1を半導体集積回路(チップセット、SoC)として構成してもよい。同様に、画像復号装置2が行う各処理を実行する回路を集積化し、画像復号装置2を半導体集積回路(チップセット、SoC)として構成してもよい。
以上、図面を参照して実施形態について詳しく説明したが、具体的な構成は上述のものに限られることはなく、要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。
1 :画像符号化装置
2 :画像復号装置
100 :ブロック分割部
110 :減算部
120 :変換・量子化部
121 :変換部
122 :量子化部
130 :エントロピー符号化部
140 :逆量子化・逆変換部
141 :逆量子化部
142 :逆変換部
150 :合成部
160 :メモリ
170 :予測部
171 :イントラ予測部
172 :インター予測部
173 :切替部
180 :評価部
180a :差分算出部
180b :正規化部
180c :調整部
190 :決定部
191 :適応変換生成部
191a :特徴量評価部
192 :候補選択部
193 :直交変換選択部
200 :エントロピー符号復号部
210 :逆量子化・逆変換部
211 :逆量子化部
212 :逆変換部
220 :合成部
230 :メモリ
240 :予測部
241 :イントラ予測部
242 :インター予測部
243 :切替部
250 :評価部
260 :決定部
261 :適応変換生成部
261a :特徴量評価部
262 :候補選択部
263 :直交変換選択部
2 :画像復号装置
100 :ブロック分割部
110 :減算部
120 :変換・量子化部
121 :変換部
122 :量子化部
130 :エントロピー符号化部
140 :逆量子化・逆変換部
141 :逆量子化部
142 :逆変換部
150 :合成部
160 :メモリ
170 :予測部
171 :イントラ予測部
172 :インター予測部
173 :切替部
180 :評価部
180a :差分算出部
180b :正規化部
180c :調整部
190 :決定部
191 :適応変換生成部
191a :特徴量評価部
192 :候補選択部
193 :直交変換選択部
200 :エントロピー符号復号部
210 :逆量子化・逆変換部
211 :逆量子化部
212 :逆変換部
220 :合成部
230 :メモリ
240 :予測部
241 :イントラ予測部
242 :インター予測部
243 :切替部
250 :評価部
260 :決定部
261 :適応変換生成部
261a :特徴量評価部
262 :候補選択部
263 :直交変換選択部
Claims (4)
- フレーム単位の現画像を分割して得られたブロック単位の対象画像を符号化する画像符号化装置であって、
前記現画像を前記ブロックに分割するブロック分割を行うブロック分割部と、
複数の参照画像を用いて前記対象画像を双予測を含むインター予測により予測して予測画像を生成する予測部と、
前記予測部が前記対象画像の時間的に前の参照画像及び後の参照画像を用いた前記双予測を行う場合に限り、前記複数の参照画像間の類似度を示す値を前記ブロックよりも小さい領域単位であって複数の画素からなる前記領域単位で算出する評価部と、を備え、
前記評価部が前記領域単位で算出した前記値に基づいて符号化の処理を制御することを特徴とする画像符号化装置。 - フレーム単位の現画像を分割して得られたブロック単位の対象画像を復号する画像復号装置であって、
複数の参照画像を用いて前記対象画像を双予測を含むインター予測により予測して予測画像を生成する予測部と、
前記予測部が前記対象画像の時間的に前の参照画像及び後の参照画像を用いた前記双予測を行う場合に限り、前記複数の参照画像間の類似度を示す値を前記ブロックよりも小さい領域単位であって複数の画素からなる前記領域単位で算出する評価部と、を備え、
前記評価部が前記領域単位で算出した前記値に基づいて復号の処理を制御することを特徴とする画像復号装置。 - コンピュータを請求項1に記載の画像符号化装置として機能させることを特徴とするプログラム。
- コンピュータを請求項2に記載の画像復号装置として機能させることを特徴とするプログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2025108304A JP7812966B2 (ja) | 2018-08-15 | 2025-06-26 | 画像符号化装置、画像復号装置、及びプログラム |
Applications Claiming Priority (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2018152991A JP7249111B2 (ja) | 2018-08-15 | 2018-08-15 | 画像符号化装置、画像復号装置、及びプログラム |
| JP2023020232A JP7483964B2 (ja) | 2018-08-15 | 2023-02-13 | 画像符号化装置、画像復号装置、及びプログラム |
| JP2024074523A JP7704929B2 (ja) | 2018-08-15 | 2024-05-01 | 画像符号化装置、画像復号装置、及びプログラム |
| JP2025108304A JP7812966B2 (ja) | 2018-08-15 | 2025-06-26 | 画像符号化装置、画像復号装置、及びプログラム |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2024074523A Division JP7704929B2 (ja) | 2018-08-15 | 2024-05-01 | 画像符号化装置、画像復号装置、及びプログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2025123577A JP2025123577A (ja) | 2025-08-22 |
| JP7812966B2 true JP7812966B2 (ja) | 2026-02-10 |
Family
ID=69620422
Family Applications (4)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2018152991A Active JP7249111B2 (ja) | 2018-08-15 | 2018-08-15 | 画像符号化装置、画像復号装置、及びプログラム |
| JP2023020232A Active JP7483964B2 (ja) | 2018-08-15 | 2023-02-13 | 画像符号化装置、画像復号装置、及びプログラム |
| JP2024074523A Active JP7704929B2 (ja) | 2018-08-15 | 2024-05-01 | 画像符号化装置、画像復号装置、及びプログラム |
| JP2025108304A Active JP7812966B2 (ja) | 2018-08-15 | 2025-06-26 | 画像符号化装置、画像復号装置、及びプログラム |
Family Applications Before (3)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2018152991A Active JP7249111B2 (ja) | 2018-08-15 | 2018-08-15 | 画像符号化装置、画像復号装置、及びプログラム |
| JP2023020232A Active JP7483964B2 (ja) | 2018-08-15 | 2023-02-13 | 画像符号化装置、画像復号装置、及びプログラム |
| JP2024074523A Active JP7704929B2 (ja) | 2018-08-15 | 2024-05-01 | 画像符号化装置、画像復号装置、及びプログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (4) | JP7249111B2 (ja) |
Families Citing this family (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP7249111B2 (ja) * | 2018-08-15 | 2023-03-30 | 日本放送協会 | 画像符号化装置、画像復号装置、及びプログラム |
| CN112417972A (zh) * | 2020-10-23 | 2021-02-26 | 奥比中光科技集团股份有限公司 | 一种热图解码方法、人体关节点估计方法及系统 |
| CN112911311B (zh) * | 2021-01-28 | 2024-08-16 | 杭州网易智企科技有限公司 | 编码方法、编码装置、存储介质及电子设备 |
| AU2022321329A1 (en) | 2021-08-06 | 2024-03-07 | Samsung Electronics Co., Ltd. | Device and method for ai-based filtering of image |
Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2000059785A (ja) | 1998-08-06 | 2000-02-25 | Hitachi Ltd | 予測復号装置 |
| JP2003204550A (ja) | 2002-01-07 | 2003-07-18 | Mitsubishi Electric Corp | 動画像符号化装置および動画像復号装置 |
| WO2010010942A1 (ja) | 2008-07-25 | 2010-01-28 | ソニー株式会社 | 画像処理装置および方法 |
| WO2010087807A1 (en) | 2009-01-27 | 2010-08-05 | Thomson Licensing | Methods and apparatus for transform selection in video encoding and decoding |
| WO2011080807A1 (ja) | 2009-12-28 | 2011-07-07 | 富士通株式会社 | 動画像符号化装置および動画像復号装置 |
| WO2011080806A1 (ja) | 2009-12-28 | 2011-07-07 | 富士通株式会社 | 動画像符号化装置および動画像復号装置 |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP6459761B2 (ja) * | 2015-05-01 | 2019-01-30 | 富士通株式会社 | 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム |
| JP7249111B2 (ja) * | 2018-08-15 | 2023-03-30 | 日本放送協会 | 画像符号化装置、画像復号装置、及びプログラム |
-
2018
- 2018-08-15 JP JP2018152991A patent/JP7249111B2/ja active Active
-
2023
- 2023-02-13 JP JP2023020232A patent/JP7483964B2/ja active Active
-
2024
- 2024-05-01 JP JP2024074523A patent/JP7704929B2/ja active Active
-
2025
- 2025-06-26 JP JP2025108304A patent/JP7812966B2/ja active Active
Patent Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2000059785A (ja) | 1998-08-06 | 2000-02-25 | Hitachi Ltd | 予測復号装置 |
| JP2003204550A (ja) | 2002-01-07 | 2003-07-18 | Mitsubishi Electric Corp | 動画像符号化装置および動画像復号装置 |
| WO2010010942A1 (ja) | 2008-07-25 | 2010-01-28 | ソニー株式会社 | 画像処理装置および方法 |
| WO2010087807A1 (en) | 2009-01-27 | 2010-08-05 | Thomson Licensing | Methods and apparatus for transform selection in video encoding and decoding |
| WO2011080807A1 (ja) | 2009-12-28 | 2011-07-07 | 富士通株式会社 | 動画像符号化装置および動画像復号装置 |
| WO2011080806A1 (ja) | 2009-12-28 | 2011-07-07 | 富士通株式会社 | 動画像符号化装置および動画像復号装置 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP7483964B2 (ja) | 2024-05-15 |
| JP2023053272A (ja) | 2023-04-12 |
| JP2024087082A (ja) | 2024-06-28 |
| JP7704929B2 (ja) | 2025-07-08 |
| JP7249111B2 (ja) | 2023-03-30 |
| JP2020028067A (ja) | 2020-02-20 |
| JP2025123577A (ja) | 2025-08-22 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7812966B2 (ja) | 画像符号化装置、画像復号装置、及びプログラム | |
| JP7733083B2 (ja) | 予測ブロック生成装置、画像符号化装置、画像復号装置、及びプログラム | |
| US9756340B2 (en) | Video encoding device and video encoding method | |
| JP7723152B2 (ja) | 画像復号装置及び画像復号方法 | |
| JP2025129349A (ja) | 予測画像補正装置、画像符号化装置、画像復号装置、及びプログラム | |
| WO2025005269A1 (ja) | 予測装置、符号化装置、復号装置、及びプログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20250626 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20260120 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20260129 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7812966 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |