JP3976920B2 - Image encoding device - Google Patents
Image encoding device Download PDFInfo
- Publication number
- JP3976920B2 JP3976920B2 JP37772298A JP37772298A JP3976920B2 JP 3976920 B2 JP3976920 B2 JP 3976920B2 JP 37772298 A JP37772298 A JP 37772298A JP 37772298 A JP37772298 A JP 37772298A JP 3976920 B2 JP3976920 B2 JP 3976920B2
- Authority
- JP
- Japan
- Prior art keywords
- frequency coefficient
- region
- color
- luminance
- edge
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Color Television Systems (AREA)
- Facsimile Image Signal Circuits (AREA)
- Color Image Communication Systems (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、カラー画像データの符号化装置に関する。
【0002】
【従来の技術】
従来のカラー画像データ符号化方式には、カラー画像データを、輝度情報と色差情報とに分解して、それぞれを符号化するものがあった。この符号化方式では、色が急峻に変化する領域では、色差の情報比率を増やし、明るさが急峻に変化する領域では、輝度の情報比率を増やすことで高い符号化効率を達成することができた。また、符号化データ量が所定画像単位毎に同じである方が、データアクセスが容易であり、固定された容量のメモリに符号を格納する場合都合がいい等のメリットがある。
【0003】
このような従来例として特許番号第2608284号や特許番号第2608285号の特許公報に記載された技術がある。第2608284号公報記載の技術では、まず画像をブロックに分割し輝度については、平均と分散と各画素の勾配を表す情報への変換を行い、色差については平均値への変換を行う。輝度の分散値が所定値を上回っているブロックは輝度エッジ領域として、輝度の各画素勾配情報を増やし、その分色差の平均値情報を減らしている。逆に、輝度の分散値が所定値を下回っているブロックは輝度非エッジ領域として、輝度の各画素勾配情報を減らし、その分色差の平均値情報を増やしている。
【0004】
また、第2608285号公報記載の技術では、輝度色差ともほぼ同様の変換を行っている。ただしブロック中で色差のばらつきが大きいときは、各画素をその色差値によって2つに分類し、それぞれの色差平均値を求める。このように色差のばらつきが大きいブロックは、色差エッジ領域として、色差の平均値情報を2つに増やし、その分輝度の平均値や分散値情報を減らす。逆に、色差のばらつきが小さいブロックは、色差非エッジ領域として、色差の平均値情報を1つに減らし、その分輝度の平均値や分散値情報を増やしている。両技術とも、領域に応じビット配分を変えつつも、輝度色差合計のビット数は固定なので、高効率でデータアクセスも容易な符号化方法となっている。
【0005】
【発明が解決しようとする課題】
上述の特許第2608284号では、輝度について2領域(エッジ領域、非エッジ領域)に分離しており、特許第2608285号では、色差について2領域(エッジ領域、非エッジ領域)に分離している。しかし実際のカラー画像では、輝度の2領域と色差の2領域は全く独立に出現する。すなわち輝度と色差について、4領域が存在することになる(図3に示すように以後この4領域を[1、0、0]領域、[1、0、1]領域、[1、1、0]領域、[1、1、1]領域とする)。この4領域について上述の従来方式をそのまま当てはめることは、必ずしもよい結果が生じるとは限らない。
【0006】
例えば、[1、0、0]領域と[1、0、1]領域は、輝度についていえば、同じ非エッジ領域だが、色差については非エッジ領域とエッジ領域で異なっている。ここに上記特許第2608285号を適用した場合、[1、0、1]領域は輝度のビット配分を減らし、色差のビット配分を増やすこととなる。これは色差にとっては好ましいことだが、輝度にとっては、好ましくなく、階調不足による画質劣化を招く。すなわち色差の2領域について、変えるべきことは、輝度/色差のビット配分ではなく、色差の変換方法なのである。
色差のエッジ領域は、非エッジ領域に対し、輝度と色差のビット配分はたとえ同じであっても、色差の平均値を1つでなく2つ作る等、変換方法を変えた方が望ましい。
【0007】
また、特許第2608284号では、輝度データを平均、分散、各画素勾配に変換しているが、これも後述する本発明の変換方式に比べれば、符号化効率の点で劣ったものである。
そこで、本発明の目的は、カラー画像データについて、高い符号化効率を有し、符号データへのアクセスが容易な画像符号化装置を提供することである。
【0010】
【課題を解決するための手段】
請求項1記載の発明は、輝度データと色差データとからなるカラー画像データを、ブロック単位に処理する画像符号化装置であって、前記ブロック毎に、前記カラー画像データを、低周波係数、縦方向の高周波係数、横方向の高周波係数、斜め方向の高周波係数の4種類の周波数係数に変換する周波数係数変換手段と、前記ブロック毎に、有彩色領域であるか無彩色領域であるかの判定、輝度エッジ領域であるか否かの判定、及び、色差エッジ領域であるか否かの判定を行い、領域分離結果を得る領域分離手段と、前記領域分離手段により、有彩色領域と判定されたブロックについては、輝度エッジ領域であるか否か又は色差エッジ領域であるか否かに応じて、低周波係数、縦方向の高周波係数、横方向の高周波係数、斜め方向の高周波係数、のそれぞれに割り当てるビット数を変化させ、前記周波数係数を量子化し、無彩色領域と判定されたブロックについては、該ブロックの前記輝度データを量子化して、いずれの領域と判定された場合でも、前記ブロック毎に同一のビット数の量子化出力を得る量子化手段と、前記量子化出力を符号化する符号化手段と、を有することにより、前記目的を達成する。
【0011】
請求項2記載の発明では、輝度データと色差データとからなるカラー画像データを、ブロック単位に処理する画像符号化装置であって、前記ブロック毎に、前記カラー画像データを、低周波係数、縦方向の高周波係数、横方向の高周波係数、斜め方向の高周波係数の4種類の周波数係数に変換する周波数係数変換手段と、前記ブロック毎に、有彩色領域であるか無彩色領域であるかの判定、輝度エッジ領域であるか否かの判定、及び、色差エッジ領域であるか否かの判定を行い、領域分離結果を得る領域分離手段と、前記領域分離手段により、有彩色領域と判定されたブロックであって、輝度エッジ領域でなく、かつ、色差エッジ領域でない、と判定されたブロックでは、前記低周波係数のみを量子化して量子化出力を得て、輝度エッジ領域でなく、かつ、色差エッジ領域でない、と判定されたブロック以外のブロックでは、輝度エッジ領域であるか否か及び色差エッジ領域であるか否か、に応じて、低周波係数、縦方向の高周波係数、横方向の高周波係数、斜め方向の高周波係数、のそれぞれに割り当てるビット数を変化させ、前記周波数係数を量子化して量子化出力を得て、無彩色領域と判定されたブロックについては、該ブロックの前記輝度データを量子化して量子化出力を得て、 (有彩色、輝度エッジなし、色差エッジなし)、(有彩色、輝度エッジなし、色差エッジあり)、(有彩色、輝度エッジあり、色差エッジなし)、(有彩色、輝度エッジあり、色差エッジあり)及び(無彩色)いずれの領域の場合でも、ブロック毎に同一のビット数で量子化出力を得る量子化手段と、前記量子化出力を符号化する符号化手段と、を有することにより、前記目的を達成する。
【0012】
【発明の実施の形態】
以下、本発明の好適な実施の形態を図ないし図5を参照して詳細に説明する。
図1は、本実施の形態に係る符号化部(送信側)のブロック図である。この図において、RGBカラー画像データは、まずYCbCrカラーデータに変換される。変換式を以下に示す。
【0013】
【数1】
Y=0.299R+0.587G+0.114B
Cr=1/(2(1−0.299))(R−Y)
Cb=1/(2(1−0.114))(B−Y)
【0014】
ちなみに逆変換式は以下の通りである。
【0015】
【数2】
R=Y+2(1−0.299)Cr
B=Y+2(1−0.114)Cb
G=(Y−0.299R−0.114B)/0.587
【0016】
上記式において、Yは輝度を表す情報であり、Cb、Crは色差を表す情報である。一般にRGBからYCbCrに変換することで、信号のエントロピーを低減させることができ、符号化効率を高めることができる。
【0017】
次にY、Cb、Cr信号はそれぞれ、2×2画素のブロック毎にサブバンド変換部へと送られる。図2は画像データに対するサブバンド変換の例を表している。元画像のまず水平方向にローパスフィルタS(n)、ハイパスフィルタD(n)をかけ、続いて垂直方向にも同様の処理をそれぞれ施し、水平高域HL、垂直高域LH、対角高域HH、低域LLの4つの周波数帯域信号が生成される。サブバンド変換式の例として最も簡単な変換式を以下に示す。
【0018】
【数3】
LPF S(n)=|(x(2n)+x(2n+1))/2|
HPF D(n)=x(2n)−x(2n+1)
【0019】
低域係数は4画素の平均値と同じである。各高域係数はそれぞれの方向のエッジ度合いを表しており、その絶対値が大きいほど、該当ブロックに急峻なエッジが含まれていることを示している。斜め方向のエッジは、水平、垂直方向のエッジに比べ感知しにくいという視覚特性が知られている。このため対角高域係数は水平、垂直高域係数に比べ、画質上の重要度が低いと言える。
この特性を利用して、後述する量子化の過程では、対角高域係数で、より多くの情報を削減することが可能となる。このような視覚的冗長性が削減可能な分、本実施の形態のサブバンド変換は、従来の変換方法(平均、分散、各画素の勾配への変換)より効果的な変換方法である。
【0020】
高域係数はエッジ度合いを表しているので、例えば次式のような条件を満たしているブロックをエッジ領域、満たしていないブロックを非エッジ領域と分別することができる。
【0021】
【数4】
輝度エッジ:{|LHy|>16 or|HLy|>16 or|HHy|>32}
色差エッジ:{|LHcb|>16 or|HLcb|>16 or|HHcb|>32 or|LHcr|>16 or|HLcr|>16 or|HHcr|>32}
【0022】
輝度についてエッジ、非エッジ2領域、色差についても同様に2領域に分離するので、組み合わせとして4通りの領域分離が可能となる。また、色差を表すCb、Crが共に0の場合、無彩色領域、そうでなければ有彩色領域と判断し、さらに2領域の分離が行える。
図3に示す例では、これらの組み合わせで、合計5通りの領域分離を行っている。図1における領域分離部は、この分離を行う部分である。分離結果(3bit/block)は、各量子化部へ伝達されると共に、最終的に生成される符号の一部となる。
【0023】
低域係数は線形または非線形粒子化されることで所定数にまでビット数が削減される。YCbCr色空間は、均等色空間ではないので、色差については、非線形の量子化を行う。
図4は、低域係数の量子化特性を示した図である。像域分離部の出力に基づき、予め用意された複数の量子化特性の中から1つが選択される。それに応じ量子化出力のビット数が変化する。例えば輝度の低域係数は、[1、0、0]領域、[1、0、1]領域で8ビットだが、[1、1、0]領域、[1、1、1]領域では4ビットとなる。入力8ビットで出力も8ビットということは、実は量子化処理を全く行っていないことである。
【0024】
高域係数はベクトル量子化される。水平高域、垂直高域、対角高域で3次元のベクトル量子化を行う。
図5は、ベクトル量子化の例を示した図である。ここでは説明の便宜のため、水平高域と垂直高域の2次元のベクトル量子化を示してある。図5中のプロットは量子化代表点を表している。図示はしないが、対角高域方向の量子化代表点は、他の方向に比べ少なくなっている。高域係数も同様に領域分離部の出力に基づき、量子化特性が選択され、量子化出力のビット数が変化する。例えば輝度の高域係数は、[1、1、0]領域、[1、1、1]領域では6ビットだが、[1、0、0]領域、[1、0、1]領域では0ビットとなる。ここで、出力0ビットとは、生成された高域係数を破棄することである。
【0025】
無彩色[0、0、0]領域では輝度の情報のみが必要とされる。本実施の形態では、輝度のサブバンド変換係数は用いず、ブロック内4画素の輝度値そのものを、それぞれ線形量子化している。
このようにして得られた量子化出力と、領域分離結果はブロック単位に合体され、圧縮符号となる。合体された圧縮符号長は、5領域どれでも常に同一となっている。ブロックあたりの符号長が固定なので、画像の全圧縮符号の中から、任意のブロックの符号を取り出す場合、そのアドレス計算が容易となる。また圧縮前から該当画像の全符号長を知ることができる。
この例によると、符号化前にはブロックあたりの情報量は96ビットであったが、これを符号化して27ビットとし、圧縮率28%を達成している。
【0026】
上述の例では、RGBカラーデータをYCbCrに変換していたが、テレビジョンで用いられるYIQ空間でも、L*、a*、b*空間であってももちろんよい。また、領域分離をサブバンド変換による高域係数に基づいて行っていたが、他にもサブバンド変換前の輝度値、色差値のばらつき度合い(例えばブロック内の最大値と最小値の差など)で行なうこともできる。画素ブロックの大きさも、本例では2×2であったが、2×2以上であっても差し支えない。
【0027】
【発明の効果】
本願に係る発明は、ブロック単位で固定長の符号化を行うため、画像メモリに格納する際には画素の画像内の位置関係を維持でき、従って画像の大きさによって必要な画像メモリの量が一意に決定することが可能である。また、このカラー画像に対して画像処理を施す際にも周辺近傍画素の情報を容易に得ることが可能になり、かつブロック単位で処理が可能なので画像処理の高速化が行える。さらに、この発明では、輝度と色差それぞれの領域特性に基づき、それぞれ最適なビット配分を行うことができるので、人間の視覚特性を生かした視覚的劣化の少ない高能率な符号化が可能となる。
【0028】
また、サブバンド変換により生成した、水平、垂直、対角の各高域係数について、それぞれ異なる比重で量子化を行うことができるので、さらに高能率な符号化が可能となる。
【0029】
また、分離手段がブロック内データの値のばらつきの大小を判定し、この判定結果に応じて該当ブロックを複数の領域に分離するので、カラー画像データについて、高い符号化効率を達成することができる。カラー画像中の無彩色領域を分離することができるので、出現頻度の高い黒文字などの領域について、高画質な符号化を行うことができる。
【図面の簡単な説明】
【図1】本発明の画像符号化装置の構成例を示した図である。
【図2】画像信号に対するサブバンド変換の例を示した図である。
【図3】領域別のビット配分の例を示した図である。
【図4】低域係数の量子化の具体例を示した図である。
【図5】高域係数の量子化の具体例を示した図である。[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an apparatus for encoding color image data.
[0002]
[Prior art]
In the conventional color image data encoding method, there is one in which color image data is decomposed into luminance information and color difference information, and each is encoded. In this encoding method, high coding efficiency can be achieved by increasing the color difference information ratio in areas where the color changes sharply, and increasing the luminance information ratio in areas where the brightness changes sharply. It was. Further, when the amount of encoded data is the same for each predetermined image unit, data access is easier, and there are advantages such as being convenient when a code is stored in a memory having a fixed capacity.
[0003]
As such conventional examples, there are techniques described in the patent publications of Patent No. 2608284 and Patent No. 2608285. In the technique described in Japanese Patent No. 2608284, first, an image is divided into blocks, and luminance is converted into information representing average, variance, and gradient of each pixel, and color differences are converted into average values. A block whose luminance variance value exceeds a predetermined value is used as a luminance edge region, and each pixel gradient information of luminance is increased, and the average value information of color difference is reduced accordingly. On the other hand, a block whose luminance variance value is lower than a predetermined value is a luminance non-edge region, and each pixel gradient information of luminance is reduced and average value information of color difference is increased accordingly.
[0004]
In the technique described in Japanese Patent No. 2608285, substantially the same conversion is performed for the luminance color difference. However, when the color difference variation is large in the block, each pixel is classified into two according to the color difference value, and the respective color difference average values are obtained. In such a block having a large variation in color difference, the average value information of the color difference is increased to two as the color difference edge region, and the average value of the luminance and the variance value information are decreased accordingly. On the other hand, a block having a small variation in color difference is a color difference non-edge region, and the average value information of color difference is reduced to one, and the average value of luminance and dispersion value information are increased accordingly. In both technologies, the bit distribution is changed according to the area, but the number of bits of the luminance color difference total is fixed, so that the encoding method is highly efficient and easy to access data.
[0005]
[Problems to be solved by the invention]
In the above-mentioned Japanese Patent No. 2608284, the luminance is separated into two regions (edge region and non-edge region), and in Japanese Patent No. 2608285, the color difference is separated into two regions (edge region and non-edge region). However, in an actual color image, two areas of luminance and two areas of color difference appear completely independently. That is, there are four areas for luminance and color difference (hereinafter, as shown in FIG. 3, these four areas are designated as [1, 0, 0] area, [1, 0, 1] area, [1, 1, 0]. ] Area, [1, 1, 1] area). Applying the above-described conventional method as it is to these four regions does not always produce good results.
[0006]
For example, the [1, 0, 0] area and the [1, 0, 1] area are the same non-edge area in terms of luminance, but the color difference differs between the non-edge area and the edge area. When the above-mentioned Japanese Patent No. 2608285 is applied, the [1, 0, 1] area decreases the bit distribution of luminance and increases the bit distribution of color difference. This is preferable for the color difference, but not preferable for the luminance, and causes image quality deterioration due to insufficient gradation. In other words, what should be changed for the two color difference areas is not the luminance / color difference bit allocation, but the color difference conversion method.
It is desirable to change the conversion method, such as creating two average values of color differences instead of one, even if the luminance and color difference bit allocation is the same for non-edge areas in the edge areas of color differences.
[0007]
In Japanese Patent No. 2608284, luminance data is converted into average, variance, and pixel gradient, which is also inferior in encoding efficiency as compared with the conversion method of the present invention described later.
SUMMARY OF THE INVENTION An object of the present invention is to provide an image coding apparatus that has high coding efficiency and easy access to code data for color image data.
[0010]
[Means for Solving the Problems]
The invention according to claim 1 is an image encoding device for processing color image data composed of luminance data and color difference data in units of blocks, and for each block, the color image data is converted into a low-frequency coefficient and a vertical frequency. Frequency coefficient conversion means for converting into four types of frequency coefficients, a high frequency coefficient in the direction, a high frequency coefficient in the horizontal direction, and a high frequency coefficient in the oblique direction, and whether each block is a chromatic color area or an achromatic color area And determining whether or not it is a luminance edge region and whether or not it is a chrominance edge region, and a region separation unit that obtains a region separation result, and the region separation unit determines that the region is a chromatic color region. For blocks, depending on whether it is a luminance edge region or a color difference edge region, the low frequency coefficient, the vertical high frequency coefficient, the horizontal high frequency coefficient, the diagonal high frequency coefficient The number of bits allocated to each of the blocks is changed, the frequency coefficient is quantized, and for the block determined to be an achromatic region, the luminance data of the block is quantized, and even if any region is determined, The object is achieved by including quantization means for obtaining a quantized output having the same number of bits for each block and encoding means for encoding the quantized output.
[0011]
According to a second aspect of the present invention, there is provided an image encoding device for processing color image data composed of luminance data and color difference data in units of blocks, and for each block, the color image data is converted into a low-frequency coefficient and a vertical length. Frequency coefficient conversion means for converting into four types of frequency coefficients, a high frequency coefficient in the direction, a high frequency coefficient in the horizontal direction, and a high frequency coefficient in the oblique direction, and whether each block is a chromatic color area or an achromatic color area And determining whether or not it is a luminance edge region and whether or not it is a chrominance edge region, and a region separation unit that obtains a region separation result, and the region separation unit determines that the region is a chromatic color region. In a block that is determined not to be a luminance edge region and not a color difference edge region, the luminance edge region is obtained by quantizing only the low frequency coefficient to obtain a quantized output. If the block is not a chrominance edge area and is not a chrominance edge area, the low frequency coefficient and the high frequency coefficient in the vertical direction depend on whether it is a luminance edge area and a chrominance edge area. For the block determined to be an achromatic region, the number of bits allocated to each of the horizontal high-frequency coefficient and the diagonal high-frequency coefficient is changed, and the frequency coefficient is quantized to obtain a quantized output. Quantize the luminance data to obtain the quantized output, (chromatic color, no luminance edge, no chrominance edge), (chromatic color, no luminance edge, with chrominance edge), (chromatic color, with luminance edge, chrominance Quantization hand that obtains quantized output with the same number of bits for each block in any area (no edge), (chromatic color, with luminance edge, with chrominance edge) and (achromatic) When, by having the encoding means for encoding the quantized output, to achieve the above object.
[0012]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, preferred embodiments of the present invention will be described in detail with reference to FIGS.
FIG. 1 is a block diagram of an encoding unit (transmission side) according to the present embodiment. In this figure, RGB color image data is first converted to YCbCr color data. The conversion formula is shown below.
[0013]
[Expression 1]
Y = 0.299R + 0.587G + 0.114B
Cr = 1 / (2 (1−0.299)) (R−Y)
Cb = 1 / (2 (1-0.114)) (BY)
[0014]
Incidentally, the inverse transformation formula is as follows.
[0015]
[Expression 2]
R = Y + 2 (1−0.299) Cr
B = Y + 2 (1-0.114) Cb
G = (Y−0.299R−0.114B) /0.587
[0016]
In the above formula, Y is information representing luminance, and Cb and Cr are information representing color differences. In general, by converting from RGB to YCbCr, the entropy of the signal can be reduced, and the encoding efficiency can be increased.
[0017]
Next, the Y, Cb, and Cr signals are sent to the subband conversion unit for each 2 × 2 pixel block. FIG. 2 shows an example of subband conversion for image data. First, a low-pass filter S (n) and a high-pass filter D (n) are first applied to the original image in the horizontal direction, and then the same processing is performed in the vertical direction to obtain a horizontal high region HL, a vertical high region LH, and a diagonal high region. Four frequency band signals of HH and low band LL are generated. The simplest conversion formula is shown below as an example of the subband conversion formula.
[0018]
[Equation 3]
LPF S (n) = | (x (2n) + x (2n + 1)) / 2 |
HPF D (n) = x (2n) −x (2n + 1)
[0019]
The low frequency coefficient is the same as the average value of 4 pixels. Each high frequency coefficient represents the degree of edge in each direction, and the larger the absolute value, the steep edge is included in the corresponding block. A visual characteristic is known that the edge in the oblique direction is less perceivable than the edge in the horizontal and vertical directions. For this reason, it can be said that the diagonal high frequency coefficient is less important in image quality than the horizontal and vertical high frequency coefficients.
Using this characteristic, in the process of quantization described later, it is possible to reduce more information with the diagonal high-frequency coefficient. Since the visual redundancy can be reduced, the subband conversion according to the present embodiment is a more effective conversion method than the conventional conversion methods (average, variance, conversion to gradient of each pixel).
[0020]
Since the high frequency coefficient represents the degree of edge, for example, a block that satisfies the condition of the following equation can be classified as an edge region, and a block that does not satisfy the condition can be classified as a non-edge region.
[0021]
[Expression 4]
Luminance edge: {| LHy |> 16 or | HLy |> 16 or | HHy |> 32}
Color difference edge: {| LH cb |> 16 or | HL cb |> 16 or | HH cb |> 32 or | LH cr |> 16 or | HL cr |> 16 or | HH cr |> 32}
[0022]
Since the edge, non-edge 2 areas, and color difference are separated into 2 areas in the same manner, 4 areas can be separated as a combination. If both Cb and Cr representing the color difference are 0, it is determined that the region is an achromatic color region, and if not, a chromatic color region, and two regions can be further separated.
In the example shown in FIG. 3, a total of five types of region separation are performed using these combinations. The region separation unit in FIG. 1 is a part that performs this separation. The separation result (3 bits / block) is transmitted to each quantization unit and becomes a part of a finally generated code.
[0023]
The low frequency coefficient is linearized or nonlinearized to reduce the number of bits to a predetermined number. Since the YCbCr color space is not a uniform color space, nonlinear quantization is performed for the color difference.
FIG. 4 is a diagram showing the quantization characteristics of the low frequency coefficient. One of a plurality of quantization characteristics prepared in advance is selected based on the output of the image area separation unit. Accordingly, the number of bits of the quantized output changes. For example, the low frequency coefficient of luminance is 8 bits in the [1, 0, 0] area and [1, 0, 1] area, but 4 bits in the [1, 1, 0] area and [1, 1, 1] area. It becomes. The fact that the input is 8 bits and the output is 8 bits actually means that no quantization processing is performed.
[0024]
The high frequency coefficient is vector quantized. Three-dimensional vector quantization is performed in the horizontal high region, vertical high region, and diagonal high region.
FIG. 5 is a diagram illustrating an example of vector quantization. Here, for convenience of explanation, two-dimensional vector quantization of a horizontal high band and a vertical high band is shown. The plot in FIG. 5 represents the quantization representative point. Although not shown in the figure, the number of quantization representative points in the diagonal high band direction is smaller than in other directions. Similarly, for the high frequency coefficient, the quantization characteristic is selected based on the output of the region separation unit, and the number of bits of the quantization output changes. For example, the high frequency coefficient of luminance is 6 bits in the [1, 1, 0] region and [1, 1, 1] region, but 0 bits in the [1, 0, 0] region and [1, 0, 1] region. It becomes. Here, the output 0 bits means that the generated high frequency coefficient is discarded.
[0025]
Only luminance information is required in the achromatic [0, 0, 0] region. In this embodiment, the luminance subband conversion coefficient is not used, and the luminance values themselves of the four pixels in the block are linearly quantized.
The quantized output obtained in this way and the region separation result are combined in units of blocks to form a compression code. The combined compression code length is always the same in all five regions. Since the code length per block is fixed, the address calculation is facilitated when the code of an arbitrary block is extracted from all the compression codes of the image. Further, it is possible to know the total code length of the corresponding image before compression.
According to this example, the information amount per block was 96 bits before encoding, but this was encoded to 27 bits, and a compression rate of 28% was achieved.
[0026]
In the above example, the RGB color data is converted to YCbCr, but it may of course be a YIQ space used in television or an L *, a *, b * space. In addition, although region separation was performed based on the high-frequency coefficient by subband conversion, other variations of luminance values and color difference values before subband conversion (for example, the difference between the maximum value and the minimum value in a block) Can also be done. The size of the pixel block is 2 × 2 in this example, but may be 2 × 2 or more.
[0027]
【The invention's effect】
Since the invention according to the present application performs encoding of a fixed length in units of blocks, the positional relationship of the pixels in the image can be maintained when storing in the image memory. Therefore, the amount of image memory required depends on the size of the image. It can be determined uniquely. Also, when image processing is performed on this color image, information on neighboring pixels can be easily obtained, and processing can be performed in units of blocks, so that the image processing speed can be increased. Further, according to the present invention, since optimum bit allocation can be performed based on the area characteristics of luminance and color difference, respectively, high-efficiency encoding with less visual degradation utilizing human visual characteristics is possible.
[0028]
In addition, since the horizontal, vertical, and diagonal high-frequency coefficients generated by subband conversion can be quantized with different specific gravities, more efficient coding is possible.
[0029]
Further, since the separating means determines the magnitude of the variation in the value of the data in the block and separates the corresponding block into a plurality of regions according to the determination result, high coding efficiency can be achieved for the color image data. . It is possible to separate the achromatic region in the color image, the area such as high frequency of appearance black character, it is possible to perform high-quality coding.
[Brief description of the drawings]
FIG. 1 is a diagram illustrating a configuration example of an image encoding device according to the present invention.
FIG. 2 is a diagram illustrating an example of subband conversion for an image signal.
FIG. 3 is a diagram illustrating an example of bit allocation by region.
FIG. 4 is a diagram illustrating a specific example of quantization of a low frequency coefficient.
FIG. 5 is a diagram illustrating a specific example of quantization of a high frequency coefficient.
Claims (2)
前記ブロック毎に、前記カラー画像データを、低周波係数、縦方向の高周波係数、横方向の高周波係数、斜め方向の高周波係数の4種類の周波数係数に変換する周波数係数変換手段と、
前記ブロック毎に、有彩色領域であるか又は無彩色領域であるかの判定、輝度エッジ領域であるか否かの判定、及び、色差エッジ領域であるか否かの判定を行い、領域分離結果を得る領域分離手段と、
前記領域分離手段により、有彩色領域と判定されたブロックについては、輝度エッジ領域であるか否か又は色差エッジ領域であるか否かに応じて、低周波係数、縦方向の高周波係数、横方向の高周波係数、斜め方向の高周波係数、のそれぞれに割り当てるビット数を変化させ、前記周波数係数を量子化し、
無彩色領域と判定されたブロックについては、該ブロックの前記輝度データを量子化して、
いずれの領域と判定された場合でも、前記ブロック毎に同一のビット数の量子化出力を得る量子化手段と、
前記量子化出力を符号化する符号化手段と、
を有することを特徴とする画像符号化装置。An image encoding device that processes color image data composed of luminance data and color difference data in units of blocks,
Frequency coefficient conversion means for converting the color image data into four types of frequency coefficients, a low frequency coefficient, a vertical high frequency coefficient, a horizontal high frequency coefficient, and a diagonal high frequency coefficient for each block;
For each block, it is determined whether it is a chromatic color region or an achromatic color region, whether it is a luminance edge region, and whether it is a color difference edge region, and a region separation result Region separation means to obtain,
The block determined to be a chromatic color area by the area separation unit is a low frequency coefficient, a high frequency coefficient in the vertical direction, a horizontal direction depending on whether it is a luminance edge area or a color difference edge area. Changing the number of bits assigned to each of the high-frequency coefficient and the diagonal high-frequency coefficient, and quantizing the frequency coefficient,
For a block determined to be an achromatic region, the luminance data of the block is quantized,
Quantization means for obtaining a quantized output of the same number of bits for each block, regardless of which area is determined,
Encoding means for encoding the quantized output;
An image encoding apparatus comprising:
前記ブロック毎に、前記カラー画像データを、低周波係数、縦方向の高周波係数、横方向の高周波係数、斜め方向の高周波係数の4種類の周波数係数に変換する周波数係数変換手段と、
前記ブロック毎に、有彩色領域であるか又は無彩色領域であるかの判定、輝度エッジ領域であるか否かの判定、及び、色差エッジ領域であるか否かの判定を行い、領域分離結果を得る領域分離手段と、
前記領域分離手段により、有彩色領域と判定されたブロックであって、
輝度エッジ領域でなく、かつ、色差エッジ領域でない、と判定されたブロックでは、前記低周波係数のみを量子化して量子化出力を得て、
輝度エッジ領域でなく、かつ、色差エッジ領域でない、と判定されたブロック以外のブロックでは、
輝度エッジ領域であるか否か及び色差エッジ領域であるか否か、に応じて、低周波係数、縦方向の高周波係数、横方向の高周波係数、斜め方向の高周波係数、のそれぞれに割り当てるビット数を変化させ、前記周波数係数を量子化して量子化出力を得て、
無彩色領域と判定されたブロックについては、該ブロックの前記輝度データを量子化して量子化出力を得て、
(有彩色、輝度エッジなし、色差エッジなし)、(有彩色、輝度エッジなし、色差エッジあり)、(有彩色、輝度エッジあり、色差エッジなし)、(有彩色、輝度エッジあり、色差エッジあり)及び(無彩色)いずれの領域の場合でも、ブロック毎に同一のビット数で量子化出力を得る量子化手段と、
前記量子化出力を符号化する符号化手段と、
を有することを特徴とする画像符号化装置。An image encoding device that processes color image data composed of luminance data and color difference data in units of blocks,
Frequency coefficient conversion means for converting the color image data into four types of frequency coefficients, a low frequency coefficient, a vertical high frequency coefficient, a horizontal high frequency coefficient, and a diagonal high frequency coefficient for each block;
For each block, it is determined whether it is a chromatic color region or an achromatic color region, whether it is a luminance edge region, and whether it is a color difference edge region, and a region separation result Region separation means to obtain,
A block determined as a chromatic color region by the region separating means,
In a block that is determined not to be a luminance edge region and not a color difference edge region, only the low frequency coefficient is quantized to obtain a quantized output,
In blocks other than those determined not to be luminance edge areas and color difference edge areas,
The number of bits allocated to each of the low frequency coefficient, the high frequency coefficient in the vertical direction, the high frequency coefficient in the horizontal direction, and the high frequency coefficient in the diagonal direction depending on whether it is a luminance edge area and a color difference edge area , Quantize the frequency coefficient to obtain a quantized output,
For a block determined to be an achromatic region, quantize the luminance data of the block to obtain a quantized output,
(Chromatic color, no luminance edge, no color difference edge), (chromatic color, no luminance edge, with color difference edge), (chromatic color, with luminance edge, no color difference edge), (chromatic color, with luminance edge, with color difference edge) ) And (achromatic) in any region, quantization means for obtaining a quantized output with the same number of bits for each block;
Encoding means for encoding the quantized output;
An image encoding apparatus comprising:
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP37772298A JP3976920B2 (en) | 1998-12-28 | 1998-12-28 | Image encoding device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP37772298A JP3976920B2 (en) | 1998-12-28 | 1998-12-28 | Image encoding device |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2000196894A JP2000196894A (en) | 2000-07-14 |
| JP3976920B2 true JP3976920B2 (en) | 2007-09-19 |
Family
ID=18509104
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP37772298A Expired - Fee Related JP3976920B2 (en) | 1998-12-28 | 1998-12-28 | Image encoding device |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3976920B2 (en) |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3495336B2 (en) | 2001-01-29 | 2004-02-09 | 日本電信電話株式会社 | Image encoding method and apparatus, image decoding method and apparatus |
| JP5743384B2 (en) | 2009-04-14 | 2015-07-01 | キヤノン株式会社 | Image processing apparatus, image processing method, and computer program |
| JP6166768B2 (en) * | 2015-12-10 | 2017-07-19 | キヤノン株式会社 | Image processing apparatus, image processing method, and program |
-
1998
- 1998-12-28 JP JP37772298A patent/JP3976920B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2000196894A (en) | 2000-07-14 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR100880039B1 (en) | Method and system for achieving coding gain in wavelet based image codec | |
| JP4870743B2 (en) | Selective chrominance decimation for digital images | |
| US9894374B2 (en) | High dynamic range codecs | |
| JP4587838B2 (en) | Display system | |
| JPH08237669A (en) | Image signal processing device, image signal processing method, and image signal decoding device | |
| JPH05505084A (en) | Image compression with color interpolation for single-sensor imaging systems | |
| JP2008527789A (en) | Entropy encoding method | |
| US7742521B2 (en) | Method and system for processing signals via perceptive vectorial quantization, computer program product therefor | |
| JP2004528791A (en) | Inter-frame encoding method and apparatus | |
| JP3523719B2 (en) | Image encoding device and image decoding device | |
| JP3857509B2 (en) | Image processing apparatus, image processing system, image encoding method, and storage medium | |
| US20030081848A1 (en) | Image encoder, image encoding method and image-encoding program | |
| JP3976920B2 (en) | Image encoding device | |
| JP3732674B2 (en) | Color image compression method and color image compression apparatus | |
| US6751355B1 (en) | Wavelet image compression using quantization based on frequency ranges and absolute values in wavelet image compression | |
| JP2021182700A (en) | Encoding device and method, program and storage medium | |
| CN102369734A (en) | Method for processing a digital file notably of the image, video and/or audio type | |
| JPH0946553A (en) | Filter | |
| JPH0797829B2 (en) | Color image input / output device | |
| JP2004159045A (en) | Multi-band video signal encoding method, multi-band video signal encoding device, multi-band video signal encoding program, and recording medium storing the program | |
| KR20020084712A (en) | Memory map having 16bit unit address structure for deblocking filter | |
| Sibade et al. | Halftoning processing on a JPEG-compressed image | |
| JPH03195179A (en) | Image data compression method | |
| JP2005159474A (en) | Image encoding apparatus and method, and image decoding apparatus and method | |
| JPS63304769A (en) | Color image data compression method |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040517 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20040618 |
|
| RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20040618 |
|
| RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20050620 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060327 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060404 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060602 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060905 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061106 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070522 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070620 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100629 Year of fee payment: 3 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110629 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110629 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120629 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130629 Year of fee payment: 6 |
|
| LAPS | Cancellation because of no payment of annual fees |