JP3890638B2 - Image information conversion apparatus and method - Google Patents
Image information conversion apparatus and method Download PDFInfo
- Publication number
- JP3890638B2 JP3890638B2 JP26370896A JP26370896A JP3890638B2 JP 3890638 B2 JP3890638 B2 JP 3890638B2 JP 26370896 A JP26370896 A JP 26370896A JP 26370896 A JP26370896 A JP 26370896A JP 3890638 B2 JP3890638 B2 JP 3890638B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- pixels
- image signal
- digital image
- coefficient data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Image Processing (AREA)
- Television Systems (AREA)
Description
【0001】
【発明の属する技術分野】
この発明は、例えばテレビジョン受像機やビデオテープレコーダ装置等に用いて好適な画像情報変換装置および方法に関し、特に、外部から供給される通常の解像度の画像情報を高解像度の画像情報に変換して出力することができる画像情報変換装置および方法に関する。
【0002】
【従来の技術】
今日において、オーディオ・ビジュアル指向の高まりから、より高解像度の画像を得ることが出来るようなテレビジョン受像器の開発が望まれ、この要望に応えて、いわゆるハイビジョンが開発された。このハイビジョンは、いわゆるNTSC方式に規定される走査線数が525本なのに対して、2倍以上の1125本となっているうえ、表示画面の縦横比もNTSC方式が3:4に対して16:9と広角画面になっている。このため、高解像度で臨場感のある画面を得ることができるようになっている。
【0003】
ここで、このような優れた特性を有するハイビジョンではあるが、NTSC方式の映像信号をそのまま供給しても画像表示を行うことはできない。これは、上述のようにNTSC方式とハイビジョン方式とでは規格が異なるからである。このため、NTSC方式の映像信号に応じた画像をハイビジョン方式で表示しようとする場合、従来は例えば図15に示すような画像情報変換装置を用いて映像信号のレート変換を行っていた。
【0004】
図15において、上述した従来の画像情報変換装置は、入力端子151を介して供給されるNTSC方式の映像信号(SDデータ)の水平方向の補間処理を行う水平補間フィルタ152と、水平方向の補間処理の行われた映像信号の垂直方向の補間処理を行う垂直補間フィルタ153とから構成されている。
【0005】
具体的には、水平補間フィルタ152は、図16に示すような構成を有している。図16の例は、例えば縦続接続型のFIRフィルタにより水平補間フィルタ152を構成したものである。図16において、161は、SDデータが供給される入力端子であり、1620 〜162m は、それぞれフィルタ係数α0 〜αm をSDデータに乗じる乗算器である。1630 〜163m-1 は、それぞれ加算器であり、1641 〜164m は、時間T(T:1サンプリング周期)の遅延素子である。出力端子165には、水平補間された出力データが得られる。この出力データが垂直補間フィルタ153へ供給される。
【0006】
垂直補間フィルタ153は、水平補間フィルタ152と同様の構成を有しており、水平補間処理の行われた映像信号に対して、垂直方向の画素の補間を行う。これにより、NTSC方式の映像信号に対して、垂直方向の画素の補間を行う。このような変換のなされたハイビジョンの映像信号(HDデータ)は、ハイビジョン受像器に供給される。これによりNTSC方式の映像信号に応じた画像をハイビジョン受像器で表示することができる。
【0007】
しかしながら、上述の従来の画像情報変換装置は、NTSC方式の映像信号を基にして、単に水平方向および垂直方向の補間を行っているに過ぎないため、解像度は基となるNTSC方式の映像信号と何ら変わらなかった。特に、通常の動画を変換対象とした場合、垂直方向の補間をフィールド内処理で行うのが一般的であるが、その場合、画像のフィールド間相関を使用していないため、画像静止部においては変換ロスにより、NTSC方式の映像信号よりもむしろ解像度が劣化する欠点があった。
【0008】
これに対し、出願人は、特願平6−205934号の画像信号変換装置において、入力信号である画像信号レベルの3次元(時空間)分布に応じてクラス分割を行い、クラス毎に予め学習により獲得された予測係数値を格納した記憶手段を持ち、予測式に基づいた演算により最適な推定値を出力する、というものを提案している。
【0009】
この手法は、HD(High Definition )画素を創造する場合、創造するHD画素の近傍にあるSD(Standerd Definition )画素データを用いてクラス分割を行い、それぞれのクラス毎に予測係数値を学習により獲得することで、画像静止部においてはフレーム内相関、また動き部においてはフィールド内相関を利用して、より真値に近いHD画素値を得る、というような巧妙なものである。
【0010】
例えば、図2および図3において示すような、HD画素y1 〜y4 の創造を目的とした場合、図5において示すSD画素m1 〜m5 とSD画素n1 〜n5 のそれぞれ空間的同一位置にある画素同士のフレーム間差分の平均値を求め、それをしきい値処理してクラス分類することにより、主に動きの程度をクラス分類で行う。
【0011】
同時に、図4において示すような、SD画素k1 〜k5 をADRC(Adaptive Dynamic Range Coding )処理することにより、少ないビット数で、主に空間内の波形表現を目的としたクラス分類を行う。
【0012】
上述の2種類のクラス分類で決定されたクラス毎に、図6において示すようなSD画素x1 〜x25を使用して、線形一次式をたて、予測係数値を学習により獲得する。この方式は、主に動きの程度を表すクラス分類と、主に空間内の波形を表すクラス分類とを別個に、それぞれに適した形で行うため、比較的少ないクラス数で高い変換性能を得られるという特徴がある。HD画素yの推定演算は、上述の手順で得られた予測係数値wn を用いて以下のような式(1)で行われる。
【0013】
y=w1 x1 +w2 x2 +・・・+wn xn (1)
この例では、n=25である。
【0014】
このように、SDデータに対応するHDデータを推定するための係数データを各クラス毎に予め学習により求めた上で、ROMテーブルに格納しておき、入力されるSDデータおよびROMテーブルから読み出した係数データを出力することにより、入力されたSDデータを単に補間処理したものとは異なり、実際のHDデータにより近いデータを出力することができるという特徴がある。
【0015】
図17を用いて具体的に説明する。入力端子171からSD画素データが供給され、そのSD画素データは、領域切り出し回路172、174および178へ供給される。領域切り出し回路172では、後段のNTSC回路173において、空間内の波形表現を目的としたクラス分類を行うため、図4において示すような、SD画素k1 〜k5 を切り出し、ADRC回路173において、ADRC処理が施される。領域切り出し回路174では、後段の動きクラス決定回路175において、動きの程度を目的としたクラス分類を行うため、図5において示すような、SD画素m1 〜m5 とSD画素n1 〜n5 とを切り出し、動きクラス決定回路175において、それぞれ空間的同一位置にある画素同士のフレーム間差分の平均値を求め、それをしきい値処理してクラス分類する。
【0016】
クラスコード発生回路176では、ADRC回路173からのクラス分類と、動きクラス決定回路175からのクラス分類とから、クラスが生成される。ROMテーブル177では、生成されたクラスに応答する予測係数が読み出される。領域切り出し回路178では、後段の推定演算回路179において、線形一次式による予測演算を行うため、図6において示すようなSD画素x1 〜x25を切り出し、推定演算回路179において、上述した式(1)で示すような線形一次式によりHDデータが出力端子180を介して取り出される。
【0017】
【発明が解決しようとする課題】
ところで、一般にこのクラス分類画像情報変換処理においては、推定演算に用いる画素の数が多くなるほど、変換性能が向上する。つまり、式(1)におけるnの値が大きくなればなるほど、変換性能が向上する。これは、一般的にいうところの大きなタップのフィルタを使うほど、変換性能が向上する、ということである。
【0018】
しかしながら、式(1)において、nの値の大きな変換装置を作ろうとすると、係数を格納するROMテーブル、そして推定演算を行う回路の規模が非常に大きなものとなってしまい、小規模で安価な回路を構成するのが非常に困難なものになってしまう欠点があった。
【0019】
したがって、この発明の目的は、上述の問題点に鑑みてなされたものであり、小規模で安価な回路を用いても、大きなタップを使用する場合と同様の変換性能を保ったまま、NTSC方式の映像信号をハイビジョン用の映像信号に変換することができるような画像情報変換装置および方法を提供することにある。
【0020】
さらに、この発明の他の目的は、大幅にハード規模を削減しても、本来の性能とほぼ等価な結果を得ることができる画像情報変換装置および方法を提供することにある。
【0021】
【課題を解決するための手段】
請求項1に記載の発明は、第1のディジタル画像信号を、より画素数の多い第2のディジタル画像信号に変換するようにした画像情報変換装置において、第1のディジタル画像信号から、第2のディジタル画像信号に含まれる推定しようとする画素の周辺の複数の画素を切り出す画素切り出し手段と、画素切り出し手段により切り出された複数の画素のレベル分布のパターンに基づいて推定しようとする第2のディジタル画像信号が属するクラスを決定してクラス情報を出力するクラス決定手段と、予め学習によりクラス情報毎に求めた、第1のディジタル画像信号から切り出した複数の画素から第2のディジタル画像信号に含まれる画素を推定するための複数の係数データに対し、当該係数データを縮退させた縮退係数データをクラス情報毎に記憶する縮退係数データ記憶手段と、クラス情報毎に、類似する係数データに対応する第1のディジタル画像信号の複数の画素のデータを加算することによって、第1のディジタル画像信号をより少ない複数の画素のデータに統合する画素数縮退手段と、統合された第1のディジタル画像信号とクラス情報に応じた縮退係数データとによる推定式を用いて第2のディジタル画像信号に含まれる画素を推定する推定手段と、からなることを特徴とする画像情報変換装置である。
【0022】
また、請求項3に記載の発明は、第1のディジタル画像信号を、より画素数の多い第2のディジタル画像信号に変換するようにした画像情報変換方法において、第1のディジタル画像信号から、第2のディジタル画像信号に含まれる推定しようとする画素の周辺の複数の画素を切り出すステップと、切り出された複数の画素のレベル分布のパターンに基づいて推定しようとする第2のディジタル画像信号が属するクラスを決定してクラス情報を出力するステップと、予め学習によりクラス情報毎に求めた、第1のディジタル画像信号から切り出した複数の画素から第2のディジタル画像信号に含まれる画素を推定するための複数の係数データに対し、類似する係数データに対応する第1のディジタル画像信号の複数の画素のデータを演算することによって、第1のディジタル画像信号をより少ない複数の画素のデータに統合する統合ステップと、係数データを縮退させた縮退係数データがクラス情報毎に記憶された係数記憶手段からクラス情報に対応した縮退係数データを読み出すステップと、統合された第1のディジタル画像信号と読み出された縮退係数データとによる推定式を用いて第2のディジタル画像信号に含まれる画素を推定するステップと、からなることを特徴とする画像情報変換方法である。
【0023】
上述したように、この発明に係る画像情報変換装置は、入力SD信号から、創造すべきHD画素の近傍に位置するSD画素のレベル分布のパターンを検出し、この検出したパターンに基づいて、その領域の画像情報が属するクラスを決定してクラス検出情報を出力する。一方、供給されたSD画素データは、もともと類似の係数データ持つSD画素データ同士を統合する作用を有するタップ縮退回路により、統合画素データとして変換され、見かけ上推定演算に用いられる画素数の削除が行われる。この統合は、付加コードデータに基づいてなされる係数データ記憶手段には、外部から供給された画像情報をこの画像情報よりも高い解像度の画像情報に変換するための情報である線形推定式の係数データクラス毎に記憶されており、この係数データは、クラス検出情報に応じて出力される。そして、画像情報変換手段が係数データ記憶手段から供給された係数データに応じて、外部から供給された画像情報を、その外部から供給された画像情報よりも高い解像度の画像情報に変換する。
【0024】
【発明の実施の形態】
以下、この発明が適用された一実施例について図面を参照して説明する。この発明の一実施例の構成を図1に示す。1で示す入力端子を介して外部から供給される画像情報として、例えばいわゆるNTSC方式の映像信号がディジタル化され、SDデータとして供給される。
【0025】
この実施例における、SD画素と創造するべきHD画素の位置関係は、図2および図3に示す通りとする。図2は、水平方向および垂直方向に現フィールドのSD画素、前フィールドのSD画素、現フィールドのHD画素および前フィールドのHD画素を表したものである。図3は、時間方向および垂直方向にSD画素とHD画素を表したものである。このように、創造するべきHD画素には、同一フィールド内で見たとき、SD画素から近い位置に存在するHD画素y1 、y2 とSD画素から遠い位置に存在するHD画素y3 、y4 の2種類がある。以降、SD画素から近い位置に存在するHD画素を推定するモードをモード1、およびSD画素から遠い位置に存在するHD画素を推定するモードをモード2と呼ぶ。
【0026】
領域切り出し回路2では、入力端子1より供給されたSD画像信号から、主に空間内の波形表現のためのクラス分類(以下、空間クラスと称する)に必要な画素を切り出す。この実施例では、例えば、図4に示すように創造するべきHD画素y1 〜y2 の近傍に位置する5つのSD画素k1 〜k5 を切り出す。領域切り出し回路2により抽出されたSDデータは、ADRC回路3に供給される。
【0027】
ADRC回路3は、領域のSDデータのレベル分布のパターン化を目的として、各領域のデータを、例えば8ビットのSDデータから2ビットのSDデータに圧縮するような演算を行う。これにより、形成されたパターン圧縮データをクラスコード発生回路6に供給する。
【0028】
本来ADRCは、VTR向け高性能符号化用に開発された適応的再量子化法であるが、信号レベルの局所的なパターンを短い語長で効率的に表現できるので、この発明の実施例では、信号パターンのクラス分類のコード発生に使用している。ADRC回路は、領域内のダイナミックレンジDR、ビット割当をn、領域内画素のデータレベルをL、再量子化コードをQとして以下の式(2)により、領域内の最大値MAX と最小値MIN との間を指定されたビット長で均等に分割して再量子化を行う。
【0029】
DR=MAX−MIN+1
Q=〔(L−MIN+0.5)・2n /DR〕 (2)
ただし、〔 〕は、切り捨て処理を意味する。
【0030】
この実施例では、領域切り出し回路2により分離されたそれぞれ5画素のSDデータを各2ビットに圧縮するものとする。圧縮されたSDデータをそれぞれq1 〜q5 とする。
【0031】
一方、入力端子1から供給されたSD画像信号は、領域切り出し回路4にも供給される。領域切り出し回路4は、主に動きの程度を表すためのクラス分類(動きクラス)に必要な画素を切り出す働きをする。この実施例では、例えば供給されたSD画像信号から、創造するべきHD画素y1 〜y2 に対して図5に示す位置に存在する10個のSD画素m1 〜m5 およびn1 〜n5 を抽出する。
【0032】
領域切り出し回路4により切り出されたデータは、動きクラス決定回路5に供給される。動きクラス決定回路5は、供給されたSDデータのフレーム間差分を算出し、その絶対値の平均値をしきい値処理することにより動きの指標である動きパラメータを算出する。具体的には、動きクラス決定回路5は、以下の式(3)により、供給されるSDデータの差分の絶対値の平均値param を算出する。
【0033】
【数1】
ただし、この実施例では、n=5である。
【0034】
上述の手法で算出したSDデータの差分の絶対値の平均値param を、例えばSDデータの差分の絶対値のヒストグラムをn等分するように予め設定したしきい値により、このSDデータの差分の絶対値の平均値param を用いて動きクラスmv-classを算出する。例えば、ここでは動きクラスを4つ設けることとして、SDデータの差分の絶対値の平均値param ≦2の場合、動きクラスmv-classを0と決定し、平均値param ≦4の場合、動きクラスmv-classを1と決定し、平均値param ≦8の場合、動きクラスmv-classを2と決定し、平均値param >8の場合、動きクラスmv-classを4と決定する。このように設定された動きクラスmv-classが、クラスコード発生回路6に供給される。
【0035】
クラスコード発生回路6は、ADRC回路3から供給されるパターン圧縮データ(空間クラス)および動きクラス決定回路5から供給される動きクラスmv-classに基づいて以下の式(4)の演算を行うことにより、そのブロックが属するクラスを検出し、そのクラスを示すクラスコードclass をタップ縮退ROM7およびROMテーブル8に供給する。このクラスコードclass は、タップ縮退ROM7およびROMテーブル8からの読み出しアドレスを示すものとなっている。
【0036】
【数2】
この実施例では、nは5、pは2である。
【0037】
さて、既に説明した通り、従来のクラス分類画像情報変換装置においては、領域切り出し回路9から供給された画素データx1 〜xn をクラスコード発生回路6で決定されたクラスコードclass を読み出しアドレスとして、ROMテーブル8から所定の係数データw1 〜wn を読み出し、それを上述した式(1)で推定演算回路11において、掛け合わせることで、SD画像データからHD画像データへの変換を行っていた。ここで、変換性能を重視してnの値を大きく取ると、ROMテーブル8および推定演算回路11がともに大きなものとなってしまい、小規模なハードウェアで高性能の変換を実現しようとする際の大きな障害となっていた。
【0038】
ところで、式(1)でnを大きくとった場合、つまり一般的な言葉で言うと大きなタップを使用した場合の係数データの実際の例を見てみると、例えば以下に示すような値をとる。
【0039】
−0.0484、−0.0748、+0.1297、+0.0532、−0.0810、+0.1875、−0.3679、+1.5571、+0.2390、−0.0400、+0.0125、−0.0076、−0.3310、−0.1554、+0.0344、−0.2683、+0.0384、+0.2333、−0.0576、−0.0084
【0040】
これらの値を見ると、絶対値的に小さく、また似通った値を持つ係数データが多いことが判る。そこで、この発明においては、後述するように、絶対値の似通った係数データが統合され、統合された係数データに含まれる元の係数データに対応するSD画素データを統合するように、タップ縮退がなされる。このタップ縮退で得られた統合画素データを推定演算で使用する。また、この統合画素データを用いて学習を行うことにより得られた統合係数データを使用し、以下のような推定演算を行う。
【0041】
y=wn1 ×(x1 +x7 −x11)+wn2 ×(−x2 +x23)+wn3 ×(x4 −x8 )+・・・+wnnn×(x3 −x18) (5)
ここで、nnはnより小さな自然数であり、wnは統合係数データである。
【0042】
なお、この統合係数データの生成方法については、後述する。このように、統合係数データを使用することで、ほとんど性能低下を引き起こさずに、タップ数を大幅に削減することが出来、高性能で小規模なハードウェアの実現が可能になる。
【0043】
クラスコード発生回路6の出力信号が供給されるタップ縮退ROM7には、統合画素データ(式(5)中の(x1 +x7 −x11)など)を作成するための情報が付加コードデータとして格納されている。具体的には、もともとの画素データをどの統合係数データ(式(5)中のwn1 など)に掛け合わせるかということを示す情報と、その際のプラス/マイナスの符号が付加コードデータとして、格納されている。また、この付加コードデータは、クラス毎に設定されている。タップ縮退ROM7からは、クラスコードclass で示されるアドレスから、そのクラスの統合画素データ生成のための付加コードデータが読み出され、この付加コードデータは、タップ縮退回路10へ供給される。
【0044】
一方、入力SDデータは、領域切り出し回路9にも供給される。領域切り出し回路9は、図6に示すような位置にある、推定演算に使用する25個のSDデータx1 〜x25を切り出す。領域切り出し回路9の出力信号は、タップ縮退回路10に供給される。タップ縮退回路10は、既に説明したような方法/主旨により、供給された25個のSDデータをタップ縮退ROM7から供給された付加コードデータに従い、例えば8個の統合画素データに変換する。
【0045】
クラスコード発生回路6の出力信号が供給されるもうひとつのROMテーブル8には、統合係数データ(式(5)中のwn1 など)が格納されている。これは従来のクラス分類画像情報変換装置のROMテーブルと同様に統合画素データのパターンとHDデータの関係を学習することにより、線形推定式を用いて、統合画素データに対応するHDデータを算出するための統合係数データがクラス毎に記憶される。これは、線形推定式によりSDデータ(統合画素データ)をこの画像情報よりも高い解像度の画像情報である、いわゆるハイビジョンの規格に合致したHDデータに変換するための情報である。この実施例において、統合係数データは、モード1とモード2で独立に用意される。なお、ROMテーブル8に記憶されている統合係数データの作成方法については後述する。ROMテーブル8からは、クラスコードclass で示されるアドレスから、そのクラスの統合係数データであるwni (class )が読み出される。この統合係数データは、推定演算回路11に供給される。
【0046】
推定演算回路11は、タップ縮退回路10から供給される8個の統合画素データと、ROMデータテーブル8から供給される統合係数データに基づいて、入力されたSDデータに対応するHDデータを算出する。
【0047】
統合画素データをxn1 〜xn8 、統合係数データをwn1 〜wn8 とすることにより、具体的には、推定演算回路11は、タップ縮退回路10から供給される統合画素データであるxn1 〜xn8 とROMテーブル8より供給された統合係数データであるwn1 〜wn8 により、モード1に関してはブロック1用の係数を用いて、モード2に関してはブロック2用の係数を用いて、それぞれ式(6)に示す演算を行うことにより、入力されたSDデータに対応するHDデータhd´を算出する。作成されたHDデータhd´は、出力端子12から出力される。この出力端子12を介して出力されるHDデータは、例えばHDテレビジョン受像器やHDビデオテープレコーダ装置等に供給される。
【0048】
hd´=wn1 xn1 +wn2 xn2 +・・・+wn8 xn8 (6)
【0049】
この発明の方式では、絶対値的に似通った値を持つ係数データを統合し、またSD画素データを統合して統合画素データとして扱い、その統合画素データを用いて学習により統合係数データを得ることで、ROMテーブルに格納する係数データの大きさや、推定演算回路の大きさを非常にコンパクトにすることができる。一方、新たにタップ縮退ROMとタップ縮退回路を持つ必要があるが、一般的にこの増大分は、係数データや推定演算回路の減少分に比して充分に小さい。
【0050】
続いて、タップ縮退ROM7に格納される付加コードデータおよびROMテーブル8に格納される統合係数データの学習方法について、図7、図8および図9を用いて説明する。ちなみに、図7において説明する範囲においては、従来の方式との差異はなく、図8および図9において説明を行う部分において、この発明の独自性がある。
【0051】
図7に示すように、係数データを学習によって得るためには、まず、既に知られているHD画像に対応したHD画像の1/4の画素数のSD画像を形成する。まず、入力端子21を介してHDデータが供給される。供給されたHDデータの垂直方向の画素を垂直間引きフィルタ22によりフィールド内の垂直方向の周波数が1/2になるように間引き処理され、さらに水平間引きフィルタ23により、HDデータの水平方向の画素が間引き処理される。
【0052】
このように、作成されたSDデータは、領域切り出し回路24、26および29に供給される。一方、入力端子21に供給されたHDデータは、正規方程式加算回路30に供給される。領域切り出し回路24では、空間クラス分類を行うために、供給されたSD画像信号から必要な画素を切り出す。具体的には、領域切り出し回路24は、先に説明した領域切り出し回路2と同一の働きをする。切り出されたSDデータは、ADRC回路25に供給される。
【0053】
ADRC回路25は、領域毎に供給されるSDデータの1次元的、あるいは2次元的なレベル分布のパターンを検出するとともに、上述のように各領域の全てのデータ、あるいは一部のデータを、例えば8ビットのSDデータから2ビットのSDデータに圧縮するような演算を行うことによりパターン圧縮データを形成し、このパターン圧縮データをクラスコード発生回路28に供給する。ADRC回路25は、先に説明したADRC回路3と同一のものである。
【0054】
一方、領域切り出し回路26に供給されたSD画像信号は、動きクラス分類のために必要なデータ切り出しが行われる。具体的には、領域切り出し回路26は、先に説明した領域切り出し回路4と同一の働きをするものである。領域切り出し回路26により切り出されたSDデータは、動きクラス決定回路27に供給される。動きクラス決定回路27は、具体的には、先に説明した動きクラス決定回路5と同一の働きをするものである。動きクラス決定回路27で決定された動きクラスはクラスコード発生回路28に供給される。
【0055】
クラスコード発生回路28は、先に説明したクラスコード発生回路6と同一のものであり、ADRC回路25から供給されるパターン圧縮データ(空間クラス)および動きクラス決定回路28から供給された動きクラスmv-classに基づいて式(4)の演算を行うことにより、そのブロックが属するクラスを検出し、そのクラスを示すクラスコードを出力するものである。クラスコード発生回路28は、クラスコードを正規方程式加算回路30に出力する。
【0056】
一方、領域切り出し回路29に供給されたSD信号は、推定演算に使用するSD画素データが切り出される。領域切り出し回路29は、具体的には、先に説明した領域切り出し回路9と同一のものであり、動きクラスmv-classに応じて、線形推定式に必要なSD画素を切り出す働きをする。領域切り出し回路29の出力は、正規方程式加算回路30に供給される。このとき、図示しないが領域切り出し回路29の前段に遅延回路を配置することによって、領域切り出し回路29から正規方程式加算回路30へ供給するデータのタイミング合わせが行われる。
【0057】
ここで、正規方程式加算回路30の説明のために、複数個のSD画素からHD画素への変換式の学習とその予測式を用いた信号変換について述べる。以下では、説明のために画素をより一般化してn画素による予測を行う場合について説明する。SD画素レベルをそれぞれ、x1 、x2 、・・・、xn として、それぞれにpビットADRCを行った結果の再量子化データをq1 、q2 、・・・、qn とする。このとき、この領域のクラスコードclass を式(4)で定義する。
【0058】
上述のようにSD画素レベルをそれぞれx1 、x2 、・・・、xn とし、HD画素レベルをyとしたとき、クラス毎に係数w1 、w2 、・・・、wn によるnタップの線形推定式を設定する。これを上述した式(1)に示す。学習前は、wi が未定係数である。
【0059】
学習は、クラス毎に複数の信号データに対して行う。データ数がmの場合、式(1)にしたがって、式(7)が設定される。
【0060】
yk =w1 xk1+w2 xk2+・・・+wn xkn (7)
(k=1、2、・・・m)
【0061】
m>nの場合は、w1 、w2 、・・・wn は一意に決まらないので、誤差ベクトルeの要素を式(8)で定義して、式(9)を最小にする係数を求める。いわゆる、最小自乗法による解法である。
【0062】
ek =yk −{w1 xk1+w2 xk2+・・・+wn xkn} (8)
(k=1、2、・・・m)
【0063】
【数3】
【0064】
ここで、式(9)のwi による偏微分係数を求める。それは以下の式(10)を0にするように、各wi を求めればよい。
【0065】
【数4】
【0066】
以下、式(11)および式(12)のように、XjiYi を定義すると、式(10)は、行列を用いて式(13)に書き換えられる。
【0067】
【数5】
【0068】
【数6】
【0069】
【数7】
【0070】
この方程式は、一般に正規方程式と呼ばれている。正規方程式加算回路30は、クラスコード発生回路28から供給されたクラスコードclass 、領域切り出し回路30より供給されたSDデータx1 、x2 、・・・、xn 、入力端子21より供給されたSDデータに対応するHD画素レベルyを用いて、この正規方程式の加算を行う。
【0071】
全てのトレーニングデータの入力が終了した後、正規方程式加算回路30は、予測係数決定回路31に正規方程式データを出力する。予測係数決定回路31は、正規方程式を掃き出し法などの一般的な行列解法を用いて、wi について解き、予測係数を算出する。予測係数決定回路31は、算出された予測係数をメモリ32に書き込む。
【0072】
以上のようにトレーニングを行った結果、メモリ32には、クラス毎に注目HDデータyを推定するための、統計的にもっとも真値に近い推定ができる予測係数が格納される。しかしながら、変換性能を重視すると、タップ数が大きくなり、係数データを格納するROMと推定演算回路の規模が大きくなるのは既に説明した通りである。
【0073】
そこで、この発明の画像情報変換装置では、上述した手法により得られたメモリ32内の予測係数(係数データ)を用いて、まずタップ縮退ROM7に格納される付加コードデータの生成を行う。既に説明を行った通り、メモリ32には、各クラス毎に予測係数が格納されているが、上述したように、その中には各クラス毎に見た場合でも、絶対値的に多くの似通った係数データが存在する。これら、絶対値的に似通った係数データに対して縮退を施し、縮退された係数データに基づいてSD画素データを統合して統合画素データとして扱い、その統合画素データを用いて学習することによって、より少数の統合係数データを生成する。
【0074】
まず、付加コードデータを生成するにあたって、例えば係数データをw1 〜w17とし、仮の統合係数データをwn1 〜wn7 とした場合、係数データと仮の統合係数データの差分絶対値和が最小となるような仮の統合係数データを採用する。この仮の統合係数データと係数データから係数データに対応するSD画素データがどの仮の統合係数データと掛け合わされるかという情報と、その係数データのプラス/マイナスの符号からなる付加コードデータが生成され、クラス毎にタップ縮退ROMに記憶される。以下、図8を用いて、このタップ縮退ROMに格納される付加コードデータを生成する一例を説明する。
【0075】
図8のフローチャートは、ステップS1から始まり、このステップS1では、供給されるn個の係数データの絶対値化が施される。ステップS2では、絶対値化が施されたn個の係数データの平均値が算出される。また、ステップS3では、絶対値化が施されたn個の係数データの最大値が算出される。ステップS4では、ステップS2で算出された平均値、ステップS3で算出された最大値および0.0の3つが仮の代表値Aとして設定される。
【0076】
ステップS5では、絶対値化されたn個の係数データが3つの仮の代表値Aのどれに一番近い値かを判断し、仮の代表値A毎に3つのグループが生成される。そして、生成されたグループ毎に平均値が求められる。求められた3つの平均値は、新たな仮の代表値Bとして設定される。このとき、仮の代表値Aの0.0は、常に0.0とする。ステップS6では、仮の代表値Bの数がnn+1個あるか否かが判断される。仮の代表値Bの数は、nn+1個であると判断された場合、制御はステップS7へ移り、仮の代表値Bの数は、nn+1個ないと判断された場合、制御はステップS8へ移る。
【0077】
ステップS8では、絶対値化されたn個の係数データが、ステップS5で設定された仮の代表値Bのどれに一番近い値かを判断し、仮の代表値B毎にグループが生成される。このとき、各グループに含まれた各係数データとそのグループの仮の代表値Bに対する最大誤差をグループ毎に算出する。グループ毎に算出された最大誤差の最も大きかったグループの仮の代表値Bの値は、±0.0001を加算し、2つに分けられ、この2つを新たに仮の代表値Aとして再設定する。すなわち、仮の代表値の数が1つ増えることになる。ステップS7では、nn+1個の仮の代表値Bから0.0が取り除かれ、nn個の仮の代表値Bが最終的な代表値として決定される。
【0078】
以下、上述したフローチャートを実際に数値を挙げて具体的に説明する。ここでは、一例としてn個の係数データを17個とし、最終的なnn個の仮の代表値を7個とする。まず、17個の係数データとその対応する番号を以下に示す。
【0079】
〔0〕 0.078855008
〔1〕 −0.014829520
〔2〕 −0.201679692
〔3〕 −0.006243910
〔4〕 0.189737246
〔5〕 −0.048766851
〔6〕 0.121056192
〔7〕 −0.237494633
〔8〕 1.291100144
〔9〕 0.260707706
〔10〕 −0.063144088
〔11〕 0.016828740
〔12〕 −0.475499421
〔13〕 0.031004170
〔14〕 0.054794021
〔15〕 −0.026714571
〔16〕 0.034312069
【0080】
ステップS1では、この17個の係数データに対して絶対値化が施され、ステップS2では、絶対値化された係数データから平均値が算出される。その平均値は、0.1854569である。さらに、ステップS3では、絶対値化された係数データから最大値が算出される。その最大値は、1.2911001である。ステップS4では、この平均値および最大値に加えて0.0を仮の代表値Aとして設定する。以下、説明を容易とするため、仮の代表値AおよびBに数字を付する。この3つからなる仮の代表値A1を以下に示す。
(仮の代表値A1):0.0、0.1854569、1.2911001
【0081】
ステップS5では、絶対値化された係数データとこの仮の代表値A1の差分を求め、最も近い仮の代表値にグループ分けがなされる。さらに、グループ毎に平均値が算出され、仮の代表値B1が設定される。この3つからなる仮の代表値B1を以下に示す。
(仮の代表値B1):0.0、0.2476958、1.2911001
【0082】
ステップS6では、仮の代表値Bがnn+1個あるか否かが判断される。ここで、仮の代表値B1の数は、8個ではないので、ステップS6からステップS8へ制御が移る。ステップS8では、絶対値化された係数データと仮の代表値B1の差分を求め、最も近い仮の代表値にグループ分けがなされる。さらに、グループ内の絶対値化された係数データと仮の代表値B1との誤差が最も大きくなる仮の代表値B1に対して±0.0001を加算する。この例では、0.0が最も大きな誤差を含む仮の代表値となるため、0.0に±0.0001を加算する。これらを加えて、仮の代表値A2が設定される。4つからなる仮の代表値A2を以下に示す。
(仮の代表値A2):−0.0001000、0.0001000、0.2476958、1.2911001
【0083】
ステップS5では、上述と同様の処理が施され、仮の代表値B2が設定される。4つからなる仮の代表値B2を以下に示す。
(仮の代表値B2):0.0、0.0451408、0.273237、1.2911001
【0084】
ステップS6を介してステップS8へ制御が移り、ステップS8では、上述と同様の処理が施され、仮の代表値A3が設定される。5つからなる仮の代表値A3を以下に示す。
(仮の代表値A3):0.0、0.0451408、0.2729237、0.2731237、1.2911001
【0085】
ステップS5では、上述と同様の処理が施され、仮の代表値B3が設定される。5つからなる仮の代表値B3を以下に示す。
(仮の代表値B3):0.0、0.0573309、0.2224048、0.4754994、1.2911001
【0086】
ステップS6を介してステップS8へ制御が移り、ステップS8では、上述と同様の処理が施され、仮の代表値A4が設定される。6つからなる仮の代表値A4を以下に示す。
(仮の代表値A4):0.0、0.0572309、0.0574309、0.2224048、0.4754994、1.2911001
【0087】
ステップS5では、上述と同様の処理が施され、仮の代表値B4が設定される。6つからなる仮の代表値B4を以下に示す。
(仮の代表値B4):0.0、0.0422193、0.0876851、0.2224048、0.4754994、1.2911001
【0088】
ステップS6を介してステップS8へ制御が移り、ステップS8では、上述と同様の処理が施され、仮の代表値A5が設定される。7つからなる仮の代表値A5を以下に示す。
(仮の代表値A5):0.0、0.0422193、0.0876851、0.2223048、0.2225048、0.4754994、1.2911001
【0089】
ステップS5では、上述と同様の処理が施され、仮の代表値B5が設定される。7つからなる仮の代表値B5を以下に示す。
(仮の代表値B5):0.0、0.0431226、0.0999556、0.1957085、0.2491012、0.4754994、1.2911001
【0090】
ステップS6を介してステップS8へ制御が移り、ステップS8では、上述と同様の処理が施され、仮の代表値A6が設定される。8つからなる仮の代表値A6を以下に示す。
(仮の代表値A6):0.0、0.0430226、0.0432226、0.0999556、0.1957085、0.2491012、0.4754994、1.2911001
【0091】
ステップS5では、上述と同様の処理が施され、仮の代表値B6が設定される。8つからなる仮の代表値B6を以下に示す。
(仮の代表値B6):0.0、0.0306769、0.0555683、0.0999556、0.1957085、0.2491012、0.4754994、1.2911001
【0092】
ステップS6では、仮の代表値B6の数が8つ有るか否かが判断されるため、ステップS7へ制御が移る。以下に8つからなる仮の代表値B6とそのグループに含まれる17個の係数データの番号を示す。
【0093】
『0』 1.2911001・・・〔8〕
『1』 0.4754994・・・〔12〕
『2』 0.2491012・・・〔7〕〔9〕
『3』 0.1957085・・・〔2〕〔4〕
『4』 0.0999556・・・〔0〕〔6〕
『5』 0.0555683・・・〔5〕〔10〕〔14〕
『6』 0.0306769・・・〔11〕〔13〕〔15〕〔16〕
『7』 0.0000000・・・〔1〕〔3〕
【0094】
ステップS7では、仮の代表値B6から0.0が取り除かれ最終的な代表値として決定される。
【0095】
これによって、17個の係数データが7個の仮の代表値B6(仮の統合係数データ)のどのグループに含まれているかが判断される。そのグループに含まれる係数データは、係数データ同士まとめることができるので、係数データに対応するSD画素データもまとめることができ、統合画素データを作成することができる。どのグループに含まれるか、言い換えればどの仮の代表値Bと掛け合わされるかの情報および係数データのプラス/マイナスの符号からなる付加コードデータが生成される。
【0096】
この付加コードデータが記憶されたタップ縮退ROMが、既に説明した図1中のタップ縮退ROM7およびこれから説明を行う図9中のタップ縮退ROM49に相当する。
【0097】
さて、上述のように作成されたメモリ32に格納されたデータは、係数データであり、統合係数データでなはい。図8のフローチャートにより最終的に求められた仮の統合係数データを統合係数データとして、使用することも可能だが、ここでは、より最適な統合係数データを生成するためのプロセスに入る。
【0098】
図9に示すように、まず入力端子41を介してHDデータが供給される。供給されるHDデータの垂直方向の画素を垂直方向間引きフィルタ42によりフィールド内の垂直方向の周波数が1/2になるように間引き処理され、さらに水平間引きフィルタ43により、HDデータの水平方向の画素が間引き処理される。垂直間引きフィルタ42は、垂直間引きフィルタ22と、水平間引きフィルタ43は、水平間引きフィルタ23と同じものである。
【0099】
このように作成されたSD画素データは、領域切り出し回路44、46および50に供給される。これら図9中の回路のほとんどは、図8中の相当する部分と全く同じ働きをするので、その部分に関しては説明を省略する。
【0100】
さて、クラスコード発生回路48は、クラスコードclass をタップ縮退ROM49と正規方程式加算回路52に出力する。タップ縮退ROM49は、タップ縮退ROM7と全く同じものであり、上述した図8により作成される。タップ縮退ROM49からは、供給されたクラスコードclass に応じて付加コードデータが読み出される。この付加コードデータは、上述したようにSD画素データを統合するための情報およびプラス/マイナスの符号からなり、タップ縮退ROM49からタップ縮退回路51へ供給される。
【0101】
一方、領域切り出し回路50に供給されたSD信号は、推定演算に使用するSD画素データが切り出される。領域切り出し回路50は、具体的には、先に説明した領域切り出し回路9と同一のものであり、動きクラスmv-classに応じて、線形推定式に必要なSD画素データを切り出す働きをする。領域切り出し回路50の出力は、タップ縮退回路51へ供給される。
【0102】
タップ縮退回路51では、供給された付加コードデータに応じて切り出されたSD画素データが統合画素データに統合される。具体的には、上述したようにまとめることが可能なSD画素データに対して符号を付加し、加算することによって、統合画素データが生成される。生成された統合画素データは、正規方程式加算回路52に供給される。
【0103】
正規方程式加算回路52、予測係数決定回路53およびメモリ54の働きについては既に詳しく述べた正規方程式加算回路30、予測係数決定回路31およびメモリ32と全く同様なので説明は省略する。
【0104】
以上のようにトレーニングを行った結果、メモリ54には、クラス毎に注目HDデータyを推定するための、統計的にもっとも真値に近い推定値ができる予測係数(統合係数データ)が格納される。以上の処理により、線形推定式により、SD画素データからHDデータを作成するための統合係数データの学習が終了する。このメモリ54が図1で使用されるROMテーブル8である。
【0105】
上述した一実施例における推定演算回路11の周辺のタップ縮退を適用しない既存の場合の構成を図10に示す。被乗数レジスタ61から被乗数として、例えばSDデータが積和器64へ供給される。このSDデータに基づいたアドレスがアドレスコントロール回路62から乗数メモリ63へ供給される。乗数メモリ63では、供給されたアドレスに応答する、例えば係数データが読み出され、その係数データは、積和器64へ供給される。積和器64では、上述した式(1)に示されるように積和演算が実行され、その演算結果は、出力端子65から出力される。
【0106】
次に、上述した一実施例におけるタップ縮退を含む具体的構成の他の例を図11に示す。この図11に示す各ブロックは、図1に示すブロックと以下に示すように対応している。アドレスコントロール回路72はクラスコード発生回路6に対応し、コントロールメモリ73はタップ縮退ROM7に対応し、タップ縮退演算回路74はタップ縮退回路10に対応し、乗数メモリ75はROMテーブル8に対応し、積和器76は推定演算回路11に対応している。
【0107】
被乗数レジスタ71から被乗数として、例えばSDデータがタップ縮退演算回路74へ供給される。このSDデータに基づいてアドレスコントロール回路72からアドレスがコントロールメモリ73および乗数メモリ75へ供給される。コントロールメモリ73では、供給されたアドレスに応答して蓄えられたデータがタップ縮退演算回路74へ供給される。
【0108】
タップ縮退演算回路74は、このデータによって制御される。そのタップ縮退演算回路74では、供給されたSDデータを、例えば25個のSDデータから9個のSDデータへ縮退され、積和器76へ供給される。乗数メモリ75では、アドレスコントロール回路72からのアドレスによって選択された係数データが積和器76へ供給される。積和器76では、上述した式(1)に示されるように積和演算が実行され、その演算結果は、出力端子77から出力される。
【0109】
ここで、タップ縮退演算回路74に用いられた具体的な回路図を図12に示す。被乗数レジスタ71からタップ縮退演算回路74に供給されたN個のSDデータDi (1≦i≦N)は、入力端子811 〜81N を介してレジスタ821 〜82N へ供給される。N個のSDデータDi は、レジスタ821 〜82N を介して出力され、K組のセレクタ831 〜83K (K<N)へ供給される。セレクタ831 〜83K では、予め最適化された結果に応じてSDデータDi が選択される。例えば、図に示すようにセレクタ831 〜83K では、4入力の何れかのパスが選択される。選択されたSDデータDi は、スルー/2の補数回路841 〜84K へ供給される。
【0110】
スルー/2の補数回路841 〜84K では、供給される制御信号に応じてSDデータDi に対して何も処理をすることなく通過させるか、または2の補数に変換する処理が実行される。2の補数への変換は、SDデータDi のビットの1/0を反転させ、LSBに `1' を付加する処理である。このとき、2の補数に変換するか否かを選択する必要がない場合、セレクタ831 〜83K からの出力をレジスタ851 〜85K に直結する場合もあり得る。スルー/2の補数回路841 〜84K の出力は、レジスタ851 〜85K を介して演算部へ供給される。
【0111】
レジスタ851 からのデータS1 は、レジスタ86、87および88からなる演算部を介して出力端子89から縮退データR1 として出力される。この演算部では、タイミングを合わせのレジスタから構成され、供給されたデータS1 は、何も処理が施されることなく出力される。レジスタ852 および853 からのデータS2 およびS3 は、加算器90において、加算される。その加算結果は、レジスタ91、92および93を介して出力端子94から縮退データR2 として出力される。この演算部では、2つのデータS2 およびS3 の加算がなされる。
【0112】
加算器95では、2つのデータSが加算され、レジスタ96を介して加算器99へ供給される。加算器97では、1つまたは2つのデータSが加算され、レジスタ98を介して加算器99へ供給される。加算器99では、既に加算された2つのデータが加算され、その加算結果は、レジスタ100および101を介して出力端子102から縮退データR3 として出力される。この演算部では、3つまたは4つのデータSの加算がなされる。
【0113】
加算器103では、2つのデータSが加算され、レジスタ104を介して加算器107へ供給される。加算器105では、2つのデータSが加算され、レジスタ106を介して加算器107へ供給される。加算器107では、既に加算された2つのデータが加算され、その加算結果は、レジスタ108を介して加算器115へ供給される。
【0114】
加算器109では、1つまたは2つのデータSが加算され、レジスタ110を介して加算器113へ供給される。加算器111では、1つまたは2つのデータSが加算され、レジスタ112を介して加算器113へ供給される。この加算器111では、データが供給されず加算結果の出力がない場合もある。加算器113では、既に加算された2つのデータが加算され、その加算結果は、レジスタ114を介して加算器115へ供給される。
【0115】
加算器115では、レジスタ108および114から供給される2つのデータが加算され、その加算結果は、レジスタ116を介して出力端子117から縮退データRM として出力される。この演算部では、5つ以上、8つ以下のデータSの加算がなされる。
【0116】
このように、データD1 〜DN は、セレクタ831 〜83K によって選択され、データS1 〜SK として、何種類かの入力数を持った加算器(演算部)に供給される。この演算部の入力数は、K個あり、セレクタと演算部の接続も、どのタップを接続して何個の加算演算をしたらよいか最適化された結果接続されている。そして、最終的にNタップのフィルタとほぼ等価となる縮退データR1 〜RM を得ることができる。ただし、タップ数の関係は、M<K<Nとする。
【0117】
図13および図14は、乗算器を備えた積和器76の構成例であり、ここでは、4タップの場合を例にしている。大きく分けて、図13に示すように、被乗数を順次供給することによってパイプラインで積和演算を行う場合と、図14に示すように、被乗数を同時に供給し、パラレルで加算を行う場合とに大別される。この発明は、図14に示す構成からなる。
【0118】
まず、図13の積和演算回路から説明する。入力端子121から供給される被乗数(画素データ)は、レジスタ122を介して乗算器1251 〜1254 へ供給される。入力端子1231 〜1234 から供給される乗数(係数)は、それぞれレジスタ1241 〜1244 を介して乗算器1251 〜1254 へ供給される。乗算器1251 〜1254 では、被乗数と乗数の乗算が実行され、その乗算結果は、レジスタ1261 〜1264 へ供給される。レジスタ1261 からのデータは、レジスタ1271 を介して加算器1281 へ供給される。加算器1281 では、レジスタ1271 からのデータとレジスタ1262 からの1サンプリング後のデータとが加算される。
【0119】
加算器1281 からの加算出力は、レジスタ1272 を介して加算器1282 へ供給される。加算器1282 では、レジスタ1272 からのデータとレジスタ1263 からの1サンプリング後のデータとが加算される。加算器1282 からの加算出力は、レジスタ1273 を介して加算器1283 へ供給される。加算器1283 では、レジスタ1273 からのデータとレジスタ1264 からの1サンプリング後のデータとが加算される。加算器1283 からの加算出力は、レジスタ1274 を介して出力端子129から出力される。
【0120】
次に、この実施例において積和器76に適用可能な構成例を図14に示す。入力端子1311 〜1314 から被乗数(画素データ)が供給され、その被乗数は、レジスタ1321 〜1324 を介して乗算器1351 〜1354 へ供給される。入力端子1331 〜1334 から乗数(係数)が供給され、その被乗数は、レジスタ1341 〜1344 を介して乗算器1351 〜1354 へ供給される。乗算器1351 〜1354 では、被乗数と乗数の乗算が行われ、その乗算結果は、それぞれレジスタ1361 〜1364 を介して加算器1371 および1372 へ供給される。
【0121】
加算器1371 では、レジスタ1361 および1362 からのデータが加算され、その加算結果は、レジスタ1381 を介して加算器139へ供給される。加算器1372 では、レジスタ1363 および1364 からのデータが加算され、その加算結果は、レジスタ1382 を介して加算器139へ供給される。加算器139では、レジスタ1381 および1382 からのデータが加算され、その加算結果は、レジスタ140を介して出力端子141から出力される。
【0122】
なお、この実施例の説明では、空間波形を少ないビット数でパターン化する情報圧縮手段として、ADRCを設けることにしたが、これはほんの一例であり、信号波形のパターンの少ないクラスで表現できるような情報圧縮手段であれば何を設けるかは自由であり、例えばDPCM(Differential Pulse Code Modulation)やVQ(Vector Quantization )等の圧縮手段を用いても良い。
【0123】
【発明の効果】
この発明に依れば、もともとの類似の係数データを持つ、SD画像データを予め統合することで、見かけ上の画素数を減らすことで、変換性能を保ったままコンパクトな推定演算回路および係数ROMを実現することができる。
【0124】
さらに、この発明に依れば、乗数メモリと積和器のハード規模をかなり大きく削減することができるため、大幅にハード規模を削減できる。また、タップ縮退は、本来Nタップのフィルタ演算をMタップ(M<N)のフィルタ演算にほぼ等価的に置き換え、入力が画像データであるため、乗数が画像の特性を反映した数値になっており、タップ縮退を行っても等価な演算が行えるようタップ縮退回路を構成できることによって、本来の性能とほぼ等価的なデータが得ることができる。
【図面の簡単な説明】
【図1】この発明に係る画像情報変換装置の一実施例のブロック図である。
【図2】SDデータとHDデータの位置関係を説明するための略線図である。
【図3】SDデータとHDデータの位置関係を説明するための略線図である。
【図4】空間クラス分類に使用するデータを説明するための略線図である。
【図5】動きクラス分類に使用するデータを説明するための略線図である。
【図6】推定演算に使用する画素を説明するための略線図である。
【図7】補正データテーブルを作成する時の説明のための略線図である。
【図8】この発明に係るタップ縮退の一例のフローチャートである。
【図9】補正データテーブルを作成する時の説明のための略線図である。
【図10】積和演算回路の一例である。
【図11】この発明に係る積和演算回路の一実施例である。
【図12】この発明に係るタップ縮退演算回路の一例の回路図である。
【図13】この発明に係る積和演算回路の一例の回路図である。
【図14】この発明に係る積和演算回路の一例の回路図である。
【図15】従来の画像情報変換装置の回路図である。
【図16】従来の画像情報変換装置の要部の回路図である。
【図17】従来の画像変換装置における画像情報変換装置の例のブロック図である。
【符号の説明】
2、4、9・・・領域切り出し回路、3・・・ADRC回路、5・・・動きクラス決定回路、6・・・クラスコード発生回路、7・・・タップ縮退ROM、8・・・ROMテーブル、10・・・タップ縮退回路、11・・・推定演算回路[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an image information conversion apparatus and method suitable for use in, for example, a television receiver, a video tape recorder apparatus, and the like, and in particular, converts normal resolution image information supplied from the outside into high resolution image information. The present invention relates to an image information conversion apparatus and method that can output the output.
[0002]
[Prior art]
Nowadays, development of a television receiver capable of obtaining a higher resolution image is desired due to the increase in audio / visual orientation. In response to this demand, so-called high vision has been developed. In this high-definition, the number of scanning lines stipulated in the so-called NTSC system is 525, whereas it is 1125, which is more than twice, and the aspect ratio of the display screen is 16: 9 and a wide-angle screen. For this reason, a high-resolution and realistic screen can be obtained.
[0003]
Here, although it is a high vision having such excellent characteristics, even if an NTSC video signal is supplied as it is, an image cannot be displayed. This is because the standards differ between the NTSC system and the high vision system as described above. For this reason, when an image according to the NTSC video signal is to be displayed by the high vision system, conventionally, for example, the video signal rate conversion is performed using an image information converter as shown in FIG.
[0004]
In FIG. 15, the conventional image information conversion apparatus described above includes a
[0005]
Specifically, the
[0006]
The vertical interpolation filter 153 has the same configuration as that of the
[0007]
However, since the above-described conventional image information conversion apparatus merely performs horizontal and vertical interpolation based on the NTSC video signal, the resolution is the same as that of the NTSC video signal. There was no change. In particular, when converting a normal moving image, it is common to perform vertical interpolation by intra-field processing. In that case, however, the inter-field correlation of the image is not used. Due to the conversion loss, there is a drawback that the resolution is deteriorated rather than the NTSC video signal.
[0008]
On the other hand, the applicant performs class division according to the three-dimensional (spatio-temporal) distribution of the image signal level as the input signal in the image signal conversion apparatus of Japanese Patent Application No. 6-205934, and learns in advance for each class. Has proposed a storage means for storing a prediction coefficient value obtained by the above-described method and outputting an optimum estimated value by a calculation based on a prediction formula.
[0009]
In this method, when creating HD (High Definition) pixels, class division is performed using SD (Standered Definition) pixel data in the vicinity of the created HD pixels, and a prediction coefficient value is obtained by learning for each class. As a result, it is possible to obtain an HD pixel value closer to the true value by using intra-frame correlation in the still image portion and intra-field correlation in the motion portion.
[0010]
For example, the HD pixel y as shown in FIGS. 1 ~ Y Four SD pixel m shown in FIG. 1 ~ M Five And SD pixel n 1 ~ N Five The average value of the inter-frame differences between the pixels at the same spatial position is obtained, and is subjected to threshold processing to classify it, so that the degree of motion is mainly performed by class classification.
[0011]
At the same time, the SD pixel k as shown in FIG. 1 ~ K Five By performing ADRC (Adaptive Dynamic Range Coding) processing, the classification is performed with a small number of bits mainly for the purpose of expressing the waveform in the space.
[0012]
For each class determined by the above two types of class classification, the SD pixel x as shown in FIG. 1 ~ X twenty five Is used to build a linear linear expression and obtain a prediction coefficient value by learning. In this method, class classification that mainly represents the degree of motion and class classification that mainly represents the waveform in the space are performed separately in a suitable manner, so high conversion performance can be obtained with a relatively small number of classes. There is a feature that is. The estimation calculation of the HD pixel y is performed using the prediction coefficient value w obtained by the above procedure n The following equation (1) is used.
[0013]
y = w 1 x 1 + W 2 x 2 + ... + w n x n (1)
In this example, n = 25.
[0014]
In this manner, coefficient data for estimating HD data corresponding to SD data is obtained by learning in advance for each class, stored in the ROM table, and read from the input SD data and the ROM table. By outputting the coefficient data, unlike the case where the input SD data is simply interpolated, it is possible to output data closer to the actual HD data.
[0015]
This will be specifically described with reference to FIG. SD pixel data is supplied from the input terminal 171, and the SD pixel data is supplied to the
[0016]
In the class
[0017]
[Problems to be solved by the invention]
By the way, in general, in this classification image information conversion process, the conversion performance improves as the number of pixels used in the estimation calculation increases. That is, the conversion performance improves as the value of n in Equation (1) increases. This means that the conversion performance improves as the filter with a large tap, which is generally called, is used.
[0018]
However, in the equation (1), if an attempt is made to create a conversion device having a large value of n, the scale of the ROM table for storing the coefficients and the circuit for performing the estimation operation becomes very large, which is small and inexpensive. There is a drawback that it is very difficult to construct a circuit.
[0019]
Accordingly, an object of the present invention is made in view of the above-mentioned problems, and the NTSC system is used while maintaining the same conversion performance as when a large tap is used even if a small and inexpensive circuit is used. It is an object of the present invention to provide an image information conversion apparatus and method which can convert a video signal of the above into a video signal for high vision.
[0020]
Furthermore, another object of the present invention is to provide an image information conversion apparatus and method capable of obtaining a result substantially equivalent to the original performance even if the hardware scale is greatly reduced.
[0021]
[Means for Solving the Problems]
According to a first aspect of the present invention, there is provided an image information conversion apparatus for converting a first digital image signal into a second digital image signal having a larger number of pixels. , Around the pixel to be estimated included in the second digital image signal A pixel cutout unit that cuts out a plurality of pixels, and a class to which a second digital image signal to be estimated belongs based on a level distribution pattern of the plurality of pixels cut out by the pixel cutout unit belongs and outputs class information Class decision means; The coefficient data is degenerated with respect to a plurality of coefficient data for estimating pixels included in the second digital image signal from a plurality of pixels cut out from the first digital image signal obtained for each class information by learning in advance. Reduced coefficient data storage means for storing the reduced coefficient data for each class information; For each class information, by adding the data of a plurality of pixels of the first digital image signal corresponding to similar coefficient data, the number of pixels is reduced to integrate the first digital image signal into the data of a plurality of pixels. According to means, integrated first digital image signal and class information Degeneration A second digital image signal using an estimation formula based on coefficient data Pixels contained in And an image information conversion device characterized by comprising: an estimation means for estimating.
[0022]
According to a third aspect of the present invention, there is provided an image information conversion method for converting a first digital image signal into a second digital image signal having a larger number of pixels. , Around the pixel to be estimated included in the second digital image signal Cutting out a plurality of pixels, determining a class to which a second digital image signal to be estimated based on a level distribution pattern of the cut out plurality of pixels belongs, and outputting class information; With respect to a plurality of coefficient data for estimating pixels included in the second digital image signal from a plurality of pixels cut out from the first digital image signal obtained for each class information in advance by learning, An integration step of integrating the first digital image signal into the data of a plurality of pixels by calculating the data of the plurality of pixels of the first digital image signal corresponding to similar coefficient data; Reduced coefficient data Corresponding to class information from coefficient storage means in which coefficient data is stored for each class information Degeneration A step of reading coefficient data, and reading the integrated first digital image signal; Degeneration A second digital image signal using an estimation formula based on coefficient data Pixels contained in And an image information conversion method characterized by comprising the steps of:
[0023]
As described above, the image information conversion apparatus according to the present invention detects a level distribution pattern of SD pixels located in the vicinity of an HD pixel to be created from an input SD signal, and based on the detected pattern, The class to which the image information of the region belongs is determined and class detection information is output. On the other hand, the supplied SD pixel data is converted as integrated pixel data by a tap degeneration circuit having an action of integrating SD pixel data having similar coefficient data, and the number of pixels used for the apparent estimation calculation is deleted. Done. This integration is performed in the coefficient data storage means based on the additional code data, and the coefficient of the linear estimation formula, which is information for converting image information supplied from the outside into image information having a higher resolution than the image information. Stored for each data class, the coefficient data is output according to the class detection information. Then, according to the coefficient data supplied from the coefficient data storage means, the image information conversion means converts the image information supplied from the outside into image information having a higher resolution than the image information supplied from the outside.
[0024]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, an embodiment to which the present invention is applied will be described with reference to the drawings. The configuration of one embodiment of the present invention is shown in FIG. For example, a so-called NTSC video signal is digitized and supplied as SD data as image information supplied from the outside via an
[0025]
In this embodiment, the positional relationship between SD pixels and HD pixels to be created is as shown in FIGS. FIG. 2 shows the SD pixel of the current field, the SD pixel of the previous field, the HD pixel of the current field, and the HD pixel of the previous field in the horizontal direction and the vertical direction. FIG. 3 shows SD pixels and HD pixels in the time direction and the vertical direction. As described above, the HD pixel to be created includes the HD pixel y that is present at a position close to the SD pixel when viewed in the same field. 1 , Y 2 HD pixels that are far from SD pixels Three , Y Four There are two types. Hereinafter, a mode for estimating an HD pixel existing at a position close to an SD pixel is referred to as
[0026]
The
[0027]
For the purpose of patterning the level distribution of the SD data in the area, the
[0028]
ADRC is originally an adaptive requantization method developed for high-performance coding for VTRs. However, since a local pattern of a signal level can be efficiently expressed with a short word length, in the embodiment of the present invention, It is used for signal pattern classification code generation. The ADRC circuit calculates the maximum value MAX and the minimum value MIN in the region according to the following equation (2), where the dynamic range DR in the region, bit allocation is n, the data level of the pixel in the region is L, and the requantization code is Q. Are re-quantized by equally dividing the interval between and with a specified bit length.
[0029]
DR = MAX-
Q = [(L-MIN + 0.5) .2 n / DR] (2)
However, [] means a truncation process.
[0030]
In this embodiment, it is assumed that each 5 pixel SD data separated by the
[0031]
On the other hand, the SD image signal supplied from the
[0032]
The data cut out by the
[0033]
[Expression 1]
However, in this embodiment, n = 5.
[0034]
The average value param of the absolute value of the difference of the SD data calculated by the above-described method is set to the difference of the SD data by a threshold value set in advance so as to divide the histogram of the absolute value of the SD data difference into n equal parts, for example. The motion class mv-class is calculated using the average value param of the absolute values. For example, here, assuming that four motion classes are provided, if the average value param ≦ 2 of the SD data difference is determined, the motion class mv-class is determined to be 0, and if the average value param ≦ 4, the motion class When mv-class is determined as 1, and the average value param ≦ 8, the motion class mv-class is determined as 2, and when the average value param> 8, the motion class mv-class is determined as 4. The motion class mv-class set in this way is supplied to the class
[0035]
The class
[0036]
[Expression 2]
In this embodiment, n is 5 and p is 2.
[0037]
As described above, in the conventional classification image information conversion device, the pixel data x supplied from the region extraction circuit 9 is used. 1 ~ X n To the predetermined coefficient data w from the ROM table 8 using the class code class determined by the class
[0038]
By the way, when n is increased in Equation (1), that is, in a general word, when a large tap is used, an actual example of coefficient data takes the following values, for example. .
[0039]
-0.0484, -0.0748, +0.1297, +0.0532, -0.0810, +0.1875, -0.3679, +1.5571, +0.2390, -0.0400, +0.0125,- 0.0076, -0.3310, -0.1554, +0.0344, -0.2683, +0.0384, +0.2333, -0.0576, -0.0084
[0040]
Looking at these values, it can be seen that there are many coefficient data that are small in absolute value and have similar values. Therefore, in the present invention, as will be described later, tap degeneration is performed so that coefficient data having similar absolute values are integrated and SD pixel data corresponding to original coefficient data included in the integrated coefficient data is integrated. Made. The integrated pixel data obtained by this tap degeneration is used in the estimation calculation. Further, the following estimation calculation is performed using the integrated coefficient data obtained by performing learning using the integrated pixel data.
[0041]
y = wn 1 X (x 1 + X 7 -X 11 ) + Wn 2 × (−x 2 + X twenty three ) + Wn Three X (x Four -X 8 ) + ... + wn nn X (x Three -X 18 (5)
Here, nn is a natural number smaller than n, and wn is integration coefficient data.
[0042]
A method for generating the integration coefficient data will be described later. As described above, by using the integration coefficient data, the number of taps can be significantly reduced with almost no performance degradation, and high-performance and small-scale hardware can be realized.
[0043]
The
[0044]
On the other hand, the input SD data is also supplied to the area cutout circuit 9. The area cutout circuit 9 is located at a position as shown in FIG. 1 ~ X twenty five Cut out. The output signal of the area cutout circuit 9 is supplied to the
[0045]
Another ROM table 8 to which the output signal of the class
[0046]
The
[0047]
Xn integrated pixel data 1 ~ Xn 8 , Integration coefficient data wn 1 ~ Wn 8 Thus, specifically, the
[0048]
hd '= wn 1 xn 1 + Wn 2 xn 2 + ... + wn 8 xn 8 (6)
[0049]
In the method of the present invention, coefficient data having similar values in absolute value are integrated, SD pixel data is integrated and treated as integrated pixel data, and integrated coefficient data is obtained by learning using the integrated pixel data. Thus, the size of the coefficient data stored in the ROM table and the size of the estimation arithmetic circuit can be made very compact. On the other hand, it is necessary to newly have a tap degeneration ROM and a tap degeneration circuit. Generally, the increase is sufficiently smaller than the decrease of the coefficient data and the estimation arithmetic circuit.
[0050]
Next, a method for learning the additional code data stored in the
[0051]
As shown in FIG. 7, in order to obtain coefficient data by learning, first, an SD image having a 1/4 pixel number of an HD image corresponding to an already known HD image is formed. First, HD data is supplied via the input terminal 21. The vertical pixels of the supplied HD data are thinned by the vertical thinning
[0052]
Thus, the created SD data is supplied to the
[0053]
The
[0054]
On the other hand, the SD image signal supplied to the
[0055]
The class
[0056]
On the other hand, SD pixel data used for estimation calculation is cut out from the SD signal supplied to the region cutout circuit 29. Specifically, the region cut-out circuit 29 is the same as the region cut-out circuit 9 described above, and functions to cut out SD pixels necessary for the linear estimation equation according to the motion class mv-class. The output of the area cutout circuit 29 is supplied to the normal
[0057]
Here, in order to explain the normal
[0058]
As described above, each SD pixel level is set to x. 1 , X 2 , ..., x n And when the HD pixel level is y, the coefficient w for each class 1 , W 2 ... w n Set an n-tap linear estimation formula. This is shown in equation (1) above. Before learning, w i Is an undetermined coefficient.
[0059]
Learning is performed on a plurality of signal data for each class. When the number of data is m, Expression (7) is set according to Expression (1).
[0060]
y k = W 1 x k1 + W 2 x k2 + ... + w n x kn (7)
(K = 1, 2, ... m)
[0061]
If m> n, w 1 , W 2 ... w n Is not uniquely determined, the element of the error vector e is defined by equation (8), and a coefficient that minimizes equation (9) is obtained. This is a so-called least square method.
[0062]
e k = Y k -{W 1 x k1 + W 2 x k2 + ... + w n x kn } (8)
(K = 1, 2, ... m)
[0063]
[Equation 3]
[0064]
Where w in equation (9) i Obtain the partial differential coefficient by. Each w so that the following equation (10) is zero: i You can ask for.
[0065]
[Expression 4]
[0066]
Hereinafter, as in the formulas (11) and (12), X ji Y i Is defined, Equation (10) can be rewritten as Equation (13) using a matrix.
[0067]
[Equation 5]
[0068]
[Formula 6]
[0069]
[Expression 7]
[0070]
This equation is generally called a normal equation. The normal
[0071]
After completing the input of all training data, the normal
[0072]
As a result of training as described above, the memory 32 stores a prediction coefficient that can be estimated statistically closest to the true value for estimating the target HD data y for each class. However, if the conversion performance is emphasized, the number of taps increases, and the scale of the ROM for storing coefficient data and the estimation arithmetic circuit increases as already described.
[0073]
Therefore, in the image information conversion apparatus according to the present invention, first, additional code data stored in the
[0074]
First, when generating additional code data, for example, coefficient data is w 1 ~ W 17 And provisional integration coefficient data as wn 1 ~ Wn 7 In this case, provisional integration coefficient data that minimizes the sum of absolute differences between the coefficient data and provisional integration coefficient data is employed. From this temporary integration coefficient data and coefficient data, information about which temporary integration coefficient data is multiplied by the SD pixel data corresponding to the coefficient data and additional code data consisting of plus / minus signs of the coefficient data are generated. And stored in the tap degeneration ROM for each class. Hereinafter, an example of generating additional code data stored in the tap degeneration ROM will be described with reference to FIG.
[0075]
The flowchart of FIG. 8 starts from step S1, and in this step S1, the n coefficient data to be supplied are converted into absolute values. In step S2, an average value of n coefficient data subjected to absolute value calculation is calculated. In step S3, the maximum value of the n coefficient data subjected to absolute value calculation is calculated. In step S4, the average value calculated in step S2, the maximum value calculated in step S3, and 0.0 are set as the temporary representative value A.
[0076]
In step S5, it is determined which of the three temporary representative values A the n coefficient data converted into absolute values is closest to, and three groups are generated for each temporary representative value A. And an average value is calculated | required for every produced | generated group. The obtained three average values are set as a new temporary representative value B. At this time, the temporary representative value A of 0.0 is always set to 0.0. In step S6, it is determined whether or not there are nn + 1 provisional representative values B. If it is determined that the number of temporary representative values B is nn + 1, the control proceeds to step S7, and if it is determined that the number of temporary representative values B is not nn + 1, the control proceeds to step S8. .
[0077]
In step S8, it is determined which of the n coefficient data converted into absolute values is closest to the temporary representative value B set in step S5, and a group is generated for each temporary representative value B. The At this time, the maximum error with respect to each coefficient data included in each group and the provisional representative value B of the group is calculated for each group. The value of the provisional representative value B of the group with the largest maximum error calculated for each group is divided into two by adding ± 0.0001, and these two are newly re-established as a provisional representative value A. Set. That is, the number of temporary representative values increases by one. In step S7, 0.0 is removed from nn + 1 provisional representative values B, and nn provisional representative values B are determined as final representative values.
[0078]
Hereinafter, the above-described flowchart will be specifically described by actually giving numerical values. Here, as an example, it is assumed that n coefficient data is 17 and the final nn temporary representative values are 7. First, 17 coefficient data and the corresponding numbers are shown below.
[0079]
[0] 0.078885008
[1] -0.014829520
[2] -0.201667992
[3] -0.0062443910
[4] 0.189737246
[5] -0.048776851
[6] 0.121056192
[7] -0.2374494633
[8] 1.291100144
[9] 0.2607707706
[10] -0.063144088
[11] 0.016828740
[12] -0.475499421
[13] 0.0310041170
[14] 0.054794021
[15] -0.026771471
[16] 0.034312069
[0080]
In step S1, the 17 coefficient data are converted into absolute values. In step S2, an average value is calculated from the converted coefficient data. The average value is 0.185454569. Further, in step S3, the maximum value is calculated from the coefficient data converted into absolute values. The maximum value is 1.2911001. In step S4, 0.0 is set as a temporary representative value A in addition to the average value and the maximum value. Hereinafter, for ease of explanation, numerals are assigned to the temporary representative values A and B. The three temporary representative values A1 are shown below.
(Temporary representative value A1): 0.0, 0.1854545, 1.2911001
[0081]
In step S5, the difference between the coefficient data converted into the absolute value and the provisional representative value A1 is obtained, and grouping is performed on the nearest provisional representative value. Further, an average value is calculated for each group, and a temporary representative value B1 is set. The three temporary representative values B1 are shown below.
(Temporary representative value B1): 0.0, 0.2476958, 1.2911001
[0082]
In step S6, it is determined whether or not there are nn + 1 provisional representative values B. Here, since the number of temporary representative values B1 is not eight, the control shifts from step S6 to step S8. In step S8, the difference between the coefficient data converted into the absolute value and the temporary representative value B1 is obtained, and the nearest temporary representative value is grouped. Further, ± 0.0001 is added to the tentative representative value B1 in which the error between the absolute value coefficient data in the group and the tentative representative value B1 is the largest. In this example, 0.0 is a provisional representative value including the largest error, so ± 0.0001 is added to 0.0. In addition to these, a temporary representative value A2 is set. A temporary representative value A2 composed of four is shown below.
(Temporary representative value A2): -0.0001000, 0.0001000, 0.2476958, 1.2911001
[0083]
In step S5, processing similar to that described above is performed, and a temporary representative value B2 is set. A temporary representative value B2 consisting of four is shown below.
(Temporary representative value B2): 0.0, 0.0451408, 0.273237, 1.2911001
[0084]
Control is transferred to step S8 via step S6, and in step S8, the same processing as described above is performed, and a temporary representative value A3 is set. The five temporary representative values A3 are shown below.
(Temporary representative value A3): 0.0, 0.0451408, 0.2729237, 0.2731237, 1.2911001
[0085]
In step S5, processing similar to that described above is performed, and a temporary representative value B3 is set. The five temporary representative values B3 are shown below.
(Temporary representative value B3): 0.0, 0.0573309, 0.2224048, 0.4754994, 1.2911001
[0086]
Control is transferred to step S8 via step S6. In step S8, the same processing as described above is performed, and a temporary representative value A4 is set. Six temporary representative values A4 are shown below.
(Temporary representative value A4): 0.0, 0.0572309, 0.0574309, 0.2224048, 0.4754994, 1.2911001
[0087]
In step S5, the same processing as described above is performed, and a temporary representative value B4 is set. Six temporary representative values B4 are shown below.
(Temporary representative value B4): 0.0, 0.0422193, 0.08776851, 0.2224048, 0.4754994, 1.2911001
[0088]
Control is transferred to step S8 via step S6, and in step S8, processing similar to that described above is performed, and a temporary representative value A5 is set. A temporary representative value A5 consisting of seven is shown below.
(Temporary representative value A5): 0.0, 0.0422193, 0.08776851, 0.2223048, 0.2225048, 0.4754994, 1.2911001
[0089]
In step S5, the same processing as described above is performed, and a temporary representative value B5 is set. A temporary representative value B5 consisting of seven is shown below.
(Temporary representative value B5): 0.0, 0.0431226, 0.0999556, 0.1957085, 0.2491012, 0.4754994, 1.2911001
[0090]
Control is transferred to step S8 via step S6, and in step S8, the same processing as described above is performed to set a temporary representative value A6. The temporary representative value A6 consisting of 8 is shown below.
(Temporary representative value A6): 0.0, 0.0430226, 0.0432226, 0.0999556, 0.1957085, 0.2491012, 0.4754994, 1.2911001
[0091]
In step S5, processing similar to that described above is performed, and a temporary representative value B6 is set. Eight temporary representative values B6 are shown below.
(Temporary representative value B6): 0.0, 0.0306769, 0.0555683, 0.0999556, 0.1957085, 0.2491012, 0.4754994, 1.2911001
[0092]
In step S6, since it is determined whether or not there are eight provisional representative values B6, the control moves to step S7. The following are the eight representative representative values B6 and the numbers of the 17 coefficient data included in the group.
[0093]
"0" 1.291001 ... [8]
"1" 0.4754994 ... [12]
"2" 0.2491012 ... [7] [9]
"3" 0.1957085 ... [2] [4]
"4" 0.0999556 ... [0] [6]
"5" 0.0555683 ... [5] [10] [14]
"6" 0.0306769 ... [11] [13] [15] [16]
"7" 0.0000000 ... [1] [3]
[0094]
In step S7, 0.0 is removed from the temporary representative value B6, and the final representative value is determined.
[0095]
Thus, it is determined in which group of the seven temporary representative values B6 (temporary integrated coefficient data) the 17 coefficient data are included. Since the coefficient data included in the group can be grouped together, the SD pixel data corresponding to the coefficient data can also be grouped, and integrated pixel data can be created. Additional code data including information on which group is included, in other words, which temporary representative value B is multiplied, and the plus / minus sign of the coefficient data is generated.
[0096]
The tap degeneration ROM in which the additional code data is stored corresponds to the
[0097]
Now, the data stored in the memory 32 created as described above is coefficient data, not integrated coefficient data. The provisional integration coefficient data finally obtained by the flowchart of FIG. 8 can be used as the integration coefficient data, but here, a process for generating more optimal integration coefficient data is entered.
[0098]
As shown in FIG. 9, first, HD data is supplied via the input terminal 41. The pixels in the vertical direction of the supplied HD data are thinned out by the vertical thinning filter 42 so that the vertical frequency in the field is halved, and further, the pixels in the horizontal direction of the HD data by the horizontal thinning filter 43. Is thinned out. The vertical thinning filter 42, the vertical thinning
[0099]
The SD pixel data created in this way is supplied to the
[0100]
The class code generation circuit 48 outputs the class code class to the
[0101]
On the other hand, SD pixel data used for estimation calculation is cut out from the SD signal supplied to the region cutout circuit 50. Specifically, the region cut-out circuit 50 is the same as the region cut-out circuit 9 described above, and functions to cut out SD pixel data necessary for the linear estimation equation according to the motion class mv-class. The output of the area cutout circuit 50 is supplied to the
[0102]
In the
[0103]
Since the functions of the normal equation addition circuit 52, the prediction
[0104]
As a result of the training as described above, the
[0105]
FIG. 10 shows a configuration in an existing case where tap degeneration around the
[0106]
Next, another example of a specific configuration including tap degeneration in the above-described embodiment is shown in FIG. Each block shown in FIG. 11 corresponds to the block shown in FIG. 1 as shown below. The
[0107]
For example, SD data is supplied from the
[0108]
The tap
[0109]
Here, a specific circuit diagram used in the tap degeneration
[0110]
Through / 2's complement circuit 84 1 ~ 84 K In the SD data D according to the supplied control signal i Is passed through without processing, or is converted to two's complement. Conversion to 2's complement is based on SD data D i Is a process of inverting 1/0 of the bit and adding `1 'to the LSB. At this time, if it is not necessary to select whether or not to convert to 2's complement, the
[0111]
[0112]
In the
[0113]
In the
[0114]
In the
[0115]
In the
[0116]
Thus, data D 1 ~ D N Is
[0117]
FIGS. 13 and 14 are configuration examples of the product-
[0118]
First, the product-sum operation circuit of FIG. 13 will be described. The multiplicand (pixel data) supplied from the
[0119]
Adder 128 1 The added output from is the
[0120]
Next, FIG. 14 shows a configuration example applicable to the sum of
[0121]
Adder 137 1 Then, register 136 1 And 136 2 Are added to each other, and the addition result is stored in the register 138. 1 Is supplied to the
[0122]
In the description of this embodiment, ADRC is provided as an information compression means for patterning a spatial waveform with a small number of bits. However, this is only an example, and it can be expressed by a class having a small pattern of signal waveforms. Any information compression means may be provided, and for example, a compression means such as DPCM (Differential Pulse Code Modulation) or VQ (Vector Quantization) may be used.
[0123]
【The invention's effect】
According to the present invention, by integrating SD image data having original similar coefficient data in advance, the apparent number of pixels is reduced, so that a compact estimation operation circuit and coefficient ROM can be maintained while maintaining conversion performance. Can be realized.
[0124]
Furthermore, according to the present invention, the hardware scale of the multiplier memory and the multiplier / summer can be considerably reduced, so that the hardware scale can be greatly reduced. Also, tap degeneration is essentially equivalent to replacing the N-tap filter operation with an M-tap (M <N) filter operation, and the input is image data, so the multiplier is a numerical value reflecting the characteristics of the image. In addition, since the tap degeneration circuit can be configured so that an equivalent operation can be performed even if tap degeneration is performed, data substantially equivalent to the original performance can be obtained.
[Brief description of the drawings]
FIG. 1 is a block diagram of an embodiment of an image information conversion apparatus according to the present invention.
FIG. 2 is a schematic diagram for explaining the positional relationship between SD data and HD data.
FIG. 3 is a schematic diagram for explaining the positional relationship between SD data and HD data;
FIG. 4 is a schematic diagram for explaining data used for space class classification.
FIG. 5 is a schematic diagram for explaining data used for motion class classification;
FIG. 6 is a schematic diagram for explaining pixels used for estimation calculation;
FIG. 7 is a schematic diagram for explanation when a correction data table is created.
FIG. 8 is a flowchart of an example of tap degeneration according to the present invention.
FIG. 9 is a schematic diagram for explanation when a correction data table is created.
FIG. 10 is an example of a product-sum operation circuit.
FIG. 11 shows an embodiment of a product-sum operation circuit according to the present invention.
FIG. 12 is a circuit diagram of an example of a tap degeneration arithmetic circuit according to the present invention.
FIG. 13 is a circuit diagram of an example of a product-sum operation circuit according to the present invention.
FIG. 14 is a circuit diagram of an example of a product-sum operation circuit according to the present invention.
FIG. 15 is a circuit diagram of a conventional image information conversion apparatus.
FIG. 16 is a circuit diagram of a main part of a conventional image information conversion apparatus.
FIG. 17 is a block diagram of an example of an image information conversion apparatus in a conventional image conversion apparatus.
[Explanation of symbols]
2, 4, 9... Area extraction circuit, 3... ADRC circuit, 5... Motion class determination circuit, 6... Class code generation circuit, 7. Table, 10 ... tap degeneration circuit, 11 ... estimation operation circuit
Claims (7)
上記第1のディジタル画像信号から、上記第2のディジタル画像信号に含まれる推定しようとする画素の周辺の複数の画素を切り出す画素切り出し手段と、
上記画素切り出し手段により切り出された上記複数の画素のレベル分布のパターンに基づいて推定しようとする上記第2のディジタル画像信号が属するクラスを決定してクラス情報を出力するクラス決定手段と、
予め学習により上記クラス情報毎に求めた、上記第1のディジタル画像信号から切り出した複数の画素から上記第2のディジタル画像信号に含まれる画素を推定するための複数の係数データに対し、当該係数データを縮退させた縮退係数データを上記クラス情報毎に記憶する縮退係数データ記憶手段と、
上記クラス情報毎に、類似する上記係数データに対応する上記第1のディジタル画像信号の複数の画素のデータを加算することによって、上記第1のディジタル画像信号をより少ない複数の画素のデータに統合する画素数縮退手段と、
上記統合された第1のディジタル画像信号と上記クラス情報に応じた上記縮退係数データとによる推定式を用いて上記第2のディジタル画像信号に含まれる画素を推定する推定手段と、
からなることを特徴とする画像情報変換装置。In an image information conversion apparatus configured to convert a first digital image signal into a second digital image signal having a larger number of pixels,
Pixel cutout means for cutting out a plurality of pixels around the pixel to be estimated included in the second digital image signal from the first digital image signal;
Class determining means for determining a class to which the second digital image signal to be estimated belongs based on a level distribution pattern of the plurality of pixels cut out by the pixel cutting out means and outputting class information;
With respect to a plurality of coefficient data for estimating pixels included in the second digital image signal from a plurality of pixels cut out from the first digital image signal obtained in advance for each class information by learning, the coefficient Degeneration coefficient data storage means for storing degeneration coefficient data obtained by degenerating data for each class information;
For each of the class information integration, by adding the data of a plurality of pixels of the first digital image signal corresponding to the coefficient data similar, the first digital image signal to a lesser plurality of pixel data Means for reducing the number of pixels,
Estimating means for estimating a pixel included in the second digital image signal by using an estimation formula based on the integrated first digital image signal and the degeneration coefficient data corresponding to the class information;
An image information conversion apparatus comprising:
さらに、上記第1のディジタル画像信号からN個の画素のデータを出力するN個の画素レジスタを有し、
上記クラス決定手段によって制御される上記画素数縮退手段では、上記N個の画素を上記N個の画素より短いL個の画素へ統合し、
上記推定手段では、上記縮退係数データと上記L個の画素のデータとを用いて積和演算を実行するようにしたことを特徴とする画像情報変換装置。The image information conversion device according to claim 1,
And N pixel registers for outputting N pixel data from the first digital image signal,
In the pixel number reduction means controlled by the class determination means, the N pixels are integrated into L pixels shorter than the N pixels,
An image information conversion apparatus according to claim 1, wherein the estimation means performs a product-sum operation using the degeneration coefficient data and the data of the L pixels.
上記第1のディジタル画像信号から、上記第2のディジタル画像信号に含まれる推定しようとする画素の周辺の複数の画素を切り出すステップと、
切り出された上記複数の画素のレベル分布のパターンに基づいて推定しようとする上記第2のディジタル画像信号が属するクラスを決定してクラス情報を出力するステップと、
予め学習により上記クラス情報毎に求めた、上記第1のディジタル画像信号から切り出した複数の画素から上記第2のディジタル画像信号に含まれる画素を推定するための複数の係数データに対し、類似する係数データに対応する上記第1のディジタル画像信号の複数の画素のデータを演算することによって、上記第1のディジタル画像信号をより少ない複数の画素のデータに統合する統合ステップと、
上記係数データを縮退させた縮退係数データが上記クラス情報毎に記憶された係数記憶手段から上記クラス情報に対応した上記縮退係数データを読み出すステップと、
上記統合された第1のディジタル画像信号と読み出された上記縮退係数データとによる推定式を用いて上記第2のディジタル画像信号に含まれる画素を推定するステップと、
からなることを特徴とする画像情報変換方法。In an image information conversion method for converting a first digital image signal into a second digital image signal having a larger number of pixels,
Cutting out a plurality of pixels around the pixel to be estimated included in the second digital image signal from the first digital image signal;
Determining a class to which the second digital image signal to be estimated belongs based on a level distribution pattern of the plurality of extracted pixels, and outputting class information;
Similar to a plurality of coefficient data for estimating pixels included in the second digital image signal from a plurality of pixels cut out from the first digital image signal obtained in advance for each class information by learning. An integration step of integrating the first digital image signal into data of a plurality of pixels by calculating data of a plurality of pixels of the first digital image signal corresponding to coefficient data;
Reading the degenerate coefficient data corresponding to the class information from coefficient storage means in which degenerate coefficient data obtained by degenerating the coefficient data is stored for each class information;
Estimating a pixel included in the second digital image signal using the estimation equation according to the first digital image signal and read the degenerate coefficient data above integration,
An image information conversion method comprising:
上記統合ステップは、上記係数データのプラス/マイナスの符号からなる付加コードデータに従って、上記第1のディジタル画像信号の複数の画素のデータを加算するようになされていることを特徴とする画像情報変換方法。The image information conversion method according to claim 3,
The integration step is configured to add data of a plurality of pixels of the first digital image signal in accordance with additional code data composed of plus / minus signs of the coefficient data. Method.
上記付加コードデータは、
上記複数の画素のそれぞれに対応するn個(nは自然数)の係数データを絶対値化するステップと、
上記n個の係数データの平均値を算出するステップと、
上記n個の係数データの最大値を算出するステップと、
上記平均値、上記最大値および基準値からなる複数の値を第1のグループに設定するステップと、
絶対値化された上記n個の係数データのそれぞれを、上記第1のグループに設定された複数の値との差分値が最小となる値に分類し、上記第1のグループに設定された上記複数の値毎に分類された上記係数データの平均値を算出し、算出された上記平均値からなる複数の値を第2のグループに設定するステップと、
上記第2のグループに設定された上記複数の値の数が上記n個より小さい自然数のnn個に1加算したnn+1個か否かを判断するステップと、
上記第2のグループに設定された上記複数の値の数が上記nn+1個ではないと判断された場合、絶対値化された上記n個の係数データのそれぞれを、上記第2のグループに設定された複数の値との差分値が最小となる値に分類し、上記第2のグループに設定された上記複数の値毎に分類された上記係数データの平均値を算出し、算出された上記平均値と当該平均値を算出した上記第2のグループに設定された値との差分値が最大となる上記第2のグループに設定された値から算出された平均値に定数を加減算し、上記加減算によって得られた上記2つの値および上記定数を加減算した上記平均値を算出した上記第2のグループに設定された値を除く上記第2のグループの平均値からなる複数の値を第1のグループに再設定するステップと、
上記第2のグループに設定された上記複数の値の数が上記nn+1個であると判断された場合、上記第2のグループに設定された上記複数の値から上記基準値が取り除かれたnn個の複数の値がnn個の縮退係数データとして出力されるステップと
からなる処理に基づいて生成されることを特徴とする画像情報変換方法。The image information conversion method according to claim 4,
The additional code data is
Converting n (n is a natural number) coefficient data corresponding to each of the plurality of pixels into absolute values;
Calculating an average value of the n coefficient data;
Calculating a maximum value of the n coefficient data;
Setting a plurality of values consisting of the average value, the maximum value and the reference value in a first group;
Each of the n coefficient data converted into absolute values is classified into values having a minimum difference value from the plurality of values set in the first group, and the value set in the first group. Calculating an average value of the coefficient data classified for each of a plurality of values, and setting a plurality of values including the calculated average values to a second group;
Determining whether the number of the plurality of values set in the second group is nn + 1 obtained by adding 1 to nn which is a natural number smaller than the n;
When it is determined that the number of the plurality of values set in the second group is not the nn + 1, each of the n coefficient data converted into absolute values is set in the second group. The difference value with the plurality of values is classified into a minimum value, the average value of the coefficient data classified for each of the plurality of values set in the second group is calculated, and the calculated average A constant is added to or subtracted from the average value calculated from the value set in the second group that maximizes the difference value between the value and the value set in the second group from which the average value is calculated, and the addition or subtraction is performed. A plurality of values composed of the average value of the second group excluding the value set in the second group, which is obtained by calculating the average value obtained by adding and subtracting the two values obtained by the above-mentioned constant, and the first group. Step to reset to
When it is determined that the number of the plurality of values set in the second group is the nn + 1, nn that is obtained by removing the reference value from the plurality of values set in the second group A plurality of values is generated based on a process comprising a step of outputting as a plurality of degenerate coefficient data.
上記基準値は、上記第1のグループに設定された上記複数の値から上記第2のグループに設定された上記複数の値へ設定する場合、および上記第2のグループに設定された上記複数の値から上記第1のグループに設定された上記複数の値へ再設定する場合においても変更しないことを特徴とする画像情報変換方法。The image information conversion method according to claim 5,
The reference value is set from the plurality of values set in the first group to the plurality of values set in the second group, and the plurality of values set in the second group. An image information conversion method characterized by not changing even when resetting from a value to the plurality of values set in the first group.
上記基準値は、0とし、
上記0は、上記平均値を算出するとき、および/または定数を加減算するときに、変更されることがないことを特徴とする画像信号変換方法。The image information conversion method according to claim 5,
The reference value is 0,
The 0 is not changed when the average value is calculated and / or when a constant is added or subtracted.
Priority Applications (10)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP26370896A JP3890638B2 (en) | 1996-09-12 | 1996-09-12 | Image information conversion apparatus and method |
| US09/011,115 US6057885A (en) | 1996-05-30 | 1997-05-30 | Picture information converting apparatus and method thereof and sum-of-product calculating circuit and method thereof |
| DE69736257T DE69736257T2 (en) | 1996-05-30 | 1997-05-30 | Circuit and method for product sum calculation |
| PCT/JP1997/001852 WO1997046014A1 (en) | 1996-05-30 | 1997-05-30 | Device and method for converting image information and circuit and method for operating sum of products |
| EP04075276A EP1445949B1 (en) | 1996-05-30 | 1997-05-30 | Sum-of-product calculating circuit and method thereof |
| EP04075275A EP1420585B1 (en) | 1996-05-30 | 1997-05-30 | Picture information converting apparatus and method thereof |
| DE69731872T DE69731872T2 (en) | 1996-05-30 | 1997-05-30 | DEVICE AND METHOD FOR IMAGE INFORMATION CONVERSION |
| EP97924276A EP0843475B1 (en) | 1996-05-30 | 1997-05-30 | Picture information converting apparatus and method |
| DE69735968T DE69735968T2 (en) | 1996-05-30 | 1997-05-30 | Apparatus and method for image information conversion |
| KR10-1998-0700772A KR100478070B1 (en) | 1996-05-30 | 1997-05-30 | Image information converting apparatus and method and adaptation circuit and method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP26370896A JP3890638B2 (en) | 1996-09-12 | 1996-09-12 | Image information conversion apparatus and method |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH1093929A JPH1093929A (en) | 1998-04-10 |
| JP3890638B2 true JP3890638B2 (en) | 2007-03-07 |
Family
ID=17393225
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP26370896A Expired - Fee Related JP3890638B2 (en) | 1996-05-30 | 1996-09-12 | Image information conversion apparatus and method |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3890638B2 (en) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2017191750A1 (en) | 2016-05-02 | 2017-11-09 | ソニー株式会社 | Encoding device and encoding method, and decoding device and decoding method |
| WO2018173873A1 (en) | 2017-03-24 | 2018-09-27 | ソニー株式会社 | Coding device and coding method, and decoding device and decoding method |
Families Citing this family (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6151416A (en) * | 1999-02-12 | 2000-11-21 | Sony Corporation | Method and apparatus for adaptive class tap selection according to multiple classification |
| CN100356365C (en) * | 2002-05-06 | 2007-12-19 | 鸿富锦精密工业(深圳)有限公司 | System and method for automatically pasting data onto image files |
| US7738739B2 (en) * | 2006-01-26 | 2010-06-15 | Vestel Elektronik Sanayi Ve Ticaret A.S. | Method and apparatus for adjusting the resolution of a digital image |
| US8655108B2 (en) | 2007-09-19 | 2014-02-18 | Sharp Laboratories Of America, Inc. | Adaptive image up-scaling technique |
| CN108227487B (en) * | 2017-12-19 | 2020-12-29 | 广东工业大学 | Switching Friction Compensation Active Disturbance Rejection Control Method and Motion Platform Based on Predictive Model |
-
1996
- 1996-09-12 JP JP26370896A patent/JP3890638B2/en not_active Expired - Fee Related
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2017191750A1 (en) | 2016-05-02 | 2017-11-09 | ソニー株式会社 | Encoding device and encoding method, and decoding device and decoding method |
| US10645384B2 (en) | 2016-05-02 | 2020-05-05 | Sony Corporation | Encoding apparatus and encoding method as well as decoding apparatus and decoding method |
| WO2018173873A1 (en) | 2017-03-24 | 2018-09-27 | ソニー株式会社 | Coding device and coding method, and decoding device and decoding method |
Also Published As
| Publication number | Publication date |
|---|---|
| JPH1093929A (en) | 1998-04-10 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR100478070B1 (en) | Image information converting apparatus and method and adaptation circuit and method | |
| JP4517409B2 (en) | Data processing apparatus and data processing method | |
| JP3890638B2 (en) | Image information conversion apparatus and method | |
| JP3674186B2 (en) | Image information conversion apparatus and method | |
| JP3946781B2 (en) | Image information conversion apparatus and method | |
| JPH0795591A (en) | Digital image signal processor | |
| JP2001285881A (en) | Digital information conversion apparatus and method, and image information conversion apparatus and method | |
| JP3627291B2 (en) | Block distortion removing apparatus and method | |
| JP3723995B2 (en) | Image information conversion apparatus and method | |
| JP3400055B2 (en) | Image information conversion device, image information conversion method, image processing device, and image processing method | |
| JP4140091B2 (en) | Image information conversion apparatus and image information conversion method | |
| JP3724008B2 (en) | Image information conversion device and coefficient data creation device | |
| JP3826434B2 (en) | Signal conversion apparatus and method | |
| JP3326879B2 (en) | Image signal converter | |
| JP3767019B2 (en) | Product-sum operation circuit and method | |
| JP3653287B2 (en) | Image information conversion apparatus and image information conversion method | |
| JP4038881B2 (en) | Image signal conversion apparatus and conversion method, and coefficient data generation apparatus and generation method used therefor | |
| JP3800638B2 (en) | Image information conversion apparatus and method | |
| JP4001143B2 (en) | Coefficient generation apparatus and method | |
| JP3922286B2 (en) | Coefficient learning apparatus and method | |
| JP2000152226A (en) | Image encoding apparatus and method, image decoding apparatus and method, and providing medium | |
| JP3831955B2 (en) | Class classification adaptive processing apparatus and method | |
| JP4042121B2 (en) | Image information processing apparatus and image information processing method | |
| JP4099554B2 (en) | Image information conversion apparatus and image information conversion method | |
| JP2006121737A (en) | Multiply and accumulate circuit |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20041207 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050202 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050329 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050523 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060404 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060601 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20060627 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060817 |
|
| A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20060913 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20061114 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20061127 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091215 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101215 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111215 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121215 Year of fee payment: 6 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131215 Year of fee payment: 7 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| LAPS | Cancellation because of no payment of annual fees |