JP4131049B2 - Signal processing apparatus and signal processing method - Google Patents
Signal processing apparatus and signal processing method Download PDFInfo
- Publication number
- JP4131049B2 JP4131049B2 JP28562398A JP28562398A JP4131049B2 JP 4131049 B2 JP4131049 B2 JP 4131049B2 JP 28562398 A JP28562398 A JP 28562398A JP 28562398 A JP28562398 A JP 28562398A JP 4131049 B2 JP4131049 B2 JP 4131049B2
- Authority
- JP
- Japan
- Prior art keywords
- class
- prediction
- tap
- data
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Television Systems (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、予測係数生成方法及び信号処理装置に関し、特に、クラス分類してクラス毎に補間処理等を行う場合に用いられる予測係数を生成するための予測係数生成方法及び生成された予測係数を用いて処理を行う信号処理装置に関するものである。
【0002】
【従来の技術】
近年において、映像信号や音声信号の解像度あるいはサンプリング周波数等を向上させる技術が種々提案されている。例えば、標準あるいは低解像度に相当する標準テレビジョン信号から、高解像度のいわゆるHDTV信号にアップコンバージョンを行う場合や、サブサンプル補間を行う場合には、従来の線形補間による手法よりも、例えば特開平6−178277号公報や特開昭7−79418号公報に開示されるようなクラス分類を伴う変換処理を行う方が、性能的に良好な結果を得られることが知られている。
【0003】
このクラス分類を伴う変換処理とは、例えば、標準あるいは低解像度に相当する標準テレビジョン信号(SD信号)を高解像度の信号(HD信号)に変換する場合に、入力されたSD信号をクラス分類してクラスコードを発生し、このクラスコードを用いてクラス毎に予め設定されている予測係数を選んで上記入力SD信号を予測演算処理することにより、HD信号を得るものである。上記予測演算処理には例えば線形1次式が用いられる。
【0004】
上記クラス分類を伴う変換処理は、上述したようなSD信号からHD信号へのアップコンバージョン以外にも、映像信号の走査方式についてインターレース/プログレッシブ変換を行う場合や、走査線数を変換する場合や、ぼけた画像を鮮明な画像に変換する場合や、電子ズーム処理や、フレーム数変換処理(例えば1秒間に24フレームと30フレームとの間での変換)や、フォーマット変換処理等の種々の信号変換処理に適用して好ましい結果が得られている。
【0005】
【発明が解決しようとする課題】
ところで、上述したようなクラス分類を伴う変換処理により、例えば原信号の解像度を向上する場合に、ぼけの小さい部分の改善度に比べてぼけの大きい部分での改善度が低いということがある。このぼけの大きい部分の改善度を上げるには、クラス分類の際に予め画素を間引いておいたり、予測演算の際の予測タップの間隔を間引いて広くとることが考えられる。
【0006】
しかしながら、上記間引きを施すと、ぼけの小さい部分についての解像度向上が十分に行えなくなるという欠点がある。
【0007】
本発明は、上述したような実情に鑑みてなされたものであり、ぼけの小さい部分と大きい部分とを有する映像信号等のような入力信号に対して、それぞれの部分に最適な解像度向上等の変換処理を施すことができるような信号処理装置及び信号処理方法の提供を目的とする。
【0008】
【課題を解決するための手段】
本発明は、上述した課題を解決するために、入力信号の処理対象となる注目位置のデータ及びその周辺の複数データをクラスタップとし、該クラスタップからクラス分類情報を求めて上記入力信号をクラス分類するクラス分類手段と、上記クラス分類手段により分類されたクラスに応じてクラス毎に予め設定された予測係数を出力する予測係数出力手段と、上記入力信号の処理対象となる上記注目位置のデータ及びその周辺の複数データを予測タップとし、該予測タップを上記予測係数出力手段からの予測係数を用いて予測演算して目的とする出力信号のデータの予測値を出力する予測演算手段と、上記入力信号に応じて上記クラス分類手段への入力データ及び上記予測演算手段への入力データの各間引き間隔を制御する間引き制御手段とを有し、上記間引き制御手段は、予め設定された複数の間引き間隔毎に、間引かれたデータを補間したときの値と真値との誤差の絶対値和をアクティビティとして求める演算手段と、この演算手段により求められたアクティビティを上記間引き間隔が小さいものから順に所定の閾値と比較して該所定の閾値を初めて超えたときの間引き間隔を最適間引き率に決定する間引き率決定手段とを有する。
【0009】
上記間引き制御は、予め設定された複数の間引き間隔についての変化の度合いを表すアクティビティを求め、求められたアクティビティに基づき上記間引き間隔の最適のものを決定することが好ましい。
【0010】
また上記間引き制御は、上記間引き間隔が小さいものから順に上記アクティビティを求め、各間引き間隔毎のアクティビティが所定の閾値を初めて超えたときの間引き間隔を最適間引き率に決定することが好ましい。
【0011】
具体的には、上記クラス分類のためにクラスタップを生成し、上記予測演算のために予測タップを生成しており、これらのクラスタップ及び予測タップについての間引き率を制御する。
【0012】
入力信号の処理対象となる注目位置におけるクラスタップ及び予測タップの間隔を最適に間引いて、原入力信号のぼけの小さい部分では短いタップ間隔で、ぼけの大きい所では長いタップ間隔でそれぞれ処理を行う。
【0013】
【発明の実施の形態】
以下、本発明に係る実施の形態について図面を参照しながら説明する。
先ず、本発明に係る信号処理装置として、上述したクラス分類を伴う変換処理を行う信号変換装置の具体例を、図1を参照しながら説明する。この具体例では、特に、画像のSD信号をHD信号に解像度変換する画像情報変換装置を想定している。
【0014】
ところで、上述のクラス分類を伴う変換処理におけるクラス分類のためには、現在の処理対象となる注目位置のデータ及びその周辺の複数データが使用され、これらのデータは、フィルタのタップに対応することから、クラスタップと称される。また、上記予測演算処理についても、注目位置のデータ及びその周辺の複数データが使用され、これらのデータは予測フィルタのタップであることから、予測タップと称される。
【0015】
図1において、入力端子11には標準解像度のSD信号が供給され、間引き制御部20を介して、予測タップ生成回路12及びクラスタップ生成回路15に送られている。予測タップ生成回路12から出力される予測タップは、予測演算回路13に送られて予測演算される。また、クラスタップ生成回路15からのクラスタップは、クラス分類回路16に供給されてクラス分類が行われ、決定されたクラスのインデックスをアドレスとして予測係数ROM17がアクセスされて予測係数が読み出され、予測演算回路13に送られる。
【0016】
予測演算回路13は、推定演算回路あるいは補間値生成回路とも称され、クラス毎に適応的に選択されて予測係数ROM17から供給された予測係数を用いて、予測タップ生成回路12からの予測タップに基づいて予測演算を行うことで、入力されたSDデータに対するHDデータを算出するものである。予測演算回路13にて予測演算されることにより得られたHD信号は、出力端子14より取り出される。
【0017】
クラス分類回路16は、クラスタップ生成回路15からのクラスタップを、例えばADRC(適応型ダイナミックレンジ符号化)することによりクラス情報を出力する。このクラス分類回路16における適応型ダイナミックレンジ符号化とは、特開昭61−144989号公報等に開示されるように、本来ビデオ信号の高能率圧縮符号化のために開発されたものであるが、ビデオ信号のレベル分布のパターンを短い語長で効率的に表現できることから、このADRC符号化データに基づいてクラス分類のための情報を得ているものである。すなわち、ビデオ信号の符号化単位となるブロック内のダイナミックレンジDRは、当該ブロック内の最大値MAX及び最小値MINにより、
DR = MAX−MIN+1
と表せ、ブロック内の各画素データのレベルLをnビットに再量子化するときの再量子化コードQは、
Q =[(L−MIN+0.5)・2n/DR]
ただし、[ ]は切り捨て処理を意味する
となる。上記ブロック内の再量子化コードQを用いて、当該ブロックのビデオ信号をクラス分類するための情報を求める。
【0018】
このクラス情報は、クラスコードあるいはクラスのインデックスとして予測係数ROM17に送られ、クラスに応じた予測係数が読み出され、予測演算回路13に送られる。
【0019】
次に、間引き制御部20について説明する。
間引き制御部20は、入力信号の変化の程度、例えば変化がなだらかか否か、あるいは画像信号の場合のぼけ具合等に応じて、上記クラスタップや予測タップの間引き率を変化させるような適応的な制御を行うものである。具体的に、図1の間引き制御部20では、入力端子11からの上記SD信号がアクティビティ演算回路21に送られてアクティビティが演算され、間引き率決定回路22はこのアクティビティに応じて間引き率を決定する。決定された間引き率により、予測タップ生成回路12及びクラスタップ生成回路15のタップの間引き率が制御される。間引き制御部20の遅延回路23は、アクティビティ演算回路21及び間引き率決定回路22での処理時間だけ入力信号を遅延するものである。
【0020】
このような入力信号のアクティビティに基づく間引き率の制御について、図2〜図4を参照しながら説明する。ここでは、簡単のために、1次元のクラスタップ及び予測タップを用いて画像の解像度変換処理を行うものと仮定するが、2次元、3次元へも容易に拡張できることは勿論である。
【0021】
図2の(A)に示すように、入力画素が1次元方向にサンプリングされているものとし、現在処理の対象となる注目画素を中心として5個のクラスタップと13個の予測タップをとるものとする。注目画素の近傍に高域成分がある場合には、タップの間隔を詰めて解像度変換処理を行うと解像度向上の改善度が高いが、注目画素の近傍に高域成分が少なく、なだらかに変化している場合には、改善度が少ないことが分かっている。その場合、図2の(B)のように間引き間隔を開けて面積的に広い部分をカバーするようにタップをとることにより、解像度が向上する。この場合、入力画像信号のアクティビティと間引き率と改善度との間には最適な関係に着目し、本発明の実施の形態においては、入力画像信号のアクティビティを演算して求め、求められたアクティビティに基づいて、クラスタップ及び予測タップの間引き率を決定している。
【0022】
なお、図2の(A)、(B)中の斜線を施した画素が、入力画素から取り出されて次段に送られるクラスタップ及び予測タップを示し、(A)は高域成分が多いとき、(B)は高域成分が少ないときをそれぞれ示している。
【0023】
ここでアクティビティの具体例としては、図2の(A)のような密な(間引きなしの)1次元のクラスタップを基本とし、図2の(B)のような1以上の画素を間引いたクラスタップにおける補間誤差の絶対値和をアクティビティとみなしている。このようにして得られたアクティビティを所定の閾値thと比較することで、最適の間引き間隔を決定する。
【0024】
図3の(A)は、1次元の入力信号を、縦軸をレベル方向として示したものであり、1間引きでクラスタップをとる例を示している。間引きされた後に得られる5個のクラスタップの画素値をX1〜X5とし、これらのタップ間の間引かれる画素値をY1〜Y4とするとき、中央のX3 が注目画素である。このときのアクティビティ(すなわちこの実施の形態での補間誤差の絶対値和の平均)A1 は、
A1 = {Σ|Yi −(Xi−Xi+1)/2|}/4
ただし、1≦i≦4
の式で表される。
【0025】
また、図3の(B)は、同様に2間引きの場合の例を示したものである。この場合、5個のクラスタップ(画素値X1〜X5)に対して、タップ間毎にそれぞれ2個ずつの画素が間引かれ、これらを順にY1,Y2、Y3,Y4、Y5,Y6、Y7,Y8とする。この図3の(B)のときのアクティビティ(補間誤差の絶対値和の平均)A2 は、
A2 = {Σ|Y2i-1 −(2Xi+Xi+1)/3|+
|Y2i −(Xi+2Xi+1)/3| }/8
ただし、1≦i≦4
の式で表される。
【0026】
以下、同様にして、間引き間隔を増やしたときの補間誤差の絶対値和の平均値(A3、A4、・・・)を求めていく。なお、間引き無しのときは、アクティビティA0 として、
A0 = α{Σ|Xi−Xi+1|}/4
ただし、α<1,1≦i≦4
の式で示される隣接画素差分の絶対値和の平均値を用いる。
【0027】
以上のようにして求めたアクティビティをA0 から順次、所定の閾値thと比較し、閾値より初めて大きくなったときのアクティビティが示す間引き率を最適間引き率と決定する。
【0028】
これを論理式のように表すと、
if (A0 >th) 間引き無し
else if (A1 >th) 1間引き
else if (A2 >th) 2間引き
else if (A3 >th) 3間引き
else if (A4 >th) 4間引き
else if (A5 >th) 5間引き
・・・
となる。
【0029】
図4は、図1の間引き率決定回路22における、上記アクティビティに基づく間引き率の決定の手順を説明するためのフローチャートであり、8間引きまで行う場合の具体例を示している。
【0030】
この図4において、最初のステップS41では、上記隣接画素差分の絶対値和の平均値により求められたアクティビティA0 が、所定の閾値thよりも大きいか否かを判別している。YESのときにはステップS42に進み、間引き率決定回路22は間引き無しコードを発生して、図1の予測タップ生成回路12及びクラスタップ生成回路15に送っている。ステップS41でNOと判別されたときには、ステップS43に進み、上記1間引きのときの補間誤差の絶対値和の平均値として求められたアクティビティA1 が、所定の閾値thよりも大きいか否かを判別している。このステップS43で、YESと判別されたときにはステップS44に進んで1間引きコードを発生し、NOと判別されたときには次のステップS45に進んでいる。ステップS45では、上記2間引きのときのアクティビティA2 が、所定の閾値thよりも大きいか否かを判別し、YESと判別されたときにはステップS46に進んで2間引きコードを発生し、NOと判別されたときには次のステップに進んでいる。このような処理を以下同様に3間引き〜6間引きについて順次行い、6間引きのときのアクティビティA6 が所定の閾値th以下のときにはステップS47に進んで、上記7間引きのときのアクティビティA7 が所定の閾値thよりも大きいか否かを判別する。このステップS47で、YESと判別されたときにはステップS48に進んで7間引きコードを発生し、NOと判別されたときには次のステップS49に進んで8間引きコードを発生している。なお、上記間引き率決定回路22にて発生された上記1間引きコード〜8間引きコードは、図1の予測タップ生成回路12及びクラスタップ生成回路15に送られることは勿論である。
【0031】
次に、上記図1に示したクラス分類を伴う変換処理のクラス毎の予測係数を最小自乗法によって求めるための学習装置について、図5を参照しながら説明する。この具体例では、上記図1に示す信号処理装置として、標準あるいは低解像度の映像信号に相当する標準テレビジョン信号(SD信号)を、高解像度の映像信号であるいわゆるHDTV信号(HD信号)に変換する装置を想定し、このSD信号をHD信号に変換する変換装置に用いられる予測係数を求めるための学習を行うための学習装置を図5に示している。
【0032】
図5の入力端子51には、教師信号となる高解像度のHD信号が供給されており、このHD信号をダウンコンバータ52に送ってローパスフィルタリング処理やダウンサンプリング処理等を施すことにより、HD信号に対応する擬似的な標準解像度のSD信号を得ている。これらのHD信号及びSD信号は、正規方程式生成回路53に送られる。また、ダウンコンバータ52からのSD信号は、間引き制御部60を介し、予測タップ生成回路54及びクラスタップ生成回路55に送られている。
【0033】
間引き制御部60は、上記図1の間引き制御部20と同様な構成を有し、上記ダウンコンバートされたSD信号がアクティビティ演算回路61に送られてアクティビティが演算され、このアクティビティに基づいて間引き率決定回路62が予測タップ及びクラスタップの間引き率を決定している。また、遅延回路63は、アクティビティ演算回路61及び間引き率決定回路62での処理時間分だけ入力信号を遅延させている。これらのアクティビティ演算回路61、間引き率決定回路62及び遅延回路63は、図1のアクティビティ演算回路21、間引き率決定回路22及び遅延回路23にそれぞれ対応するものであり、動作は上述した図1の各部と同様であるため、説明を省略する。
【0034】
間引き制御部60の遅延回路63を介した上記SD信号が供給される予測タップ生成回路54及びクラスタップ生成回路55には、間引き制御部60の間引き率決定回路62からの間引き制御信号あるいは間引きコードが入力され、各タップの間引き間隔が制御されるようになっている。予測タップ生成回路54からの予測タップは、正規方程式生成回路53に送られ、クラスタップ生成回路55からのクラスタップはクラス分類回路56でクラス分類されて、クラス情報が正規方程式生成回路53に送られる。予測タップ生成回路54、クラスタップ生成回路55及びクラス分類回路56は、動作は上述した図1の各予測タップ生成回路12、クラスタップ生成回路15及びクラス分類回路16とそれぞれ同様であるため、説明を省略する。
【0035】
正規方程式生成回路53は、クラス毎にそれぞれ正規方程式を生成する回路であり、学習素材が入力し終わった後に得られた各クラス毎の正規方程式を連立方程式解法回路57に送り、各クラス毎に正規方程式から連立方程式を解いて各クラス毎の予測係数を求め、これらの各クラス毎の予測係数を予測係数メモリ58に記憶する。この予測係数メモリ58の記憶内容が、図1の予測係数ROM17に書き込まれて用いられる。
【0036】
以上説明したような本発明の実施の形態によれば、入力信号の処理対象となる注目位置におけるクラスタップ及び予測タップの間隔を最適に間引いて、原入力信号のぼけの小さい所では短いタップ間隔で、ぼけの大きい所では長いタップ間隔でそれぞれ処理を行うことにより、ぼけの小さい部分でも、ぼけの大きい部分でも、改善度の低下がなく、より一層の解像度の向上が図れる。
【0037】
なお、本発明は上述した実施の形態のみに限定されるものではなく、例えば、アクティビティ演算回路21、間引き率決定回路22及び遅延回路23は、ハードウェア的に表しているが、ソフトウェアにより実現できることは勿論である。また、標準解像度の映像信号(SD信号)を高解像度の映像信号(HD信号)に変換する場合のみに限定されず、所定解像度の映像信号を他の解像度の映像信号に変換する場合や、所定のサンプリング周波数あるいはサンプルビット数のオーディオ信号を、他のサンプリング周波数やサンプルビット数のオーディオ信号に変換する場合等にも適用できることは勿論である。
【0038】
【発明の効果】
本発明によれば、入力信号をクラス分類し、分類されたクラスに応じた予測係数予測係数を用いて予測演算して予測値を出力する際に、上記入力信号に応じて上記クラス分類及び上記予測演算の対象となるデータの各間引き間隔を制御することにより、入力信号の各部に応じた最適の間引き率での信号処理が行われ、より一層の品質向上が図れる。
【0039】
また、上記間引き制御として、予め設定された複数の間引き間隔についての変化の度合いを表すアクティビティを求め、上記間引き間隔が小さいものから順に上記アクティビティを求め、各間引き間隔毎のアクティビティが所定の閾値を初めて超えたときの間引き間隔を最適間引き率に決定することにより、最適な間引き間隔を合理的に求めることができる。
【0040】
また、上記クラス分類のためにクラスタップを生成し、上記予測演算のために予測タップを生成しており、これらのクラスタップ及び予測タップについての間引き率を制御し、入力信号の処理対象となる注目位置におけるクラスタップ及び予測タップの間隔を最適に間引いて、原入力信号のぼけの小さい部分では短いタップ間隔で、ぼけの大きい部分では長いタップ間隔でそれぞれ処理を行うことにより、ぼけの小さい部分でも、ぼけの大きい部分でも、改善度の低下がなく、より一層の品質向上が図れる。
【図面の簡単な説明】
【図1】本発明の実施の形態として、クラス分類を伴う変換処理を行う画像情報変換装置の一例を示すブロック図である。
【図2】入力信号から取り出されるクラスタップ及び予測タップについて、高域成分が多いときと少ないときとをそれぞれ示す図である。
【図3】入力信号から取り出されるクラスタップの信号変化について、1間引きのときと2間引きのときとをそれぞれ示す図である。
【図4】入力信号のアクティビティに基づく間引き率決定の手順を説明するためのフローチャートである。
【図5】本発明の実施の形態を説明するための、クラス分類を伴う変換処理の予測係数を求めるための学習装置の一例を示すブロック図である。
【符号の説明】
12 予測タップ生成回路、 13 予測演算回路、 15 クラスタップ生成回路、 16 クラス分類回路、 17 予測係数ROM、 20 間引き制御部、 21 アクティビティ演算回路、 22 間引き率決定回路[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a prediction coefficient generation method and a signal processing apparatus, and more particularly to a prediction coefficient generation method and a generated prediction coefficient for generating a prediction coefficient used when classifying and performing interpolation processing or the like for each class. The present invention relates to a signal processing apparatus that performs processing by using the signal processing apparatus.
[0002]
[Prior art]
In recent years, various techniques for improving the resolution or sampling frequency of video and audio signals have been proposed. For example, in the case of up-conversion from a standard television signal corresponding to standard or low resolution to a so-called HDTV signal of high resolution, or in the case of performing sub-sample interpolation, for example, Japanese Patent Laid-Open It is known that a better result can be obtained by performing the conversion process with classification as disclosed in JP-A-6-178277 and JP-A-7-79418.
[0003]
The conversion process accompanied by the class classification is, for example, when converting a standard television signal (SD signal) corresponding to a standard or low resolution into a high resolution signal (HD signal), and classifying the input SD signal into a class classification. Then, a class code is generated, and a prediction coefficient preset for each class is selected using this class code, and the input SD signal is subjected to a predictive calculation process to obtain an HD signal. For the prediction calculation process, for example, a linear linear expression is used.
[0004]
In addition to the up-conversion from the SD signal to the HD signal as described above, the conversion process with the above classification is performed when performing interlace / progressive conversion for the scanning method of the video signal, converting the number of scanning lines, Various signal conversions such as converting a blurred image into a clear image, electronic zoom processing, frame number conversion processing (for example, conversion between 24 and 30 frames per second), format conversion processing, etc. Favorable results have been obtained when applied to processing.
[0005]
[Problems to be solved by the invention]
By the way, in the case of improving the resolution of the original signal by the above-described conversion process with classification, for example, the degree of improvement in the portion with large blur may be lower than that in the portion with small blur. In order to increase the degree of improvement in the portion where the blur is large, it is conceivable that pixels are thinned out in advance during classification, or that the interval between prediction taps during prediction calculation is thinned out.
[0006]
However, when the above thinning is performed, there is a drawback that the resolution cannot be sufficiently improved for a portion with a small blur.
[0007]
The present invention has been made in view of the above-described circumstances. For an input signal such as a video signal having a small blur portion and a large blur portion, an optimal resolution improvement for each portion is performed. It is an object of the present invention to provide a signal processing apparatus and a signal processing method that can perform conversion processing.
[0008]
[Means for Solving the Problems]
In order to solve the above-described problem, the present invention uses the data of the target position to be processed of the input signal and a plurality of data around it as a class tap, obtains class classification information from the class tap, and classifies the input signal as a class. Class classification means for classifying, prediction coefficient output means for outputting a prediction coefficient preset for each class according to the class classified by the class classification means, and data on the target position to be processed by the input signal And a plurality of data around it as a prediction tap, a prediction calculation means for predicting and calculating the prediction tap using a prediction coefficient from the prediction coefficient output means, and outputting a prediction value of the data of the target output signal; and in response to an input signal and a decimation control means for controlling each sampling interval of the input data to the input data and the prediction calculation means to said classification means The thinning-out control means includes an arithmetic means for obtaining, as an activity, an absolute value sum of errors between a value obtained by interpolating the thinned data and a true value at a plurality of preset thinning intervals, The activity obtained by the means is compared with a predetermined threshold value in order from the smallest thinning interval, and the thinning rate determining unit determines the thinning interval as the optimum thinning rate when the predetermined threshold value is exceeded for the first time .
[0009]
In the thinning control, it is preferable to obtain an activity representing the degree of change for a plurality of preset thinning intervals, and to determine the optimum thinning interval based on the obtained activity.
[0010]
In the thinning-out control, it is preferable that the activities are obtained in order starting from the smallest thinning-out interval, and the thinning-out interval when the activity for each thinning-out interval exceeds a predetermined threshold for the first time is determined as the optimum thinning-out rate.
[0011]
Specifically, class taps are generated for the class classification, prediction taps are generated for the prediction calculation, and the thinning rate for these class taps and prediction taps is controlled.
[0012]
Optimal thinning of the class tap and prediction tap intervals at the target position where the input signal is to be processed, and processing is performed with a short tap interval when the blur of the original input signal is small and with a long tap interval when the blur is large .
[0013]
DETAILED DESCRIPTION OF THE INVENTION
Embodiments according to the present invention will be described below with reference to the drawings.
First, as a signal processing apparatus according to the present invention, a specific example of a signal conversion apparatus that performs the conversion process with the above-described class classification will be described with reference to FIG. In this specific example, an image information conversion device that converts the resolution of an image SD signal into an HD signal is assumed.
[0014]
By the way, for the class classification in the conversion process with the class classification described above, the data of the current position to be processed and a plurality of data around it are used, and these data correspond to the taps of the filter. Therefore, it is called a class tap. The prediction calculation process is also referred to as a prediction tap because it uses the data of the position of interest and a plurality of data around it, and these data are taps of the prediction filter.
[0015]
In FIG. 1, a standard resolution SD signal is supplied to the
[0016]
The
[0017]
The
DR = MAX-MIN + 1
The requantization code Q when the level L of each pixel data in the block is requantized to n bits is
Q = [(L−MIN + 0.5) · 2 n / DR]
However, [] means truncation processing. Information for classifying the video signal of the block is obtained using the requantization code Q in the block.
[0018]
This class information is sent to the
[0019]
Next, the thinning
The thinning
[0020]
The control of the thinning rate based on the activity of the input signal will be described with reference to FIGS. Here, for the sake of simplicity, it is assumed that the resolution conversion processing of an image is performed using a one-dimensional class tap and a prediction tap, but it goes without saying that it can be easily extended to two dimensions and three dimensions.
[0021]
As shown in FIG. 2A, it is assumed that the input pixel is sampled in a one-dimensional direction and takes five class taps and 13 prediction taps around the target pixel to be processed. And If there is a high frequency component in the vicinity of the target pixel, resolution improvement processing with a narrow tap interval will improve resolution, but there will be little high frequency component in the vicinity of the target pixel and it will change smoothly. If so, it is known that there is little improvement. In that case, the resolution is improved by taking a tap so as to cover a wide area with a thinning interval as shown in FIG. In this case, paying attention to the optimum relationship among the activity of the input image signal, the thinning rate, and the improvement level, in the embodiment of the present invention, the activity of the input image signal is obtained by calculation. Based on the above, the thinning rate of the class tap and the prediction tap is determined.
[0022]
2A and 2B, the hatched pixels indicate class taps and prediction taps that are extracted from the input pixels and sent to the next stage, and FIG. 2A is when there are many high-frequency components. , (B) respectively show a case where the high frequency component is small.
[0023]
Here, a specific example of the activity is based on a dense (without thinning) one-dimensional class tap as shown in FIG. 2A, and one or more pixels as shown in FIG. 2B are thinned out. The sum of absolute values of interpolation errors in class taps is regarded as activity. The optimum thinning-out interval is determined by comparing the activity thus obtained with a predetermined threshold th.
[0024]
FIG. 3A shows a one-dimensional input signal with the vertical axis as the level direction, and shows an example in which class taps are taken by one decimation. When the pixel values of the five class taps obtained after the thinning are X 1 to X 5 and the pixel values thinned between these taps are Y 1 to Y 4 , the center X 3 is the target pixel. is there. The activity at this time (that is, the average of the sum of absolute values of interpolation errors in this embodiment) A 1 is
A 1 = {Σ | Y i − (X i −X i + 1 ) / 2 |} / 4
However, 1 ≦ i ≦ 4
It is expressed by the following formula.
[0025]
FIG. 3B shows an example in the case of two thinning out similarly. In this case, for the five class taps (pixel values X 1 to X 5 ), two pixels are thinned out between the taps, and these are sequentially assigned to Y 1 , Y 2 , Y 3 , Y 4. , Y 5 , Y 6 , Y 7 , Y 8 . The activity (average of the sum of absolute values of interpolation errors) A 2 at (B) in FIG.
A 2 = {Σ | Y 2i-1 − (2X i + X i + 1 ) / 3 | +
| Y 2i − (X i + 2X i + 1 ) / 3 |} / 8
However, 1 ≦ i ≦ 4
It is expressed by the following formula.
[0026]
In the same manner, the average value (A 3 , A 4 ,...) Of the sum of absolute values of interpolation errors when the thinning interval is increased is obtained. When there is no decimation, the activity A 0 is
A 0 = α {Σ | X i −X i + 1 |} / 4
However, α <1, 1 ≦ i ≦ 4
The average value of the sum of absolute values of adjacent pixel differences expressed by the following equation is used.
[0027]
The activities obtained as described above are sequentially compared with the predetermined threshold th from A 0 , and the thinning rate indicated by the activity when it becomes larger than the threshold for the first time is determined as the optimum thinning rate.
[0028]
If this is expressed as a logical expression,
if (A 0 > th) No decimation
else if (A 1 > th) 1 decimation
else if (A 2 > th) 2 decimation
else if (A 3 > th) 3 decimation
else if (A 4 > th) 4 thinning
else if (A 5 > th) 5 decimation
It becomes.
[0029]
FIG. 4 is a flowchart for explaining the procedure for determining the thinning rate based on the activity in the thinning
[0030]
In FIG. 4, in the first step S41, it is determined whether or not the activity A 0 obtained by the average value of the absolute value sum of the adjacent pixel differences is larger than a predetermined threshold th. If YES, the process proceeds to step S42, where the thinning
[0031]
Next, a learning apparatus for obtaining the prediction coefficient for each class of the conversion process with class classification shown in FIG. 1 by the least square method will be described with reference to FIG. In this specific example, as the signal processing apparatus shown in FIG. 1, a standard television signal (SD signal) corresponding to a standard or low resolution video signal is converted into a so-called HDTV signal (HD signal) which is a high resolution video signal. FIG. 5 shows a learning apparatus for performing learning for obtaining a prediction coefficient used in a conversion apparatus that converts this SD signal into an HD signal, assuming a conversion apparatus.
[0032]
The
[0033]
The thinning
[0034]
The prediction
[0035]
The normal
[0036]
According to the embodiment of the present invention as described above, the interval between the class tap and the prediction tap at the target position to be processed of the input signal is optimally thinned, and a short tap interval at a place where the blur of the original input signal is small. Thus, by performing the processing at a long tap interval in a place where the blur is large, there is no decrease in the degree of improvement in a portion where the blur is large or a portion where the blur is large, and the resolution can be further improved.
[0037]
The present invention is not limited to the above-described embodiment. For example, the
[0038]
【The invention's effect】
According to the present invention, when the input signal is classified, and the prediction calculation is performed using the prediction coefficient prediction coefficient corresponding to the classified class and the prediction value is output, the classification and the classification are performed according to the input signal. By controlling each thinning interval of the data to be subjected to the prediction calculation, signal processing is performed at an optimum thinning rate corresponding to each part of the input signal, and the quality can be further improved.
[0039]
In addition, as the thinning control, an activity indicating the degree of change in a plurality of preset thinning intervals is obtained, the activities are obtained in order from the smallest thinning intervals, and the activity for each thinning interval has a predetermined threshold value. By determining the thinning interval when it exceeds the first time as the optimum thinning rate, the optimal thinning interval can be reasonably obtained.
[0040]
Further, class taps are generated for the class classification, and prediction taps are generated for the prediction calculation. The decimation rate for these class taps and prediction taps is controlled, and the input signal is processed. By optimizing the interval between the class tap and the prediction tap at the target position, processing is performed with a short tap interval in a portion where the blur of the original input signal is small, and a long tap interval in a portion where the blur is large. However, even in the part where the blur is large, the improvement degree does not decrease and the quality can be further improved.
[Brief description of the drawings]
FIG. 1 is a block diagram illustrating an example of an image information conversion apparatus that performs conversion processing with class classification as an embodiment of the present invention.
FIG. 2 is a diagram showing when a high frequency component is large and when a class tap and a prediction tap extracted from an input signal are large.
FIGS. 3A and 3B are diagrams showing a signal change of a class tap taken out from an input signal, when thinning out one time and when thinning out two times, respectively;
FIG. 4 is a flowchart for explaining a procedure for determining a thinning rate based on an activity of an input signal.
FIG. 5 is a block diagram showing an example of a learning apparatus for obtaining a prediction coefficient of conversion processing with class classification for explaining an embodiment of the present invention.
[Explanation of symbols]
12 prediction tap generation circuit, 13 prediction calculation circuit, 15 class tap generation circuit, 16 class classification circuit, 17 prediction coefficient ROM, 20 decimation control unit, 21 activity calculation circuit, 22 decimation rate determination circuit
Claims (7)
上記クラス分類手段により分類されたクラスに応じてクラス毎に予め設定された予測係数を出力する予測係数出力手段と、
上記入力信号の処理対象となる上記注目位置のデータ及びその周辺の複数データを予測タップとし、該予測タップを上記予測係数出力手段からの予測係数を用いて予測演算して目的とする出力信号のデータの予測値を出力する予測演算手段と、
上記入力信号に応じて上記クラス分類手段への入力データ及び上記予測演算手段への入力データの各間引き間隔を制御する間引き制御手段とを有し、
上記間引き制御手段は、
予め設定された複数の間引き間隔毎に、間引かれたデータを補間したときの値と真値との誤差の絶対値和をアクティビティとして求める演算手段と、
この演算手段により求められたアクティビティを上記間引き間隔が小さいものから順に所定の閾値と比較して該所定の閾値を初めて超えたときの間引き間隔を最適間引き率に決定する間引き率決定手段とを有する信号処理装置。Class classification means for classifying the input signal by obtaining class classification information from the data of the target position to be processed of the input signal and a plurality of data around it as class tap ,
Prediction coefficient output means for outputting a prediction coefficient preset for each class according to the class classified by the class classification means;
The target position data to be processed of the input signal and a plurality of data around it are set as prediction taps, and the prediction tap is predicted using the prediction coefficient from the prediction coefficient output means, and the target output signal is output. A prediction calculation means for outputting a predicted value of the data ;
In response to the input signal have a and decimation control means for controlling each sampling interval of the input data to the input data and the prediction calculation means to said classification means,
The decimation control means is
An arithmetic means for obtaining, as an activity, an absolute value sum of errors between a value obtained by interpolating the thinned data and a true value for each of a plurality of preset thinning intervals;
A decimation rate determination unit that compares the activity obtained by the calculation unit with a predetermined threshold value in order from the smallest decimation interval and determines the decimation interval when the predetermined threshold value is exceeded for the first time as an optimum decimation rate. Signal processing device.
上記クラス分類工程により分類されたクラスに応じてクラス毎に予め設定された予測係数を出力する予測係数出力工程と、
上記入力信号の処理対象となる上記注目位置のデータ及びその周辺の複数データを予測タップとし、該予測タップを上記予測係数出力工程からの予測係数を用いて予測演算して目的とする出力信号のデータの予測値を出力する予測演算工程と、
上記入力信号に応じて上記クラス分類工程への入力データ及び上記予測演算工程への入力データの各間引き間隔を制御する間引き制御工程とを有し、
上記間引き制御工程は、
予め設定された複数の間引き間隔毎に、間引かれたデータを補間したときの値と真値との誤差の絶対値和をアクティビティとして求める演算工程と、
この演算工程により求められたアクティビティを上記間引き間隔が小さいものから順に所定の閾値と比較して該所定の閾値を初めて超えたときの間引き間隔を最適間引き率に決定する間引き率決定工程とを有する信号処理方法。 A class classification step for classifying the input signal by obtaining class classification information from the data of the target position to be processed of the input signal and a plurality of data around the class tap, and class classification information from the class tap ;
A prediction coefficient output step for outputting a prediction coefficient preset for each class according to the class classified by the class classification step ;
The target position data to be processed of the input signal and a plurality of data around it are set as prediction taps, and the prediction tap is predicted using the prediction coefficient from the prediction coefficient output step, and the target output signal A prediction calculation step for outputting a predicted value of the data;
A decimation control step for controlling each decimation interval of the input data to the class classification step and the input data to the prediction calculation step according to the input signal ,
The decimation control step is
A calculation step for obtaining, as an activity, an absolute value sum of errors between a value obtained by interpolating the thinned data and a true value for each of a plurality of preset thinning intervals,
A decimation rate determination step of determining the decimation interval as the optimum decimation rate when the activity obtained by this calculation step is compared with a predetermined threshold in order from the one with the smallest decimation interval and the predetermined threshold is exceeded for the first time Signal processing method.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP28562398A JP4131049B2 (en) | 1998-10-07 | 1998-10-07 | Signal processing apparatus and signal processing method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP28562398A JP4131049B2 (en) | 1998-10-07 | 1998-10-07 | Signal processing apparatus and signal processing method |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2000115721A JP2000115721A (en) | 2000-04-21 |
| JP4131049B2 true JP4131049B2 (en) | 2008-08-13 |
Family
ID=17693937
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP28562398A Expired - Fee Related JP4131049B2 (en) | 1998-10-07 | 1998-10-07 | Signal processing apparatus and signal processing method |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4131049B2 (en) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US12002432B2 (en) | 2020-05-29 | 2024-06-04 | Nichia Corporation | Information processing method, information processing program, information processing device, and image display device |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP4066146B2 (en) | 2002-04-26 | 2008-03-26 | ソニー株式会社 | Data conversion device, data conversion method, learning device, learning method, program, and recording medium |
-
1998
- 1998-10-07 JP JP28562398A patent/JP4131049B2/en not_active Expired - Fee Related
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US12002432B2 (en) | 2020-05-29 | 2024-06-04 | Nichia Corporation | Information processing method, information processing program, information processing device, and image display device |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2000115721A (en) | 2000-04-21 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5666164A (en) | Image signal converting apparatus | |
| JPH07162848A (en) | Digital image signal processor | |
| JP3794505B2 (en) | Signal conversion apparatus and signal conversion method | |
| JPH1175180A (en) | Image processing apparatus and image processing method, and transmission medium and transmission method | |
| JPH06351002A (en) | Motion signal detection method and video signal processing apparatus using the same | |
| JP3321915B2 (en) | Image signal converter | |
| JP4168490B2 (en) | Motion determination device, method and image information conversion device | |
| JPH0795591A (en) | Digital image signal processor | |
| JP4131049B2 (en) | Signal processing apparatus and signal processing method | |
| JP3671469B2 (en) | Prediction coefficient learning method and signal conversion apparatus and method | |
| JP3362463B2 (en) | Frame interpolation device | |
| JP3693187B2 (en) | Signal conversion apparatus and signal conversion method | |
| JP3326879B2 (en) | Image signal converter | |
| JPH0851622A (en) | Digital image signal processor | |
| JPH07193789A (en) | Image information conversion device | |
| JP4352298B2 (en) | Arithmetic device, conversion device, and method thereof | |
| JP3480015B2 (en) | Apparatus and method for generating image data | |
| JPH0851598A (en) | Image information conversion device | |
| JP3669522B2 (en) | Signal conversion device, signal conversion method, coefficient learning device, and coefficient learning method | |
| JP3587188B2 (en) | Digital image signal processing apparatus and processing method | |
| JP3918759B2 (en) | Image data generation apparatus and generation method | |
| JP4164912B2 (en) | Signal processing apparatus and signal processing method | |
| JP4126629B2 (en) | Video signal processing apparatus and video signal processing method | |
| JPH08317347A (en) | Image information conversion device | |
| JP4310847B2 (en) | Image information conversion apparatus and conversion method |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050831 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A132 Effective date: 20080205 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080407 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080430 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080513 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110606 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110606 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110606 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120606 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120606 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130606 Year of fee payment: 5 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| LAPS | Cancellation because of no payment of annual fees |