JP4144091B2 - Image processing apparatus and method - Google Patents
Image processing apparatus and method Download PDFInfo
- Publication number
- JP4144091B2 JP4144091B2 JP00157699A JP157699A JP4144091B2 JP 4144091 B2 JP4144091 B2 JP 4144091B2 JP 00157699 A JP00157699 A JP 00157699A JP 157699 A JP157699 A JP 157699A JP 4144091 B2 JP4144091 B2 JP 4144091B2
- Authority
- JP
- Japan
- Prior art keywords
- class
- plane
- pixels
- pixel
- prediction coefficient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Image Processing (AREA)
- Picture Signal Circuits (AREA)
- Facsimile Image Signal Circuits (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は画像処理装置および方法に関し、特に、画像データ内の時間方向に存在するノイズを除去するのに用いて好適な画像処理装置および方法に関する。
【0002】
【従来の技術】
従来、画像データのノイズ成分を除去するのに、画像の動き検出を行い、充分に静止していると判断された部分(画素群)に対して、時間方向のフィルタリング処理を行うようにしていた。
【0003】
【発明が解決しようとする課題】
しかしながら、上述したノイズ成分の除去処理では、ノイズ成分が重畳されると正しい動き検出ができなくなり、その結果、正しいノイズ成分の除去ができなくなるといった課題があった。
【0004】
また、上述したノイズ成分の除去処理では、充分に静止していると判断された画像領域に対しては、ノイズ成分が抑制されるが、動画領域に対してもノイズ成分を抑制しようとした場合、一様な(構造的に固定あるいは主たる画像の属性に因らない)空間内での平滑化によりノイズ除去処理を行うため(変化のある部分をノイズとして除去するため)、主たる画像の空間解像度の劣化を伴ってしまうという課題があった。
【0005】
本発明はこのような状況に鑑みてなされたものであり、所定の枚数のフィールド内で、信号レベルが同一であると判断される平面を推定し、その推定された平面で、傾きが0となる一方向を判定し、その方向でノイズが除去されるように適応処理を行うようにして、空間解像度の劣化を抑制するものである。
【0006】
【課題を解決するための手段】
本発明の画像処理装置は、注目画素が中央に位置する基準フィールドを含み、基準フィールドの時間的に前または後に位置する所定枚数のフィールドから構成される画素データをブロック化するブロック化手段と、ブロック化手段によりブロック化された画素データを所定の式に代入し、レベル値が同一であると判断される平面を推定する平面推定手段と、平面推定手段により推定された平面式に、クラス毎に設定されている複数の画素の座標値を代入し、最小値と最大値との差をとることによりクラス毎のダイナミックレンジを算出する算出手段と、クラス毎に設定されている予測係数を記憶する記憶手段と、算出手段により算出されたダイナミックレンジの最小値をもつクラスに対応する予測係数を記憶手段から読み出す読み出し手段と、読み出し手段により読み出された予測係数と所定の画素からなる予測タップとを用いて適応処理を行う適応処理手段と、を備え、平面推定手段の所定の式は、注目画素の座標を(水平x,垂直y,時間z)=(0,0,0)としてブロック内の他の画素の座標を表現し、信号レベルをr、残差をe、係数をc1乃至c4としたとき、
r+e=c1・x+c2・y+c3・z+c4
と表され、平面推定手段は、最小自乗法により、残差eが最小となるような平面を推定する。
【0007】
本発明の画像処理方法は、注目画素が中央に位置する基準フィールドを含み、基準フィールドの時間的に前または後に位置する所定枚数のフィールドから構成される画素データをブロック化するブロック化ステップと、ブロック化ステップでブロック化された画素データを所定の式に代入し、レベル値が同一であると判断される平面を推定する平面推定ステップと、平面推定ステップで推定された平面式に、クラス毎に設定されている複数の画素の座標値を代入し、最小値と最大値との差をとることによりクラス毎のダイナミックレンジを算出する算出ステップと、クラス毎に設定されている予測係数を記憶する記憶ステップと、算出ステップで算出されたダイナミックレンジの最小値をもつクラスに対応する予測係数を記憶ステップから読み出す読み出しステップと、読み出しステップで読み出された予測係数と所定の画素からなる予測タップとを用いて適応処理を行う適応処理ステップと、を備え、平面推定ステップの所定の式は、注目画素の座標を(水平x,垂直y,時間z)=(0,0,0)としてブロック内の他の画素の座標を表現し、信号レベルをr、残差をe、係数をc1乃至c4としたとき、
r+e=c1・x+c2・y+c3・z+c4
と表され、平面推定ステップの処理は、最小自乗法により、残差eが最小となるような平面を推定する。
【0009】
本発明の画像処理装置および方法においては、所定枚数のフィールドから構成されるブロックの画素データが所定の式に代入され、レベル値が同一であると判断される平面が推定され、その推定された平面の平面式に、クラス毎に設定されている複数の画素の座標値が代入され、最小値と最大値との差をとることによりクラス毎のダイナミックレンジが算出され、ダイナミックレンジの最小値をもつクラスに対応する予測係数と所定の画素からなる予測タップとが用いられて適応処理が行なわれる。また、平面が推定されるときの所定の式は、注目画素の座標を(水平x,垂直y,時間z)=(0,0,0)としてブロック内の他の画素の座標を表現し、信号レベルをr、残差をe、係数をc1乃至c4としたとき、
r+e=c1・x+c2・y+c3・z+c4
と表され、最小自乗法により、残差eが最小となるような平面が推定される。
【0010】
【発明の実施の形態】
以下に本発明の実施の形態を説明するが、特許請求の範囲に記載の発明の各手段と以下の実施の形態との対応関係を明らかにするために、各手段の後の括弧内に、対応する実施の形態(但し一例)を付加して本発明の特徴を記述すると、次のようになる。但し勿論この記載は、各手段を記載したものに限定することを意味するものではない。
【0011】
請求項1に記載の画像処理装置は、注目画素が中央に位置する基準フィールドを含み、基準フィールドの時間的に前または後に位置する所定枚数のフィールドから構成される画素データをブロック化するブロック化手段(例えば、図1のブロック構成部1)と、ブロック化手段によりブロック化された画素データを所定の式に代入し、レベル値が同一であると判断される平面を推定する平面推定手段(例えば、図2のステップS3)と、平面推定手段により推定された平面式に、クラス毎に設定されている複数の画素の座標値を代入し、最小値と最大値との差をとることによりクラス毎のダイナミックレンジを算出する算出手段(例えば、図2のステップS4)と、クラス毎に設定されている予測係数を記憶する記憶手段(例えば、図1の予測係数ROM6)と、算出手段により算出されたダイナミックレンジの最小値をもつクラスに対応する予測係数を記憶手段から読み出す読み出し手段(例えば、図2のステップS5)と、読み出し手段により読み出された予測係数と所定の画素からなる予測タップとを用いて適応処理を行う適応処理手段(例えば、図2のステップS6)とを備えることを特徴とする。
【0012】
図1は、本発明を適用した画像処理装置の一実施の形態の構成を示すブロック図である。入力SD(Standard Definition)信号は、ブロック構成部1を介してFIFO(First In First Out)などで構成される信号遅延部2に供給される。信号遅延部2に入力されたSD信号は、必要に応じブロック構成部1にブロック化されて読み出され、平面推定部3に出力される。平面推定部3から出力された信号は、定常性方向評価部4に出力される。
【0013】
定常性方向評価部4から出力された信号は、予測タップ構成部5と予測係数ROM(Random Access Memory)6に出力される。予測処理部7は、予測タップ構成部5から出力された信号を、予測係数ROM6に記憶されている予測係数により、所定の処理を施し、処理後のSD信号として出力する。
【0014】
次に、画像処理装置の動作を図2のフローチャートを参照して説明する。ステップS1において、SD信号(例えば8ビットPCM(Pulse Code Modulation)の輝度信号)が、ブロック構成部1を介して信号遅延部2に入力され、記憶される。ステップS2において、ブロック構成部1は、信号遅延部2に記憶されている所定量のSD信号(画像データ)を読み出す。その読み出される所定量のデータは、図3(A)に示したように、5枚の第1フィールド(例えば、奇数フィールド)と4枚の第2フィールド(例えば、偶数フィールド)から構成される合計9フィールド分のデータのうちの、各フィールドの所定の領域のデータである。簡単のため、この例では、図3(B)に示すように、第1フィールドの領域は45(=9×5)画素から構成され、第2フィールドの領域は36(=9×4)画素から構成されているものとする。従って、信号遅延部2から読み出される9フィールド分の領域の総画素数は369画素となる。この369画素からなる9フィールドを、以下、適宜、局所的時空間ブロックと記述する。
【0015】
換言すると、局所的時空間ブロックは、処理対象とされた注目画素が領域の中央に位置する基準フィールドを含み、その基準フィールドの時間的に前または後に位置する4フィールドの合計9フィールドから構成される。また、基準フィールドの領域は、水平方向に9画素、垂直方向に5画素から構成されるフィールドである。基準フィールドの時間軸方向の座標値を0としたとき、基準フィールドより時間的に前に存在するフィールドの時間軸方向の座標値(時刻)はマイナスで表され、基準フィールドより時間的に後に存在するフィールドの時間軸方向の座標値(時刻)はプラスで表される。従って、時間軸方向の座標値(時刻)は、−4乃至4まで変化する。また、注目画素の時空間座標を以下のように示して、この座標を原点とし、他の画素の座標を表現する。
(水平、垂直、時刻)=(x,y,z)=(0,0,0)
【0016】
ブロック構成部1は、信号遅延部2から1つの局所的時空間ブロックのデータを一括して読み出し、平面推定部3に出力する。平面推定部3は、入力された局所的時空間ブロックの全画素データを次式(1)に代入する。
rn+e=c1・xn+c2・yn+c3・zn+c4 ・・・(1)
式(1)において、rnはノイズ画像(入力SD画像)における時空間座標(水平、垂直、時刻)が(xn,yn,zn)の画素データの輝度信号値であり、eは残差、(xn,yn,zn)は時空間ブロック内のn番目の画素の水平、垂直、時刻の注目画素を原点とする座標値であり、c1乃至c4は係数である。
【0017】
平面推定部3は、入力された局所的時空間ブロックの画素データの輝度信号値rnと、その画素データの座標値(xn,yn,zn)を、式(1)に代入し、次式(2)に示す残差eの自乗和が最小となるように、係数c1乃至c4を求める。
【式1】
【0018】
なお、式(2)における値mは図3(A)の例の場合、368となる。求められた係数をc1’乃至c4’とするとき、式(3)に示す平面式が生成される。
r=c1’・x+c2’・y+c3’・z+c4’ ・・・(3)
【0019】
このようにして、平面推定部3により求められた係数c1’乃至c4’を用いて表される式(3)により生成される平面が推定平面とされる。この推定平面の一例が図4に示されている。図4において示された推定平面は、式(3)により生成される平面であり、局所的時空間ブロック内に実際に存在する画素により生成される平面、換言すれば、推定平面上に局所的時空間ブロックの画素が乗っている平面とは限らない。さらに換言すると、推定平面は、信号レベル(輝度値)がほぼ同一であると判断される画素が存在するであろう位置に存在する平面である。
【0020】
図4に示したような推定平面が推定される場合、すなわち、垂直方向と水平方向からなる面の水平方向においては、左側から右側にかけて垂直座標値が下がり、時間方向においては、水平と垂直の座標値共に変化がない平面が推定される場合、図中右上側から左下側にかけて、徐々に輝度値が下がる、或いは上がる(グラデーションがかかっているような)画像が、9フィールド分の時刻の間、変化なく表示されていることになる。
【0021】
なお、図4に示した推定平面は、等レベル面を表現しているものであり、信号のレベルそのものを表現しているものではなく、信号のレベル値の等高線のようなものとして示してある。
【0022】
図4に示したような推定平面が推定される他の例としては、先の空間方向に関し徐々に輝度値が変化するものの他、階段上に急峻に変化する場合など、推定平面と直交する方向に何らかの輝度値変化を呈するような画像である。
【0023】
次に、定常性方向評価部4は、このようにして、平面推定部3により求められた係数c1’乃至c4’を用いて表される推定平面に含まれ、少なくとも1次元方向に関し、傾斜が0の方向(定常方向)を求める。求められる傾斜0の方向は、1次元または2次元の関数、例えば、f(x)やf(x,y)で表現される直線式となる。求められる定常方向は、上述した輝度値をそのままプロットしたときに、階段状になる画像の場合、その階段のステップの方向、換言すれば、階段を上り下りする方向と直交する方向となる。
【0024】
定常性方向評価部4は、定常方向を求めるとともに、クラス分類も行う。換言すると、クラスに基づく定常方向を判定する。すなわち、予め複数のクラスと、各クラスに分類される為の条件が定められており、どのクラスに分類されるかにより定常性が判断される。各クラスに分類される為の条件としては、9フィールドに含まれる369画素の内の所定の5画素の存在位置による。
【0025】
この場合、総クラス数は、369C5個のクラスとなる。しかしながら、369C5個のクラスは膨大な組み合わせ数になるため実用的ではない。そこで、図5に示したように、5枚の第1フィールドの所定の21画素(以下、適宜、選択候補画素と記述する)から5画素を用いてクラス数を考えると、21C5=20349個のクラスとなり、取り扱いやすいクラス数になる。さらに、注目画素を必ず含むという条件を付加することにより、選択候補画素の20画素から4画素を選択することになるので、20C4=4845個のクラスとなり、より取り扱いやすいクラス数となる。
【0026】
図5に示した例では、基準フィールド内の選択候補画素の17画素は、注目画素を含む縦横斜め方向に関する全ての方向において、5画素が選択できるように配置されている。そして、基準フィールドの前後のフィールドでは、注目画素と時間軸の座標値のみが異なる4点、換言すれば、注目画素と垂直方向と水平方向の座標値が同じ4点が選択候補画素とされている。
【0027】
なお、図5の例においては、第1フィールドに存在する画素のみを用いているが、第2フィールドに存在する画素を選択候補画素として用いても良いし、21画素以上の画素を選択候補画素としても良い。すなわち、選択候補画素としては、9フィールド内の全ての画素である396画素とすることが一番良いが、上述したように実用的ではないので、実用的な数で、なるべく多くの画素を選択候補画素とすることが望ましい。
【0028】
注目画素を含む21画素の選択候補画素を用いてクラスを作成すると、4845個のクラスが作成できる。図6に、4845個のクラスのうち、クラス0とクラス4844(一番最初と最後のクラス)、並びに特徴的なクラスであるクラス152とクラス2088が例として示されている。クラス番号の付け方は、スキャン順に基づいている。例えば、クラス0は、選択候補画素の21画素のうち、最初にスキャンされる座標値(0,0,−4)の画素、その次にスキャンされる座標値(0,0,−2)の画素、さらにその次にスキャンされる座標値(−4,−4,0)の画素、そして、その次にスキャンされる座標値(0,−4,0)の画素、および座標値(0,0,0)の注目画素の合計5画素である。
【0029】
同様にして、スキャン順に基づいてクラス番号を付けることにより、クラス0乃至4844が生成される。クラス152は、例えば静止画などのように、定常方向が時間軸方向に最も定常性が得られる画像が分類されるクラスである。クラス2088は、例えば、白地に斜めに1本の線が引いてあるような画像のように、同一フィールド内の斜め方向に最も定常性が得られる画像が分類されるクラスである。
【0030】
定常性方向評価部4は、まず平面推定部3により求められた推定平面の式(3)に、順次、クラス0乃至4844内の5画素の座標値を代入し、その5画素毎に算出される値rの最小値と最大値の差(ダイナミックレンジ)をとる。そして、クラス毎に得られたダイナミックレンジのうち、最小のダイナミックレンジを有するクラスを、処理している局所的時空間ブロックの分類クラスとする。ただし、このようして定常性方向評価部4において算出される値rは、輝度値を意味するものではなく、単にダイナミックレンジを算出するための値として用いられている。
【0031】
詳細に説明するに、まず、クラス0の5画素の座標値、すなわち、(0,0,−4),(0,0,−2),(−4,−4,0),(0,−4,0),(0,0,0)を、順次、式(3)に代入することにより、5つの値rが得られる。得られた5つの値rの最小値と最大値の差を取ることにより、クラス0のダイナミックレンジが得られる。同様の処理をクラス1乃至4844に対しても行うことにより、合計4845個のダイナミックレンジが得られる。これら4845個のダイナミックレンジのうち、最小のダイナミックレンジを有するクラスを、処理している画素のクラス(以下、分類クラスと称する)として決定する。仮に、ダイナミックレンジが0であるクラスが存在する場合、そのクラスの5画素は、式(3)で表される推定平面上に存在することを意味する。
【0032】
このようにして、求められた分類クラスは、予測タップ構成部5と予測係数ROM6に供給される。ステップS5において、予測タップ構成部5は、供給された分類クラスに対応する予測タップの画素データを、信号遅延部2から読み出し、予測処理部7に出力する。また、予測係数ROM6は、供給された分類クラスに対応する予測係数を予測処理部7に出力する。予測タップとしては、図6に示したように、定常方向を判断するのに用いたクラス毎に設定された5画素が用いられる。従って、予測タップ構成部5が信号遅延部2から読み出す画素データは、分類クラスの5画素の座標値に対応する位置に存在する画素データ(輝度値)である。
【0033】
予測処理部7は、ステップS6において、供給された予測係数と画素データを用いて適応処理し、処理後の画素データを出力する。なお、適応処理とは、注目画素のクラスに対応した予測係数と予測タップの画素データを用いて後述する式(4)に示す線形1次結合モデルの演算を行う処理のことである。
【0034】
上述したように、画像処理装置においては、入力SD画像が、クラス毎に、予め予測係数ROM6に記憶された予測係数を用いて適応処理される。ここで、予測係数ROM6に記憶される予測係数を生成する予測係数学習装置について説明する。
【0035】
図7は、予測係数学習装置の構成を示すブロック図である。そのブロック構成部21、信号遅延部22、平面推定部23、定常性方向評価部24、および予測タップ構成部25は、図1の対応する名称の、ブロック構成部1、信号遅延部2、平面推定部3、定常性方向評価部4、および予測タップ構成部5と同様の機能を有するものであり、その説明は適宜省略する。
【0036】
予測係数学習装置に入力されたSD信号は、上述したように、ブロック構成部21、信号遅延部22、平面推定部23、および定常性方向評価部24によりクラス分類される。分類クラスに対して、予測係数学習部26により、予測係数が算出される。以下、予測係数学習部26により行われる予測係数の算出について説明する。
【0037】
いま、注目画素の画素データyの予測値E[y]を、その注目画素と空間的または時間的に近接する位置にある画素(注目画素を含む)の入力データx1,x2,x3,・・・と、所定の予測係数w1,w2,w3,・・・の線形結合により規定される線形1次結合モデルにより求める場合、予測値E[y]は、次式で表すことができる。
E[y]=w1x1+w2x2+w3x3+・・・・・・(4)
【0038】
式(4)を一般化した例として、予測係数wの集合でなる行列W、入力データxでなる行列X、および予測値E[y]の集合でなる行列Yを、
【数2】
と定義すると、次式(5)のような観測方程式が成立する。
観測方程式:XW=Y ・・・(5)
【0039】
そして、この観測方程式に最小自乗法を適用して注目画素の画素データyに近い予測値E[y]を求めることを考える。この場合、教師データとなる注目画素の真の画素データyの集合でなる行列Y’、および画素データyに対する予測値E[y]の残差eの集合でなる行列Eを、
【数3】
で定義すると、式(5)から次式のような残差方程式(6)が成立する。
残差方程式:XW=Y+E ・・・(6)
【0040】
なお、教師データとは、参照SD画像のことであり、入力SD信号と同一内容であるが、ノイズ成分のない非ノイズ画像である。
【0041】
画素データyに近い予測値E[y]を求めるための予測係数wiは、自乗誤差
【数4】
を最小にすることで求めることができる。従って、この自乗誤差を予測係数wiで微分したものが0になる場合の予測係数wi、すなわち、次式(7)を満たす予測係数wiが、画素データyに近い予測値E[y]を求めるための最適値ということになる。
【数5】
【0042】
そこで、まず、式(6)を微分することにより次式(8)が成立する。
【数6】
【0043】
式(7)と式(8)より次式(9)が得られる。
【数7】
【0044】
さらに、式(6)の残差方程式における学習データx、予測係数w、教師データの画素データy、および残差eの関係を考慮すると、式(9)から、次のような正規方程式(10)を得ることができる。
【0045】
【数8】
【0046】
式(10)の正規方程式は、求めるべき予想係数wの数と同じ数だけたてることができるので、式(10)を解くことで、最適な予測係数wを求めることができる。なお、式(10)を解くにあたっては、例えば、掃き出し法(Gauss-Jordanの消去法)などを適用することが可能である。
【0047】
このようにして求められた予測係数wは、クラス(予測タップ)と関連付けられて予測係数ROM6(図1)に記憶される。予測処理部7は、上述したようにして求めれれた予約係数ROM6に記憶されている予約係数wを用いて、式(4)に示した線形1次結合モデルにより、注目画素に対しての適応処理を行う。
【0048】
このようにして算出された予測係数の一例を図8に示す。図8には、クラス152とクラス2088の予測係数を示している。このような予測係数wと予測タップに対応する画素データyを、式(4)に代入することにより、ノイズが除去された画素データを得ることが可能となる。
【0049】
本実施の形態においては、レベル値が等しいと判断された定常方向に関し、クラス分類適応処理を用いたので、動画にも静止画にも最適なノイズの除去が可能となる。
【0050】
上述した説明においては、ノイズ除去に関して本発明を適用したが、動き検出にも適用することが可能である。すなわち、本発明は、クラス分類する際に、レベル値が等しいと判断される平面を推定し、さらに定常方向を判定する。このことは、例えば、定常方向が時間方向に関して、右上方向である場合、その画像の被写体は、右上の方向に移動していると判断することが可能であることを示している。
【0051】
従って、分類クラスにより、被写体の動き方向を検出する事が可能である。本実施の形態を動き検出に用いた場合、ノイズがのった画像に対しても、ノイズののった状態のデータを用いて定常方向を判定できるので、ノイズの影響を受け難い動き検出が可能となる。
【0052】
本明細書中において、上記処理を実行するコンピュータプログラムをユーザに提供する提供媒体には、磁気ディスク、CD-ROMなどの情報記録媒体の他、インターネット、デジタル衛星などのネットワークによる伝送媒体も含まれる。
【0053】
【発明の効果】
以上の如く本発明によれば、動画にも静止画にも適したノイズ成分の除去を行うことが可能となる。
【図面の簡単な説明】
【図1】本発明を適用して画像処理装置の一実施の形態の構成を示すブロック図である。
【図2】 図1に示した画像処理装置の動作を説明するフローチャートである。
【図3】時空間ブロックを説明する図である。
【図4】推定平面を説明する図である。
【図5】選択候補画素を説明する図である。
【図6】クラスと予測タップの一例を示す図である。
【図7】予測係数学習装置の構成を示すブロック図である。
【図8】クラスと予測係数の一例を示す図である。
【符号の説明】
1 ブロック構成部, 2 信号遅延部, 3 平面推定部, 4 定常性方向評価部, 5 予測タップ構成部, 6 予測係数ROM, 7 予測処理部,26 予測係数学習部[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an image processing apparatus and method, in particular, it relates to a suitable image processing apparatus and method used to remove the noise present in the time direction in the image data.
[0002]
[Prior art]
Conventionally, in order to remove noise components of image data, image motion detection is performed, and filtering in the time direction is performed on a portion (pixel group) that is determined to be sufficiently stationary. .
[0003]
[Problems to be solved by the invention]
However, the noise component removal process described above has a problem that correct motion detection cannot be performed when the noise components are superimposed, and as a result, correct noise components cannot be removed.
[0004]
In addition, the noise component removal process described above suppresses noise components for image areas that are determined to be sufficiently stationary, but attempts to suppress noise components for moving image areas as well. To perform noise removal processing by smoothing in a uniform space (regardless of structurally fixed or main image attribute) (to remove the changed part as noise), the spatial resolution of the main image There was a problem that it was accompanied by deterioration.
[0005]
The present invention has been made in view of such a situation, and in a predetermined number of fields, a plane that is determined to have the same signal level is estimated, and the estimated plane has an inclination of 0. One direction is determined, and adaptive processing is performed so that noise is removed in that direction, thereby suppressing the degradation of the spatial resolution.
[0006]
[Means for Solving the Problems]
An image processing apparatus according to the present invention includes a reference unit that includes a reference field in which a pixel of interest is located in the center, and blocks pixel data including a predetermined number of fields positioned before or after the reference field in time, By substituting the pixel data blocked by the blocking means into a predetermined expression, the plane estimation means for estimating the plane that is determined to have the same level value, and the plane expression estimated by the plane estimation means Substituting the coordinate values of a plurality of pixels set in, and calculating the dynamic range for each class by taking the difference between the minimum value and the maximum value, and storing the prediction coefficient set for each class Storage means for reading out, and reading means for reading out the prediction coefficient corresponding to the class having the minimum value of the dynamic range calculated by the calculation means from the storage means; And a adaptive processing means for performing adaptive processing using the prediction taps formed of the prediction coefficient and predetermined pixels read by the reading means, a predetermined equation of the plane estimating means, the coordinates of the pixel of interest (horizontal x , Vertical y, time z) = (0, 0, 0), the coordinates of other pixels in the block are expressed, the signal level is r, the residual is e, and the coefficients are c1 to c4.
r + e = c1 * x + c2 * y + c3 * z + c4
The plane estimation means estimates a plane that minimizes the residual e by the method of least squares .
[0007]
The image processing method of the present invention includes a reference step in which a pixel of interest is located in the center, and a blocking step for blocking pixel data composed of a predetermined number of fields located before or after the reference field, By substituting the pixel data blocked in the blocking step into a predetermined formula, the plane estimation step for estimating the plane that is determined to have the same level value, and the plane formula estimated in the plane estimation step Substituting the coordinate values of a plurality of pixels set in, and calculating the dynamic range for each class by taking the difference between the minimum and maximum values, and storing the prediction coefficient set for each class And the prediction coefficient corresponding to the class having the minimum value of the dynamic range calculated in the calculation step is read from the storage step. A reading step of issuing an adaptive processing step of performing adaptive processing using the prediction taps formed of the prediction coefficient and predetermined pixels read by the reading step, with a predetermined equation of the plane estimating step, the pixel of interest Coordinates are (horizontal x, vertical y, time z) = (0, 0, 0), the coordinates of other pixels in the block are expressed, signal level is r, residual is e, and coefficients are c1 to c4. When
r + e = c1 * x + c2 * y + c3 * z + c4
In the plane estimation step, the plane that minimizes the residual e is estimated by the method of least squares.
[0009]
In the image processing apparatus and method of the present invention , pixel data of a block composed of a predetermined number of fields is substituted into a predetermined formula, and a plane on which the level values are determined to be the same is estimated, and the estimated The coordinate value of multiple pixels set for each class is assigned to the plane formula of the plane, and the dynamic range for each class is calculated by taking the difference between the minimum and maximum values. The adaptive processing is performed using the prediction coefficient corresponding to the class to be held and the prediction tap made up of predetermined pixels. Further, the predetermined formula when the plane is estimated represents the coordinates of the other pixels in the block with the coordinates of the pixel of interest as (horizontal x, vertical y, time z) = (0, 0, 0), When the signal level is r, the residual is e, and the coefficients are c1 to c4,
r + e = c1 * x + c2 * y + c3 * z + c4
The plane that minimizes the residual e is estimated by the method of least squares.
[0010]
DETAILED DESCRIPTION OF THE INVENTION
Embodiments of the present invention will be described below, but in order to clarify the correspondence between each means of the invention described in the claims and the following embodiments, in parentheses after each means, The features of the present invention will be described with the corresponding embodiment (however, an example) added. However, of course, this description does not mean that each means is limited to the description.
[0011]
The image processing apparatus according to
[0012]
FIG. 1 is a block diagram showing a configuration of an embodiment of an image processing apparatus to which the present invention is applied. An input SD (Standard Definition) signal is supplied to a
[0013]
The signal output from the stationarity
[0014]
Next, the operation of the image processing apparatus will be described with reference to the flowchart of FIG. In step S1, an SD signal (for example, an 8-bit PCM (Pulse Code Modulation) luminance signal) is input to the
[0015]
In other words, the local spatio-temporal block includes a reference field in which the target pixel to be processed is located in the center of the region, and is composed of a total of nine fields of four fields located before or after the reference field in time. The The reference field region is a field composed of 9 pixels in the horizontal direction and 5 pixels in the vertical direction. When the coordinate value in the time axis direction of the reference field is set to 0, the coordinate value (time) in the time axis direction of the field that exists in time before the reference field is expressed as minus and exists in time after the reference field. The coordinate value (time) in the time axis direction of the field to be displayed is represented by plus. Accordingly, the coordinate value (time) in the time axis direction changes from −4 to 4. The spatio-temporal coordinates of the pixel of interest are shown as follows, and the coordinates of other pixels are expressed using this coordinate as the origin.
(Horizontal, vertical, time) = (x, y, z) = (0, 0, 0)
[0016]
The
r n + e =
In the formula (1), r n is the luminance signal value of the pixel data of the space-time coordinates (horizontal, vertical, time) (x n, y n, z n) in the noise image (input SD image), e is The residual, (x n , y n , z n ) is a coordinate value with the target pixel of the horizontal, vertical, and time of the nth pixel in the spatiotemporal block as the origin, and c1 to c4 are coefficients.
[0017]
The
[Formula 1]
[0018]
Note that the value m in Expression (2) is 368 in the example of FIG. When the obtained coefficients are c1 ′ to c4 ′, a plane expression shown in Expression (3) is generated.
r = c1 ′ · x + c2 ′ · y + c3 ′ · z + c4 ′ (3)
[0019]
In this way, the plane generated by the equation (3) expressed using the coefficients c1 ′ to c4 ′ obtained by the
[0020]
When the estimation plane as shown in FIG. 4 is estimated, that is, in the horizontal direction of the surface composed of the vertical direction and the horizontal direction, the vertical coordinate value decreases from the left side to the right side, and in the time direction, the horizontal and vertical directions When a plane with no change in coordinate values is estimated, an image whose luminance value gradually decreases or rises (like gradation) from the upper right side to the lower left side in the figure during the time of 9 fields It will be displayed without change.
[0021]
Note that the estimation plane shown in FIG. 4 represents an isolevel plane, and does not represent a signal level itself, but is represented as a contour line of a signal level value. .
[0022]
As another example in which the estimation plane as shown in FIG. 4 is estimated, a direction perpendicular to the estimation plane is used, such as a case where the luminance value gradually changes with respect to the previous spatial direction or a steep change on the stairs. Is an image that exhibits some luminance value change.
[0023]
Next, the stationarity
[0024]
The stationarity
[0025]
In this case, the total number of classes is 369 C 5 classes. However, the 369 C 5 class is not practical because of the huge number of combinations. Therefore, as shown in FIG. 5, when considering the number of classes using 5 pixels from predetermined 21 pixels (hereinafter, referred to as selection candidate pixels as appropriate) of the 5 first fields, 21 C 5 = 20349 The number of classes is easy to handle. Further, by adding a condition that the target pixel is necessarily included, four pixels are selected from 20 selection candidate pixels, so that 20 C 4 = 4845 classes, which is a more easily handled class number.
[0026]
In the example shown in FIG. 5, 17 selection candidate pixels in the reference field are arranged so that 5 pixels can be selected in all directions related to the vertical and horizontal diagonal directions including the target pixel. In the fields before and after the reference field, four points that differ only in the coordinate value of the target pixel from the time axis, in other words, four points that have the same vertical and horizontal coordinate values as the target pixel are selected candidate pixels. Yes.
[0027]
In the example of FIG. 5, only the pixels existing in the first field are used. However, the pixels existing in the second field may be used as selection candidate pixels, or pixels of 21 pixels or more are selected. It is also good. In other words, it is best to select 396 pixels, which are all the pixels in the nine fields, as the selection candidate pixels, but since it is not practical as described above, select as many pixels as possible with a practical number. It is desirable to use candidate pixels.
[0028]
If a class is created using 21 selection candidate pixels including the target pixel, 4845 classes can be created. In FIG. 6, among the 4845 classes,
[0029]
Similarly,
[0030]
The stationarity
[0031]
To describe in detail, first, coordinate values of five pixels of
[0032]
In this way, the obtained classification class is supplied to the prediction
[0033]
In step S6, the prediction processing unit 7 performs an adaptive process using the supplied prediction coefficient and pixel data, and outputs the processed pixel data. Note that the adaptive processing is processing for performing a linear first combination model calculation represented by Expression (4), which will be described later, using a prediction coefficient corresponding to a class of a pixel of interest and pixel data of a prediction tap.
[0034]
As described above, in the image processing apparatus, the input SD image is adaptively processed for each class using the prediction coefficient stored in the
[0035]
FIG. 7 is a block diagram illustrating a configuration of the prediction coefficient learning apparatus. The
[0036]
As described above, the SD signals input to the prediction coefficient learning device are classified into classes by the
[0037]
Now, the predicted value E [y] of the pixel data y of the pixel of interest is converted into the input data x1, x2, x3,... Of the pixels (including the pixel of interest) located spatially or temporally close to the pixel of interest. .., And a linear primary combination model defined by a linear combination of predetermined prediction coefficients w1, w2, w3,..., The prediction value E [y] can be expressed by the following equation.
E [y] = w1x1 + w2x2 + w3x3 + (4)
[0038]
As an example of generalizing Equation (4), a matrix W composed of a set of prediction coefficients w, a matrix X composed of input data x, and a matrix Y composed of a set of predicted values E [y]
[Expression 2]
Then, an observation equation such as the following equation (5) is established.
Observation equation: XW = Y (5)
[0039]
Then, it is considered to apply the least square method to this observation equation to obtain a predicted value E [y] close to the pixel data y of the target pixel. In this case, a matrix Y ′ composed of a set of true pixel data y of the target pixel serving as teacher data and a matrix E composed of a set of residuals e of predicted values E [y] for the pixel data y are
[Equation 3]
Is defined from equation (5), the following residual equation (6) is established.
Residual equation: XW = Y + E (6)
[0040]
The teacher data is a reference SD image, which is a non-noise image having the same content as the input SD signal but having no noise component.
[0041]
The prediction coefficient w i for obtaining the predicted value E [y] close to the pixel data y is a square error ## EQU4 ##
Can be obtained by minimizing. Accordingly, the prediction coefficient w i when the square error is differentiated by the prediction coefficient w i , that is, the prediction coefficient w i satisfying the following equation (7) is the predicted value E [y ] Is the optimum value for obtaining the above.
[Equation 5]
[0042]
Therefore, first, the following formula (8) is established by differentiating the formula (6).
[Formula 6]
[0043]
The following equation (9) is obtained from the equations (7) and (8).
[Expression 7]
[0044]
Further, considering the relationship among the learning data x, the prediction coefficient w, the pixel data y of the teacher data, and the residual e in the residual equation of Equation (6), from Equation (9), the following normal equation (10 ) Can be obtained.
[0045]
[Equation 8]
[0046]
Since the normal equation of Expression (10) can be formed by the same number as the number of prediction coefficients w to be obtained, the optimal prediction coefficient w can be obtained by solving Expression (10). In solving equation (10), for example, a sweep-out method (Gauss-Jordan elimination method) or the like can be applied.
[0047]
The prediction coefficient w thus obtained is stored in the prediction coefficient ROM 6 (FIG. 1) in association with the class (prediction tap). The prediction processing unit 7 uses the reservation coefficient w stored in the
[0048]
An example of the prediction coefficient calculated in this way is shown in FIG. FIG. 8 shows prediction coefficients of class 152 and class 2088. By substituting the prediction coefficient w and the pixel data y corresponding to the prediction tap into Equation (4), it is possible to obtain pixel data from which noise has been removed.
[0049]
In the present embodiment, since the class classification adaptive processing is used for the steady direction in which the level values are determined to be equal, it is possible to remove noise that is optimal for both moving images and still images.
[0050]
In the above description, the present invention is applied to noise removal, but it can also be applied to motion detection. That is, according to the present invention, when classifying, a plane that is determined to have the same level value is estimated, and a steady direction is further determined. This indicates that, for example, when the steady direction is the upper right direction with respect to the time direction, it is possible to determine that the subject of the image is moving in the upper right direction.
[0051]
Therefore, it is possible to detect the movement direction of the subject by the classification class. When this embodiment is used for motion detection, a steady direction can be determined using noise-added data even for a noise-added image, so that motion detection that is less susceptible to noise can be performed. It becomes possible.
[0052]
In this specification, the medium for providing a computer program for executing the above processing to the user includes not only an information recording medium such as a magnetic disk and a CD-ROM, but also a transmission medium via a network such as the Internet and a digital satellite. .
[0053]
【The invention's effect】
As described above , according to the present invention, it is possible to remove noise components suitable for both moving images and still images.
[Brief description of the drawings]
FIG. 1 is a block diagram illustrating a configuration of an embodiment of an image processing apparatus to which the present invention is applied.
FIG. 2 is a flowchart for explaining the operation of the image processing apparatus shown in FIG.
FIG. 3 is a diagram illustrating a spatiotemporal block.
FIG. 4 is a diagram illustrating an estimation plane.
FIG. 5 is a diagram illustrating selection candidate pixels.
FIG. 6 is a diagram illustrating an example of a class and a prediction tap.
FIG. 7 is a block diagram illustrating a configuration of a prediction coefficient learning device.
FIG. 8 is a diagram illustrating an example of a class and a prediction coefficient.
[Explanation of symbols]
1 block configuration unit, 2 signal delay unit, 3 plane estimation unit, 4 stationarity direction evaluation unit, 5 prediction tap configuration unit, 6 prediction coefficient ROM, 7 prediction processing unit, 26 prediction coefficient learning unit
Claims (4)
前記ブロック化手段によりブロック化された画素データを所定の式に代入し、レベル値が同一であると判断される平面を推定する平面推定手段と、
前記平面推定手段により推定された平面式に、クラス毎に設定されている複数の画素の座標値を代入し、最小値と最大値との差をとることによりクラス毎のダイナミックレンジを算出する算出手段と、
前記クラス毎に設定されている予測係数を記憶する記憶手段と、
前記算出手段により算出されたダイナミックレンジの最小値をもつクラスに対応する予測係数を前記記憶手段から読み出す読み出し手段と、
前記読み出し手段により読み出された前記予測係数と所定の画素からなる予測タップとを用いて適応処理を行う適応処理手段と、
を備え、
前記平面推定手段の所定の式は、
前記注目画素の座標を(水平x,垂直y,時間z)=(0,0,0)として前記ブロック内の他の画素の座標を表現し、信号レベルをr、残差をe、係数をc1乃至c4としたとき、
r+e=c1・x+c2・y+c3・z+c4
と表され、前記平面推定手段は、最小自乗法により、前記残差eが最小となるような平面を推定する
画像処理装置。Blocking means for blocking pixel data including a reference field in which a pixel of interest is located in the center and composed of a predetermined number of fields positioned before or after the reference field in time,
Plane estimation means for substituting the pixel data blocked by the blocking means into a predetermined formula and estimating a plane determined to have the same level value;
A calculation that calculates the dynamic range for each class by substituting the coordinate values of a plurality of pixels set for each class into the plane equation estimated by the plane estimation means and taking the difference between the minimum value and the maximum value. Means,
Storage means for storing a prediction coefficient set for each class;
Reading means for reading out the prediction coefficient corresponding to the class having the minimum value of the dynamic range calculated by the calculating means from the storage means;
Adaptive processing means for performing adaptive processing using the prediction coefficient read by the reading means and a prediction tap comprising predetermined pixels ;
With
The predetermined formula of the plane estimation means is
The coordinates of the pixel of interest are (horizontal x, vertical y, time z) = (0, 0, 0), the coordinates of other pixels in the block are expressed, the signal level is r, the residual is e, and the coefficient is When c1 to c4,
r + e = c1 * x + c2 * y + c3 * z + c4
The plane estimation means estimates the plane that minimizes the residual e by the method of least squares .
請求項1に記載の画像処理装置。The image processing apparatus according to claim 1, wherein the adaptive processing unit calculates data from which noise of the pixel of interest has been removed by linear linear combination of the prediction tap and the prediction coefficient.
請求項1に記載の画像処理装置。The image processing apparatus according to claim 1, wherein a motion of an image displayed by the pixel data is detected from a class having a minimum value of a dynamic range calculated by the calculation unit.
前記ブロック化ステップでブロック化された画素データを所定の式に代入し、レベル値が同一であると判断される平面を推定する平面推定ステップと、
前記平面推定ステップで推定された平面式に、クラス毎に設定されている複数の画素の座標値を代入し、最小値と最大値との差をとることによりクラス毎のダイナミックレンジを算出する算出ステップと、
前記クラス毎に設定されている予測係数を記憶する記憶ステップと、
前記算出ステップで算出されたダイナミックレンジの最小値をもつクラスに対応する予測係数を前記記憶ステップから読み出す読み出しステップと、
前記読み出しステップで読み出された前記予測係数と所定の画素からなる予測タップとを用いて適応処理を行う適応処理ステップと、
を備え、
前記平面推定ステップの所定の式は、
前記注目画素の座標を(水平x,垂直y,時間z)=(0,0,0)として前記ブロック内の他の画素の座標を表現し、信号レベルをr、残差をe、係数をc1乃至c4としたとき、
r+e=c1・x+c2・y+c3・z+c4
と表され、前記平面推定ステップの処理は、最小自乗法により、前記残差eが最小となるような平面を推定する
画像処理方法。A blocking step for blocking pixel data including a reference field in which a pixel of interest is located at the center, and a predetermined number of fields positioned before or after the reference field in time;
A plane estimation step for substituting the pixel data blocked in the blocking step into a predetermined formula and estimating a plane determined to have the same level value;
A calculation that calculates the dynamic range for each class by substituting the coordinate values of a plurality of pixels set for each class into the plane equation estimated in the plane estimation step and taking the difference between the minimum value and the maximum value. Steps,
Storing a prediction coefficient set for each class;
A reading step of reading out the prediction coefficient corresponding to the class having the minimum value of the dynamic range calculated in the calculation step from the storage step;
An adaptive processing step for performing adaptive processing using the prediction coefficient read in the reading step and a prediction tap composed of predetermined pixels ;
With
The predetermined expression of the plane estimation step is
The coordinates of the pixel of interest are (horizontal x, vertical y, time z) = (0, 0, 0), the coordinates of other pixels in the block are expressed, the signal level is r, the residual is e, and the coefficient is When c1 to c4,
r + e = c1 * x + c2 * y + c3 * z + c4
In the image processing method , the process of the plane estimation step estimates a plane that minimizes the residual e by the method of least squares .
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP00157699A JP4144091B2 (en) | 1999-01-07 | 1999-01-07 | Image processing apparatus and method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP00157699A JP4144091B2 (en) | 1999-01-07 | 1999-01-07 | Image processing apparatus and method |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2000201283A JP2000201283A (en) | 2000-07-18 |
| JP4144091B2 true JP4144091B2 (en) | 2008-09-03 |
Family
ID=11505355
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP00157699A Expired - Fee Related JP4144091B2 (en) | 1999-01-07 | 1999-01-07 | Image processing apparatus and method |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4144091B2 (en) |
Families Citing this family (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP4214459B2 (en) | 2003-02-13 | 2009-01-28 | ソニー株式会社 | Signal processing apparatus and method, recording medium, and program |
| JP4143916B2 (en) * | 2003-02-25 | 2008-09-03 | ソニー株式会社 | Image processing apparatus and method, recording medium, and program |
| JP4144374B2 (en) * | 2003-02-25 | 2008-09-03 | ソニー株式会社 | Image processing apparatus and method, recording medium, and program |
| JP4144378B2 (en) | 2003-02-28 | 2008-09-03 | ソニー株式会社 | Image processing apparatus and method, recording medium, and program |
| JP4144377B2 (en) | 2003-02-28 | 2008-09-03 | ソニー株式会社 | Image processing apparatus and method, recording medium, and program |
| JP4392583B2 (en) * | 2003-06-27 | 2010-01-06 | ソニー株式会社 | Signal processing apparatus, signal processing method, program, and recording medium |
| JP4392584B2 (en) | 2003-06-27 | 2010-01-06 | ソニー株式会社 | Signal processing apparatus, signal processing method, program, and recording medium |
-
1999
- 1999-01-07 JP JP00157699A patent/JP4144091B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2000201283A (en) | 2000-07-18 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7634153B2 (en) | Image processing apparatus and control method thereof | |
| US6934056B2 (en) | Noise cleaning and interpolating sparsely populated color digital image using a variable noise cleaning kernel | |
| JP4887544B2 (en) | How to remove noise from video data | |
| JP5260635B2 (en) | Noise-reduced color image using panchromatic image | |
| JP3538055B2 (en) | Motion vector detection device | |
| US20030228067A1 (en) | Image processing apparatus, image processing method, and computer program | |
| JPH11144053A (en) | Image data interpolation processing method | |
| JP2004508639A (en) | Image matching | |
| JPH05344336A (en) | Image generating system for minimizing contour in quantized digital color image and relevant method | |
| US7454078B2 (en) | Method and apparatus for flicker removal from an image sequence | |
| JP4144091B2 (en) | Image processing apparatus and method | |
| JPH11103466A (en) | Picture signal processor and medium for recording program | |
| JP4292625B2 (en) | Interpolation processing apparatus and recording medium recording interpolation processing program | |
| CN1736108A (en) | Efficient predictive image parameter estimation | |
| JPH06176144A (en) | Image processing device | |
| JP2006067541A (en) | Video conversion apparatus, video conversion method, and recording medium | |
| JPH06326975A (en) | Method and equipment for movement compressing type processing of video signal | |
| JP4084719B2 (en) | Image processing apparatus, image forming apparatus including the image processing apparatus, image processing method, image processing program, and computer-readable recording medium | |
| JPH04365182A (en) | Image scaling processing device | |
| JPH11331858A (en) | Picture signal processor and medium recording program | |
| JP3651093B2 (en) | Motion vector detection apparatus and method | |
| JP2000134511A (en) | Image information conversion apparatus and conversion method | |
| JP2904364B2 (en) | Binarization method of gradation image | |
| JP3456617B2 (en) | Area dividing device | |
| JP2000200349A (en) | Image information conversion device, image information conversion method, learning device, and learning method |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051208 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080311 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080314 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080501 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080527 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080609 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110627 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120627 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130627 Year of fee payment: 5 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| LAPS | Cancellation because of no payment of annual fees |