JP4479098B2 - Signal processing apparatus and method, and recording medium - Google Patents
Signal processing apparatus and method, and recording medium Download PDFInfo
- Publication number
- JP4479098B2 JP4479098B2 JP2000389043A JP2000389043A JP4479098B2 JP 4479098 B2 JP4479098 B2 JP 4479098B2 JP 2000389043 A JP2000389043 A JP 2000389043A JP 2000389043 A JP2000389043 A JP 2000389043A JP 4479098 B2 JP4479098 B2 JP 4479098B2
- Authority
- JP
- Japan
- Prior art keywords
- pixel
- frame
- foreground
- background
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Image Analysis (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、信号処理装置および方法、並びに記録媒体に関し、特に、センサにより検出した信号と現実世界との違いを考慮した信号処理装置および方法、並びに記録媒体に関する。
【0002】
【従来の技術】
現実世界における事象をセンサで検出し、画像、音声、温度、または圧力などの、センサが出力するサンプリングデータを処理する技術が広く利用されている。
【0003】
例えば、静止している所定の背景の前で移動する物体をビデオカメラで撮像して得られる画像には、物体の移動速度が比較的速い場合、動きボケが生じることになる。
【0004】
【発明が解決しようとする課題】
静止している背景の前で物体が移動するとき、移動する物体の画像自身の混ざり合いによる動きボケのみならず、背景の画像と移動する物体の画像との混ざり合いが生じる。従来は、背景の画像と移動する物体の画像との混ざり合いの状態を検出することは、考えられていなかった。
【0005】
本発明はこのような状況に鑑みてなされたものであり、背景の画像および移動する物体の画像など複数のオブジェクトの混ざり合いの状態を示す混合比を検出することができるようにすることを目的とする。
【0006】
【課題を解決するための手段】
請求項1に記載の信号処理装置は、入力画像の画素ごとに、連続する2つのフレームの入力画像の同じ位置の画素の画素値の差分の絶対値と、予め定められた閾値とを比較することで、入力画像の画素のフレーム間の動きの有無を判定する静動判定手段と、入力画像の画素ごとに、所定フレームと、所定フレームの1つ前のフレームとの間の動きの有無の判定結果、および所定フレームと、所定フレームの1つ後のフレームとの間の動きの有無の判定結果に基づいて、画素が、前景となるオブジェクトを構成する前景オブジェクト成分のみからなる前景領域、背景となるオブジェクトを構成する背景オブジェクト成分のみからなる背景領域、または前景オブジェクト成分と背景オブジェクト成分が混合されてなる混合領域の何れの領域であるかを特定し、その特定結果を示す領域情報を生成する領域特定手段と、処理対象フレームの入力画像における、領域情報により示される混合領域を構成する画素について、処理対象フレームの画素の画素値と、処理対象フレームに隣接するフレームの画素の画素値との差を、処理対象フレームの前後に隣接するフレームの画素の画素値の差で除算することにより、画素における背景オブジェクト成分の混合比を算出する混合比算出手段とを備えることを特徴とする。
【0007】
混合領域は、アンカバードバックグラウンド領域と、カバードバックグラウンド領域とからなるようにし、領域特定手段には、処理対象フレームと、処理対象フレームの1つ後のフレームとの間の動きの有無の判定結果、および処理対象フレームの1つ後のフレームと、処理対象フレームの2つ後のフレームとの間の動きの有無の判定結果から、アンカバードバックグラウンド領域である画素を特定するアンカバードバックグラウンド領域特定手段と、処理対象フレームと、処理対象フレームの1つ前のフレームとの間の動きの有無の判定結果、および処理対象フレームの1つ前のフレームと、処理対象フレームの2つ前のフレームとの間の動きの有無の判定結果から、カバードバックグラウンド領域である画素を特定するカバードバックグラウンド領域特定手段と、処理対象フレームと、処理対象フレームの1つ後のフレームとの間の動きの有無の判定結果、および処理対象フレームと、処理対象フレームの1つ前のフレームとの間の動きの有無の判定結果から、前景領域である画素、および背景領域である画素を特定する前景領域/背景領域特定手段と、アンカバードバックグラウンド領域特定手段、カバードバックグラウンド領域特定手段、および前景領域/背景領域特定手段による特定結果から、領域情報を生成する領域情報生成手段とを設け、混合比算出手段には、アンカバードバックグラウンド領域の画素について、処理対象フレームの画素の画素値と、処理対象フレームの1つ前のフレームの画素の画素値との差を、処理対象フレームの前後に隣接するフレームの画素の画素値の差で除算することにより混合比を算出する第1の混合比算出手段と、カバードバックグラウンド領域の画素について、処理対象フレームの画素の画素値と、処理対象フレームの1つ後のフレームの画素の画素値との差を、処理対象フレームの前後に隣接するフレームの画素の画素値の差で除算することにより混合比を算出する第2の混合比算出手段とを設けることができる。
【0012】
請求項3に記載の信号処理方法、または請求項4に記載の記録媒体のプログラムは、入力画像の画素ごとに、連続する2つのフレームの入力画像の同じ位置の画素の画素値の差分の絶対値と、予め定められた閾値とを比較することで、入力画像の画素のフレーム間の動きの有無を判定する静動判定ステップと、入力画像の画素ごとに、所定フレームと、所定フレームの1つ前のフレームとの間の動きの有無の判定結果、および所定フレームと、所定フレームの1つ後のフレームとの間の動きの有無の判定結果に基づいて、画素が、前景となるオブジェクトを構成する前景オブジェクト成分のみからなる前景領域、背景となるオブジェクトを構成する背景オブジェクト成分のみからなる背景領域、または前景オブジェクト成分と背景オブジェクト成分が混合されてなる混合領域の何れの領域であるかを特定し、その特定結果を示す領域情報を生成する領域特定ステップと、処理対象フレームの入力画像における、領域情報により示される混合領域を構成する画素について、処理対象フレームの画素の画素値と、処理対象フレームに隣接するフレームの画素の画素値との差を、処理対象フレームの前後に隣接するフレームの画素の画素値の差で除算することにより、画素における背景オブジェクト成分の混合比を算出する混合比算出ステップとを含むことを特徴とする。
【0014】
請求項1に記載の信号処理装置、請求項3に記載の信号処理方法、および請求項4に記載の記録媒体においては、入力画像の画素ごとに、連続する2つのフレームの入力画像の同じ位置の画素の画素値の差分の絶対値と、予め定められた閾値とが比較されることで、入力画像の画素のフレーム間の動きの有無が判定され、入力画像の画素ごとに、所定フレームと、所定フレームの1つ前のフレームとの間の動きの有無の判定結果、および所定フレームと、所定フレームの1つ後のフレームとの間の動きの有無の判定結果に基づいて、画素が、前景となるオブジェクトを構成する前景オブジェクト成分のみからなる前景領域、背景となるオブジェクトを構成する背景オブジェクト成分のみからなる背景領域、または前景オブジェクト成分と背景オブジェクト成分が混合されてなる混合領域の何れの領域であるかが特定され、その特定結果を示す領域情報が生成され、処理対象フレームの入力画像における、領域情報により示される混合領域を構成する画素について、処理対象フレームの画素の画素値と、処理対象フレームに隣接するフレームの画素の画素値との差を、処理対象フレームの前後に隣接するフレームの画素の画素値の差で除算することにより、画素における背景オブジェクト成分の混合比が算出される。
【0015】
【発明の実施の形態】
図1は、本発明の原理を表している。同図に示すように、空間と時間軸を有する現実社会1の情報である第1の信号がセンサ2により取得され、データ化される。センサ2が取得したデータ3である検出信号は、現実社会1の情報を、現実社会より低い次元の時空間に射影して得られた情報である。従って、射影して得られた情報は、射影により発生する歪みを有している。換言すれば、センサ2が出力するデータ3は、現実社会1の情報に対して歪みを有している。また、データ3は、射影による歪みを有しているが、これを補正するための有意情報を含んでいる。
【0016】
そこで、本発明においては、センサ2が出力したデータを信号処理部4において信号処理することで、その歪みが除去されるか、低減されるか、または調整される。または、本発明においては、センサ2が出力したデータを信号処理部4において信号処理することで、有意情報が抽出される。
【0017】
図2は、本発明が適用される信号処理装置の構成例を表している。センサ11は、例えば、ビデオカメラで構成され、現実社会の画像を撮像し、得られた画像データを信号処理部12に出力する。信号処理部12は、例えば、パーソナルコンピュータなどで構成され、センサ11より入力されたデータを処理し、射影により発生する歪みの量を調整したり、射影により埋もれた有意情報の含まれる領域を特定したり、更に特定した領域から有意情報を抽出したり、抽出した有意情報に基づいて、入力されたデータを処理したりする。
【0018】
ここで言う有意情報は、例えば、後述する混合比である。
【0019】
なお、射影により埋もれた有意情報の含まれる領域を示す情報も有意情報と考えることができる。ここでは、後述する領域情報が有意情報に相当する。
【0020】
ここで言う有意情報の含まれる領域は、例えば、後述する混合領域である。
【0021】
信号処理部12は、例えば、図3に示すように構成される。CPU(Central Processing Uuit)21は、ROM(Read Only Memory)22、または記憶部28に記憶されているプログラムに従って各種の処理を実行する。RAM(Random Access Memory)23には、CPU21が実行するプログラムやデータなどが適宜記憶される。これらのCPU21、ROM22、およびRAM23は、バス24により相互に接続されている。
【0022】
CPU21にはまた、バス24を介して入出力インタフェース25が接続されている。入出力インタフェース25には、キーボード、マウス、マイクロホンなどよりなる入力部26、ディスプレイ、スピーカなどよりなる出力部27が接続されている。CPU21は、入力部26から入力される指令に対応して各種の処理を実行する。そして、CPU21は、処理の結果得られた画像や音声等を出力部27に出力する。
【0023】
入出力インタフェース25に接続されている記憶部28は、例えばハードディスクなどで構成され、CPU21が実行するプログラムや各種のデータを記憶する。通信部29は、インターネット、その他のネットワークを介して外部の装置と通信する。この例の場合、通信部29はセンサ11の出力を取り込む取得部として働く。
【0024】
また、通信部29を介してプログラムを取得し、記憶部28に記憶してもよい。
【0025】
入出力インタフェース25に接続されているドライブ30は、磁気ディスク51、光ディスク52、光磁気ディスク53、或いは半導体メモリ54などが装着されたとき、それらを駆動し、そこに記録されているプログラムやデータなどを取得する。取得されたプログラムやデータは、必要に応じて記憶部28に転送され、記憶される。
【0026】
次に、センサにより取得されたデータから、有意情報が埋もれている領域を特定したり、埋もれた有意情報を抽出する処理を行う信号処理装置についてより具体的な例を挙げて説明する。以下の例において、CCDラインセンサまたはCCDエリアセンサがセンサに対応し、領域情報や混合比が有意情報に対応し、混合領域において、前景と背景が混合していることや動きボケが歪みに対応する。
【0027】
図4は、信号処理部12を示すブロック図である。
【0028】
なお、信号処理部12の各機能をハードウェアで実現するか、ソフトウェアで実現するかは問わない。つまり、本明細書の各ブロック図は、ハードウェアのブロック図と考えても、ソフトウェアによる機能ブロック図と考えても良い。
【0029】
ここで、動きボケとは、撮像の対象となる、現実世界におけるオブジェクトの動きと、センサ11の撮像の特性とにより生じる、動いているオブジェクトに対応する画像に含まれている歪みをいう。
【0030】
この明細書では、撮像の対象となる、現実世界におけるオブジェクトに対応する画像を、画像オブジェクトと称する。
【0031】
信号処理部12に供給された入力画像は、オブジェクト抽出部101、領域特定部103、混合比算出部104、および前景背景分離部105に供給される。
【0032】
オブジェクト抽出部101は、入力画像に含まれる前景のオブジェクトに対応する画像オブジェクトを粗く抽出して、抽出した画像オブジェクトを動き検出部102に供給する。オブジェクト抽出部101は、例えば、入力画像に含まれる前景のオブジェクトに対応する画像オブジェクトの輪郭を検出することで、前景のオブジェクトに対応する画像オブジェクトを粗く抽出する。
【0033】
オブジェクト抽出部101は、入力画像に含まれる背景のオブジェクトに対応する画像オブジェクトを粗く抽出して、抽出した画像オブジェクトを動き検出部102に供給する。オブジェクト抽出部101は、例えば、入力画像と、抽出された前景のオブジェクトに対応する画像オブジェクトとの差から、背景のオブジェクトに対応する画像オブジェクトを粗く抽出する。
【0034】
また、例えば、オブジェクト抽出部101は、内部に設けられている背景メモリに記憶されている背景の画像と、入力画像との差から、前景のオブジェクトに対応する画像オブジェクト、および背景のオブジェクトに対応する画像オブジェクトを粗く抽出するようにしてもよい。
【0035】
動き検出部102は、例えば、ブロックマッチング法、勾配法、位相相関法、およびペルリカーシブ法などの手法により、粗く抽出された前景のオブジェクトに対応する画像オブジェクトの動きベクトルを算出して、算出した動きベクトルおよび動きベクトルの位置情報(動きベクトルに対応する画素の位置を特定する情報)を動きボケ抽出部106に供給する。
【0036】
動き検出部102が出力する動きベクトルには、動き量vに対応する情報が含まれるている。
【0037】
また、例えば、動き検出部102は、画像オブジェクトに画素を特定する画素位置情報と共に、画像オブジェクト毎の動きベクトルを動きボケ調整部106に出力するようにしてもよい。
【0038】
動き量vは、動いているオブジェクトに対応する画像の位置の変化を画素間隔を単位として表す値である。例えば、前景に対応するオブジェクトの画像が、あるフレームを基準として次のフレームにおいて4画素分離れた位置に表示されるように移動しているとき、前景に対応するオブジェクトの画像の動き量vは、4とされる。
【0039】
なお、オブジェクト抽出部101および動き検出部102は、動いているオブジェクトに対応した動きボケ量の調整を動きボケ調整部106で行う場合に用いられる。
【0040】
領域特定部103は、入力された画像の画素のそれぞれを、前景領域、背景領域、または混合領域のいずれかに特定し、画素毎に前景領域、背景領域、または混合領域のいずれかに属するかを示す情報(以下、領域情報と称する)を混合比算出部104、前景背景分離部105、および動きボケ調整部106に供給する。
【0041】
混合比算出部104は、入力画像、および領域特定部103から供給された領域情報を基に、混合領域63に含まれる画素に対応する混合比(以下、混合比αと称する)を算出して、算出した混合比を前景背景分離部105に供給する。
【0042】
混合比αは、後述する式(3)に示されるように、画素値における、背景のオブジェクトに対応する画像の成分(以下、背景の成分とも称する)の割合を示す値である。
【0043】
前景背景分離部105は、領域特定部103から供給された領域情報、および混合比算出部104から供給された混合比αを基に、前景のオブジェクトに対応する画像の成分(以下、前景の成分とも称する)のみから成る前景成分画像と、背景の成分のみから成る背景成分画像とに入力画像を分離して、前景成分画像を動きボケ調整部106および選択部107に供給する。なお、分離された前景成分画像を最終的な出力とすることも考えられる。従来の混合領域を考慮しないで前景と背景だけを特定し、分離していた方式に比べ正確な前景と背景を得ることが出来る。
【0044】
動きボケ調整部106は、動きベクトルからわかる動き量vおよび領域情報を基に、前景成分画像に含まれる1以上の画素を示す処理単位を決定する。処理単位は、動きボケの量の調整の処理の対象となる1群の画素を指定するデータである。
【0045】
動きボケ調整部106は、信号処理部12に入力された動きボケ調整量、前景背景分離部105から供給された前景成分画像、動き検出部102から供給された動きベクトルおよびその位置情報、並びに処理単位を基に、前景成分画像に含まれる動きボケを除去する、動きボケの量を減少させる、または動きボケの量を増加させるなど前景成分画像に含まれる動きボケの量を調整して、動きボケの量を調整した前景成分画像を選択部107に出力する。動きベクトルとその位置情報は使わないこともある。
【0046】
選択部107は、例えば使用者の選択に対応した選択信号を基に、前景背景分離部105から供給された前景成分画像、および動きボケ調整部106から供給された動きボケの量が調整された前景成分画像のいずれか一方を選択して、選択した前景成分画像を出力する。
【0047】
次に、図5乃至図20を参照して、信号処理部12に供給される入力画像について説明する。
【0048】
図5は、センサによる撮像を説明する図である。センサ11は、例えば、固体撮像素子であるCCD(Charge-Coupled Device)エリアセンサを備えたCCDビデオカメラなどで構成される。現実世界における、前景に対応するオブジェクトは、現実世界における、背景に対応するオブジェクトと、センサ11との間を、例えば、図中の左側から右側に水平に移動する。
【0049】
センサ11は、前景に対応するオブジェクトを、背景に対応するオブジェクトと共に撮像する。センサ11は、撮像した画像を1フレーム単位で出力する。例えば、センサ11は、1秒間に30フレームから成る画像を出力する。センサ11の露光時間は、1/30秒とすることができる。露光時間は、センサ11が入力された光の電荷への変換を開始してから、入力された光の電荷への変換を終了するまでの期間である。以下、露光時間をシャッタ時間とも称する。
【0050】
図6は、画素の配置を説明する図である。図6中において、A乃至Iは、個々の画素を示す。画素は、画像に対応する平面上に配置されている。1つの画素に対応する1つの検出素子は、センサ11上に配置されている。センサ11が画像を撮像するとき、1つの検出素子は、画像を構成する1つの画素に対応する画素値を出力する。例えば、検出素子のX方向の位置は、画像上の横方向の位置に対応し、検出素子のY方向の位置は、画像上の縦方向の位置に対応する。
【0051】
図7に示すように、例えば、CCDである検出素子は、シャッタ時間に対応する期間、入力された光を電荷に変換して、変換された電荷を蓄積する。電荷の量は、入力された光の強さと、光が入力されている時間にほぼ比例する。検出素子は、シャッタ時間に対応する期間において、入力された光から変換された電荷を、既に蓄積されている電荷に加えていく。すなわち、検出素子は、シャッタ時間に対応する期間、入力される光を積分して、積分された光に対応する量の電荷を蓄積する。検出素子は、時間に対して、積分効果があるとも言える。
【0052】
検出素子に蓄積された電荷は、図示せぬ回路により、電圧値に変換され、電圧値は更にデジタルデータなどの画素値に変換されて出力される。従って、センサ11から出力される個々の画素値は、前景または背景に対応するオブジェクトの空間的に広がりを有するある部分を、シャッタ時間について積分した結果である、1次元の空間に射影された値を有する。
【0053】
信号処理部12は、このようなセンサ11の蓄積の動作により、出力信号に埋もれてしまった有意な情報、例えば、混合比αを抽出する。信号処理部12は、前景の画像オブジェクト自身が混ざり合うことによる生ずる歪みの量、例えば、動きボケの量などを調整する。また、信号処理部12は、前景の画像オブジェクトと背景の画像オブジェクトとが混ざり合うことにより生ずる歪みの量を調整する。
【0054】
図8は、動いている前景に対応するオブジェクトと、静止している背景に対応するオブジェクトとを撮像して得られる画像を説明する図である。図8(A)は、動きを伴う前景に対応するオブジェクトと、静止している背景に対応するオブジェクトとを撮像して得られる画像を示している。図8(A)に示す例において、前景に対応するオブジェクトは、画面に対して水平に左から右に動いている。
【0055】
図8(B)は、図8(A)に示す画像の1つのラインに対応する画素値を時間方向に展開したモデル図である。図8(B)の横方向は、図8(A)の空間方向Xに対応している。
【0056】
背景領域の画素は、背景の成分、すなわち、背景のオブジェクトに対応する画像の成分のみから、その画素値が構成されている。前景領域の画素は、前景の成分、すなわち、前景のオブジェクトに対応する画像の成分のみから、その画素値が構成されている。
【0057】
混合領域の画素は、背景の成分、および前景の成分から、その画素値が構成されている。混合領域は、背景の成分、および前景の成分から、その画素値が構成されているので、歪み領域ともいえる。混合領域は、更に、カバードバックグラウンド領域およびアンカバードバックグラウンド領域に分類される。
【0058】
カバードバックグラウンド領域は、前景領域に対して、前景のオブジェクトの進行方向の前端部に対応する位置の混合領域であり、時間の経過に対応して背景成分が前景に覆い隠される領域をいう。
【0059】
これに対して、アンカバードバックグラウンド領域は、前景領域に対して、前景のオブジェクトの進行方向の後端部に対応する位置の混合領域であり、時間の経過に対応して背景成分が現れる領域をいう。
【0060】
このように、前景領域、背景領域、またはカバードバックグラウンド領域若しくはアンカバードバックグラウンド領域を含む画像が、領域特定部103、混合比算出部104、および前景背景分離部105に入力画像として入力される。
【0061】
図9は、以上のような、背景領域、前景領域、混合領域、カバードバックグラウンド領域、およびアンカバードバックグラウンド領域を説明する図である。図8に示す画像に対応する場合、背景領域は、静止部分であり、前景領域は、動き部分であり、混合領域のカバードバックグラウンド領域は、背景から前景に変化する部分であり、混合領域のアンカバードバックグラウンド領域は、前景から背景に変化する部分である。
【0062】
図10は、静止している前景に対応するオブジェクトおよび静止している背景に対応するオブジェクトを撮像した画像における、隣接して1列に並んでいる画素の画素値を時間方向に展開したモデル図である。例えば、隣接して1列に並んでいる画素として、画面の1つのライン上に並んでいる画素を選択することができる。
【0063】
図10に示すF01乃至F04の画素値は、静止している前景のオブジェクトに対応する画素の画素値である。図10に示すB01乃至B04の画素値は、静止している背景のオブジェクトに対応する画素の画素値である。
【0064】
図10における縦方向は、図中の上から下に向かって時間が経過する。図10中の矩形の上辺の位置は、センサ11が入力された光の電荷への変換を開始する時刻に対応し、図10中の矩形の下辺の位置は、センサ11が入力された光の電荷への変換を終了する時刻に対応する。すなわち、図10中の矩形の上辺から下辺までの距離は、シャッタ時間に対応する。
【0065】
以下において、シャッタ時間とフレーム間隔とが同一である場合を例に説明する。
【0066】
図10における横方向は、図8で説明した空間方向Xに対応する。より具体的には、図10に示す例において、図10中の”F01”と記載された矩形の左辺から”B04”と記載された矩形の右辺までの距離は、画素のピッチの8倍、すなわち、連続している8つの画素の間隔に対応する。
【0067】
前景のオブジェクトおよび背景のオブジェクトが静止している場合、シャッタ時間に対応する期間において、センサ11に入力される光は変化しない。
【0068】
ここで、シャッタ時間に対応する期間を2つ以上の同じ長さの期間に分割する。例えば、仮想分割数を4とすると、図10に示すモデル図は、図11に示すモデルとして表すことができる。仮想分割数は、前景に対応するオブジェクトの動き量vなどに対応して設定される。例えば、4である動き量vに対応して、仮想分割数は、4とされ、シャッタ時間に対応する期間は4つに分割される。
【0069】
図中の最も上の行は、シャッタが開いて最初の、分割された期間に対応する。図中の上から2番目の行は、シャッタが開いて2番目の、分割された期間に対応する。図中の上から3番目の行は、シャッタが開いて3番目の、分割された期間に対応する。図中の上から4番目の行は、シャッタが開いて4番目の、分割された期間に対応する。
【0070】
以下、動き量vに対応して分割されたシャッタ時間をシャッタ時間/vとも称する。
【0071】
前景に対応するオブジェクトが静止しているとき、センサ11に入力される光は変化しないので、前景の成分F01/vは、画素値F01を仮想分割数で除した値に等しい。同様に、前景に対応するオブジェクトが静止しているとき、前景の成分F02/vは、画素値F02を仮想分割数で除した値に等しく、前景の成分F03/vは、画素値F03を仮想分割数で除した値に等しく、前景の成分F04/vは、画素値F04を仮想分割数で除した値に等しい。
【0072】
背景に対応するオブジェクトが静止しているとき、センサ11に入力される光は変化しないので、背景の成分B01/vは、画素値B01を仮想分割数で除した値に等しい。同様に、背景に対応するオブジェクトが静止しているとき、背景の成分B02/vは、画素値B02を仮想分割数で除した値に等しく、B03/vは、画素値B03を仮想分割数で除した値に等しく、B04/vは、画素値B04を仮想分割数で除した値に等しい。
【0073】
すなわち、前景に対応するオブジェクトが静止している場合、シャッタ時間に対応する期間において、センサ11に入力される前景のオブジェクトに対応する光が変化しないので、シャッタが開いて最初の、シャッタ時間/vに対応する前景の成分F01/vと、シャッタが開いて2番目の、シャッタ時間/vに対応する前景の成分F01/vと、シャッタが開いて3番目の、シャッタ時間/vに対応する前景の成分F01/vと、シャッタが開いて4番目の、シャッタ時間/vに対応する前景の成分F01/vとは、同じ値となる。F02/v乃至F04/vも、F01/vと同様の関係を有する。
【0074】
背景に対応するオブジェクトが静止している場合、シャッタ時間に対応する期間において、センサ11に入力される背景のオブジェクトに対応する光は変化しないので、シャッタが開いて最初の、シャッタ時間/vに対応する背景の成分B01/vと、シャッタが開いて2番目の、シャッタ時間/vに対応する背景の成分B01/vと、シャッタが開いて3番目の、シャッタ時間/vに対応する背景の成分B01/vと、シャッタが開いて4番目の、シャッタ時間/vに対応する背景の成分B01/vとは、同じ値となる。B02/v乃至B04/vも、同様の関係を有する。
【0075】
次に、前景に対応するオブジェクトが移動し、背景に対応するオブジェクトが静止している場合について説明する。
【0076】
図12は、前景に対応するオブジェクトが図中の右側に向かって移動する場合の、カバードバックグラウンド領域を含む、1つのライン上の画素の画素値を時間方向に展開したモデル図である。図12において、前景の動き量vは、4である。1フレームは短い時間なので、前景に対応するオブジェクトが剛体であり、等速で移動していると仮定することができる。図12において、前景に対応するオブジェクトの画像は、あるフレームを基準として次のフレームにおいて4画素分右側に表示されるように移動する。
【0077】
図12において、最も左側の画素乃至左から4番目の画素は、前景領域に属する。図12において、左から5番目乃至左から7番目の画素は、カバードバックグラウンド領域である混合領域に属する。図12において、最も右側の画素は、背景領域に属する。
【0078】
前景に対応するオブジェクトが時間の経過と共に背景に対応するオブジェクトを覆い隠すように移動しているので、カバードバックグラウンド領域に属する画素の画素値に含まれる成分は、シャッタ時間に対応する期間のある時点で、背景の成分から、前景の成分に替わる。
【0079】
例えば、図12中に太線枠を付した画素値Mは、式(1)で表される。
【0080】
M=B02/v+B02/v+F07/v+F06/v (1)
【0081】
例えば、左から5番目の画素は、1つのシャッタ時間/vに対応する背景の成分を含み、3つのシャッタ時間/vに対応する前景の成分を含むので、左から5番目の画素の混合比αは、1/4である。左から6番目の画素は、2つのシャッタ時間/vに対応する背景の成分を含み、2つのシャッタ時間/vに対応する前景の成分を含むので、左から6番目の画素の混合比αは、1/2である。左から7番目の画素は、3つのシャッタ時間/vに対応する背景の成分を含み、1つのシャッタ時間/vに対応する前景の成分を含むので、左から7番目の画素の混合比αは、3/4である。
【0082】
前景に対応するオブジェクトが、剛体であり、前景の画像が次のフレームにおいて4画素右側に表示されるように等速で移動すると仮定できるので、例えば、図12中の左から4番目の画素の、シャッタが開いて最初の、シャッタ時間/vの前景の成分F07/vは、図12中の左から5番目の画素の、シャッタが開いて2番目のシャッタ時間/vに対応する前景の成分に等しい。同様に、前景の成分F07/vは、図12中の左から6番目の画素の、シャッタが開いて3番目のシャッタ時間/vに対応する前景の成分と、図12中の左から7番目の画素の、シャッタが開いて4番目のシャッタ時間/vに対応する前景の成分とに、それぞれ等しい。
【0083】
前景に対応するオブジェクトが、剛体であり、前景の画像が次のフレームにおいて4画素右側に表示されるように等速で移動すると仮定できるので、例えば、図12中の左から3番目の画素の、シャッタが開いて最初のシャッタ時間/vの前景の成分F06/vは、図12中の左から4番目の画素の、シャッタが開いて2番目のシャッタ時間/vに対応する前景の成分に等しい。同様に、前景の成分F06/vは、図12中の左から5番目の画素の、シャッタが開いて3番目のシャッタ時間/vに対応する前景の成分と、図12中の左から6番目の画素の、シャッタが開いて4番目のシャッタ時間/vに対応する前景の成分とに、それぞれ等しい。
【0084】
前景に対応するオブジェクトが、剛体であり、前景の画像が次のフレームにおいて4画素右側に表示されるように等速で移動すると仮定できるので、例えば、図12中の左から2番目の画素の、シャッタが開いて最初のシャッタ時間/vの前景の成分F05/vは、図12中の左から3番目の画素の、シャッタが開いて2番目のシャッタ時間/vのに対応する前景の成分に等しい。同様に、前景の成分F05/vは、図12中の左から4番目の画素の、シャッタが開いて3番目のシャッタ時間/vに対応する前景の成分と、図12中の左から5番目の画素の、シャッタが開いて4番目のシャッタ時間/vに対応する前景の成分とに、それぞれ等しい。
【0085】
前景に対応するオブジェクトが、剛体であり、前景の画像が次のフレームにおいて4画素右側に表示されるように等速で移動すると仮定できるので、例えば、図12中の最も左側の画素の、シャッタが開いて最初のシャッタ時間/vの前景の成分F04/vは、図12中の左から2番目の画素の、シャッタが開いて2番目のシャッタ時間/vに対応する前景の成分に等しい。同様に、前景の成分F04/vは、図12中の左から3番目の画素の、シャッタが開いて3番目のシャッタ時間/vに対応する前景の成分と、図12中の左から4番目の画素の、シャッタが開いて4番目のシャッタ時間/vに対応する前景の成分とに、それぞれ等しい。
【0086】
動いているオブジェクトに対応する前景の領域は、このように動きボケを含むので、歪み領域とも言える。
【0087】
図13は、前景が図中の右側に向かって移動する場合の、アンカバードバックグラウンド領域を含む、1つのライン上の画素の画素値を時間方向に展開したモデル図である。図13において、前景の動き量vは、4である。1フレームは短い時間なので、前景に対応するオブジェクトが剛体であり、等速で移動していると仮定することができる。図13において、前景に対応するオブジェクトの画像は、あるフレームを基準として次のフレームにおいて4画素分右側に移動する。
【0088】
図13において、最も左側の画素乃至左から4番目の画素は、背景領域に属する。図13において、左から5番目乃至左から7番目の画素は、アンカバードバックグラウンドである混合領域に属する。図13において、最も右側の画素は、前景領域に属する。
【0089】
背景に対応するオブジェクトを覆っていた前景に対応するオブジェクトが時間の経過と共に背景に対応するオブジェクトの前から取り除かれるように移動しているので、アンカバードバックグラウンド領域に属する画素の画素値に含まれる成分は、シャッタ時間に対応する期間のある時点で、前景の成分から、背景の成分に替わる。
【0090】
例えば、図13中に太線枠を付した画素値M'は、式(2)で表される。
【0091】
M'=F02/v+F01/v+B26/v+B26/v (2)
【0092】
例えば、左から5番目の画素は、3つのシャッタ時間/vに対応する背景の成分を含み、1つのシャッタ時間/vに対応する前景の成分を含むので、左から5番目の画素の混合比αは、3/4である。左から6番目の画素は、2つのシャッタ時間/vに対応する背景の成分を含み、2つのシャッタ時間/vに対応する前景の成分を含むので、左から6番目の画素の混合比αは、1/2である。左から7番目の画素は、1つのシャッタ時間/vに対応する背景の成分を含み、3つのシャッタ時間/vに対応する前景の成分を含むので、左から7番目の画素の混合比αは、1/4である。
【0093】
式(1)および式(2)をより一般化すると、画素値Mは、式(3)で表される。
【0094】
【数1】
ここで、αは、混合比である。Bは、背景の画素値であり、Fi/vは、前景の成分である。
【0095】
前景に対応するオブジェクトが剛体であり、等速で動くと仮定でき、かつ、動き量vが4であるので、例えば、図13中の左から5番目の画素の、シャッタが開いて最初の、シャッタ時間/vの前景の成分F01/vは、図13中の左から6番目の画素の、シャッタが開いて2番目のシャッタ時間/vに対応する前景の成分に等しい。同様に、F01/vは、図13中の左から7番目の画素の、シャッタが開いて3番目のシャッタ時間/vに対応する前景の成分と、図13中の左から8番目の画素の、シャッタが開いて4番目のシャッタ時間/vに対応する前景の成分とに、それぞれ等しい。
【0096】
前景に対応するオブジェクトが剛体であり、等速で動くと仮定でき、かつ、仮想分割数が4であるので、例えば、図13中の左から6番目の画素の、シャッタが開いて最初の、シャッタ時間/vの前景の成分F02/vは、図13中の左から7番目の画素の、シャッタが開いて2番目のシャッタ時間/vに対応する前景の成分に等しい。同様に、前景の成分F02/vは、図13中の左から8番目の画素の、シャッタが開いて3番目のシャッタ時間/vに対応する前景の成分に等しい。
【0097】
前景に対応するオブジェクトが剛体であり、等速で動くと仮定でき、かつ、動き量vが4であるので、例えば、図13中の左から7番目の画素の、シャッタが開いて最初の、シャッタ時間/vの前景の成分F03/vは、図13中の左から8番目の画素の、シャッタが開いて2番目のシャッタ時間/vに対応する前景の成分に等しい。
【0098】
図11乃至図13の説明において、仮想分割数は、4であるとして説明したが、仮想分割数は、動き量vに対応する。動き量vは、一般に、前景に対応するオブジェクトの移動速度に対応する。例えば、前景に対応するオブジェクトが、あるフレームを基準として次のフレームにおいて4画素分右側に表示されるように移動しているとき、動き量vは、4とされる。動き量vに対応し、仮想分割数は、4とされる。同様に、例えば、前景に対応するオブジェクトが、あるフレームを基準として次のフレームにおいて6画素分左側に表示されるように移動しているとき、動き量vは、6とされ、仮想分割数は、6とされる。
【0099】
図14および図15に、以上で説明した、前景領域、背景領域、カバードバックグラウンド領域若しくはアンカバードバックグラウンド領域から成る混合領域と、分割されたシャッタ時間に対応する前景の成分および背景の成分との関係を示す。
【0100】
図14は、静止している背景の前を移動しているオブジェクトに対応する前景を含む画像から、前景領域、背景領域、および混合領域の画素を抽出した例を示す。図14に示す例において、前景に対応するオブジェクトは、画面に対して水平に移動している。
【0101】
フレーム#n+1は、フレーム#nの次のフレームであり、フレーム#n+2は、フレーム#n+1の次のフレームである。
【0102】
フレーム#n乃至フレーム#n+2のいずれかから抽出した、前景領域、背景領域、および混合領域の画素を抽出して、動き量vを4として、抽出された画素の画素値を時間方向に展開したモデルを図15に示す。
【0103】
前景領域の画素値は、前景に対応するオブジェクトが移動するので、シャッタ時間/vの期間に対応する、4つの異なる前景の成分から構成される。例えば、図15に示す前景領域の画素のうち最も左側に位置する画素は、F01/v,F02/v,F03/v、およびF04/vから構成される。すなわち、前景領域の画素は、動きボケを含んでいる。
【0104】
背景に対応するオブジェクトが静止しているので、シャッタ時間に対応する期間において、センサ11に入力される背景に対応する光は変化しない。この場合、背景領域の画素値は、動きボケを含まない。
【0105】
カバードバックグラウンド領域若しくはアンカバードバックグラウンド領域から成る混合領域に属する画素の画素値は、前景の成分と、背景の成分とから構成される。
【0106】
次に、オブジェクトに対応する画像が動いているとき、複数のフレームにおける、隣接して1列に並んでいる画素であって、フレーム上で同一の位置の画素の画素値を時間方向に展開したモデルについて説明する。例えば、オブジェクトに対応する画像が画面に対して水平に動いているとき、隣接して1列に並んでいる画素として、画面の1つのライン上に並んでいる画素を選択することができる。
【0107】
図16は、静止している背景に対応するオブジェクトを撮像した画像の3つのフレームの、隣接して1列に並んでいる画素であって、フレーム上で同一の位置の画素の画素値を時間方向に展開したモデル図である。フレーム#nは、フレーム#n-1の次のフレームであり、フレーム#n+1は、フレーム#nの次のフレームである。他のフレームも同様に称する。
【0108】
図16に示すB01乃至B12の画素値は、静止している背景のオブジェクトに対応する画素の画素値である。背景に対応するオブジェクトが静止しているので、フレーム#n-1乃至フレームn+1において、対応する画素の画素値は、変化しない。例えば、フレーム#n-1におけるB05の画素値を有する画素の位置に対応する、フレーム#nにおける画素、およびフレーム#n+1における画素は、それぞれ、B05の画素値を有する。
【0109】
図17は、静止している背景に対応するオブジェクトと共に図中の右側に移動する前景に対応するオブジェクトを撮像した画像の3つのフレームの、隣接して1列に並んでいる画素であって、フレーム上で同一の位置の画素の画素値を時間方向に展開したモデル図である。図17に示すモデルは、カバードバックグラウンド領域を含む。
【0110】
図17において、前景に対応するオブジェクトが、剛体であり、等速で移動すると仮定でき、前景の画像が次のフレームにおいて4画素右側に表示されるように移動するので、前景の動き量vは、4であり、仮想分割数は、4である。
【0111】
例えば、図17中のフレーム#n-1の最も左側の画素の、シャッタが開いて最初のシャッタ時間/vの前景の成分は、F12/vとなり、図17中の左から2番目の画素の、シャッタが開いて2番目のシャッタ時間/vの前景の成分も、F12/vとなる。図17中の左から3番目の画素の、シャッタが開いて3番目のシャッタ時間/vの前景の成分、および図17中の左から4番目の画素の、シャッタが開いて4番目のシャッタ時間/vの前景の成分は、F12/vとなる。
【0112】
図17中のフレーム#n-1の最も左側の画素の、シャッタが開いて2番目のシャッタ時間/vの前景の成分は、F11/vとなり、図17中の左から2番目の画素の、シャッタが開いて3番目のシャッタ時間/vの前景の成分も、F11/vとなる。図17中の左から3番目の画素の、シャッタが開いて4番目のシャッタ時間/vの前景の成分は、F11/vとなる。
【0113】
図17中のフレーム#n-1の最も左側の画素の、シャッタが開いて3番目のシャッタ時間/vの前景の成分は、F10/vとなり、図17中の左から2番目の画素の、シャッタが開いて4番目のシャッタ時間/vの前景の成分も、F10/vとなる。図17中のフレーム#n-1の最も左側の画素の、シャッタが開いて4番目のシャッタ時間/vの前景の成分は、F09/vとなる。
【0114】
背景に対応するオブジェクトが静止しているので、図17中のフレーム#n-1の左から2番目の画素の、シャッタが開いて最初のシャッタ時間/vの背景の成分は、B01/vとなる。図17中のフレーム#n-1の左から3番目の画素の、シャッタが開いて最初および2番目のシャッタ時間/vの背景の成分は、B02/vとなる。図17中のフレーム#n-1の左から4番目の画素の、シャッタが開いて最初乃至3番目のシャッタ時間/vの背景の成分は、B03/vとなる。
【0115】
図17中のフレーム#n-1において、最も左側の画素は、前景領域に属し、左側から2番目乃至4番目の画素は、カバードバックグラウンド領域である混合領域に属する。
【0116】
図17中のフレーム#n-1の左から5番目の画素乃至12番目の画素は、背景領域に属し、その画素値は、それぞれ、B04乃至B11となる。
【0117】
図17中のフレーム#nの左から1番目の画素乃至5番目の画素は、前景領域に属する。フレーム#nの前景領域における、シャッタ時間/vの前景の成分は、F05/v乃至F12/vのいずれかである。
【0118】
前景に対応するオブジェクトが、剛体であり、等速で移動すると仮定でき、前景の画像が次のフレームにおいて4画素右側に表示されるように移動するので、図17中のフレーム#nの左から5番目の画素の、シャッタが開いて最初のシャッタ時間/vの前景の成分は、F12/vとなり、図17中の左から6番目の画素の、シャッタが開いて2番目のシャッタ時間/vの前景の成分も、F12/vとなる。図17中の左から7番目の画素の、シャッタが開いて3番目のシャッタ時間/vの前景の成分、および図17中の左から8番目の画素の、シャッタが開いて4番目のシャッタ時間/vの前景の成分は、F12/vとなる。
【0119】
図17中のフレーム#nの左から5番目の画素の、シャッタが開いて2番目のシャッタ時間/vの前景の成分は、F11/vとなり、図17中の左から6番目の画素の、シャッタが開いて3番目のシャッタ時間/vの前景の成分も、F11/vとなる。図17中の左から7番目の画素の、シャッタが開いて4番目のシャッタ時間/vの前景の成分は、F11/vとなる。
【0120】
図17中のフレーム#nの左から5番目の画素の、シャッタが開いて3番目のシャッタ時間/vの前景の成分は、F10/vとなり、図17中の左から6番目の画素の、シャッタが開いて4番目のシャッタ時間/vの前景の成分も、F10/vとなる。図17中のフレーム#nの左から5番目の画素の、シャッタが開いて4番目のシャッタ時間/vの前景の成分は、F09/vとなる。
【0121】
背景に対応するオブジェクトが静止しているので、図17中のフレーム#nの左から6番目の画素の、シャッタが開いて最初のシャッタ時間/vの背景の成分は、B05/vとなる。図17中のフレーム#nの左から7番目の画素の、シャッタが開いて最初および2番目のシャッタ時間/vの背景の成分は、B06/vとなる。図17中のフレーム#nの左から8番目の画素の、シャッタが開いて最初乃至3番目の、シャッタ時間/vの背景の成分は、B07/vとなる。
【0122】
図17中のフレーム#nにおいて、左側から6番目乃至8番目の画素は、カバードバックグラウンド領域である混合領域に属する。
【0123】
図17中のフレーム#nの左から9番目の画素乃至12番目の画素は、背景領域に属し、画素値は、それぞれ、B08乃至B11となる。
【0124】
図17中のフレーム#n+1の左から1番目の画素乃至9番目の画素は、前景領域に属する。フレーム#n+1の前景領域における、シャッタ時間/vの前景の成分は、F01/v乃至F12/vのいずれかである。
【0125】
前景に対応するオブジェクトが、剛体であり、等速で移動すると仮定でき、前景の画像が次のフレームにおいて4画素右側に表示されるように移動するので、図17中のフレーム#n+1の左から9番目の画素の、シャッタが開いて最初のシャッタ時間/vの前景の成分は、F12/vとなり、図17中の左から10番目の画素の、シャッタが開いて2番目のシャッタ時間/vの前景の成分も、F12/vとなる。図17中の左から11番目の画素の、シャッタが開いて3番目のシャッタ時間/vの前景の成分、および図17中の左から12番目の画素の、シャッタが開いて4番目のシャッタ時間/vの前景の成分は、F12/vとなる。
【0126】
図17中のフレーム#n+1の左から9番目の画素の、シャッタが開いて2番目のシャッタ時間/vの期間の前景の成分は、F11/vとなり、図17中の左から10番目の画素の、シャッタが開いて3番目のシャッタ時間/vの前景の成分も、F11/vとなる。図17中の左から11番目の画素の、シャッタが開いて4番目の、シャッタ時間/vの前景の成分は、F11/vとなる。
【0127】
図17中のフレーム#n+1の左から9番目の画素の、シャッタが開いて3番目の、シャッタ時間/vの前景の成分は、F10/vとなり、図17中の左から10番目の画素の、シャッタが開いて4番目のシャッタ時間/vの前景の成分も、F10/vとなる。図17中のフレーム#n+1の左から9番目の画素の、シャッタが開いて4番目のシャッタ時間/vの前景の成分は、F09/vとなる。
【0128】
背景に対応するオブジェクトが静止しているので、図17中のフレーム#n+1の左から10番目の画素の、シャッタが開いて最初のシャッタ時間/vの背景の成分は、B09/vとなる。図17中のフレーム#n+1の左から11番目の画素の、シャッタが開いて最初および2番目のシャッタ時間/vの背景の成分は、B10/vとなる。図17中のフレーム#n+1の左から12番目の画素の、シャッタが開いて最初乃至3番目の、シャッタ時間/vの背景の成分は、B11/vとなる。
【0129】
図17中のフレーム#n+1において、左側から10番目乃至12番目の画素は、カバードバックグラウンド領域である混合領域に対応する。
【0130】
図18は、図17に示す画素値から前景の成分を抽出した画像のモデル図である。
【0131】
図19は、静止している背景と共に図中の右側に移動するオブジェクトに対応する前景を撮像した画像の3つのフレームの、隣接して1列に並んでいる画素であって、フレーム上で同一の位置の画素の画素値を時間方向に展開したモデル図である。図19において、アンカバードバックグラウンド領域が含まれている。
【0132】
図19において、前景に対応するオブジェクトは、剛体であり、かつ等速で移動していると仮定できる。前景に対応するオブジェクトが、次のフレームにおいて4画素分右側に表示されるように移動しているので、動き量vは、4である。
【0133】
例えば、図19中のフレーム#n-1の最も左側の画素の、シャッタが開いて最初の、シャッタ時間/vの前景の成分は、F13/vとなり、図19中の左から2番目の画素の、シャッタが開いて2番目のシャッタ時間/vの前景の成分も、F13/vとなる。図19中の左から3番目の画素の、シャッタが開いて3番目のシャッタ時間/vの前景の成分、および図19中の左から4番目の画素の、シャッタが開いて4番目のシャッタ時間/vの前景の成分は、F13/vとなる。
【0134】
図19中のフレーム#n-1の左から2番目の画素の、シャッタが開いて最初のシャッタ時間/vの前景の成分は、F14/vとなり、図19中の左から3番目の画素の、シャッタが開いて2番目のシャッタ時間/vの前景の成分も、F14/vとなる。図19中の左から3番目の画素の、シャッタが開いて最初の、シャッタ時間/vの前景の成分は、F15/vとなる。
【0135】
背景に対応するオブジェクトが静止しているので、図19中のフレーム#n-1の最も左側の画素の、シャッタが開いて2番目乃至4番目の、シャッタ時間/vの背景の成分は、B25/vとなる。図19中のフレーム#n-1の左から2番目の画素の、シャッタが開いて3番目および4番目の、シャッタ時間/vの背景の成分は、B26/vとなる。図19中のフレーム#n-1の左から3番目の画素の、シャッタが開いて4番目のシャッタ時間/vの背景の成分は、B27/vとなる。
【0136】
図19中のフレーム#n-1において、最も左側の画素乃至3番目の画素は、アンカバードバックグラウンド領域である混合領域に属する。
【0137】
図19中のフレーム#n-1の左から4番目の画素乃至12番目の画素は、前景領域に属する。フレームの前景の成分は、F13/v乃至F24/vのいずれかである。
【0138】
図19中のフレーム#nの最も左側の画素乃至左から4番目の画素は、背景領域に属し、画素値は、それぞれ、B25乃至B28となる。
【0139】
前景に対応するオブジェクトが、剛体であり、等速で移動すると仮定でき、前景の画像が次のフレームにおいて4画素右側に表示されるように移動するので、図19中のフレーム#nの左から5番目の画素の、シャッタが開いて最初のシャッタ時間/vの前景の成分は、F13/vとなり、図19中の左から6番目の画素の、シャッタが開いて2番目のシャッタ時間/vの前景の成分も、F13/vとなる。図19中の左から7番目の画素の、シャッタが開いて3番目のシャッタ時間/vの前景の成分、および図19中の左から8番目の画素の、シャッタが開いて4番目のシャッタ時間/vの前景の成分は、F13/vとなる。
【0140】
図19中のフレーム#nの左から6番目の画素の、シャッタが開いて最初のシャッタ時間/vの前景の成分は、F14/vとなり、図19中の左から7番目の画素の、シャッタが開いて2番目のシャッタ時間/vの前景の成分も、F14/vとなる。図19中の左から8番目の画素の、シャッタが開いて最初のシャッタ時間/vの前景の成分は、F15/vとなる。
【0141】
背景に対応するオブジェクトが静止しているので、図19中のフレーム#nの左から5番目の画素の、シャッタが開いて2番目乃至4番目のシャッタ時間/vの背景の成分は、B29/vとなる。図19中のフレーム#nの左から6番目の画素の、シャッタが開いて3番目および4番目のシャッタ時間/vの背景の成分は、B30/vとなる。図19中のフレーム#nの左から7番目の画素の、シャッタが開いて4番目のシャッタ時間/vの背景の成分は、B31/vとなる。
【0142】
図19中のフレーム#nにおいて、左から5番目の画素乃至7番目の画素は、アンカバードバックグラウンド領域である混合領域に属する。
【0143】
図19中のフレーム#nの左から8番目の画素乃至12番目の画素は、前景領域に属する。フレーム#nの前景領域における、シャッタ時間/vの期間に対応する値は、F13/v乃至F20/vのいずれかである。
【0144】
図19中のフレーム#n+1の最も左側の画素乃至左から8番目の画素は、背景領域に属し、画素値は、それぞれ、B25乃至B32となる。
【0145】
前景に対応するオブジェクトが、剛体であり、等速で移動すると仮定でき、前景の画像が次のフレームにおいて4画素右側に表示されるように移動するので、図19中のフレーム#n+1の左から9番目の画素の、シャッタが開いて最初のシャッタ時間/vの前景の成分は、F13/vとなり、図19中の左から10番目の画素の、シャッタが開いて2番目のシャッタ時間/vの前景の成分も、F13/vとなる。図19中の左から11番目の画素の、シャッタが開いて3番目のシャッタ時間/vの前景の成分、および図19中の左から12番目の画素の、シャッタが開いて4番目のシャッタ時間/vの前景の成分は、F13/vとなる。
【0146】
図19中のフレーム#n+1の左から10番目の画素の、シャッタが開いて最初のシャッタ時間/vの前景の成分は、F14/vとなり、図19中の左から11番目の画素の、シャッタが開いて2番目のシャッタ時間/vの前景の成分も、F14/vとなる。図19中の左から12番目の画素の、シャッタが開いて最初のシャッタ時間/vの前景の成分は、F15/vとなる。
【0147】
背景に対応するオブジェクトが静止しているので、図19中のフレーム#n+1の左から9番目の画素の、シャッタが開いて2番目乃至4番目の、シャッタ時間/vの背景の成分は、B33/vとなる。図19中のフレーム#n+1の左から10番目の画素の、シャッタが開いて3番目および4番目のシャッタ時間/vの背景の成分は、B34/vとなる。図19中のフレーム#n+1の左から11番目の画素の、シャッタが開いて4番目のシャッタ時間/vの背景の成分は、B35/vとなる。
【0148】
図19中のフレーム#n+1において、左から9番目の画素乃至11番目の画素は、アンカバードバックグラウンド領域である混合領域に属する。
【0149】
図19中のフレーム#n+1の左から12番目の画素は、前景領域に属する。フレーム#n+1の前景領域における、シャッタ時間/vの前景の成分は、F13/v乃至F16/vのいずれかである。
【0150】
図20は、図19に示す画素値から前景の成分を抽出した画像のモデル図である。
【0151】
図4に戻り、領域特定部103は、複数のフレームの画素値を用いて、前景領域、背景領域、カバードバックグラウンド領域、またはアンカバードバックグラウンド領域に属することを示すフラグを画素毎に対応付けて、領域情報として、混合比算出部104および動きボケ調整部106に供給する。
【0152】
混合比算出部104は、複数のフレームの画素値、および領域情報を基に、混合領域に含まれる画素について画素毎に混合比αを算出し、算出した混合比αを前景背景分離部105に供給する。
【0153】
前景背景分離部105は、複数のフレームの画素値、領域情報、および混合比αを基に、前景の成分のみからなる前景成分画像を抽出して、動きボケ調整部106に供給する。
【0154】
動きボケ調整部106は、前景背景分離部105から供給された前景成分画像、動き検出部102から供給された動きベクトル、および領域特定部103から供給された領域情報を基に、前景成分画像に含まれる動きボケの量を調整して、動きボケの量を調整した前景成分画像を出力する。
【0155】
図21のフローチャートを参照して、信号処理部12による動きボケの量の調整の処理を説明する。ステップS101において、領域特定部103は、入力画像を基に、入力画像の画素毎に前景領域、背景領域、カバードバックグラウンド領域、またはアンカバードバックグラウンド領域のいずれかに属するかを示す領域情報を生成する領域特定の処理を実行する。領域特定の処理の詳細は、図30のフローチャートを参照して後述する。領域特定部103は、生成した領域情報を混合比算出部104に供給する。
【0156】
なお、ステップS101において、領域特定部103は、入力画像を基に、入力画像の画素毎に前景領域、背景領域、または混合領域(カバードバックグラウンド領域、またはアンカバードバックグラウンド領域の区別をしない)のいずれかに属するかを示す領域情報を生成するようにしてもよい。この場合において、前景背景分離部105および動きボケ調整部106は、動きベクトルの方向を基に、混合領域がカバードバックグラウンド領域であるか、またはアンカバードバックグラウンド領域であるかを判定する。例えば、動きベクトルの方向に対応して、前景領域、混合領域、および背景領域と順に並んでいるとき、その混合領域は、カバードバックグラウンド領域と判定され、動きベクトルの方向に対応して、背景領域、混合領域、および前景領域と順に並んでいるとき、その混合領域は、アンカバードバックグラウンド領域と判定される。
【0157】
ステップS102において、混合比算出部104は、入力画像および領域情報を基に、混合領域に含まれる画素毎に、混合比αを算出する。混合比算出の処理の詳細は、図40のフローチャートを参照して後述する。混合比算出部104は、算出した混合比αを前景背景分離部105に供給する。
【0158】
ステップS103において、前景背景分離部105は、領域情報、および混合比αを基に、入力画像から前景の成分を抽出して、前景成分画像として動きボケ調整部106に供給する。
【0159】
ステップS104において、動きボケ調整部106は、動きベクトルおよび領域情報を基に、動き方向に並ぶ連続した画素であって、アンカバードバックグラウンド領域、前景領域、およびカバードバックグラウンド領域のいずれかに属するものの画像上の位置を示す処理単位を生成し、処理単位に対応する前景成分に含まれる動きボケの量を調整する。動きボケの量の調整の処理の詳細については、図57のフローチャートを参照して後述する。
【0160】
ステップS105において、信号処理部12は、画面全体について処理を終了したか否かを判定し、画面全体について処理を終了していないと判定された場合、ステップS104に進み、処理単位に対応する前景の成分を対象とした動きボケの量の調整の処理を繰り返す。
【0161】
ステップS106において、画面全体について処理を終了したと判定された場合、処理は終了する。
【0162】
このように、信号処理部12は、前景と背景を分離して、前景に含まれる動きボケの量を調整することができる。すなわち、信号処理部12は、前景の画素の画素値であるサンプルデータに含まれる動きボケの量を調整することができる。
【0163】
以下、領域特定部103、混合比算出部104、前景背景分離部105、および動きボケ調整部106のそれぞれの構成について説明する。
【0164】
図22は、領域特定部103の構成の一例を示すブロック図である。フレームメモリ121は、入力された画像をフレーム単位で記憶する。フレームメモリ121は、処理の対象がフレーム#nであるとき、フレーム#nの2つ前のフレームであるフレーム#n-2、フレーム#nの1つ前のフレームであるフレーム#n-1、フレーム#n、フレーム#nの1つ後のフレームであるフレーム#n+1、およびフレーム#nの2つ後のフレームであるフレーム#n+2を記憶する。
【0165】
静動判定部122−1は、フレーム#nの領域特定の対象である画素の画像上の位置と同一の位置にあるフレーム#n+2の画素の画素値、およびフレーム#nの領域特定の対象である画素の画像上の位置と同一の位置にあるフレーム#n+1の画素の画素値をフレームメモリ121から読み出して、読み出した画素値の差の絶対値を算出する。静動判定部122−1は、フレーム#n+2の画素値とフレーム#n+1の画素値との差の絶対値が、予め設定している閾値Thより大きいか否かを判定し、差の絶対値が閾値Thより大きいと判定された場合、動きを示す静動判定を領域判定部123−1に供給する。フレーム#n+2の画素の画素値とフレーム#n+1の画素の画素値との差の絶対値が閾値Th以下であると判定された場合、静動判定部122−1は、静止を示す静動判定を領域判定部123−1に供給する。
【0166】
静動判定部122−2は、フレーム#nの領域特定の対象である画素の画像上の位置と同一の位置にあるフレーム#n+1の画素の画素値、およびフレーム#nの対象となる画素の画素値をフレームメモリ121から読み出して、画素値の差の絶対値を算出する。静動判定部122−2は、フレーム#n+1の画素値とフレーム#nの画素値との差の絶対値が、予め設定している閾値Thより大きいか否かを判定し、画素値の差の絶対値が、閾値Thより大きいと判定された場合、動きを示す静動判定を領域判定部123−1および領域判定部123−2に供給する。フレーム#n+1の画素の画素値とフレーム#nの画素の画素値との差の絶対値が、閾値Th以下であると判定された場合、静動判定部122−2は、静止を示す静動判定を領域判定部123−1および領域判定部123−2に供給する。
【0167】
静動判定部122−3は、フレーム#nの領域特定の対象である画素の画素値、およびフレーム#nの領域特定の対象である画素の画像上の位置と同一の位置にあるフレーム#n-1の画素の画素値をフレームメモリ121から読み出して、画素値の差の絶対値を算出する。静動判定部122−3は、フレーム#nの画素値とフレーム#n-1の画素値との差の絶対値が、予め設定している閾値Thより大きいか否かを判定し、画素値の差の絶対値が、閾値Thより大きいと判定された場合、動きを示す静動判定を領域判定部123−2および領域判定部123−3に供給する。フレーム#nの画素の画素値とフレーム#n-1の画素の画素値との差の絶対値が、閾値Th以下であると判定された場合、静動判定部122−3は、静止を示す静動判定を領域判定部123−2および領域判定部123−3に供給する。
【0168】
静動判定部122−4は、フレーム#nの領域特定の対象である画素の画像上の位置と同一の位置にあるフレーム#n-1の画素の画素値、およびフレーム#nの領域特定の対象である画素の画像上の位置と同一の位置にあるフレーム#n-2の画素の画素値をフレームメモリ121から読み出して、画素値の差の絶対値を算出する。静動判定部122−4は、フレーム#n-1の画素値とフレーム#n-2の画素値との差の絶対値が、予め設定している閾値Thより大きいか否かを判定し、画素値の差の絶対値が、閾値Thより大きいと判定された場合、動きを示す静動判定を領域判定部123−3に供給する。フレーム#n-1の画素の画素値とフレーム#n-2の画素の画素値との差の絶対値が、閾値Th以下であると判定された場合、静動判定部122−4は、静止を示す静動判定を領域判定部123−3に供給する。
【0169】
領域判定部123−1は、静動判定部122−1から供給された静動判定が静止を示し、かつ、静動判定部122−2から供給された静動判定が動きを示しているとき、フレーム#nにおける領域特定の対象である画素がアンカバードバックグラウンド領域に属すると判定し、領域の判定される画素に対応するアンカバードバックグラウンド領域判定フラグに、アンカバードバックグラウンド領域に属することを示す”1”を設定する。
【0170】
領域判定部123−1は、静動判定部122−1から供給された静動判定が動きを示すか、または、静動判定部122−2から供給された静動判定が静止を示しているとき、フレーム#nにおける領域特定の対象である画素がアンカバードバックグラウンド領域に属しないと判定し、領域の判定される画素に対応するアンカバードバックグラウンド領域判定フラグに、アンカバードバックグラウンド領域に属しないことを示す”0”を設定する。
【0171】
領域判定部123−1は、このように”1”または”0”が設定されたアンカバードバックグラウンド領域判定フラグを判定フラグ格納フレームメモリ124に供給する。
【0172】
領域判定部123−2は、静動判定部122−2から供給された静動判定が静止を示し、かつ、静動判定部122−3から供給された静動判定が静止を示しているとき、フレーム#nにおける領域特定の対象である画素が静止領域に属すると判定し、領域の判定される画素に対応する静止領域判定フラグに、静止領域に属することを示す”1”を設定する。
【0173】
領域判定部123−2は、静動判定部122−2から供給された静動判定が動きを示すか、または、静動判定部122−3から供給された静動判定が動きを示しているとき、フレーム#nにおける領域特定の対象である画素が静止領域に属しないと判定し、領域の判定される画素に対応する静止領域判定フラグに、静止領域に属しないことを示す”0”を設定する。
【0174】
領域判定部123−2は、このように”1”または”0”が設定された静止領域判定フラグを判定フラグ格納フレームメモリ124に供給する。
【0175】
領域判定部123−2は、静動判定部122−2から供給された静動判定が動きを示し、かつ、静動判定部122−3から供給された静動判定が動きを示しているとき、フレーム#nにおける領域特定の対象である画素が動き領域に属すると判定し、領域の判定される画素に対応する動き領域判定フラグに、動き領域に属することを示す”1”を設定する。
【0176】
領域判定部123−2は、静動判定部122−2から供給された静動判定が静止を示すか、または、静動判定部122−3から供給された静動判定が静止を示しているとき、フレーム#nにおける領域特定の対象である画素が動き領域に属しないと判定し、領域の判定される画素に対応する動き領域判定フラグに、動き領域に属しないことを示す”0”を設定する。
【0177】
領域判定部123−2は、このように”1”または”0”が設定された動き領域判定フラグを判定フラグ格納フレームメモリ124に供給する。
【0178】
領域判定部123−3は、静動判定部122−3から供給された静動判定が動きを示し、かつ、静動判定部122−4から供給された静動判定が静止を示しているとき、フレーム#nにおける領域特定の対象である画素がカバードバックグラウンド領域に属すると判定し、領域の判定される画素に対応するカバードバックグラウンド領域判定フラグに、カバードバックグラウンド領域に属することを示す”1”を設定する。
【0179】
領域判定部123−3は、静動判定部122−3から供給された静動判定が静止を示すか、または、静動判定部122−4から供給された静動判定が動きを示しているとき、フレーム#nにおける領域特定の対象である画素がカバードバックグラウンド領域に属しないと判定し、領域の判定される画素に対応するカバードバックグラウンド領域判定フラグに、カバードバックグラウンド領域に属しないことを示す”0”を設定する。
【0180】
領域判定部123−3は、このように”1”または”0”が設定されたカバードバックグラウンド領域判定フラグを判定フラグ格納フレームメモリ124に供給する。
【0181】
判定フラグ格納フレームメモリ124は、領域判定部123−1から供給されたアンカバードバックグラウンド領域判定フラグ、領域判定部123−2から供給された静止領域判定フラグ、領域判定部123−2から供給された動き領域判定フラグ、および領域判定部123−3から供給されたカバードバックグラウンド領域判定フラグをそれぞれ記憶する。
【0182】
判定フラグ格納フレームメモリ124は、記憶しているアンカバードバックグラウンド領域判定フラグ、静止領域判定フラグ、動き領域判定フラグ、およびカバードバックグラウンド領域判定フラグを合成部125に供給する。合成部125は、判定フラグ格納フレームメモリ124から供給された、アンカバードバックグラウンド領域判定フラグ、静止領域判定フラグ、動き領域判定フラグ、およびカバードバックグラウンド領域判定フラグを基に、各画素が、アンカバードバックグラウンド領域、静止領域、動き領域、およびカバードバックグラウンド領域のいずれかに属することを示す領域情報を生成し、判定フラグ格納フレームメモリ126に供給する。
【0183】
判定フラグ格納フレームメモリ126は、合成部125から供給された領域情報を記憶すると共に、記憶している領域情報を出力する。
【0184】
次に、領域特定部103の処理の例を図23乃至図27を参照して説明する。
【0185】
前景に対応するオブジェクトが移動しているとき、オブジェクトに対応する画像の画面上の位置は、フレーム毎に変化する。図23に示すように、フレーム#nにおいて、Yn(x,y)で示される位置に位置するオブジェクトに対応する画像は、次のフレームであるフレーム#n+1において、Yn+1(x,y)に位置する。
【0186】
前景のオブジェクトに対応する画像の動き方向に隣接して1列に並ぶ画素の画素値を時間方向に展開したモデル図を図24に示す。例えば、前景のオブジェクトに対応する画像の動き方向が画面に対して水平であるとき、図24におけるモデル図は、1つのライン上の隣接する画素の画素値を時間方向に展開したモデルを示す。
【0187】
図24において、フレーム#nにおけるラインは、フレーム#n+1におけるラインと同一である。
【0188】
フレーム#nにおいて、左から2番目の画素乃至13番目の画素に含まれているオブジェクトに対応する前景の成分は、フレーム#n+1において、左から6番目乃至17番目の画素に含まれる。
【0189】
フレーム#nにおいて、カバードバックグラウンド領域に属する画素は、左から11番目乃至13番目の画素であり、アンカバードバックグラウンド領域に属する画素は、左から2番目乃至4番目の画素である。フレーム#n+1において、カバードバックグラウンド領域に属する画素は、左から15番目乃至17番目の画素であり、アンカバードバックグラウンド領域に属する画素は、左から6番目乃至8番目の画素である。
【0190】
図24に示す例において、フレーム#nに含まれる前景の成分が、フレーム#n+1において4画素移動しているので、動き量vは、4である。仮想分割数は、動き量vに対応し、4である。
【0191】
次に、注目しているフレームの前後における混合領域に属する画素の画素値の変化について説明する。
【0192】
図25に示す、背景が静止し、前景の動き量vが4であるフレーム#nにおいて、カバードバックグラウンド領域に属する画素は、左から15番目乃至17番目の画素である。動き量vが4であるので、1つ前のフレーム#n-1において、左から15番目乃至17番目の画素は、背景の成分のみを含み、背景領域に属する。また、更に1つ前のフレーム#n-2において、左から15番目乃至17番目の画素は、背景の成分のみを含み、背景領域に属する。
【0193】
ここで、背景に対応するオブジェクトが静止しているので、フレーム#n-1の左から15番目の画素の画素値は、フレーム#n-2の左から15番目の画素の画素値から変化しない。同様に、フレーム#n-1の左から16番目の画素の画素値は、フレーム#n-2の左から16番目の画素の画素値から変化せず、フレーム#n-1の左から17番目の画素の画素値は、フレーム#n-2の左から17番目の画素の画素値から変化しない。
【0194】
すなわち、フレーム#nにおけるカバードバックグラウンド領域に属する画素に対応する、フレーム#n-1およびフレーム#n-2の画素は、背景の成分のみから成り、画素値が変化しないので、その差の絶対値は、ほぼ0の値となる。従って、フレーム#nにおける混合領域に属する画素に対応する、フレーム#n-1およびフレーム#n-2の画素に対する静動判定は、静動判定部122−4により、静止と判定される。
【0195】
フレーム#nにおけるカバードバックグラウンド領域に属する画素は、前景の成分を含むので、フレーム#n-1における背景の成分のみから成る場合と、画素値が異なる。従って、フレーム#nにおける混合領域に属する画素、および対応するフレーム#n-1の画素に対する静動判定は、静動判定部122−3により、動きと判定される。
【0196】
このように、領域判定部123−3は、静動判定部122−3から動きを示す静動判定の結果が供給され、静動判定部122−4から静止を示す静動判定の結果が供給されたとき、対応する画素がカバードバックグラウンド領域に属すると判定する。
【0197】
図26に示す、背景が静止し、前景の動き量vが4であるフレーム#nにおいて、アンカバードバックグラウンド領域に含まれる画素は、左から2番目乃至4番目の画素である。動き量vが4であるので、1つ後のフレーム#n+1において、左から2番目乃至4番目の画素は、背景の成分のみを含み、背景領域に属する。また、更に1つ後のフレーム#n+2において、左から2番目乃至4番目の画素は、背景の成分のみを含み、背景領域に属する。
【0198】
ここで、背景に対応するオブジェクトが静止しているので、フレーム#n+2の左から2番目の画素の画素値は、フレーム#n+1の左から2番目の画素の画素値から変化しない。同様に、フレーム#n+2の左から3番目の画素の画素値は、フレーム#n+1の左から3番目の画素の画素値から変化せず、フレーム#n+2の左から4番目の画素の画素値は、フレーム#n+1の左から4番目の画素の画素値から変化しない。
【0199】
すなわち、フレーム#nにおけるアンカバードバックグラウンド領域に属する画素に対応する、フレーム#n+1およびフレーム#n+2の画素は、背景の成分のみから成り、画素値が変化しないので、その差の絶対値は、ほぼ0の値となる。従って、フレーム#nにおける混合領域に属する画素に対応する、フレーム#n+1およびフレーム#n+2の画素に対する静動判定は、静動判定部122−1により、静止と判定される。
【0200】
フレーム#nにおけるアンカバードバックグラウンド領域に属する画素は、前景の成分を含むので、フレーム#n+1における背景の成分のみから成る場合と、画素値が異なる。従って、フレーム#nにおける混合領域に属する画素、および対応するフレーム#n+1の画素に対する静動判定は、静動判定部122−2により、動きと判定される。
【0201】
このように、領域判定部123−1は、静動判定部122−2から動きを示す静動判定の結果が供給され、静動判定部122−1から静止を示す静動判定の結果が供給されたとき、対応する画素がアンカバードバックグラウンド領域に属すると判定する。
【0202】
図27は、フレーム#nにおける領域特定部103の判定条件を示す図である。フレーム#nの判定の対象となる画素の画像上の位置と同一の位置にあるフレーム#n-2の画素と、フレーム#nの判定の対象となる画素の画像上の位置と同一の位置にあるフレーム#n-1の画素とが静止と判定され、フレーム#nの判定の対象となる画素の画像上の位置と同一の位置にあるフレーム#n-1の画素と、フレーム#nの画素とが動きと判定されたとき、領域特定部103は、フレーム#nの判定の対象となる画素がカバードバックグラウンド領域に属すると判定する。
【0203】
フレーム#nの判定の対象となる画素の画像上の位置と同一の位置にあるフレーム#n-1の画素と、フレーム#nの画素とが静止と判定され、フレーム#nの画素と、フレーム#nの判定の対象となる画素の画像上の位置と同一の位置にあるフレーム#n+1の画素とが静止と判定されたとき、領域特定部103は、フレーム#nの判定の対象となる画素が静止領域に属すると判定する。
【0204】
フレーム#nの判定の対象となる画素の画像上の位置と同一の位置にあるフレーム#n-1の画素と、フレーム#nの画素とが動きと判定され、フレーム#nの画素と、フレーム#nの判定の対象となる画素の画像上の位置と同一の位置にあるフレーム#n+1の画素とが動きと判定されたとき、領域特定部103は、フレーム#nの判定の対象となる画素が動き領域に属すると判定する。
【0205】
フレーム#nの画素と、フレーム#nの判定の対象となる画素の画像上の位置と同一の位置にあるフレーム#n+1の画素とが動きと判定され、フレーム#nの判定の対象となる画素の画像上の位置と同一の位置にあるフレーム#n+1の画素と、フレーム#nの判定の対象となる画素の画像上の位置と同一の位置にあるフレーム#n+2の画素とが静止と判定されたとき、領域特定部103は、フレーム#nの判定の対象となる画素がアンカバードバックグラウンド領域に属すると判定する。
【0206】
図28は、領域特定部103の領域の特定の結果の例を示す図である。図28(A)において、カバードバックグラウンド領域に属すると判定された画素は、白で表示されている。図28(B)において、アンカバードバックグラウンド領域に属すると判定された画素は、白で表示されている。
【0207】
図28(C)において、動き領域に属すると判定された画素は、白で表示されている。図28(D)において、静止領域に属すると判定された画素は、白で表示されている。
【0208】
図29は、判定フラグ格納フレームメモリ126が出力する領域情報の内、混合領域を示す領域情報を画像として示す図である。図29において、カバードバックグラウンド領域またはアンカバードバックグラウンド領域に属すると判定された画素、すなわち混合領域に属すると判定された画素は、白で表示されている。判定フラグ格納フレームメモリ126が出力する混合領域を示す領域情報は、混合領域、および前景領域内のテクスチャの無い部分に囲まれたテクスチャの有る部分を示す。
【0209】
次に、図30のフローチャートを参照して、領域特定部103の領域特定の処理を説明する。ステップS121において、フレームメモリ121は、判定の対象となるフレーム#nを含むフレーム#n-2乃至フレーム#n+2の画像を取得する。
【0210】
ステップS122において、静動判定部122−3は、フレーム#n-1の画素とフレーム#nの同一位置の画素とで、静止か否かを判定し、静止と判定された場合、ステップS123に進み、静動判定部122−2は、フレーム#nの画素とフレーム#n+1の同一位置の画素とで、静止か否かを判定する。
【0211】
ステップS123において、フレーム#nの画素とフレーム#n+1の同一位置の画素とで、静止と判定された場合、ステップS124に進み、領域判定部123−2は、領域の判定される画素に対応する静止領域判定フラグに、静止領域に属することを示す”1”を設定する。領域判定部123−2は、静止領域判定フラグを判定フラグ格納フレームメモリ124に供給し、手続きは、ステップS125に進む。
【0212】
ステップS122において、フレーム#n-1の画素とフレーム#nの同一位置の画素とで、動きと判定された場合、または、ステップS123において、フレーム#nの画素とフレーム#n+1の同一位置の画素とで、動きと判定された場合、フレーム#nの画素が静止領域には属さないので、ステップS124の処理はスキップされ、手続きは、ステップS125に進む。
【0213】
ステップS125において、静動判定部122−3は、フレーム#n-1の画素とフレーム#nの同一位置の画素とで、動きか否かを判定し、動きと判定された場合、ステップS126に進み、静動判定部122−2は、フレーム#nの画素とフレーム#n+1の同一位置の画素とで、動きか否かを判定する。
【0214】
ステップS126において、フレーム#nの画素とフレーム#n+1の同一位置の画素とで、動きと判定された場合、ステップS127に進み、領域判定部123−2は、領域の判定される画素に対応する動き領域判定フラグに、動き領域に属することを示す”1”を設定する。領域判定部123−2は、動き領域判定フラグを判定フラグ格納フレームメモリ124に供給し、手続きは、ステップS128に進む。
【0215】
ステップS125において、フレーム#n-1の画素とフレーム#nの同一位置の画素とで、静止と判定された場合、または、ステップS126において、フレーム#nの画素とフレーム#n+1の同一位置の画素とで、静止と判定された場合、フレーム#nの画素が動き領域には属さないので、ステップS127の処理はスキップされ、手続きは、ステップS128に進む。
【0216】
ステップS128において、静動判定部122−4は、フレーム#n-2の画素とフレーム#n-1の同一位置の画素とで、静止か否かを判定し、静止と判定された場合、ステップS129に進み、静動判定部122−3は、フレーム#n-1の画素とフレーム#nの同一位置の画素とで、動きか否かを判定する。
【0217】
ステップS129において、フレーム#n-1の画素とフレーム#nの同一位置の画素とで、動きと判定された場合、ステップS130に進み、領域判定部123−3は、領域の判定される画素に対応するカバードバックグラウンド領域判定フラグに、カバードバックグラウンド領域に属することを示す”1”を設定する。領域判定部123−3は、カバードバックグラウンド領域判定フラグを判定フラグ格納フレームメモリ124に供給し、手続きは、ステップS131に進む。
【0218】
ステップS128において、フレーム#n-2の画素とフレーム#n-1の同一位置の画素とで、動きと判定された場合、または、ステップS129において、フレーム#n-1の画素とフレーム#nの同一位置の画素とで、静止と判定された場合、フレーム#nの画素がカバードバックグラウンド領域には属さないので、ステップS130の処理はスキップされ、手続きは、ステップS131に進む。
【0219】
ステップS131において、静動判定部122−2は、フレーム#nの画素とフレーム#n+1の同一位置の画素とで、動きか否かを判定し、動きと判定された場合、ステップS132に進み、静動判定部122−1は、フレーム#n+1の画素とフレーム#n+2の同一位置の画素とで、静止か否かを判定する。
【0220】
ステップS132において、フレーム#n+1の画素とフレーム#n+2の同一位置の画素とで、静止と判定された場合、ステップS133に進み、領域判定部123−1は、領域の判定される画素に対応するアンカバードバックグラウンド領域判定フラグに、アンカバードバックグラウンド領域に属することを示す”1”を設定する。領域判定部123−1は、アンカバードバックグラウンド領域判定フラグを判定フラグ格納フレームメモリ124に供給し、手続きは、ステップS134に進む。
【0221】
ステップS131において、フレーム#nの画素とフレーム#n+1の同一位置の画素とで、静止と判定された場合、または、ステップS132において、フレーム#n+1の画素とフレーム#n+2の同一位置の画素とで、動きと判定された場合、フレーム#nの画素がアンカバードバックグラウンド領域には属さないので、ステップS133の処理はスキップされ、手続きは、ステップS134に進む。
【0222】
ステップS134において、領域特定部103は、フレーム#nの全ての画素について領域を特定したか否かを判定し、フレーム#nの全ての画素について領域を特定していないと判定された場合、手続きは、ステップS122に戻り、他の画素について、領域特定の処理を繰り返す。
【0223】
ステップS134において、フレーム#nの全ての画素について領域を特定したと判定された場合、ステップS135に進み、合成部125は、判定フラグ格納フレームメモリ124に記憶されているアンカバードバックグラウンド領域判定フラグ、およびカバードバックグラウンド領域判定フラグを基に、混合領域を示す領域情報を生成し、更に、各画素が、アンカバードバックグラウンド領域、静止領域、動き領域、およびカバードバックグラウンド領域のいずれかに属することを示す領域情報を生成し、生成した領域情報を判定フラグ格納フレームメモリ126に設定し、処理は終了する。
【0224】
このように、領域特定部103は、フレームに含まれている画素のそれぞれについて、動き領域、静止領域、アンカバードバックグラウンド領域、またはカバードバックグラウンド領域に属することを示す領域情報を生成することができる。
【0225】
なお、領域特定部103は、アンカバードバックグラウンド領域およびカバードバックグラウンド領域に対応する領域情報に論理和を適用することにより、混合領域に対応する領域情報を生成して、フレームに含まれている画素のそれぞれについて、動き領域、静止領域、または混合領域に属することを示すフラグから成る領域情報を生成するようにしてもよい。
【0226】
前景に対応するオブジェクトがテクスチャを有す場合、領域特定部103は、より正確に動き領域を特定することができる。
【0227】
領域特定部103は、動き領域を示す領域情報を前景領域を示す領域情報として、また、静止領域を示す領域情報を背景領域を示す領域情報として出力することができる。
【0228】
なお、背景に対応するオブジェクトが静止しているとして説明したが、背景領域に対応する画像が動きを含んでいても上述した領域を特定する処理を適用することができる。例えば、背景領域に対応する画像が一様に動いているとき、領域特定部103は、この動きに対応して画像全体をシフトさせ、背景に対応するオブジェクトが静止している場合と同様に処理する。また、背景領域に対応する画像が局所毎に異なる動きを含んでいるとき、領域特定部103は、動きに対応した画素を選択して、上述の処理を実行する。
【0229】
図31は、混合比算出部104の構成を示すブロック図である。推定混合比処理部201は、入力画像を基に、カバードバックグラウンド領域のモデルに対応する演算により、画素毎に推定混合比を算出して、算出した推定混合比を混合比決定部203に供給する。
【0230】
推定混合比処理部202は、入力画像を基に、アンカバードバックグラウンド領域のモデルに対応する演算により、画素毎に推定混合比を算出して、算出した推定混合比を混合比決定部203に供給する。
【0231】
前景に対応するオブジェクトがシャッタ時間内に等速で動いていると仮定できるので、混合領域に属する画素の混合比αは、以下の性質を有する。すなわち、混合比αは、画素の位置の変化に対応して、直線的に変化する。画素の位置の変化を1次元とすれば、混合比αの変化は、直線で表現することができ、画素の位置の変化を2次元とすれば、混合比αの変化は、平面で表現することができる。
【0232】
なお、1フレームの期間は短いので、前景に対応するオブジェクトが剛体であり、等速で移動していると仮定が成り立つ。
【0233】
この場合、混合比αの傾きは、前景のシャッタ時間内での動き量vの逆比となる。
【0234】
理想的な混合比αの例を図32に示す。理想的な混合比αの混合領域における傾きlは、動き量vの逆数として表すことができる。
【0235】
図32に示すように、理想的な混合比αは、背景領域において、1の値を有し、前景領域において、0の値を有し、混合領域において、0を越え1未満の値を有する。
【0236】
図33の例において、フレーム#nの左から7番目の画素の画素値C06は、フレーム#n-1の左から7番目の画素の画素値P06を用いて、式(4)で表すことができる。
【0237】
【数2】
【0238】
式(4)において、画素値C06を混合領域の画素の画素値Mと、画素値P06を背景領域の画素の画素値Bと表現する。すなわち、混合領域の画素の画素値Mおよび背景領域の画素の画素値Bは、それぞれ、式(5)および式(6)のように表現することができる。
【0239】
M=C06 (5)
B=P06 (6)
【0240】
式(4)中の2/vは、混合比αに対応する。動き量vが4なので、フレーム#nの左から7番目の画素の混合比αは、0.5となる。
【0241】
以上のように、注目しているフレーム#nの画素値Cを混合領域の画素値と見なし、フレーム#nの前のフレーム#n-1の画素値Pを背景領域の画素値と見なすことで、混合比αを示す式(3)は、式(7)のように書き換えられる。
【0242】
C=α・P+f (7)
式(7)のfは、注目している画素に含まれる前景の成分の和ΣiFi/vである。式(7)に含まれる変数は、混合比αおよび前景の成分の和fの2つである。
【0243】
同様に、アンカバードバックグラウンド領域における、動き量vが4であり、時間方向の仮想分割数が4である、画素値を時間方向に展開したモデルを図34に示す。
【0244】
アンカバードバックグラウンド領域において、上述したカバードバックグラウンド領域における表現と同様に、注目しているフレーム#nの画素値Cを混合領域の画素値と見なし、フレーム#nの後のフレーム#n+1の画素値Nを背景領域の画素値と見なすことで、混合比αを示す式(3)は、式(8)のように表現することができる。
【0245】
C=α・N+f (8)
【0246】
なお、背景のオブジェクトが静止しているとして説明したが、背景のオブジェクトが動いている場合においても、背景の動き量vに対応させた位置の画素の画素値を利用することにより、式(4)乃至式(8)を適用することができる。例えば、図33において、背景に対応するオブジェクトの動き量vが2であり、仮想分割数が2であるとき、背景に対応するオブジェクトが図中の右側に動いているとき、式(6)における背景領域の画素の画素値Bは、画素値P04とされる。
【0247】
式(7)および式(8)は、それぞれ2つの変数を含むので、そのままでは混合比αを求めることができない。ここで、画像は一般的に空間的に相関が強いので近接する画素同士でほぼ同じ画素値となる。
【0248】
そこで、前景成分は、空間的に相関が強いので、前景の成分の和fを前または後のフレームから導き出せるように式を変形して、混合比αを求める。
【0249】
図35のフレーム#nの左から7番目の画素の画素値Mcは、式(9)で表すことができる。
【0250】
【数3】
式(9)の右辺第1項の2/vは、混合比αに相当する。式(9)の右辺第2項は、後のフレーム#n+1の画素値を利用して、式(10)のように表すこととする。
【0251】
【数4】
【0252】
ここで、前景の成分の空間相関を利用して、式(11)が成立するとする。
【0253】
F=F05=F06=F07=F08=F09=F10=F11=F12 (11)
式(10)は、式(11)を利用して、式(12)のように置き換えることができる。
【0254】
【数5】
【0255】
結果として、βは、式(13)で表すことができる。
【0256】
β=2/4 (13)
【0257】
一般的に、式(11)に示すように混合領域に関係する前景の成分が等しいと仮定すると、混合領域の全ての画素について、内分比の関係から式(14)が成立する。
【0258】
β=1-α (14)
【0259】
式(14)が成立するとすれば、式(7)は、式(15)に示すように展開することができる。
【0260】
【数6】
【0261】
同様に、式(14)が成立するとすれば、式(8)は、式(16)に示すように展開することができる。
【0262】
【数7】
【0263】
式(15)および式(16)において、C,N、およびPは、既知の画素値なので、式(15)および式(16)に含まれる変数は、混合比αのみである。式(15)および式(16)における、C,N、およびPの関係を図36に示す。Cは、混合比αを算出する、フレーム#nの注目している画素の画素値である。Nは、注目している画素と空間方向の位置が対応する、フレーム#n+1の画素の画素値である。Pは、注目している画素と空間方向の位置が対応する、フレーム#n-1の画素の画素値である。
【0264】
従って、式(15)および式(16)のそれぞれに1つの変数が含まれることとなるので、3つのフレームの画素の画素値を利用して、混合比αを算出することができる。式(15)および式(16)を解くことにより、正しい混合比αが算出されるための条件は、混合領域に関係する前景の成分が等しい、すなわち、前景のオブジェクトが静止しているとき撮像された前景の画像オブジェクトにおいて、前景のオブジェクトの動きの方向に対応する、画像オブジェクトの境界に位置する画素であって、動き量vの2倍の数の連続している画素の画素値が、一定であることである。
【0265】
以上のように、カバードバックグラウンド領域に属する画素の混合比αは、式(17)により算出され、アンカバードバックグラウンド領域に属する画素の混合比αは、式(18)により算出される。
【0266】
α=(C-N)/(P-N) (17)
α=(C-P)/(N-P) (18)
【0267】
図37は、推定混合比処理部201の構成を示すブロック図である。フレームメモリ221は、入力された画像をフレーム単位で記憶し、入力画像として入力されているフレームから1つ後のフレームをフレームメモリ222および混合比演算部223に供給する。
【0268】
フレームメモリ222は、入力された画像をフレーム単位で記憶し、フレームメモリ221から供給されているフレームから1つ後のフレームを混合比演算部223に供給する。
【0269】
従って、入力画像としてフレーム#n+1が混合比演算部223に入力されているとき、フレームメモリ221は、フレーム#nを混合比演算部223に供給し、フレームメモリ222は、フレーム#n-1を混合比演算部223に供給する。
【0270】
混合比演算部223は、式(17)に示す演算により、フレーム#nの注目している画素の画素値C、注目している画素と空間的位置が対応する、フレーム#n+1の画素の画素値N、および注目している画素と空間的位置が対応する、フレーム#n-1の画素の画素値Pを基に、注目している画素の推定混合比を算出して、算出した推定混合比を出力する。例えば、背景が静止しているとき、混合比演算部223は、フレーム#nの注目している画素の画素値C、注目している画素とフレーム内の位置が同じ、フレーム#n+1の画素の画素値N、および注目している画素とフレーム内の位置が同じ、フレーム#n-1の画素の画素値Pを基に、注目している画素の推定混合比を算出して、算出した推定混合比を出力する。
【0271】
このように、推定混合比処理部201は、入力画像を基に、推定混合比を算出して、混合比決定部203に供給することができる。
【0272】
なお、推定混合比処理部202は、推定混合比処理部201が式(17)に示す演算により、注目している画素の推定混合比を算出するのに対して、式(18)に示す演算により、注目している画素の推定混合比を算出する部分が異なることを除き、推定混合比処理部201と同様なので、その説明は省略する。
【0273】
図38は、推定混合比処理部201により算出された推定混合比の例を示す図である。図38に示す推定混合比は、等速で動いているオブジェクトに対応する前景の動き量vが11である場合の結果を、1ラインに対して示すものである。
【0274】
推定混合比は、混合領域において、図32に示すように、ほぼ直線的に変化していることがわかる。
【0275】
図31に戻り、混合比決定部203は、領域特定部103から供給された、混合比αの算出の対象となる画素が、前景領域、背景領域、カバードバックグラウンド領域、またはアンカバードバックグラウンド領域のいずれかに属するかを示す領域情報を基に、混合比αを設定する。混合比決定部203は、対象となる画素が前景領域に属する場合、0を混合比αに設定し、対象となる画素が背景領域に属する場合、1を混合比αに設定し、対象となる画素がカバードバックグラウンド領域に属する場合、推定混合比処理部201から供給された推定混合比を混合比αに設定し、対象となる画素がアンカバードバックグラウンド領域に属する場合、推定混合比処理部202から供給された推定混合比を混合比αに設定する。混合比決定部203は、領域情報を基に設定した混合比αを出力する。
【0276】
図39は、混合比算出部104の他の構成を示すブロック図である。選択部231は、領域特定部103から供給された領域情報を基に、カバードバックグラウンド領域に属する画素および、これに対応する前および後のフレームの画素を推定混合比処理部232に供給する。選択部231は、領域特定部103から供給された領域情報を基に、アンカバードバックグラウンド領域に属する画素および、これに対応する前および後のフレームの画素を推定混合比処理部233に供給する。
【0277】
推定混合比処理部232は、選択部231から入力された画素値を基に、式(17)に示す演算により、カバードバックグラウンド領域に属する、注目している画素の推定混合比を算出して、算出した推定混合比を選択部234に供給する。
【0278】
推定混合比処理部233は、選択部231から入力された画素値を基に、式(18)に示す演算により、アンカバードバックグラウンド領域に属する、注目している画素の推定混合比を算出して、算出した推定混合比を選択部234に供給する。
【0279】
選択部234は、領域特定部103から供給された領域情報を基に、対象となる画素が前景領域に属する場合、0である推定混合比を選択して、混合比αに設定し、対象となる画素が背景領域に属する場合、1である推定混合比を選択して、混合比αに設定する。選択部234は、対象となる画素がカバードバックグラウンド領域に属する場合、推定混合比処理部232から供給された推定混合比を選択して混合比αに設定し、対象となる画素がアンカバードバックグラウンド領域に属する場合、推定混合比処理部233から供給された推定混合比を選択して混合比αに設定する。選択部234は、領域情報を基に選択して設定した混合比αを出力する。
【0280】
このように、図39に示す他の構成を有する混合比算出部104は、画像の含まれる画素毎に混合比αを算出して、算出した混合比αを出力することができる。
【0281】
図40のフローチャートを参照して、図31に構成を示す混合比算出部104の混合比αの算出の処理を説明する。ステップS151において、混合比算出部104は、領域特定部103から供給された領域情報を取得する。ステップS152において、推定混合比処理部201は、カバードバックグラウンド領域に対応するモデルにより推定混合比の演算の処理を実行し、算出した推定混合比を混合比決定部203に供給する。混合比推定の演算の処理の詳細は、図41のフローチャートを参照して、後述する。
【0282】
ステップS153において、推定混合比処理部202は、アンカバードバックグラウンド領域に対応するモデルにより推定混合比の演算の処理を実行し、算出した推定混合比を混合比決定部203に供給する。
【0283】
ステップS154において、混合比算出部104は、フレーム全体について、混合比αを推定したか否かを判定し、フレーム全体について、混合比αを推定していないと判定された場合、ステップS152に戻り、次の画素について混合比αを推定する処理を実行する。
【0284】
ステップS154において、フレーム全体について、混合比αを推定したと判定された場合、ステップS155に進み、混合比決定部203は、画素が、前景領域、背景領域、カバードバックグラウンド領域、またはアンカバードバックグラウンド領域のいずれかに属するかを示す、領域特定部103から供給された領域情報を基に、混合比αを設定する。混合比決定部203は、対象となる画素が前景領域に属する場合、0を混合比αに設定し、対象となる画素が背景領域に属する場合、1を混合比αに設定し、対象となる画素がカバードバックグラウンド領域に属する場合、推定混合比処理部201から供給された推定混合比を混合比αに設定し、対象となる画素がアンカバードバックグラウンド領域に属する場合、推定混合比処理部202から供給された推定混合比を混合比αに設定し、処理は終了する。
【0285】
このように、混合比算出部104は、領域特定部103から供給された領域情報、および入力画像を基に、各画素に対応する特徴量である混合比αを算出することができる。
【0286】
図39に構成を示す混合比算出部104の混合比αの算出の処理は、図40のフローチャートで説明した処理と同様なので、その説明は省略する。
【0287】
次に、図40のステップS152に対応する、カバードバックグラウンド領域に対応するモデルによる混合比推定の処理を図41のフローチャートを参照して説明する。
【0288】
ステップS171において、混合比演算部223は、フレームメモリ221から、フレーム#nの注目画素の画素値Cを取得する。
【0289】
ステップS172において、混合比演算部223は、フレームメモリ222から、注目画素に対応する、フレーム#n-1の画素の画素値Pを取得する。
【0290】
ステップS173において、混合比演算部223は、入力画像に含まれる注目画素に対応する、フレーム#n+1の画素の画素値Nを取得する。
【0291】
ステップS174において、混合比演算部223は、フレーム#nの注目画素の画素値C、フレーム#n-1の画素の画素値P、およびフレーム#n+1の画素の画素値Nを基に、推定混合比を演算する。
【0292】
ステップS175において、混合比演算部223は、フレーム全体について、推定混合比を演算する処理を終了したか否かを判定し、フレーム全体について、推定混合比を演算する処理を終了していないと判定された場合、ステップS171に戻り、次の画素について推定混合比を算出する処理を繰り返す。
【0293】
ステップS175において、フレーム全体について、推定混合比を演算する処理を終了したと判定された場合、処理は終了する。
【0294】
このように、推定混合比処理部201は、入力画像を基に、推定混合比を演算することができる。
【0295】
図40のステップS153におけるアンカバードバックグラウンド領域に対応するモデルによる混合比推定の処理は、アンカバードバックグラウンド領域のモデルに対応する式を利用した、図41のフローチャートに示す処理と同様なので、その説明は省略する。
【0296】
なお、図39に示す推定混合比処理部232および推定混合比処理部233は、図41に示すフローチャートと同様の処理を実行して推定混合比を演算するので、その説明は省略する。
【0297】
また、背景に対応するオブジェクトが静止しているとして説明したが、背景領域に対応する画像が動きを含んでいても上述した混合比αを求める処理を適用することができる。例えば、背景領域に対応する画像が一様に動いているとき、推定混合比処理部201は、背景の動きに対応して画像全体をシフトさせ、背景に対応するオブジェクトが静止している場合と同様に処理する。また、背景領域に対応する画像が局所毎に異なる背景の動きを含んでいるとき、推定混合比処理部201は、混合領域に属する画素に対応する画素として、背景の動きに対応した画素を選択して、上述の処理を実行する。
【0298】
なお、図31または図39に示す混合比算出部104の構成は、一例である。
【0299】
また、混合比算出部104は、全ての画素について、カバードバックグラウンド領域に対応するモデルによる混合比推定の処理のみを実行して、算出された推定混合比を混合比αとして出力するようにしてもよい。この場合において、混合比αは、カバードバックグラウンド領域に属する画素について、背景の成分の割合を示し、アンカバードバックグラウンド領域に属する画素について、前景の成分の割合を示す。アンカバードバックグラウンド領域に属する画素について、このように算出された混合比αと1との差分の絶対値を算出して、算出した絶対値を混合比αに設定すれば、信号処理部12は、アンカバードバックグラウンド領域に属する画素について、背景の成分の割合を示す混合比αを求めることができる。
【0300】
なお、同様に、混合比算出部104は、全ての画素について、アンカバードバックグラウンド領域に対応するモデルによる混合比推定の処理のみを実行して、算出された推定混合比を混合比αとして出力するようにしてもよい。
【0301】
次に、前景背景分離部105について説明する。図42は、前景背景分離部105の構成の一例を示すブロック図である。前景背景分離部105に供給された入力画像は、分離部251、スイッチ252、およびスイッチ254に供給される。カバードバックグラウンド領域を示す情報、およびアンカバードバックグラウンド領域を示す、領域特定部103から供給された領域情報は、分離部251に供給される。前景領域を示す領域情報は、スイッチ252に供給される。背景領域を示す領域情報は、スイッチ254に供給される。
【0302】
混合比算出部104から供給された混合比αは、分離部251に供給される。
【0303】
分離部251は、カバードバックグラウンド領域を示す領域情報、アンカバードバックグラウンド領域を示す領域情報、および混合比αを基に、入力画像から前景の成分を分離して、分離した前景の成分を合成部253に供給するとともに、入力画像から背景の成分を分離して、分離した背景の成分を合成部255に供給する。
【0304】
スイッチ252は、前景領域を示す領域情報を基に、前景に対応する画素が入力されたとき、閉じられ、入力画像に含まれる前景に対応する画素のみを合成部253に供給する。
【0305】
スイッチ254は、背景領域を示す領域情報を基に、背景に対応する画素が入力されたとき、閉じられ、入力画像に含まれる背景に対応する画素のみを合成部255に供給する。
【0306】
合成部253は、分離部251から供給された前景に対応する成分、スイッチ252から供給された前景に対応する画素を基に、前景成分画像を合成し、合成した前景成分画像を出力する。前景領域と混合領域とは重複しないので、合成部253は、例えば、前景に対応する成分と、前景に対応する画素とに論理和の演算を適用して、前景成分画像を合成する。
【0307】
合成部253は、前景成分画像の合成の処理の最初に実行される初期化の処理において、内蔵しているフレームメモリに全ての画素値が0である画像を格納し、前景成分画像の合成の処理において、前景成分画像を格納(上書き)する。従って、合成部253が出力する前景成分画像の内、背景領域に対応する画素には、画素値として0が格納されている。
【0308】
合成部255は、分離部251から供給された背景に対応する成分、スイッチ254から供給された背景に対応する画素を基に、背景成分画像を合成して、合成した背景成分画像を出力する。背景領域と混合領域とは重複しないので、合成部255は、例えば、背景に対応する成分と、背景に対応する画素とに論理和の演算を適用して、背景成分画像を合成する。
【0309】
合成部255は、背景成分画像の合成の処理の最初に実行される初期化の処理において、内蔵しているフレームメモリに全ての画素値が0である画像を格納し、背景成分画像の合成の処理において、背景成分画像を格納(上書き)する。従って、合成部255が出力する背景成分画像の内、前景領域に対応する画素には、画素値として0が格納されている。
【0310】
図43は、前景背景分離部105に入力される入力画像、並びに前景背景分離部105から出力される前景成分画像および背景成分画像を示す図である。
【0311】
図43(A)は、表示される画像の模式図であり、図43(B)は、図43(A)に対応する前景領域に属する画素、背景領域に属する画素、および混合領域に属する画素を含む1ラインの画素を時間方向に展開したモデル図を示す。
【0312】
図43(A)および図43(B)に示すように、前景背景分離部105から出力される背景成分画像は、背景領域に属する画素、および混合領域の画素に含まれる背景の成分から構成される。
【0313】
図43(A)および図43(B)に示すように、前景背景分離部105から出力される前景成分画像は、前景領域に属する画素、および混合領域の画素に含まれる前景の成分から構成される。
【0314】
混合領域の画素の画素値は、前景背景分離部105により、背景の成分と、前景の成分とに分離される。分離された背景の成分は、背景領域に属する画素と共に、背景成分画像を構成する。分離された前景の成分は、前景領域に属する画素と共に、前景成分画像を構成する。
【0315】
このように、前景成分画像は、背景領域に対応する画素の画素値が0とされ、前景領域に対応する画素および混合領域に対応する画素に意味のある画素値が設定される。同様に、背景成分画像は、前景領域に対応する画素の画素値が0とされ、背景領域に対応する画素および混合領域に対応する画素に意味のある画素値が設定される。
【0316】
次に、分離部251が実行する、混合領域に属する画素から前景の成分、および背景の成分を分離する処理について説明する。
【0317】
図44は、図中の左から右に移動するオブジェクトに対応する前景を含む、2つのフレームの前景の成分および背景の成分を示す画像のモデルである。図44に示す画像のモデルにおいて、前景の動き量vは4であり、仮想分割数は、4とされている。
【0318】
フレーム#nにおいて、最も左の画素、および左から14番目乃至18番目の画素は、背景の成分のみから成り、背景領域に属する。フレーム#nにおいて、左から2番目乃至4番目の画素は、背景の成分および前景の成分を含み、アンカバードバックグラウンド領域に属する。フレーム#nにおいて、左から11番目乃至13番目の画素は、背景の成分および前景の成分を含み、カバードバックグラウンド領域に属する。フレーム#nにおいて、左から5番目乃至10番目の画素は、前景の成分のみから成り、前景領域に属する。
【0319】
フレーム#n+1において、左から1番目乃至5番目の画素、および左から18番目の画素は、背景の成分のみから成り、背景領域に属する。フレーム#n+1において、左から6番目乃至8番目の画素は、背景の成分および前景の成分を含み、アンカバードバックグラウンド領域に属する。フレーム#n+1において、左から15番目乃至17番目の画素は、背景の成分および前景の成分を含み、カバードバックグラウンド領域に属する。フレーム#n+1において、左から9番目乃至14番目の画素は、前景の成分のみから成り、前景領域に属する。
【0320】
図45は、カバードバックグラウンド領域に属する画素から前景の成分を分離する処理を説明する図である。図45において、α1乃至α18は、フレーム#nにおける画素のぞれぞれに対応する混合比である。図45において、左から15番目乃至17番目の画素は、カバードバックグラウンド領域に属する。
【0321】
フレーム#nの左から15番目の画素の画素値C15は、式(19)で表される。
【0322】
C15=B15/v+F09/v+F08/v+F07/v
=α15・B15+F09/v+F08/v+F07/v
=α15・P15+F09/v+F08/v+F07/v (19)
ここで、α15は、フレーム#nの左から15番目の画素の混合比である。P15は、フレーム#n-1の左から15番目の画素の画素値である。
【0323】
式(19)を基に、フレーム#nの左から15番目の画素の前景の成分の和f15は、式(20)で表される。
【0324】
f15=F09/v+F08/v+F07/v
=C15-α15・P15 (20)
【0325】
同様に、フレーム#nの左から16番目の画素の前景の成分の和f16は、式(21)で表され、フレーム#nの左から17番目の画素の前景の成分の和f17は、式(22)で表される。
【0326】
f16=C16-α16・P16 (21)
f17=C17-α17・P17 (22)
このように、カバードバックグラウンド領域に属する画素の画素値Cに含まれる前景の成分fcは、式(23)で計算される。
【0327】
fc=C-α・P (23)
Pは、1つ前のフレームの、対応する画素の画素値である。
【0328】
図46は、アンカバードバックグラウンド領域に属する画素から前景の成分を分離する処理を説明する図である。図46において、α1乃至α18は、フレーム#nにおける画素のぞれぞれに対応する混合比である。図46において、左から2番目乃至4番目の画素は、アンカバードバックグラウンド領域に属する。
【0329】
フレーム#nの左から2番目の画素の画素値C02は、式(24)で表される。
【0330】
C02=B02/v+B02/v+B02/v+F01/v
=α2・B02+F01/v
=α2・N02+F01/v (24)
ここで、α2は、フレーム#nの左から2番目の画素の混合比である。N02は、フレーム#n+1の左から2番目の画素の画素値である。
【0331】
式(24)を基に、フレーム#nの左から2番目の画素の前景の成分の和f02は、式(25)で表される。
【0332】
f02=F01/v
=C02-α2・N02 (25)
【0333】
同様に、フレーム#nの左から3番目の画素の前景の成分の和f03は、式(26)で表され、フレーム#nの左から4番目の画素の前景の成分の和f04は、式(27)で表される。
【0334】
f03=C03-α3・N03 (26)
f04=C04-α4・N04 (27)
【0335】
このように、アンカバードバックグラウンド領域に属する画素の画素値Cに含まれる前景の成分fuは、式(28)で計算される。
【0336】
fu=C-α・N (28)
Nは、1つ後のフレームの、対応する画素の画素値である。
【0337】
このように、分離部251は、領域情報に含まれる、カバードバックグラウンド領域を示す情報、およびアンカバードバックグラウンド領域を示す情報、並びに画素毎の混合比αを基に、混合領域に属する画素から前景の成分、および背景の成分を分離することができる。
【0338】
図47は、以上で説明した処理を実行する分離部251の構成の一例を示すブロック図である。分離部251に入力された画像は、フレームメモリ301に供給され、混合比算出部104から供給されたカバードバックグラウンド領域およびアンカバードバックグラウンド領域を示す領域情報、並びに混合比αは、分離処理ブロック302に入力される。
【0339】
フレームメモリ301は、入力された画像をフレーム単位で記憶する。フレームメモリ301は、処理の対象がフレーム#nであるとき、フレーム#nの1つ前のフレームであるフレーム#n-1、フレーム#n、およびフレーム#nの1つ後のフレームであるフレーム#n+1を記憶する。
【0340】
フレームメモリ301は、フレーム#n-1、フレーム#n、およびフレーム#n+1の対応する画素を分離処理ブロック302に供給する。
【0341】
分離処理ブロック302は、カバードバックグラウンド領域およびアンカバードバックグラウンド領域を示す領域情報、並びに混合比αを基に、フレームメモリ301から供給されたフレーム#n-1、フレーム#n、およびフレーム#n+1の対応する画素の画素値に図45および図46を参照して説明した演算を適用して、フレーム#nの混合領域に属する画素から前景の成分および背景の成分を分離して、フレームメモリ303に供給する。
【0342】
分離処理ブロック302は、アンカバード領域処理部311、カバード領域処理部312、合成部313、および合成部314で構成されている。
【0343】
アンカバード領域処理部311の乗算器321は、混合比αを、フレームメモリ301から供給されたフレーム#n+1の画素の画素値に乗じて、スイッチ322に出力する。スイッチ322は、フレームメモリ301から供給されたフレーム#nの画素(フレーム#n+1の画素に対応する)がアンカバードバックグラウンド領域であるとき、閉じられ、乗算器321から供給された混合比αを乗じた画素値を演算器322および合成部314に供給する。スイッチ322から出力されるフレーム#n+1の画素の画素値に混合比αを乗じた値は、フレーム#nの対応する画素の画素値の背景の成分に等しい。
【0344】
演算器323は、フレームメモリ301から供給されたフレーム#nの画素の画素値から、スイッチ322から供給された背景の成分を減じて、前景の成分を求める。演算器323は、アンカバードバックグラウンド領域に属する、フレーム#nの画素の前景の成分を合成部313に供給する。
【0345】
カバード領域処理部312の乗算器331は、混合比αを、フレームメモリ301から供給されたフレーム#n-1の画素の画素値に乗じて、スイッチ332に出力する。スイッチ332は、フレームメモリ301から供給されたフレーム#nの画素(フレーム#n-1の画素に対応する)がカバードバックグラウンド領域であるとき、閉じられ、乗算器331から供給された混合比αを乗じた画素値を演算器333および合成部314に供給する。スイッチ332から出力されるフレーム#n-1の画素の画素値に混合比αを乗じた値は、フレーム#nの対応する画素の画素値の背景の成分に等しい。
【0346】
演算器333は、フレームメモリ301から供給されたフレーム#nの画素の画素値から、スイッチ332から供給された背景の成分を減じて、前景の成分を求める。演算器333は、カバードバックグラウンド領域に属する、フレーム#nの画素の前景の成分を合成部313に供給する。
【0347】
合成部313は、フレーム#nの、演算器323から供給された、アンカバードバックグラウンド領域に属する画素の前景の成分、および演算器333から供給された、カバードバックグラウンド領域に属する画素の前景の成分を合成して、フレームメモリ303に供給する。
【0348】
合成部314は、フレーム#nの、スイッチ322から供給された、アンカバードバックグラウンド領域に属する画素の背景の成分、およびスイッチ332から供給された、カバードバックグラウンド領域に属する画素の背景の成分を合成して、フレームメモリ303に供給する。
【0349】
フレームメモリ303は、分離処理ブロック302から供給された、フレーム#nの混合領域の画素の前景の成分と、背景の成分とをそれぞれに記憶する。
【0350】
フレームメモリ303は、記憶しているフレーム#nの混合領域の画素の前景の成分、および記憶しているフレーム#nの混合領域の画素の背景の成分を出力する。
【0351】
特徴量である混合比αを利用することにより、画素値に含まれる前景の成分と背景の成分とを完全に分離することが可能になる。
【0352】
合成部253は、分離部251から出力された、フレーム#nの混合領域の画素の前景の成分と、前景領域に属する画素とを合成して前景成分画像を生成する。合成部255は、分離部251から出力された、フレーム#nの混合領域の画素の背景の成分と、背景領域に属する画素とを合成して背景成分画像を生成する。
【0353】
図48は、図44のフレーム#nに対応する、前景成分画像の例と、背景成分画像の例を示す図である。
【0354】
図48(A)は、図44のフレーム#nに対応する、前景成分画像の例を示す。最も左の画素、および左から14番目の画素は、前景と背景が分離される前において、背景の成分のみから成っていたので、画素値が0とされる。
【0355】
左から2番目乃至4番目の画素は、前景と背景とが分離される前において、アンカバードバックグラウンド領域に属し、背景の成分が0とされ、前景の成分がそのまま残されている。左から11番目乃至13番目の画素は、前景と背景とが分離される前において、カバードバックグラウンド領域に属し、背景の成分が0とされ、前景の成分がそのまま残されている。左から5番目乃至10番目の画素は、前景の成分のみから成るので、そのまま残される。
【0356】
図48(B)は、図44のフレーム#nに対応する、背景成分画像の例を示す。最も左の画素、および左から14番目の画素は、前景と背景とが分離される前において、背景の成分のみから成っていたので、そのまま残される。
【0357】
左から2番目乃至4番目の画素は、前景と背景とが分離される前において、アンカバードバックグラウンド領域に属し、前景の成分が0とされ、背景の成分がそのまま残されている。左から11番目乃至13番目の画素は、前景と背景とが分離される前において、カバードバックグラウンド領域に属し、前景の成分が0とされ、背景の成分がそのまま残されている。左から5番目乃至10番目の画素は、前景と背景とが分離される前において、前景の成分のみから成っていたので、画素値が0とされる。
【0358】
次に、図49に示すフローチャートを参照して、前景背景分離部105による前景と背景との分離の処理を説明する。ステップS201において、分離部251のフレームメモリ301は、入力画像を取得し、前景と背景との分離の対象となるフレーム#nを、その前のフレーム#n-1およびその後のフレーム#n+1と共に記憶する。
【0359】
ステップS202において、分離部251の分離処理ブロック302は、混合比算出部104から供給された領域情報を取得する。ステップS203において、分離部251の分離処理ブロック302は、混合比算出部104から供給された混合比αを取得する。
【0360】
ステップS204において、アンカバード領域処理部311は、領域情報および混合比αを基に、フレームメモリ301から供給された、アンカバードバックグラウンド領域に属する画素の画素値から、背景の成分を抽出する。
【0361】
ステップS205において、アンカバード領域処理部311は、領域情報および混合比αを基に、フレームメモリ301から供給された、アンカバードバックグラウンド領域に属する画素の画素値から、前景の成分を抽出する。
【0362】
ステップS206において、カバード領域処理部312は、領域情報および混合比αを基に、フレームメモリ301から供給された、カバードバックグラウンド領域に属する画素の画素値から、背景の成分を抽出する。
【0363】
ステップS207において、カバード領域処理部312は、領域情報および混合比αを基に、フレームメモリ301から供給された、カバードバックグラウンド領域に属する画素の画素値から、前景の成分を抽出する。
【0364】
ステップS208において、合成部313は、ステップS205の処理で抽出されたアンカバードバックグラウンド領域に属する画素の前景の成分と、ステップS207の処理で抽出されたカバードバックグラウンド領域に属する画素の前景の成分とを合成する。合成された前景の成分は、合成部253に供給される。更に、合成部253は、スイッチ252を介して供給された前景領域に属する画素と、分離部251から供給された前景の成分とを合成して、前景成分画像を生成する。
【0365】
ステップS209において、合成部314は、ステップS204の処理で抽出されたアンカバードバックグラウンド領域に属する画素の背景の成分と、ステップS206の処理で抽出されたカバードバックグラウンド領域に属する画素の背景の成分とを合成する。合成された背景の成分は、合成部255に供給される。更に、合成部255は、スイッチ254を介して供給された背景領域に属する画素と、分離部251から供給された背景の成分とを合成して、背景成分画像を生成する。
【0366】
ステップS210において、合成部253は、前景成分画像を出力する。ステップS211において、合成部255は、背景成分画像を出力し、処理は終了する。
【0367】
このように、前景背景分離部105は、領域情報および混合比αを基に、入力画像から前景の成分と、背景の成分とを分離し、前景の成分のみから成る前景成分画像、および背景の成分のみから成る背景成分画像を出力することができる。
【0368】
次に、前景成分画像からの動きボケの量の調整について説明する。
【0369】
図50は、動きボケ調整部106の構成の一例を示すブロック図である。動き検出部102から供給された動きベクトルとその位置情報、および領域特定部103から供給された領域情報は、処理単位決定部351およびモデル化部352に供給される。前景背景分離部105から供給された前景成分画像は、足し込み部354に供給される。
【0370】
処理単位決定部351は、動きベクトルとその位置情報、および領域情報を基に、動きベクトルと共に、生成した処理単位をモデル化部352に供給する。処理単位決定部351は、生成した処理単位を足し込み部354に供給する。
【0371】
処理単位決定部351が生成する処理単位は、図51に例を示すように、前景成分画像のカバードバックグラウンド領域に対応する画素から始まり、アンカバードバックグラウンド領域に対応する画素までの動き方向に並ぶ連続する画素、またはアンカバードバックグラウンド領域に対応する画素から始まり、カバードバックグラウンド領域に対応する画素までの動き方向に並ぶ連続する画素を示す。処理単位は、例えば、左上点(処理単位で指定される画素であって、画像上で最も左または最も上に位置する画素の位置)および右下点の2つのデータから成る。
【0372】
モデル化部352は、動きベクトルおよび入力された処理単位を基に、モデル化を実行する。より具体的には、例えば、モデル化部352は、処理単位に含まれる画素の数、画素値の時間方向の仮想分割数、および画素毎の前景の成分の数に対応する複数のモデルを予め記憶しておき、処理単位、および画素値の時間方向の仮想分割数を基に、図52に示すような、画素値と前景の成分との対応を指定するモデルを選択するようにしても良い。
【0373】
例えば、処理単位に対応する画素の数が12でありシャッタ時間内の動き量vが5であるときにおいては、モデル化部352は、仮想分割数を5とし、最も左に位置する画素が1つの前景の成分を含み、左から2番目の画素が2つの前景の成分を含み、左から3番目の画素が3つの前景の成分を含み、左から4番目の画素が4つの前景の成分を含み、左から5番目の画素が5つの前景の成分を含み、左から6番目の画素が5つの前景の成分を含み、左から7番目の画素が5つの前景の成分を含み、左から8番目の画素が5つの前景の成分を含み、左から9番目の画素が4つの前景の成分を含み、左から10番目の画素が3つの前景の成分を含み、左から11番目の画素が2つの前景の成分を含み、左から12番目の画素が1つの前景の成分を含み、全体として8つの前景の成分から成るモデルを選択する。
【0374】
なお、モデル化部352は、予め記憶してあるモデルから選択するのではなく、動きベクトル、および処理単位が供給されたとき、動きベクトル、および処理単位を基に、モデルを生成するようにしてもよい。
【0375】
モデル化部352は、選択したモデルを方程式生成部353に供給する。
【0376】
方程式生成部353は、モデル化部352から供給されたモデルを基に、方程式を生成する。図52に示す前景成分画像のモデルを参照して、前景の成分の数が8であり、処理単位に対応する画素の数が12であり、動き量vが5であり、仮想分割数が5であるときの、方程式生成部353が生成する方程式について説明する。
【0377】
前景成分画像に含まれるシャッタ時間/vに対応する前景成分がF01/v乃至F08/vであるとき、F01/v乃至F08/vと画素値C01乃至C12との関係は、式(29)乃至式(40)で表される。
【0378】
C01=F01/v (29)
C02=F02/v+F01/v (30)
C03=F03/v+F02/v+F01/v (31)
C04=F04/v+F03/v+F02/v+F01/v (32)
C05=F05/v+F04/v+F03/v+F02/v+F01/v (33)
C06=F06/v+F05/v+F04/v+F03/v+F02/v (34)
C07=F07/v+F06/v+F05/v+F04/v+F03/v (35)
C08=F08/v+F07/v+F06/v+F05/v+F04/v (36)
C09=F08/v+F07/v+F06/v+F05/v (37)
C10=F08/v+F07/v+F06/v (38)
C11=F08/v+F07/v (39)
C12=F08/v (40)
【0379】
方程式生成部353は、生成した方程式を変形して方程式を生成する。方程式生成部353が生成する方程式を、式(41)乃至式(52)に示す。
C01=1・F01/v+0・F02/v+0・F03/v+0・F04/v+0・F05/v
+0・F06/v+0・F07/v+0・F08/v (41)
C02=1・F01/v+1・F02/v+0・F03/v+0・F04/v+0・F05/v
+0・F06/v+0・F07/v+0・F08/v (42)
C03=1・F01/v+1・F02/v+1・F03/v+0・F04/v+0・F05/v
+0・F06/v+0・F07/v+0・F08/v (43)
C04=1・F01/v+1・F02/v+1・F03/v+1・F04/v+0・F05/v
+0・F06/v+0・F07/v+0・F08/v (44)
C05=1・F01/v+1・F02/v+1・F03/v+1・F04/v+1・F05/v
+0・F06/v+0・F07/v+0・F08/v (45)
C06=0・F01/v+1・F02/v+1・F03/v+1・F04/v+1・F05/v
+1・F06/v+0・F07/v+0・F08/v (46)
C07=0・F01/v+0・F02/v+1・F03/v+1・F04/v+1・F05/v
+1・F06/v+1・F07/v+0・F08/v (47)
C08=0・F01/v+0・F02/v+0・F03/v+1・F04/v+1・F05/v
+1・F06/v+1・F07/v+1・F08/v (48)
C09=0・F01/v+0・F02/v+0・F03/v+0・F04/v+1・F05/v
+1・F06/v+1・F07/v+1・F08/v (49)
C10=0・F01/v+0・F02/v+0・F03/v+0・F04/v+0・F05/v
+1・F06/v+1・F07/v+1・F08/v (50)
C11=0・F01/v+0・F02/v+0・F03/v+0・F04/v+0・F05/v
+0・F06/v+1・F07/v+1・F08/v (51)
C12=0・F01/v+0・F02/v+0・F03/v+0・F04/v+0・F05/v
+0・F06/v+0・F07/v+1・F08/v (52)
【0380】
式(41)乃至式(52)は、式(53)として表すこともできる。
【0381】
【数8】
式(53)において、jは、画素の位置を示す。この例において、jは、1乃至12のいずれか1つの値を有する。また、iは、前景値の位置を示す。この例において、iは、1乃至8のいずれか1つの値を有する。aijは、iおよびjの値に対応して、0または1の値を有する。
【0382】
誤差を考慮して表現すると、式(53)は、式(54)のように表すことができる。
【0383】
【数9】
式(54)において、ejは、注目画素Cjに含まれる誤差である。
【0384】
式(54)は、式(55)に書き換えることができる。
【0385】
【数10】
【0386】
ここで、最小自乗法を適用するため、誤差の自乗和Eを式(56)に示すように定義する。
【0387】
【数11】
【0388】
誤差が最小になるためには、誤差の自乗和Eに対する、変数Fkによる偏微分の値が0になればよい。式(57)を満たすようにFkを求める。
【0389】
【数12】
【0390】
式(57)において、動き量vは固定値であるから、式(58)を導くことができる。
【0391】
【数13】
【0392】
式(58)を展開して、移項すると、式(59)を得る。
【0393】
【数14】
【0394】
式(59)のkに1乃至8の整数のいずれか1つを代入して得られる8つの式に展開する。得られた8つの式を、行列により1つの式により表すことができる。この式を正規方程式と呼ぶ。
【0395】
このような最小自乗法に基づく、方程式生成部353が生成する正規方程式の例を式(60)に示す。
【0396】
【数15】
【0397】
式(60)をA・F=v・Cと表すと、C,A,vが既知であり、Fは未知である。また、A,vは、モデル化の時点で既知だが、Cは、足し込み動作において画素値を入力することで既知となる。
【0398】
最小自乗法に基づく正規方程式により前景成分を算出することにより、画素Cに含まれている誤差を分散させることができる。
【0399】
方程式生成部353は、このように生成された正規方程式を足し込み部354に供給する。
【0400】
足し込み部354は、処理単位決定部351から供給された処理単位を基に、前景成分画像に含まれる画素値Cを、方程式生成部353から供給された行列の式に設定する。足し込み部354は、画素値Cを設定した行列を演算部355に供給する。
【0401】
演算部355は、掃き出し法(Gauss-Jordanの消去法)などの解法に基づく処理により、動きボケが除去された前景成分Fi/vを算出して、動きボケが除去された前景の画素値である、0乃至8の整数のいずれかのiに対応するFiを算出して、図53に例を示す、動きボケが除去された画素値であるFiから成る、動きボケが除去された前景成分画像を動きボケ付加部356および選択部357に出力する。
【0402】
なお、図53に示す動きボケが除去された前景成分画像において、C03乃至C10のそれぞれにF01乃至F08のそれぞれが設定されているのは、画面に対する前景成分画像の位置を変化させないためであり、任意の位置に対応させることができる。
【0403】
動きボケ付加部356は、動き量vとは異なる値の動きボケ調整量v'、例えば、動き量vの半分の値の動きボケ調整量v'や、動き量vと無関係の値の動きボケ調整量v'を与えることで、動きボケの量を調整することができる。例えば、図54に示すように、動きボケ付加部356は、動きボケが除去された前景の画素値Fiを動きボケ調整量v'で除すことにより、前景成分Fi/v'を算出して、前景成分Fi/v'の和を算出して、動きボケの量が調整された画素値を生成する。例えば、動きボケ調整量v'が3のとき、画素値C02は、(F01)/v'とされ、画素値C03は、(F01+F02)/v'とされ、画素値C04は、(F01+F02+F03)/v'とされ、画素値C05は、(F02+F03+F04)/v'とされる。
【0404】
動きボケ付加部356は、動きボケの量を調整した前景成分画像を選択部357に供給する。
【0405】
選択部357は、例えば使用者の選択に対応した選択信号を基に、演算部355から供給された動きボケが除去された前景成分画像、および動きボケ付加部356から供給された動きボケの量が調整された前景成分画像のいずれか一方を選択して、選択した前景成分画像を出力する。
【0406】
このように、動きボケ調整部106は、選択信号および動きボケ調整量v'を基に、動きボケの量を調整することができる。
【0407】
また、例えば、図55に示すように、処理単位に対応する画素の数が8であり、動き量vが4であるとき、動きボケ調整部106は、式(61)に示す行列の式を生成する。
【0408】
【数16】
【0409】
動きボケ調整部106は、このように処理単位の長さに対応した数の式を立てて、動きボケの量が調整された画素値であるFiを算出する。同様に、例えば、処理単位に含まれる画素の数が100あるとき、100個の画素に対応する式を生成して、Fiを算出する。
【0410】
図56は、動きボケ調整部106の他の構成を示す図である。図50に示す場合と同様の部分には同一の番号を付してあり、その説明は省略する。
【0411】
選択部361は、選択信号を基に、入力された動きベクトルとその位置信号をそのまま処理単位決定部351およびモデル化部352に供給するか、または動きベクトルの大きさを動きボケ調整量v'に置き換えて、その大きさが動きボケ調整量v'に置き換えられた動きベクトルとその位置信号を処理単位決定部351およびモデル化部352に供給する。
【0412】
このようにすることで、図56の動きボケ調整部106の処理単位決定部351乃至演算部355は、動き量vと動きボケ調整量v'との値に対応して、動きボケの量を調整することができる。例えば、動き量vが5であり、動きボケ調整量v'が3であるとき、図56の動きボケ調整部106の処理単位決定部351乃至演算部355は、図52に示す動き量vが5である前景成分画像に対して、3である動きボケ調整量v'対応する図54に示すようなモデルに従って、演算を実行し、(動き量v)/(動きボケ調整量v')=5/3、すなわちほぼ1.7の動き量vに応じた動きボケを含む画像を算出する。なお、この場合、算出される画像は、3である動き量vに対応した動きボケを含むのではないので、動きボケ付加部356の結果とは動き量vと動きボケ調整量v'の関係の意味合いが異なる点に注意が必要である。
【0413】
以上のように、動きボケ調整部106は、動き量vおよび処理単位に対応して、式を生成し、生成した式に前景成分画像の画素値を設定して、動きボケの量が調整された前景成分画像を算出する。
【0414】
次に、図57のフローチャートを参照して、動きボケ調整部106による前景成分画像に含まれる動きボケの量の調整の処理を説明する。
【0415】
ステップS251において、動きボケ調整部106の処理単位決定部351は、動きベクトルおよび領域情報を基に、処理単位を生成し、生成した処理単位をモデル化部352に供給する。
【0416】
ステップS252において、動きボケ調整部106のモデル化部352は、動き量vおよび処理単位に対応して、モデルの選択や生成を行う。ステップS253において、方程式生成部353は、選択されたモデルを基に、正規方程式を作成する。
【0417】
ステップS254において、足し込み部354は、作成された正規方程式に前景成分画像の画素値を設定する。ステップS255において、足し込み部354は、処理単位に対応する全ての画素の画素値の設定を行ったか否かを判定し、処理単位に対応する全ての画素の画素値の設定を行っていないと判定された場合、ステップS254に戻り、正規方程式への画素値の設定の処理を繰り返す。
【0418】
ステップS255において、処理単位の全ての画素の画素値の設定を行ったと判定された場合、ステップS256に進み、演算部355は、足し込み部354から供給された画素値が設定された正規方程式を基に、動きボケの量を調整した前景の画素値を算出して、処理は終了する。
【0419】
このように、動きボケ調整部106は、動きベクトルおよび領域情報を基に、動きボケを含む前景画像から動きボケの量を調整することができる。
【0420】
すなわち、サンプルデータである画素値に含まれる動きボケの量を調整することができる。
【0421】
なお、図50に示す動きボケ調整部106の構成は、一例であり、唯一の構成ではない。
【0422】
以上のように、図4に構成を示す信号処理部12は、入力画像に含まれる動きボケの量を調整することができる。図4に構成を示す信号処理部12は、埋もれた情報である混合比αを算出して、算出した混合比αを出力することができる。
【0423】
図58は、信号処理部12の機能の他の構成を示すブロック図である。
【0424】
図4に示す部分と同様の部分には同一の番号を付してあり、その説明は適宜省略する。
【0425】
領域特定部103は、領域情報を混合比算出部104および合成部371に供給する。
【0426】
混合比算出部104は、混合比αを前景背景分離部105および合成部371に供給する。
【0427】
前景背景分離部105は、前景成分画像を合成部371に供給する。
【0428】
合成部371は、混合比算出部104から供給された混合比α、領域特定部103から供給された領域情報を基に、任意の背景画像と、前景背景分離部105から供給された前景成分画像とを合成して、任意の背景画像と前景成分画像とが合成された合成画像を出力する。
【0429】
図59は、合成部371の構成を示す図である。背景成分生成部381は、混合比αおよび任意の背景画像を基に、背景成分画像を生成して、混合領域画像合成部382に供給する。
【0430】
混合領域画像合成部382は、背景成分生成部381から供給された背景成分画像と前景成分画像とを合成することにより、混合領域合成画像を生成して、生成した混合領域合成画像を画像合成部383に供給する。
【0431】
画像合成部383は、領域情報を基に、前景成分画像、混合領域画像合成部382から供給された混合領域合成画像、および任意の背景画像を合成して、合成画像を生成して出力する。
【0432】
このように、合成部371は、前景成分画像を、任意の背景画像に合成することができる。
【0433】
特徴量である混合比αを基に前景成分画像を任意の背景画像と合成して得られた画像は、単に画素を合成した画像に比較し、より自然なものと成る。
【0434】
図60は、動きボケの量を調整する信号処理部12の機能の更に他の構成を示すブロック図である。図4に示す信号処理部12が領域特定と混合比αの算出を順番に行うのに対して、図60に示す信号処理部12は、領域特定と混合比αの算出を並行して行う。
【0435】
図4のブロック図に示す機能と同様の部分には同一の番号を付してあり、その説明は省略する。
【0436】
入力画像は、混合比算出部401、前景背景分離部402、領域特定部103、およびオブジェクト抽出部101に供給される。
【0437】
混合比算出部401は、入力画像を基に、画素がカバードバックグラウンド領域に属すると仮定した場合における推定混合比、および画素がアンカバードバックグラウンド領域に属すると仮定した場合における推定混合比を、入力画像に含まれる画素のそれぞれに対して算出し、算出した画素がカバードバックグラウンド領域に属すると仮定した場合における推定混合比、および画素がアンカバードバックグラウンド領域に属すると仮定した場合における推定混合比を前景背景分離部402に供給する。
【0438】
図61は、混合比算出部401の構成の一例を示すブロック図である。
【0439】
図61に示す推定混合比処理部201は、図31に示す推定混合比処理部201と同じである。図61に示す推定混合比処理部202は、図31に示す推定混合比処理部202と同じである。
【0440】
推定混合比処理部201は、入力画像を基に、カバードバックグラウンド領域のモデルに対応する演算により、画素毎に推定混合比を算出して、算出した推定混合比を出力する。
【0441】
推定混合比処理部202は、入力画像を基に、アンカバードバックグラウンド領域のモデルに対応する演算により、画素毎に推定混合比を算出して、算出した推定混合比を出力する。
【0442】
前景背景分離部402は、混合比算出部401から供給された、画素がカバードバックグラウンド領域に属すると仮定した場合における推定混合比、および画素がアンカバードバックグラウンド領域に属すると仮定した場合における推定混合比、並びに領域特定部103から供給された領域情報を基に、入力画像から前景成分画像を生成し、生成した前景成分画像を動きボケ調整部106および選択部107に供給する。
【0443】
図62は、前景背景分離部402の構成の一例を示すブロック図である。
【0444】
図42に示す前景背景分離部105と同様の部分には同一の番号を付してあり、その説明は省略する。
【0445】
選択部421は、領域特定部103から供給された領域情報を基に、混合比算出部401から供給された、画素がカバードバックグラウンド領域に属すると仮定した場合における推定混合比、および画素がアンカバードバックグラウンド領域に属すると仮定した場合における推定混合比のいずれか一方を選択して、選択した推定混合比を混合比αとして分離部251に供給する。
【0446】
分離部251は、選択部421から供給された混合比αおよび領域情報を基に、混合領域に属する画素の画素値から前景の成分および背景の成分を抽出し、抽出した前景の成分を合成部253に供給すると共に、背景の成分を合成部255に供給する。
【0447】
分離部251は、図47に示す構成と同じ構成とすることができる。
【0448】
合成部253は、前景成分画像を合成して、出力する。合成部255は、背景成分画像を合成して出力する。
【0449】
図60に示す動きボケ調整部106は、図4に示す場合と同様の構成とすることができ、領域情報および動きベクトルを基に、前景背景分離部402から供給された前景成分画像に含まれる動きボケの量を調整して、動きボケの量が調整された前景成分画像を出力する。
【0450】
図60に示す選択部107は、例えば使用者の選択に対応した選択信号を基に、前景背景分離部402から供給された前景成分画像、および動きボケ調整部106から供給された動きボケの量が調整された前景成分画像のいずれか一方を選択して、選択した前景成分画像を出力する。
【0451】
このように、図60に構成を示す信号処理部12は、入力画像に含まれる前景のオブジェクトに対応する画像に対して、その画像に含まれる動きボケの量を調整して出力することができる。図60に構成を示す信号処理部12は、第1の実施例と同様に、埋もれた情報である混合比αを算出して、算出した混合比αを出力することができる。
【0452】
図63は、前景成分画像を任意の背景画像と合成する信号処理部12の機能の他の構成を示すブロック図である。図58に示す信号処理部12が領域特定と混合比αの算出をシリアルに行うのに対して、図63に示す信号処理部12は、領域特定と混合比αの算出をパラレルに行う。
【0453】
図60のブロック図に示す機能と同様の部分には同一の番号を付してあり、その説明は省略する。
【0454】
図63に示す混合比算出部401は、入力画像を基に、画素がカバードバックグラウンド領域に属すると仮定した場合における推定混合比、および画素がアンカバードバックグラウンド領域に属すると仮定した場合における推定混合比を、入力画像に含まれる画素のそれぞれに対して算出し、算出した画素がカバードバックグラウンド領域に属すると仮定した場合における推定混合比、および画素がアンカバードバックグラウンド領域に属すると仮定した場合における推定混合比を前景背景分離部402および合成部431に供給する。
【0455】
図63に示す前景背景分離部402は、混合比算出部401から供給された、画素がカバードバックグラウンド領域に属すると仮定した場合における推定混合比、および画素がアンカバードバックグラウンド領域に属すると仮定した場合における推定混合比、並びに領域特定部103から供給された領域情報を基に、入力画像から前景成分画像を生成し、生成した前景成分画像を合成部431に供給する。
【0456】
合成部431は、混合比算出部401から供給された、画素がカバードバックグラウンド領域に属すると仮定した場合における推定混合比、および画素がアンカバードバックグラウンド領域に属すると仮定した場合における推定混合比、領域特定部103から供給された領域情報を基に、任意の背景画像と、前景背景分離部402から供給された前景成分画像とを合成して、任意の背景画像と前景成分画像とが合成された合成画像を出力する。
【0457】
図64は、合成部431の構成を示す図である。図59のブロック図に示す機能と同様の部分には同一の番号を付してあり、その説明は省略する。
【0458】
選択部441は、領域特定部103から供給された領域情報を基に、混合比算出部401から供給された、画素がカバードバックグラウンド領域に属すると仮定した場合における推定混合比、および画素がアンカバードバックグラウンド領域に属すると仮定した場合における推定混合比のいずれか一方を選択して、選択した推定混合比を混合比αとして背景成分生成部381に供給する。
【0459】
図64に示す背景成分生成部381は、選択部441から供給された混合比αおよび任意の背景画像を基に、背景成分画像を生成して、混合領域画像合成部382に供給する。
【0460】
図64に示す混合領域画像合成部382は、背景成分生成部381から供給された背景成分画像と前景成分画像とを合成することにより、混合領域合成画像を生成して、生成した混合領域合成画像を画像合成部383に供給する。
【0461】
画像合成部383は、領域情報を基に、前景成分画像、混合領域画像合成部382から供給された混合領域合成画像、および任意の背景画像を合成して、合成画像を生成して出力する。
【0462】
このように、合成部431は、前景成分画像を、任意の背景画像に合成することができる。
【0463】
なお、混合比αは、画素値に含まれる背景の成分の割合として説明したが、画素値に含まれる前景の成分の割合としてもよい。
【0464】
また、前景となるオブジェクトの動きの方向は左から右として説明したが、その方向に限定されないことは勿論である。
【0465】
以上においては、3次元空間と時間軸情報を有する現実空間の画像をビデオカメラを用いて2次元空間と時間軸情報を有する時空間への射影を行った場合を例としたが、本発明は、この例に限らず、より多くの第1の次元の第1の情報を、より少ない第2の次元の第2の情報に射影した場合に、その射影によって発生する歪みを補正したり、有意情報を抽出したり、またはより自然に画像を合成する場合に適応することが可能である。
【0466】
なお、センサ11は、CCDに限らす、固体撮像素子である、例えば、BBD(Bucket Brigade Device)、CID(Charge Injection Device)、またはCPD(Charge Priming Device)などのセンサでもよく、また、検出素子がマトリックス状に配置されているセンサに限らず、検出素子が1列に並んでいるセンサでもよい。
【0467】
本発明の信号処理を行うプログラムを記録した記録媒体は、図3に示すように、コンピュータとは別に、ユーザにプログラムを提供するために配布される、プログラムが記録されている磁気ディスク51(フロッピディスクを含む)、光ディスク52(CD-ROM(Compaut Disk-Read Only Memory),DVD(Digital Versatile Disk)を含む)、光磁気ディスク53(MD(Mini-Disk)を含む)、もしくは半導体メモリ54などよりなるパッケージメディアにより構成されるだけでなく、コンピュータに予め組み込まれた状態でユーザに提供される、プログラムが記録されているROM22や、記憶部28に含まれるハードディスクなどで構成される。
【0468】
なお、本明細書において、記録媒体に記録されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
【0469】
【発明の効果】
以上の如く、請求項1に記載の信号処理装置、請求項3に記載の信号処理方法、および請求項4に記載の記録媒体によれば、入力画像の画素ごとにフレーム間の動きの有無を判定し、その判定結果から、各画素が前景領域、背景領域、または混合領域の何れであるかを特定し、特定された混合領域の画素について、各フレームの画素の画素値を用いた演算を行なうようにしたので、混合比を検出することができるようになる。
【図面の簡単な説明】
【図1】本発明の原理を説明する図である。
【図2】本発明を適用するシステムの構成例を示すブロック図である。
【図3】図2の信号処理部の構成例を示すブロック図である。
【図4】信号処理部12を示すブロック図である。
【図5】センサによる撮像を説明する図である。
【図6】画素の配置を説明する図である。
【図7】検出素子の動作を説明する図である。
【図8】動いている前景に対応するオブジェクトと、静止している背景に対応するオブジェクトとを撮像して得られる画像を説明する図である。
【図9】背景領域、前景領域、混合領域、カバードバックグラウンド領域、およびアンカバードバックグラウンド領域を説明する図である。
【図10】静止している前景に対応するオブジェクトおよび静止している背景に対応するオブジェクトを撮像した画像における、隣接して1列に並んでいる画素の画素値を時間方向に展開したモデル図である。
【図11】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図12】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図13】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図14】前景領域、背景領域、および混合領域の画素を抽出した例を示す図である。
【図15】画素と画素値を時間方向に展開したモデルとの対応を示す図である。
【図16】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図17】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図18】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図19】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図20】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図21】動きボケの量の調整の処理を説明するフローチャートである。
【図22】領域特定部103の構成の一例を示すブロック図である。
【図23】前景に対応するオブジェクトが移動しているときの画像を説明する図である。
【図24】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図25】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図26】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図27】領域判定の条件を説明する図である。
【図28】領域特定部103の領域の特定の結果の例を示す図である。
【図29】領域特定部103の領域の特定の結果の例を示す図である。
【図30】領域特定の処理を説明するフローチャートである。
【図31】混合比算出部104の構成を示すブロック図である。
【図32】理想的な混合比αの例を示す図である。
【図33】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図34】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図35】前景の成分の相関を利用した近似を説明する図である。
【図36】 C,N、およびPの関係を説明する図である。
【図37】推定混合比処理部201の構成を示すブロック図である。
【図38】推定混合比の例を示す図である。
【図39】混合比算出部104の他の構成を示すブロック図である。
【図40】混合比の算出の処理を説明するフローチャートである。
【図41】推定混合比の演算の処理を説明するフローチャートである。
【図42】前景背景分離部105の構成の一例を示すブロック図である。
【図43】入力画像、前景成分画像、および背景成分画像を示す図である。
【図44】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図45】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図46】画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図47】分離部251の構成の一例を示すブロック図である。
【図48】分離された前景成分画像、および背景成分画像の例を示す図である。
【図49】前景と背景との分離の処理を説明するフローチャートである。
【図50】動きボケ調整部106の構成の一例を示すブロック図である。
【図51】処理単位を説明する図である。
【図52】前景成分画像の画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図53】前景成分画像の画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図54】前景成分画像の画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図55】前景成分画像の画素値を時間方向に展開し、シャッタ時間に対応する期間を分割したモデル図である。
【図56】動きボケ調整部106の他の構成を示す図である。
【図57】動きボケ調整部106による前景成分画像に含まれる動きボケの量の調整の処理を説明するフローチャートである。
【図58】信号処理部12の機能の他の構成を示すブロック図である。
【図59】合成部371の構成を示す図である。
【図60】信号処理部12の機能の更に他の構成を示すブロック図である。
【図61】混合比算出部401の構成を示すブロック図である。
【図62】前景背景分離部402の構成を示すブロック図である。
【図63】信号処理部12の機能の他の構成を示すブロック図である。
【図64】合成部431の構成を示す図である。
【符号の説明】
11 センサ, 12 信号処理部, 21 CPU, 22 ROM, 23 RAM, 26 入力部, 27 出力部, 28 記憶部, 29 通信部, 51 磁気ディスク, 52 光ディスク, 53 光磁気ディスク, 54 半導体メモリ, 101 オブジェクト抽出部, 102 動き検出部, 103領域特定部, 104 混合比算出部, 105 前景背景分離部, 106動きボケ調整部, 107 選択部, 121 フレームメモリ, 122−1乃至122−4 静動判定部, 123−1乃至123−3 領域判定部, 124 判定フラグ格納フレームメモリ, 125 合成部, 126 判定フラグ格納フレームメモリ, 201 推定混合比処理部, 202 推定混合比処理部, 203 混合比決定部, 221 フレームメモリ, 222 フレームメモリ, 223 混合比演算部, 231 選択部, 232 推定混合比処理部, 233 推定混合比処理部, 234 選択部, 251 分離部, 252 スイッチ, 253 合成部, 254 スイッチ, 255 合成部, 301 フレームメモリ, 302 分離処理ブロック, 303 フレームメモリ, 311 アンカバード領域処理部, 312 カバード領域処理部, 313 合成部, 314 合成部, 351 処理単位決定部, 352 モデル化部, 353 方程式生成部, 354 足し込み部, 355演算部, 356 動きボケ付加部, 357 選択部, 361 選択部,371 合成部, 381 背景成分生成部, 382 混合領域画像合成部, 383 画像合成部, 401 混合比算出部, 402 前景背景分離部, 421 選択部, 431 合成部, 441 選択部[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a signal processing apparatus and method, and a recording medium, and more particularly, to a signal processing apparatus and method that considers a difference between a signal detected by a sensor and the real world, and a recording medium.
[0002]
[Prior art]
A technique for detecting an event in the real world with a sensor and processing sampling data output from the sensor, such as an image, sound, temperature, or pressure, is widely used.
[0003]
For example, in an image obtained by capturing an object moving in front of a predetermined background with a video camera, motion blur occurs when the moving speed of the object is relatively fast.
[0004]
[Problems to be solved by the invention]
When an object moves in front of a stationary background, not only motion blur due to mixing of the moving object image itself, but also mixing of the background image and the moving object image occurs. Conventionally, it has not been considered to detect a mixed state between a background image and a moving object image.
[0005]
The present invention has been made in view of such a situation, and an object of the present invention is to be able to detect a mixing ratio indicating a state of mixing of a plurality of objects such as a background image and a moving object image. And
[0006]
[Means for Solving the Problems]
The signal processing device according to
[0007]
The mixed area is composed of an uncovered background area and a covered background area, and the area specifying means determines whether or not there is motion between the processing target frame and a frame immediately after the processing target frame. An uncovered background that identifies a pixel that is an uncovered background area from the result and a determination result of presence / absence of motion between the next frame to the processing target frame and the second frame to the processing target frame The determination result of the presence / absence of motion between the area specifying means, the processing target frame, and the frame immediately before the processing target frame, and the frame immediately before the processing target frame and the processing target frame A covered background that identifies the pixels that are the covered background area based on the result of the presence or absence of motion with the frame A determination result of the presence / absence of motion between the und area specifying means, the processing target frame, and the frame immediately after the processing target frame, and between the processing target frame and the frame immediately before the processing target frame; Foreground area / background area specifying means for specifying a pixel that is a foreground area and a pixel that is a background area from a determination result of presence / absence of motion, an uncovered background area specifying means, a covered background area specifying means, and a foreground area An area information generation unit that generates area information from the identification result by the background area identification unit is provided, and the mixing ratio calculation unit includes a pixel value of the pixel of the processing target frame and a process for the pixel of the uncovered background area. The difference between the pixel value of the pixel of the previous frame of the target frame and the image of the adjacent frames before and after the processing target frame. First mixture ratio calculating means for calculating the mixture ratio by dividing by the difference between the pixel values of the pixel, the pixel value of the pixel of the processing target frame, and the pixel after the processing target frame for the pixels of the covered background area Second mixing ratio calculation means for calculating a mixing ratio by dividing a difference from a pixel value of a pixel of a frame by a difference of pixel values of pixels of adjacent frames before and after the processing target frame can be provided. .
[0012]
The signal processing method according to claim 3 or the recording medium program according to
[0014]
The signal processing device according to
[0015]
DETAILED DESCRIPTION OF THE INVENTION
FIG. 1 illustrates the principle of the present invention. As shown in the figure, a first signal that is information of the
[0016]
Therefore, in the present invention, the signal output from the
[0017]
FIG. 2 shows a configuration example of a signal processing apparatus to which the present invention is applied. The
[0018]
Significant information here is, for example, a mixture ratio described later.
[0019]
Note that information indicating an area including significant information buried by projection can also be considered significant information. Here, region information described later corresponds to significant information.
[0020]
The area including significant information here is, for example, a mixed area described later.
[0021]
The
[0022]
An input /
[0023]
The
[0024]
A program may be acquired via the
[0025]
The
[0026]
Next, a signal processing apparatus that performs processing for identifying a region where significant information is buried or extracting the buried significant information from data acquired by a sensor will be described with a more specific example. In the following example, the CCD line sensor or CCD area sensor corresponds to the sensor, the area information and mixing ratio correspond to significant information, and the foreground and background are mixed and motion blur corresponds to distortion in the mixed area. To do.
[0027]
FIG. 4 is a block diagram showing the
[0028]
It does not matter whether each function of the
[0029]
Here, the motion blur refers to a distortion included in an image corresponding to a moving object, which is caused by the movement of an object in the real world to be imaged and the imaging characteristics of the
[0030]
In this specification, an image corresponding to an object in the real world to be imaged is referred to as an image object.
[0031]
The input image supplied to the
[0032]
The
[0033]
The
[0034]
Further, for example, the
[0035]
The
[0036]
The motion vector output from the
[0037]
Further, for example, the
[0038]
The motion amount v is a value that represents a change in the position of the image corresponding to the moving object in units of pixel intervals. For example, when the image of the object corresponding to the foreground is moved so as to be displayed at a position separated by four pixels in the next frame with reference to a certain frame, the motion amount v of the image of the object corresponding to the foreground is 4.
[0039]
The
[0040]
The
[0041]
Based on the input image and the region information supplied from the
[0042]
The mixing ratio α is a value indicating a ratio of an image component (hereinafter also referred to as a background component) corresponding to a background object in a pixel value, as shown in an equation (3) described later.
[0043]
Based on the region information supplied from the
[0044]
The motion
[0045]
The motion
[0046]
For example, the
[0047]
Next, an input image supplied to the
[0048]
FIG. 5 is a diagram for explaining imaging by a sensor. The
[0049]
The
[0050]
FIG. 6 is a diagram illustrating the arrangement of pixels. In FIG. 6, A to I indicate individual pixels. The pixels are arranged on a plane corresponding to the image. One detection element corresponding to one pixel is arranged on the
[0051]
As shown in FIG. 7, for example, a detection element that is a CCD converts input light into electric charges for a period corresponding to a shutter time, and accumulates the converted electric charges. The amount of charge is approximately proportional to the intensity of the input light and the time during which the light is input. In the period corresponding to the shutter time, the detection element adds the electric charge converted from the input light to the already accumulated electric charge. That is, the detection element integrates the input light for a period corresponding to the shutter time, and accumulates an amount of charge corresponding to the integrated light. It can be said that the detection element has an integration effect with respect to time.
[0052]
The electric charge accumulated in the detection element is converted into a voltage value by a circuit (not shown), and the voltage value is further converted into a pixel value such as digital data and output. Accordingly, each pixel value output from the
[0053]
The
[0054]
FIG. 8 is a diagram for explaining an image obtained by imaging an object corresponding to a moving foreground and an object corresponding to a stationary background. FIG. 8A shows an image obtained by imaging an object corresponding to the foreground with movement and an object corresponding to the stationary background. In the example shown in FIG. 8A, the object corresponding to the foreground is moving horizontally from the left to the right with respect to the screen.
[0055]
FIG. 8B is a model diagram in which pixel values corresponding to one line of the image shown in FIG. 8A are expanded in the time direction. The horizontal direction in FIG. 8B corresponds to the spatial direction X in FIG.
[0056]
The pixel value of the background region pixel is composed of only the background component, that is, the image component corresponding to the background object. The pixel value of the foreground region pixel is composed of only the foreground component, that is, the image component corresponding to the foreground object.
[0057]
The pixel value of the pixel in the mixed area is composed of a background component and a foreground component. Since the pixel value is composed of the background component and the foreground component, the mixed region can be said to be a distortion region. The mixed area is further classified into a covered background area and an uncovered background area.
[0058]
The covered background area is a mixed area at a position corresponding to the front end in the advancing direction of the foreground object with respect to the foreground area, and is an area where the background component is covered with the foreground as time passes.
[0059]
On the other hand, the uncovered background area is a mixed area at a position corresponding to the rear end portion of the foreground object in the advancing direction with respect to the foreground area, and an area where a background component appears as time passes. Say.
[0060]
As described above, an image including a foreground area, a background area, or a covered background area or an uncovered background area is input as an input image to the
[0061]
FIG. 9 is a diagram illustrating the background area, the foreground area, the mixed area, the covered background area, and the uncovered background area as described above. In the case of corresponding to the image shown in FIG. 8, the background area is a static part, the foreground area is a moving part, the covered background area of the mixed area is a part that changes from the background to the foreground, The uncovered background area is a portion that changes from the foreground to the background.
[0062]
FIG. 10 is a model diagram in which pixel values of pixels arranged in a row adjacent to each other in an image obtained by capturing an object corresponding to a stationary foreground and an object corresponding to a stationary background are developed in the time direction. It is. For example, pixels arranged on one line of the screen can be selected as the pixels arranged adjacent to each other in one column.
[0063]
The pixel values F01 to F04 shown in FIG. 10 are pixel values corresponding to the still foreground object. The pixel values B01 to B04 shown in FIG. 10 are pixel values corresponding to the stationary background object.
[0064]
In the vertical direction in FIG. 10, time elapses from the top to the bottom in the figure. The position of the upper side of the rectangle in FIG. 10 corresponds to the time when the
[0065]
Hereinafter, a case where the shutter time and the frame interval are the same will be described as an example.
[0066]
The horizontal direction in FIG. 10 corresponds to the spatial direction X described in FIG. More specifically, in the example shown in FIG. 10, the distance from the left side of the rectangle described as “F01” in FIG. 10 to the right side of the rectangle described as “B04” is 8 times the pixel pitch, That is, it corresponds to the interval between eight consecutive pixels.
[0067]
When the foreground object and the background object are stationary, the light input to the
[0068]
Here, the period corresponding to the shutter time is divided into two or more periods having the same length. For example, if the number of virtual divisions is 4, the model diagram shown in FIG. 10 can be represented as the model shown in FIG. The virtual division number is set in accordance with the amount of motion v of the object corresponding to the foreground. For example, the number of virtual divisions is 4 corresponding to the motion amount v being 4, and the period corresponding to the shutter time is divided into 4.
[0069]
The top row in the figure corresponds to the first divided period after the shutter opens. The second row from the top in the figure corresponds to the second divided period from when the shutter has opened. The third line from the top in the figure corresponds to the third divided period from when the shutter has opened. The fourth row from the top in the figure corresponds to the fourth divided period from when the shutter has opened.
[0070]
Hereinafter, the shutter time divided in accordance with the motion amount v is also referred to as shutter time / v.
[0071]
Since the light input to the
[0072]
Since the light input to the
[0073]
That is, when the object corresponding to the foreground is stationary, the light corresponding to the foreground object input to the
[0074]
When the object corresponding to the background is stationary, the light corresponding to the background object input to the
[0075]
Next, a case where the object corresponding to the foreground moves and the object corresponding to the background is stationary will be described.
[0076]
FIG. 12 is a model diagram in which pixel values of pixels on one line including the covered background area are expanded in the time direction when the object corresponding to the foreground moves toward the right side in the drawing. In FIG. 12, the foreground motion amount v is 4. Since one frame is a short time, it can be assumed that the object corresponding to the foreground is a rigid body and is moving at a constant speed. In FIG. 12, the image of the object corresponding to the foreground moves so as to be displayed on the right by four pixels in the next frame with reference to a certain frame.
[0077]
In FIG. 12, the leftmost pixel through the fourth pixel from the left belong to the foreground area. In FIG. 12, the fifth pixel from the left to the seventh pixel from the left belong to the mixed area which is a covered background area. In FIG. 12, the rightmost pixel belongs to the background area.
[0078]
Since the object corresponding to the foreground is moving so as to cover the object corresponding to the background with the passage of time, the component included in the pixel value of the pixel belonging to the covered background area has a period corresponding to the shutter time. At this point, the background component is replaced by the foreground component.
[0079]
For example, a pixel value M with a thick frame in FIG. 12 is expressed by Expression (1).
[0080]
M = B02 / v + B02 / v + F07 / v + F06 / v (1)
[0081]
For example, since the fifth pixel from the left includes a background component corresponding to one shutter time / v and includes a foreground component corresponding to three shutter times / v, the mixture ratio of the fifth pixel from the left α is 1/4. The sixth pixel from the left includes a background component corresponding to two shutter times / v and includes a foreground component corresponding to two shutter times / v. Therefore, the mixture ratio α of the sixth pixel from the left is 1/2. The seventh pixel from the left includes a background component corresponding to three shutter times / v, and includes a foreground component corresponding to one shutter time / v. Therefore, the mixture ratio α of the seventh pixel from the left is 3/4.
[0082]
Since it can be assumed that the object corresponding to the foreground is a rigid body and moves at a constant speed so that the foreground image is displayed on the right side of four pixels in the next frame, for example, the fourth pixel from the left in FIG. The foreground component F07 / v of the first shutter time / v after the shutter opens is the foreground component corresponding to the second shutter time / v of the fifth pixel from the left in FIG. be equivalent to. Similarly, the foreground component F07 / v corresponds to the foreground component of the sixth pixel from the left in FIG. 12 corresponding to the third shutter time / v from when the shutter has opened, and the seventh pixel from the left in FIG. Are equal to the foreground component corresponding to the fourth shutter time / v after the shutter is opened.
[0083]
Since it can be assumed that the object corresponding to the foreground is a rigid body and moves at a constant speed so that the foreground image is displayed on the right side of four pixels in the next frame, for example, the third pixel from the left in FIG. The foreground component F06 / v of the first shutter time / v after the shutter is opened is the foreground component corresponding to the second shutter time / v of the fourth pixel from the left in FIG. equal. Similarly, the foreground component F06 / v is the fifth pixel from the left in FIG. 12 and the foreground component corresponding to the third shutter time / v from when the shutter has opened, and the sixth pixel from the left in FIG. And the foreground component corresponding to the fourth shutter time / v after the shutter is opened.
[0084]
Since it can be assumed that the object corresponding to the foreground is a rigid body and moves at a constant speed so that the foreground image is displayed on the right side of four pixels in the next frame, for example, the second pixel from the left in FIG. The foreground component F05 / v of the first shutter time / v after the shutter is opened is the foreground component corresponding to the second shutter time / v of the third pixel from the left in FIG. be equivalent to. Similarly, the foreground component F05 / v is the fourth pixel from the left in FIG. 12, the foreground component corresponding to the third shutter time / v from when the shutter is opened, and the fifth pixel from the left in FIG. And the foreground component corresponding to the fourth shutter time / v after the shutter is opened.
[0085]
Since it can be assumed that the object corresponding to the foreground is a rigid body and moves at a constant speed so that the foreground image is displayed on the right side of four pixels in the next frame, for example, the shutter of the leftmost pixel in FIG. The foreground component F04 / v of the first shutter time / v after opening is equal to the foreground component of the second pixel from the left in FIG. 12 corresponding to the second shutter time / v after the shutter is opened. Similarly, the foreground component F04 / v is the fourth pixel from the left in FIG. 12 and the foreground component of the third pixel from the left in FIG. 12 corresponding to the third shutter time / v from when the shutter has opened. And the foreground component corresponding to the fourth shutter time / v after the shutter is opened.
[0086]
Since the foreground area corresponding to the moving object includes motion blur as described above, it can be said to be a distortion area.
[0087]
FIG. 13 is a model diagram in which pixel values of pixels on one line including the uncovered background area are expanded in the time direction when the foreground moves toward the right side in the drawing. In FIG. 13, the foreground motion amount v is 4. Since one frame is a short time, it can be assumed that the object corresponding to the foreground is a rigid body and is moving at a constant speed. In FIG. 13, the image of the object corresponding to the foreground moves to the right by four pixels in the next frame with reference to a certain frame.
[0088]
In FIG. 13, the leftmost pixel through the fourth pixel from the left belong to the background area. In FIG. 13, the fifth through seventh pixels from the left belong to the mixed area that is an uncovered background. In FIG. 13, the rightmost pixel belongs to the foreground area.
[0089]
Since the object corresponding to the foreground that covered the object corresponding to the background is moved so as to be removed from the front of the object corresponding to the background over time, it is included in the pixel value of the pixel belonging to the uncovered background area The component to be changed from the foreground component to the background component at a certain point in time corresponding to the shutter time.
[0090]
For example, the pixel value M ′ with a thick frame in FIG. 13 is expressed by Expression (2).
[0091]
M '= F02 / v + F01 / v + B26 / v + B26 / v (2)
[0092]
For example, the fifth pixel from the left includes a background component corresponding to three shutter times / v, and includes a foreground component corresponding to one shutter time / v, so the mixing ratio of the fifth pixel from the left α is 3/4. The sixth pixel from the left includes a background component corresponding to two shutter times / v and includes a foreground component corresponding to two shutter times / v. Therefore, the mixture ratio α of the sixth pixel from the left is 1/2. Since the seventh pixel from the left includes a background component corresponding to one shutter time / v and includes a foreground component corresponding to three shutter times / v, the mixture ratio α of the seventh pixel from the left is 1/4.
[0093]
When the expressions (1) and (2) are generalized, the pixel value M is expressed by the expression (3).
[0094]
[Expression 1]
Here, α is a mixing ratio. B is a background pixel value, and Fi / v is a foreground component.
[0095]
Since the object corresponding to the foreground is a rigid body and can be assumed to move at a constant speed and the amount of movement v is 4, for example, the first pixel from the left in FIG. The foreground component F01 / v of the shutter time / v is equal to the foreground component of the sixth pixel from the left in FIG. 13 corresponding to the second shutter time / v after the shutter is opened. Similarly, F01 / v is the foreground component of the seventh pixel from the left in FIG. 13 corresponding to the third shutter time / v after the shutter is opened, and the eighth pixel from the left in FIG. , And the foreground component corresponding to the fourth shutter time / v after the shutter is opened.
[0096]
Since it can be assumed that the object corresponding to the foreground is a rigid body and moves at a constant speed, and the number of virtual divisions is 4, for example, the first pixel from the left in FIG. The foreground component F02 / v of the shutter time / v is equal to the foreground component of the seventh pixel from the left in FIG. 13 corresponding to the second shutter time / v after the shutter is opened. Similarly, the foreground component F02 / v is equal to the foreground component of the eighth pixel from the left in FIG. 13 corresponding to the third shutter time / v from when the shutter has opened.
[0097]
Since the object corresponding to the foreground is a rigid body and can be assumed to move at a constant speed and the amount of movement v is 4, for example, the seventh pixel from the left in FIG. The foreground component F03 / v of the shutter time / v is equal to the foreground component of the eighth pixel from the left in FIG. 13 corresponding to the second shutter time / v after the shutter is opened.
[0098]
In the description of FIG. 11 to FIG. 13, it is described that the virtual division number is 4, but the virtual division number corresponds to the motion amount v. The amount of movement v generally corresponds to the moving speed of the object corresponding to the foreground. For example, when the object corresponding to the foreground is moving so as to be displayed to the right by four pixels in the next frame with reference to a certain frame, the amount of movement v is 4. Corresponding to the motion amount v, the number of virtual divisions is 4. Similarly, for example, when the object corresponding to the foreground is moving so that it is displayed on the left by 6 pixels in the next frame with reference to a certain frame, the motion amount v is set to 6, and the number of virtual divisions is , 6.
[0099]
14 and 15, the foreground area, the background area, the covered background area or the uncovered background area described above, the foreground components and the background components corresponding to the divided shutter times, and The relationship is shown.
[0100]
FIG. 14 shows an example in which pixels in the foreground area, background area, and mixed area are extracted from an image including a foreground corresponding to an object moving in front of a stationary background. In the example shown in FIG. 14, the object corresponding to the foreground is moving horizontally with respect to the screen.
[0101]
Frame # n + 1 is the next frame after frame #n, and frame # n + 2 is the next frame after frame # n + 1.
[0102]
Extract the pixels in the foreground area, background area, and mixed area extracted from any of frame #n to frame # n + 2, set the amount of motion v to 4, and set the pixel values of the extracted pixels in the time direction The developed model is shown in FIG.
[0103]
Since the object corresponding to the foreground moves, the pixel value in the foreground area is composed of four different foreground components corresponding to the shutter time / v period. For example, the leftmost pixel among the pixels in the foreground area shown in FIG. 15 is composed of F01 / v, F02 / v, F03 / v, and F04 / v. That is, the pixels in the foreground area include motion blur.
[0104]
Since the object corresponding to the background is stationary, the light corresponding to the background input to the
[0105]
The pixel value of the pixel belonging to the mixed area composed of the covered background area or the uncovered background area is composed of a foreground component and a background component.
[0106]
Next, when the image corresponding to the object is moving, the pixel values of the pixels at the same position on the frame that are adjacent to each other in a plurality of frames are developed in the time direction. The model will be described. For example, when the image corresponding to the object moves horizontally with respect to the screen, the pixels arranged on one line of the screen can be selected as the pixels arranged in a row adjacent to each other.
[0107]
FIG. 16 shows pixels arranged in a row adjacent to three frames of an image obtained by capturing an object corresponding to a stationary background, and the pixel values of the pixels at the same position on the frame are represented by time. It is the model figure developed in the direction. Frame #n is the next frame after frame # n-1, and frame # n + 1 is the next frame after frame #n. Other frames are also referred to in the same manner.
[0108]
The pixel values B01 to B12 shown in FIG. 16 are pixel values corresponding to a stationary background object. Since the object corresponding to the background is stationary, the pixel value of the corresponding pixel does not change in frame # n−1 to frame
[0109]
FIG. 17 shows pixels arranged in a row adjacent to three frames of an image obtained by imaging an object corresponding to a foreground moving to the right side in the drawing together with an object corresponding to a stationary background, FIG. 5 is a model diagram in which pixel values of pixels at the same position on a frame are developed in the time direction. The model shown in FIG. 17 includes a covered background area.
[0110]
In FIG. 17, it can be assumed that the object corresponding to the foreground is a rigid body and moves at a constant speed. 4 and the number of virtual divisions is 4.
[0111]
For example, the foreground component of the leftmost pixel of frame # n-1 in FIG. 17 for the first shutter time / v after the shutter opens is F12 / v, and the second pixel from the left in FIG. The foreground component of the second shutter time / v after the shutter is opened is also F12 / v. The foreground component of the third pixel from the left in FIG. 17 for the third shutter time / v after the shutter opens, and the fourth shutter time for the fourth pixel from the left in FIG. The foreground component of / v is F12 / v.
[0112]
The foreground component of the leftmost pixel of frame # n-1 in FIG. 17 for the second shutter time / v after the shutter opens is F11 / v, and the second pixel from the left in FIG. The foreground component of the third shutter time / v after the shutter is opened is also F11 / v. The foreground component of the third pixel from the left in FIG. 17 corresponding to the fourth portion of the shutter time / v from when the shutter has opened is F11 / v.
[0113]
The foreground component of the leftmost pixel of frame # n-1 in FIG. 17 for the third shutter time / v from when the shutter has opened is F10 / v, and the second pixel from the left in FIG. The foreground component of the fourth shutter time / v after the shutter is opened is also F10 / v. The foreground component of the leftmost pixel in frame # n−1 in FIG. 17 corresponding to the fourth shutter time / v from when the shutter has opened is F09 / v.
[0114]
Since the object corresponding to the background is stationary, the background component of the second pixel from the left in frame # n-1 in FIG. 17 corresponding to the first shutter time / v after the shutter opens is B01 / v Become. The background component of the third pixel from the left of frame # n−1 in FIG. 17 corresponding to the first and second shutter time / v from when the shutter has opened is B02 / v. The background component of the fourth pixel from the left of frame # n−1 in FIG. 17 corresponding to the first through third shutter time / v from when the shutter has opened is B03 / v.
[0115]
In frame # n−1 in FIG. 17, the leftmost pixel belongs to the foreground area, and the second to fourth pixels from the left belong to the mixed area which is a covered background area.
[0116]
The fifth through twelfth pixels from the left in frame # n−1 in FIG. 17 belong to the background area, and the pixel values thereof are B04 through B11, respectively.
[0117]
The first through fifth pixels from the left of frame #n in FIG. 17 belong to the foreground area. The foreground component of the shutter time / v in the foreground area of frame #n is any one of F05 / v to F12 / v.
[0118]
It can be assumed that the object corresponding to the foreground is a rigid body and moves at a constant speed, and moves so that the foreground image is displayed on the right side of four pixels in the next frame. The foreground component of the fifth pixel at the first shutter time / v after the shutter opens is F12 / v, and the sixth pixel from the left in FIG. 17 opens the shutter at the second shutter time / v. The foreground component is also F12 / v. The foreground component of the seventh pixel from the left in FIG. 17 corresponding to the third shutter time / v from when the shutter has opened, and the fourth shutter time from the shutter opening of the eighth pixel from the left in FIG. The foreground component of / v is F12 / v.
[0119]
The foreground component of the fifth pixel from the left in frame #n in FIG. 17 corresponding to the second shutter time / v from when the shutter has opened is F11 / v, and the sixth pixel from the left in FIG. The foreground component of the third shutter time / v after the shutter is opened is also F11 / v. The foreground component of the seventh pixel from the left in FIG. 17 corresponding to the fourth portion of the shutter time / v from when the shutter has opened is F11 / v.
[0120]
The foreground component of the fifth pixel from the left in frame #n in FIG. 17 corresponding to the third shutter time / v from when the shutter has opened is F10 / v, and the sixth pixel from the left in FIG. The foreground component of the fourth shutter time / v after the shutter is opened is also F10 / v. The foreground component of the fifth pixel from the left of frame #n in FIG. 17 corresponding to the fourth portion of the shutter time / v from when the shutter has opened is F09 / v.
[0121]
Since the object corresponding to the background is stationary, the background component of the sixth pixel from the left in frame #n in FIG. 17 corresponding to the first shutter time / v after the shutter is opened is B05 / v. The background component of the seventh pixel from the left of frame #n in FIG. 17 corresponding to the first and second shutter time / v from when the shutter has opened is B06 / v. The background component of the eighth pixel from the left of frame #n in FIG. 17 corresponding to the first through third shutter time / v from when the shutter has opened is B07 / v.
[0122]
In frame #n in FIG. 17, the sixth through eighth pixels from the left belong to the mixed area, which is a covered background area.
[0123]
The ninth through twelfth pixels from the left in frame #n in FIG. 17 belong to the background area, and the pixel values are B08 through B11, respectively.
[0124]
The first through ninth pixels from the left of frame # n + 1 in FIG. 17 belong to the foreground area. The foreground component of the shutter time / v in the foreground area of frame # n + 1 is any one of F01 / v to F12 / v.
[0125]
It can be assumed that the object corresponding to the foreground is a rigid body and moves at a constant speed, and the foreground image moves so as to be displayed on the right side by four pixels in the next frame. Therefore, the frame # n + 1 in FIG. The foreground component of the ninth pixel from the left when the shutter opens is the first shutter time / v is F12 / v, and the tenth pixel from the left in FIG. The foreground component of / v is also F12 / v. The foreground component of the eleventh pixel from the left in FIG. 17 and the third shutter time / v from when the shutter has opened, and the fourth shutter time from the shutter of the twelfth pixel from the left in FIG. The foreground component of / v is F12 / v.
[0126]
The foreground component of the ninth pixel from the left of frame # n + 1 in FIG. 17 corresponding to the second shutter time / v from when the shutter has opened is F11 / v, which is the tenth from the left in FIG. The foreground component of the third shutter time / v after the shutter opens is also F11 / v. The foreground component of the eleventh pixel from the left in FIG. 17 corresponding to the fourth shutter time / v from when the shutter has opened is F11 / v.
[0127]
The foreground component of the ninth pixel from the left of frame # n + 1 in FIG. 17 corresponding to the third shutter time / v from when the shutter has opened is F10 / v, which is the tenth pixel from the left in FIG. The foreground component of the fourth shutter time / v after the shutter is opened is also F10 / v. The foreground component of the ninth pixel from the left of frame # n + 1 in FIG. 17 corresponding to the fourth portion of the shutter time / v from when the shutter has opened is F09 / v.
[0128]
Since the object corresponding to the background is stationary, the background component of the tenth pixel from the left of frame # n + 1 in FIG. Become. The background component of the eleventh pixel from the left of frame # n + 1 in FIG. 17 corresponding to the first and second shutter time / v from when the shutter has opened is B10 / v. The background component of the twelfth pixel from the left of frame # n + 1 in FIG. 17 corresponding to the first through third shutter time / v from when the shutter has opened is B11 / v.
[0129]
In frame # n + 1 in FIG. 17, the tenth through twelfth pixels from the left correspond to the mixed area, which is a covered background area.
[0130]
FIG. 18 is a model diagram of an image obtained by extracting foreground components from the pixel values shown in FIG.
[0131]
FIG. 19 shows pixels arranged in a row adjacent to one another in three frames of an image obtained by capturing a foreground corresponding to an object moving to the right side in the drawing together with a stationary background. It is the model figure which expand | deployed the pixel value of the pixel of the position of the time direction. In FIG. 19, an uncovered background area is included.
[0132]
In FIG. 19, it can be assumed that the object corresponding to the foreground is a rigid body and is moving at a constant speed. Since the object corresponding to the foreground is moved so as to be displayed on the right side by four pixels in the next frame, the motion amount v is 4.
[0133]
For example, the foreground component of the leftmost pixel of frame # n−1 in FIG. 19 that is the first for the shutter time / v after the shutter opens is F13 / v, and is the second pixel from the left in FIG. The foreground component of the second shutter time / v after the shutter is opened is also F13 / v. The foreground component of the third pixel from the left in FIG. 19 corresponding to the third shutter time / v from when the shutter has opened, and the fourth shutter time from the shutter opening of the fourth pixel from the left in FIG. The foreground component of / v is F13 / v.
[0134]
The foreground component of the second pixel from the left in frame # n-1 in FIG. 19 corresponding to the first shutter time / v from when the shutter has opened is F14 / v, and the third pixel from the left in FIG. The foreground component of the second shutter time / v after the shutter is opened is also F14 / v. The foreground component of the third pixel from the left in FIG. 19 corresponding to the first shutter time / v from when the shutter has opened is F15 / v.
[0135]
Since the object corresponding to the background is stationary, the background component of the leftmost pixel of frame # n−1 in FIG. 19 corresponding to the second to fourth shutter time / v from when the shutter has opened is B25. / v. The background component of the second pixel from the left of frame # n−1 in FIG. 19 corresponding to the third and fourth shutter time / v from when the shutter has opened is B26 / v. The background component of the third pixel from the left of frame # n−1 in FIG. 19 corresponding to the fourth portion of the shutter time / v from when the shutter has opened is B27 / v.
[0136]
In frame # n−1 in FIG. 19, the leftmost pixel through the third pixel belong to the mixed area, which is an uncovered background area.
[0137]
The fourth through twelfth pixels from the left of frame # n−1 in FIG. 19 belong to the foreground area. The foreground component of the frame is any one of F13 / v to F24 / v.
[0138]
The leftmost pixel through the fourth pixel from the left in frame #n in FIG. 19 belong to the background area, and the pixel values are B25 through B28, respectively.
[0139]
It can be assumed that the object corresponding to the foreground is a rigid body and moves at a constant speed, and the foreground image moves so as to be displayed on the right side of four pixels in the next frame, so from the left of frame #n in FIG. The foreground component of the fifth pixel from the first shutter time / v after the shutter opens is F13 / v, and the sixth pixel from the left in FIG. The foreground component is also F13 / v. The foreground component of the seventh pixel from the left in FIG. 19 corresponding to the third shutter time / v from when the shutter has opened, and the fourth shutter time from the shutter opening of the eighth pixel from the left in FIG. The foreground component of / v is F13 / v.
[0140]
The foreground component of the sixth pixel from the left of frame #n in FIG. 19 corresponding to the first shutter time / v from when the shutter has opened is F14 / v, and the seventh pixel from the left in FIG. The foreground component of the second shutter time / v after opening is also F14 / v. The foreground component of the eighth pixel from the left in FIG. 19 corresponding to the first portion of the shutter time / v from when the shutter has opened is F15 / v.
[0141]
Since the object corresponding to the background is stationary, the background components of the fifth pixel from the left of frame #n in FIG. 19 corresponding to the second through fourth shutter time / v from when the shutter has opened are B29 / v. The background component of the sixth pixel from the left of frame #n in FIG. 19 corresponding to the third and fourth shutter time / v from when the shutter has opened is B30 / v. The background component of the seventh pixel from the left of frame #n in FIG. 19 corresponding to the fourth portion of the shutter time / v from when the shutter has opened is B31 / v.
[0142]
In frame #n in FIG. 19, the fifth through seventh pixels from the left belong to the mixed area, which is an uncovered background area.
[0143]
The eighth through twelfth pixels from the left of frame #n in FIG. 19 belong to the foreground area. The value corresponding to the period of the shutter time / v in the foreground area of frame #n is any one of F13 / v to F20 / v.
[0144]
The leftmost pixel through the eighth pixel from the left in frame # n + 1 in FIG. 19 belong to the background area, and the pixel values thereof are B25 through B32, respectively.
[0145]
It can be assumed that the object corresponding to the foreground is a rigid body and moves at a constant speed, and moves so that the foreground image is displayed on the right side by four pixels in the next frame. The foreground component of the ninth pixel from the left when the shutter opens is the first shutter time / v is F13 / v, and the tenth pixel from the left in FIG. 19 is the second shutter time after the shutter is opened. The foreground component of / v is also F13 / v. The foreground component of the eleventh pixel from the left in FIG. 19 corresponding to the third shutter time / v from when the shutter has opened, and the fourth shutter time from the shutter opening of the twelfth pixel from the left in FIG. The foreground component of / v is F13 / v.
[0146]
The foreground component of the tenth pixel from the left of frame # n + 1 in FIG. 19 corresponding to the first shutter time / v from when the shutter has opened is F14 / v, and the eleventh pixel from the left in FIG. The foreground component of the second shutter time / v after the shutter is opened is also F14 / v. The foreground component of the twelfth pixel from the left in FIG. 19 corresponding to the first shutter time / v from when the shutter has opened is F15 / v.
[0147]
Since the object corresponding to the background is stationary, the background component of the ninth pixel from the left of frame # n + 1 in FIG. , B33 / v. The background component of the tenth pixel from the left of frame # n + 1 in FIG. 19 corresponding to the third and fourth shutter time / v from when the shutter has opened is B34 / v. The background component of the eleventh pixel from the left of frame # n + 1 in FIG. 19 corresponding to the fourth portion of the shutter time / v from when the shutter has opened is B35 / v.
[0148]
In frame # n + 1 in FIG. 19, the ninth through eleventh pixels from the left belong to the mixed area, which is an uncovered background area.
[0149]
The twelfth pixel from the left of frame # n + 1 in FIG. 19 belongs to the foreground area. The foreground component of the shutter time / v in the foreground area of frame # n + 1 is any one of F13 / v to F16 / v.
[0150]
FIG. 20 is a model diagram of an image obtained by extracting foreground components from the pixel values shown in FIG.
[0151]
Returning to FIG. 4, the
[0152]
The mixture
[0153]
The foreground /
[0154]
The motion
[0155]
With reference to the flowchart of FIG. 21, the process of adjusting the amount of motion blur by the
[0156]
In step S101, the
[0157]
In step S102, the mixture
[0158]
In step S103, the foreground /
[0159]
In step S104, the motion
[0160]
In step S105, the
[0161]
If it is determined in step S106 that the process has been completed for the entire screen, the process ends.
[0162]
As described above, the
[0163]
Hereinafter, the configurations of the
[0164]
FIG. 22 is a block diagram illustrating an example of the configuration of the
[0165]
The static determination unit 122-1 determines the pixel value of the pixel of frame # n + 2 at the same position as the position of the pixel that is the target of region specification of frame #n, and the region specification of frame #n. The pixel value of the pixel of frame # n + 1 at the same position as the position of the target pixel on the image is read from the
[0166]
The static motion determination unit 122-2 is the pixel value of the pixel of frame # n + 1 at the same position on the image of the pixel that is the target of region identification of frame #n, and the target of frame #n. The pixel value of the pixel is read from the
[0167]
The static motion determination unit 122-3 generates a frame #n at the same position as the pixel value of the pixel that is the target for specifying the region of frame #n and the position of the pixel that is the target for specifying the region of frame #n. The pixel value of −1 pixel is read from the
[0168]
The static motion determination unit 122-4 determines the pixel value of the pixel of frame # n-1 at the same position on the image of the pixel that is the target of region specification of frame #n, and the region specification of frame #n. The pixel value of the pixel of frame # n-2 at the same position on the image of the target pixel is read from the
[0169]
The region determination unit 123-1 is configured such that the static motion determination supplied from the static motion determination unit 122-1 indicates stillness and the static motion determination supplied from the static motion determination unit 122-2 indicates movement. The pixel that is the target of region identification in frame #n is determined to belong to the uncovered background region, and the uncovered background region determination flag corresponding to the pixel that is determined to belong to the region belongs to the uncovered background region. “1” indicating “” is set.
[0170]
In the region determination unit 123-1, the static motion determination supplied from the static motion determination unit 122-1 indicates movement, or the static motion determination supplied from the static motion determination unit 122-2 indicates static. When determining that the pixel that is the target of region identification in frame #n does not belong to the uncovered background region, the uncovered background region determination flag corresponding to the pixel to be determined for the region is set to the uncovered background region. “0” is set to indicate that it does not belong.
[0171]
The area determination unit 123-1 supplies the uncovered background area determination flag in which “1” or “0” is set in this way to the determination flag
[0172]
The area determination unit 123-2 is configured such that the static motion determination supplied from the static motion determination unit 122-2 indicates static and the static motion determination supplied from the static motion determination unit 122-3 indicates static. Then, it is determined that the pixel that is the target of region identification in frame #n belongs to the still region, and “1” indicating that it belongs to the still region is set in the still region determination flag corresponding to the pixel to be determined for the region.
[0173]
In the area determination unit 123-2, the static motion determination supplied from the static motion determination unit 122-2 indicates a motion, or the static motion determination supplied from the static motion determination unit 122-3 indicates a motion. At this time, it is determined that the pixel that is the region identification target in frame #n does not belong to the still region, and “0” indicating that it does not belong to the still region is set in the still region determination flag corresponding to the pixel to be determined for the region. Set.
[0174]
The region determination unit 123-2 supplies the still region determination flag set to “1” or “0” to the determination flag
[0175]
The region determination unit 123-2 is configured such that the static motion determination supplied from the static motion determination unit 122-2 indicates movement and the static motion determination supplied from the static motion determination unit 122-3 indicates movement. Then, it is determined that the pixel that is the target of region identification in frame #n belongs to the motion region, and “1” indicating that it belongs to the motion region is set in the motion region determination flag corresponding to the pixel determined for the region.
[0176]
In the region determination unit 123-2, the static motion determination supplied from the static motion determination unit 122-2 indicates static or the static motion determination supplied from the static motion determination unit 122-3 indicates static. At this time, it is determined that the pixel that is the region identification target in frame #n does not belong to the motion region, and “0” indicating that it does not belong to the motion region is set in the motion region determination flag corresponding to the pixel that is determined to be the region. Set.
[0177]
The region determination unit 123-2 supplies the motion region determination flag set to “1” or “0” to the determination flag
[0178]
The region determination unit 123-3 is configured such that the static motion determination supplied from the static motion determination unit 122-3 indicates movement and the static motion determination supplied from the static motion determination unit 122-4 indicates stillness. , It is determined that the pixel that is the target of region identification in frame #n belongs to the covered background region, and the covered background region determination flag corresponding to the pixel to be determined of the region indicates that it belongs to the covered background region. 1 ”is set.
[0179]
In the area determination unit 123-3, the static motion determination supplied from the static motion determination unit 122-3 indicates stillness, or the static motion determination supplied from the static motion determination unit 122-4 indicates movement. When determining that the pixel that is the target of region identification in frame #n does not belong to the covered background region, the covered background region determination flag corresponding to the pixel to be determined for the region does not belong to the covered background region. “0” is set to indicate.
[0180]
The area determination unit 123-3 supplies the covered background area determination flag set to “1” or “0” to the determination flag
[0181]
The determination flag
[0182]
The determination flag
[0183]
The determination flag
[0184]
Next, an example of processing of the
[0185]
When the object corresponding to the foreground is moving, the position on the screen of the image corresponding to the object changes for each frame. As shown in FIG. 23, in the frame #n, the image corresponding to the object located at the position indicated by Yn (x, y) is Yn + 1 (x, y in the frame # n + 1 which is the next frame. Located in y).
[0186]
FIG. 24 shows a model diagram in which pixel values of pixels arranged in a row adjacent to the moving direction of the image corresponding to the foreground object are developed in the time direction. For example, when the moving direction of the image corresponding to the foreground object is horizontal with respect to the screen, the model diagram in FIG. 24 shows a model in which pixel values of adjacent pixels on one line are expanded in the time direction.
[0187]
In FIG. 24, the line in frame #n is the same as the line in frame # n + 1.
[0188]
Foreground components corresponding to the objects included in the second through thirteenth pixels from the left in frame #n are included in the sixth through seventeenth pixels from the left in frame # n + 1.
[0189]
In frame #n, the pixels belonging to the covered background area are the 11th to 13th pixels from the left, and the pixels belonging to the uncovered background area are the 2nd to 4th pixels from the left. In frame # n + 1, the pixels belonging to the covered background area are the 15th to 17th pixels from the left, and the pixels belonging to the uncovered background area are the 6th to 8th pixels from the left.
[0190]
In the example shown in FIG. 24, the foreground component included in frame #n has moved four pixels in frame # n + 1, so the amount of motion v is four. The virtual division number corresponds to the motion amount v and is 4.
[0191]
Next, changes in pixel values of pixels belonging to the mixed region before and after the frame of interest will be described.
[0192]
In the frame #n shown in FIG. 25 where the background is stationary and the foreground motion amount v is 4, the pixels belonging to the covered background area are the fifteenth through seventeenth pixels from the left. Since the motion amount v is 4, in the previous frame # n−1, the fifteenth through seventeenth pixels from the left include only background components and belong to the background area. In frame # n-2, the fifteenth through seventeenth pixels from the left include only background components and belong to the background area.
[0193]
Here, since the object corresponding to the background is stationary, the pixel value of the fifteenth pixel from the left in frame # n-1 does not change from the pixel value of the fifteenth pixel from the left in frame # n-2. . Similarly, the pixel value of the 16th pixel from the left of frame # n-1 does not change from the pixel value of the 16th pixel from the left of frame # n-2, and the 17th pixel from the left of frame # n-1 The pixel value of this pixel does not change from the pixel value of the 17th pixel from the left in frame # n-2.
[0194]
That is, the pixels of frame # n-1 and frame # n-2 corresponding to the pixels belonging to the covered background area in frame #n are composed of only background components, and the pixel value does not change. The value is almost zero. Therefore, the static motion determination for the pixels in frame # n-1 and frame # n-2 corresponding to the pixels belonging to the mixed region in frame #n is determined as static by the static motion determination unit 122-4.
[0195]
Since the pixels belonging to the covered background area in frame #n include the foreground components, the pixel values are different from the case of only the background components in frame # n-1. Therefore, the static motion determination for the pixels belonging to the mixed region in frame #n and the corresponding pixels in frame # n-1 is determined as motion by the static motion determination unit 122-3.
[0196]
As described above, the region determination unit 123-3 is supplied with the result of the static motion determination indicating the motion from the static motion determination unit 122-3, and is supplied with the result of the static motion determination indicating the static motion from the static motion determination unit 122-4. When it is done, it is determined that the corresponding pixel belongs to the covered background area.
[0197]
In frame #n shown in FIG. 26 where the background is stationary and the foreground motion amount v is 4, the pixels included in the uncovered background area are the second through fourth pixels from the left. Since the motion amount v is 4, in the next frame # n + 1, the second through fourth pixels from the left include only background components and belong to the background area. Further, in the next frame # n + 2, the second through fourth pixels from the left include only background components and belong to the background area.
[0198]
Here, since the object corresponding to the background is stationary, the pixel value of the second pixel from the left of frame # n + 2 does not change from the pixel value of the second pixel from the left of frame # n + 1. . Similarly, the pixel value of the third pixel from the left of frame # n + 2 does not change from the pixel value of the third pixel from the left of frame # n + 1, and is the fourth from the left of frame # n + 2. The pixel value of this pixel does not change from the pixel value of the fourth pixel from the left in frame # n + 1.
[0199]
That is, the pixels of frame # n + 1 and frame # n + 2, which correspond to the pixels belonging to the uncovered background area in frame #n, consist only of background components, and the pixel value does not change. The absolute value is almost zero. Accordingly, the static motion determination for the pixels of frame # n + 1 and frame # n + 2 corresponding to the pixels belonging to the mixed area in frame #n is determined as static by the static motion determination unit 122-1.
[0200]
Since the pixels belonging to the uncovered background area in frame #n include the foreground components, the pixel values are different from the case of only the background components in frame # n + 1. Therefore, the static motion determination for the pixels belonging to the mixed region in frame #n and the corresponding pixels in frame # n + 1 is determined as motion by the static motion determination unit 122-2.
[0201]
As described above, the region determination unit 123-1 is supplied with the result of the static motion determination indicating the motion from the static motion determination unit 122-2, and is supplied with the result of the static motion determination indicating the static motion from the static motion determination unit 122-1. Is determined to belong to the uncovered background area.
[0202]
FIG. 27 is a diagram illustrating determination conditions of the
[0203]
The pixel in frame # n-1 and the pixel in frame #n at the same position on the image of the pixel to be determined in frame #n are determined to be stationary, and the pixel in frame #n When it is determined that the pixel of frame # n + 1 at the same position on the image of the pixel to be determined as #n is still, the
[0204]
The pixel in frame # n-1 and the pixel in frame #n at the same position on the image of the pixel to be determined in frame #n are determined to move, and the pixel in frame #n When it is determined that a pixel in frame # n + 1 located at the same position on the image of a pixel to be determined as #n is a motion, the
[0205]
The pixel in frame #n and the pixel in frame # n + 1 at the same position on the image of the pixel to be determined in frame #n are determined as motion, and the determination target in frame #n The pixel of frame # n + 1 at the same position as the position of the pixel on the image and the pixel of frame # n + 2 at the same position as the position of the pixel to be determined at frame #n on the image Are determined to be stationary, the
[0206]
FIG. 28 is a diagram illustrating an example of the result of specifying the area of the
[0207]
In FIG. 28C, pixels determined to belong to the motion region are displayed in white. In FIG. 28D, the pixels determined to belong to the still area are displayed in white.
[0208]
FIG. 29 is a diagram showing, as an image, area information indicating a mixed area among the area information output from the determination flag
[0209]
Next, the area specifying process of the
[0210]
In step S122, the static motion determination unit 122-3 determines whether the pixel in frame # n-1 and the pixel at the same position in frame #n are stationary. Then, the static motion determination unit 122-2 determines whether or not the frame #n and the pixel at the same position in the frame # n + 1 are still.
[0211]
If it is determined in step S123 that the pixel in frame #n and the pixel in the same position in frame # n + 1 are determined to be stationary, the process proceeds to step S124, and the region determination unit 123-2 determines that the region is determined as a pixel. A corresponding still area determination flag is set to “1” indicating that it belongs to a still area. The region determination unit 123-2 supplies the still region determination flag to the determination flag
[0212]
When it is determined in step S122 that the pixel in frame # n-1 and the pixel in the same position in frame #n are in motion, or in step S123, the pixel in frame #n and the same position in frame # n + 1 If the pixel is determined to be moving, the pixel of frame #n does not belong to the still region, so the process of step S124 is skipped, and the procedure proceeds to step S125.
[0213]
In step S125, the static motion determination unit 122-3 determines whether or not the pixel in frame # n-1 and the pixel in the same position in frame #n are in motion, and if it is determined as motion, the process proceeds to step S126. Proceeding, the static motion determination unit 122-2 determines whether or not there is motion between the pixel of frame #n and the pixel at the same position of frame # n + 1.
[0214]
If it is determined in step S126 that the motion of the pixel in frame #n and the pixel in the same position in frame # n + 1 is determined as moving, the process proceeds to step S127, and the region determination unit 123-2 determines that the region is determined. “1” indicating that it belongs to a motion region is set in the corresponding motion region determination flag. The region determination unit 123-2 supplies the motion region determination flag to the determination flag
[0215]
If it is determined in step S125 that the pixel in frame # n-1 and the pixel in the same position in frame #n are stationary, or in step S126, the pixel in frame #n and the same position in frame # n + 1 If the current pixel is determined to be still, the pixel of frame #n does not belong to the motion region, so the process of step S127 is skipped, and the procedure proceeds to step S128.
[0216]
In step S128, the static motion determination unit 122-4 determines whether or not the pixel in frame # n-2 and the pixel at the same position in frame # n-1 are stationary. Proceeding to S129, the static motion determination unit 122-3 determines whether or not there is movement between the pixel of frame # n-1 and the pixel at the same position of frame #n.
[0217]
If it is determined in step S129 that the pixel in frame # n-1 and the pixel in the same position in frame #n are in motion, the process proceeds to step S130, and the region determination unit 123-3 determines that the region is to be determined. The corresponding covered background area determination flag is set to “1” indicating that it belongs to the covered background area. The region determination unit 123-3 supplies the covered background region determination flag to the determination flag
[0218]
If it is determined in step S128 that the pixel in frame # n-2 and the pixel in the same position in frame # n-1 are in motion, or in step S129, the pixel in frame # n-1 and the pixel in frame #n If it is determined that the pixel at the same position is still, the pixel of frame #n does not belong to the covered background area, so the process of step S130 is skipped, and the procedure proceeds to step S131.
[0219]
In step S131, the static motion determination unit 122-2 determines whether or not the pixel in the frame #n and the pixel in the same position in the frame # n + 1 are in motion, and if it is determined as motion, the process proceeds to step S132. Then, the static motion determination unit 122-1 determines whether or not the frame # n + 1 and the pixel at the same position in the frame # n + 2 are still.
[0220]
If it is determined in step S132 that the pixel in frame # n + 1 and the pixel in the same position in frame # n + 2 are stationary, the process proceeds to step S133, and the region determination unit 123-1 determines the region. In the uncovered background area determination flag corresponding to the pixel, “1” indicating that the pixel belongs to the uncovered background area is set. The region determination unit 123-1 supplies the uncovered background region determination flag to the determination flag
[0221]
If it is determined in step S131 that the pixel in frame #n and the pixel at the same position in frame # n + 1 are stationary, or in step S132, the pixel in frame # n + 1 and the frame # n + 2 If it is determined that the motion is the same pixel, the pixel of frame #n does not belong to the uncovered background area, so the process of step S133 is skipped, and the procedure proceeds to step S134.
[0222]
In step S134, the
[0223]
If it is determined in step S134 that the area has been specified for all the pixels of frame #n, the process proceeds to step S135, where the
[0224]
As described above, the
[0225]
The
[0226]
When the object corresponding to the foreground has a texture, the
[0227]
The
[0228]
In addition, although the object corresponding to the background has been described as stationary, the above-described processing for specifying the region can be applied even if the image corresponding to the background region includes a motion. For example, when the image corresponding to the background area is moving uniformly, the
[0229]
FIG. 31 is a block diagram illustrating a configuration of the mixture
[0230]
The estimated mixture
[0231]
Since it can be assumed that the object corresponding to the foreground is moving at a constant speed within the shutter time, the mixture ratio α of the pixels belonging to the mixed area has the following properties. That is, the mixture ratio α changes linearly in response to changes in the pixel position. If the change in the pixel position is one-dimensional, the change in the mixture ratio α can be expressed by a straight line. If the change in the pixel position is two-dimensional, the change in the mixture ratio α is expressed by a plane. be able to.
[0232]
Since the period of one frame is short, it is assumed that the object corresponding to the foreground is a rigid body and moves at a constant speed.
[0233]
In this case, the gradient of the mixture ratio α is the inverse ratio of the motion amount v within the foreground shutter time.
[0234]
An example of an ideal mixing ratio α is shown in FIG. The gradient l in the mixing region of the ideal mixing ratio α can be expressed as the reciprocal of the motion amount v.
[0235]
As shown in FIG. 32, the ideal mixture ratio α has a value of 1 in the background region, a value of 0 in the foreground region, and a value greater than 0 and less than 1 in the mixed region. .
[0236]
In the example of FIG. 33, the pixel value C06 of the seventh pixel from the left of frame #n can be expressed by Expression (4) using the pixel value P06 of the seventh pixel from the left of frame # n-1. it can.
[0237]
[Expression 2]
[0238]
In Expression (4), the pixel value C06 is expressed as the pixel value M of the pixel in the mixed region, and the pixel value P06 is expressed as the pixel value B of the pixel in the background region. That is, the pixel value M of the pixel in the mixed region and the pixel value B of the pixel in the background region can be expressed as Equation (5) and Equation (6), respectively.
[0239]
M = C06 (5)
B = P06 (6)
[0240]
2 / v in the formula (4) corresponds to the mixing ratio α. Since the motion amount v is 4, the mixture ratio α of the seventh pixel from the left of the frame #n is 0.5.
[0241]
As described above, the pixel value C of the focused frame #n is regarded as the pixel value of the mixed region, and the pixel value P of the frame # n-1 before the frame #n is regarded as the pixel value of the background region. Equation (3) indicating the mixing ratio α can be rewritten as Equation (7).
[0242]
C = α ・ P + f (7)
F in Expression (7) is the sum of the foreground components included in the pixel of interest ΣiFi / v. There are two variables included in equation (7): the mixture ratio α and the sum f of the foreground components.
[0243]
Similarly, FIG. 34 shows a model in which pixel values are expanded in the time direction, in which the amount of motion v is 4 and the number of virtual divisions in the time direction is 4, in the uncovered background area.
[0244]
In the uncovered background area, similarly to the above-described representation in the covered background area, the pixel value C of the frame #n of interest is regarded as the pixel value of the mixed area, and the frame # n + 1 after the frame #n Eq. (3) indicating the mixture ratio α can be expressed as Eq. (8) by regarding the pixel value N of as the pixel value of the background region.
[0245]
C = α ・ N + f (8)
[0246]
Although it has been described that the background object is stationary, even when the background object is moving, by using the pixel value of the pixel at the position corresponding to the background motion amount v, the expression (4 ) To Expression (8) can be applied. For example, in FIG. 33, when the motion amount v of the object corresponding to the background is 2 and the number of virtual divisions is 2, when the object corresponding to the background is moving to the right side in the figure, The pixel value B of the pixel in the background area is set to a pixel value P04.
[0247]
Since Expression (7) and Expression (8) each include two variables, the mixture ratio α cannot be obtained as it is. Here, since an image generally has a strong spatial correlation, adjacent pixels have almost the same pixel value.
[0248]
Therefore, since the foreground components have a strong spatial correlation, the formula is modified so that the sum f of the foreground components can be derived from the previous or subsequent frame to obtain the mixture ratio α.
[0249]
The pixel value Mc of the seventh pixel from the left in frame #n in FIG. 35 can be expressed by Expression (9).
[0250]
[Equation 3]
2 / v in the first term on the right side of Equation (9) corresponds to the mixing ratio α. The second term on the right side of Expression (9) is expressed as Expression (10) using the pixel value of the subsequent frame # n + 1.
[0251]
[Expression 4]
[0252]
Here, Equation (11) is established using the spatial correlation of the foreground components.
[0253]
F = F05 = F06 = F07 = F08 = F09 = F10 = F11 = F12 (11)
Expression (10) can be replaced with Expression (12) using Expression (11).
[0254]
[Equation 5]
[0255]
As a result, β can be expressed by equation (13).
[0256]
β = 2/4 (13)
[0257]
In general, assuming that the foreground components related to the mixed area are equal as shown in Expression (11), Expression (14) is established from the relationship of the internal ratio for all the pixels in the mixed area.
[0258]
β = 1-α (14)
[0259]
If Expression (14) is established, Expression (7) can be expanded as shown in Expression (15).
[0260]
[Formula 6]
[0261]
Similarly, if equation (14) holds, equation (8) can be expanded as shown in equation (16).
[0262]
[Expression 7]
[0263]
In Expressions (15) and (16), C, N, and P are known pixel values, so the only variable included in Expressions (15) and (16) is the mixture ratio α. FIG. 36 shows the relationship between C, N, and P in the equations (15) and (16). C is the pixel value of the pixel of interest in frame #n for calculating the mixture ratio α. N is a pixel value of a pixel in frame # n + 1 corresponding to a pixel of interest corresponding to a position in the spatial direction. P is a pixel value of a pixel in frame # n−1 in which the pixel of interest corresponds to the position in the spatial direction.
[0264]
Therefore, since one variable is included in each of Expression (15) and Expression (16), the mixture ratio α can be calculated using the pixel values of the pixels of the three frames. The condition for calculating the correct mixture ratio α by solving the equations (15) and (16) is that the foreground components related to the mixed region are equal, that is, when the foreground object is stationary. In the foreground image object thus obtained, the pixel values of the pixels located at the boundary of the image object corresponding to the direction of the motion of the foreground object, which are twice as many as the movement amount v, are continuous. It is constant.
[0265]
As described above, the mixture ratio α of pixels belonging to the covered background area is calculated by Expression (17), and the mixture ratio α of pixels belonging to the uncovered background area is calculated by Expression (18).
[0266]
α = (C-N) / (P-N) (17)
α = (C-P) / (N-P) (18)
[0267]
FIG. 37 is a block diagram illustrating a configuration of the estimated mixture
[0268]
The
[0269]
Therefore, when the frame # n + 1 is input to the mixture
[0270]
The mixture
[0271]
As described above, the estimated mixture
[0272]
The estimated mixture
[0273]
FIG. 38 is a diagram illustrating an example of the estimated mixture ratio calculated by the estimated mixture
[0274]
It can be seen that the estimated mixture ratio changes almost linearly in the mixed region as shown in FIG.
[0275]
Referring back to FIG. 31, the mixture
[0276]
FIG. 39 is a block diagram showing another configuration of the mixture
[0277]
The estimated mixture
[0278]
The estimated mixture
[0279]
When the target pixel belongs to the foreground area based on the area information supplied from the
[0280]
In this way, the mixture
[0281]
With reference to the flowchart of FIG. 40, the process of calculating the mixture ratio α of the
[0282]
In step S <b> 153, the estimated mixture
[0283]
In step S154, the mixture
[0284]
If it is determined in step S154 that the mixture ratio α has been estimated for the entire frame, the process proceeds to step S155, where the mixture
[0285]
As described above, the mixture
[0286]
39 is the same as the process described with reference to the flowchart of FIG. 40, and thus the description thereof is omitted.
[0287]
Next, the mixing ratio estimation process using the model corresponding to the covered background area corresponding to step S152 in FIG. 40 will be described with reference to the flowchart in FIG.
[0288]
In step S171, the mixture
[0289]
In step S172, the mixture
[0290]
In step S173, the mixture
[0291]
In step S174, the mixture
[0292]
In step S175, the mixture
[0293]
If it is determined in step S175 that the process of calculating the estimated mixture ratio has been completed for the entire frame, the process ends.
[0294]
Thus, the estimated mixture
[0295]
The process of estimating the mixture ratio by the model corresponding to the uncovered background area in step S153 of FIG. 40 is the same as the process shown in the flowchart of FIG. 41 using the expression corresponding to the model of the uncovered background area. Description is omitted.
[0296]
Note that the estimated mixture
[0297]
In addition, although it has been described that the object corresponding to the background is stationary, the above-described processing for obtaining the mixture ratio α can be applied even if the image corresponding to the background region includes a motion. For example, when the image corresponding to the background area is moving uniformly, the estimated mixture
[0298]
Note that the configuration of the mixture
[0299]
In addition, the mixture
[0300]
Similarly, the mixture
[0301]
Next, the foreground /
[0302]
The mixture ratio α supplied from the mixture
[0303]
The
[0304]
The
[0305]
The
[0306]
The combining
[0307]
In the initialization process executed at the beginning of the foreground component image synthesis process, the
[0308]
The combining
[0309]
In the initialization process executed at the beginning of the background component image synthesis process, the
[0310]
FIG. 43 is a diagram illustrating an input image input to the foreground /
[0311]
FIG. 43A is a schematic diagram of a displayed image, and FIG. 43B shows pixels belonging to the foreground area, pixels belonging to the background area, and pixels belonging to the mixed area corresponding to FIG. 1 is a model diagram in which one line of pixels including is expanded in the time direction.
[0312]
As shown in FIGS. 43A and 43B, the background component image output from the foreground /
[0313]
As shown in FIGS. 43A and 43B, the foreground component image output from the foreground /
[0314]
The pixel values of the pixels in the mixed region are separated into a background component and a foreground component by the foreground /
[0315]
Thus, in the foreground component image, the pixel value of the pixel corresponding to the background area is set to 0, and a meaningful pixel value is set to the pixel corresponding to the foreground area and the pixel corresponding to the mixed area. Similarly, in the background component image, the pixel value of the pixel corresponding to the foreground area is set to 0, and a meaningful pixel value is set to the pixel corresponding to the background area and the pixel corresponding to the mixed area.
[0316]
Next, a process executed by the
[0317]
FIG. 44 is an image model showing foreground components and background components of two frames including a foreground corresponding to an object moving from left to right in the drawing. In the image model shown in FIG. 44, the foreground motion amount v is 4, and the number of virtual divisions is 4.
[0318]
In frame #n, the leftmost pixel and the fourteenth through eighteenth pixels from the left consist only of background components and belong to the background area. In frame #n, the second through fourth pixels from the left include a background component and a foreground component, and belong to the uncovered background area. In frame #n, the eleventh through thirteenth pixels from the left include a background component and a foreground component, and belong to the covered background area. In frame #n, the fifth through tenth pixels from the left consist of only the foreground components and belong to the foreground area.
[0319]
In frame # n + 1, the first through fifth pixels from the left and the eighteenth pixel from the left consist of only the background components, and belong to the background area. In frame # n + 1, the sixth through eighth pixels from the left include a background component and a foreground component, and belong to the uncovered background area. In frame # n + 1, the fifteenth through seventeenth pixels from the left include a background component and a foreground component, and belong to the covered background area. In frame # n + 1, the ninth through fourteenth pixels from the left consist of only the foreground components, and belong to the foreground area.
[0320]
FIG. 45 is a diagram illustrating processing for separating foreground components from pixels belonging to the covered background area. In FIG. 45, α1 to α18 are mixing ratios corresponding to the respective pixels in frame #n. In FIG. 45, the fifteenth through seventeenth pixels from the left belong to the covered background area.
[0321]
The pixel value C15 of the fifteenth pixel from the left in frame #n is expressed by equation (19).
[0322]
C15 = B15 / v + F09 / v + F08 / v + F07 / v
= α15 ・ B15 + F09 / v + F08 / v + F07 / v
= α15 ・ P15 + F09 / v + F08 / v + F07 / v (19)
Here, α15 is the mixture ratio of the fifteenth pixel from the left in frame #n. P15 is the pixel value of the fifteenth pixel from the left in frame # n-1.
[0323]
Based on Expression (19), the sum f15 of the foreground components of the fifteenth pixel from the left in frame #n is expressed by Expression (20).
[0324]
f15 = F09 / v + F08 / v + F07 / v
= C15-α15 ・ P15 (20)
[0325]
Similarly, the foreground component sum f16 of the 16th pixel from the left in frame #n is expressed by equation (21), and the foreground component sum f17 of the 17th pixel from the left in frame #n is expressed by equation (21). (22)
[0326]
f16 = C16-α16 ・ P16 (21)
f17 = C17-α17 ・ P17 (22)
As described above, the foreground component fc included in the pixel value C of the pixel belonging to the covered background area is calculated by Expression (23).
[0327]
fc = C-α ・ P (23)
P is the pixel value of the corresponding pixel in the previous frame.
[0328]
FIG. 46 is a diagram illustrating processing for separating foreground components from pixels belonging to the uncovered background area. In FIG. 46, α1 to α18 are mixing ratios corresponding to the respective pixels in frame #n. In FIG. 46, the second through fourth pixels from the left belong to the uncovered background area.
[0329]
The pixel value C02 of the second pixel from the left in frame #n is expressed by Expression (24).
[0330]
C02 = B02 / v + B02 / v + B02 / v + F01 / v
= α2 ・ B02 + F01 / v
= α2 ・ N02 + F01 / v (24)
Here, α2 is the mixture ratio of the second pixel from the left in frame #n. N02 is the pixel value of the second pixel from the left in frame # n + 1.
[0331]
Based on Expression (24), the sum f02 of the foreground components of the second pixel from the left in frame #n is expressed by Expression (25).
[0332]
f02 = F01 / v
= C02-α2 ・ N02 (25)
[0333]
Similarly, the sum f03 of the foreground components of the third pixel from the left in frame #n is expressed by Expression (26), and the sum f04 of the foreground components of the fourth pixel from the left of frame #n is expressed by Expression (26). (27)
[0334]
f03 = C03-α3 ・ N03 (26)
f04 = C04-α4 ・ N04 (27)
[0335]
In this way, the foreground component fu included in the pixel value C of the pixel belonging to the uncovered background area is calculated by Expression (28).
[0336]
fu = C-α ・ N (28)
N is the pixel value of the corresponding pixel in the next frame.
[0337]
As described above, the
[0338]
FIG. 47 is a block diagram illustrating an example of the configuration of the
[0339]
The
[0340]
The
[0341]
The
[0342]
The
[0343]
The
[0344]
The
[0345]
The
[0346]
The
[0347]
The
[0348]
The
[0349]
The
[0350]
The
[0351]
By using the mixture ratio α, which is a feature amount, it is possible to completely separate the foreground component and the background component included in the pixel value.
[0352]
The synthesizing
[0353]
FIG. 48 is a diagram illustrating an example of a foreground component image and an example of a background component image corresponding to frame #n in FIG.
[0354]
FIG. 48A shows an example of the foreground component image corresponding to frame #n in FIG. Since the leftmost pixel and the fourteenth pixel from the left consist of only background components before the foreground and the background are separated, the pixel value is set to zero.
[0355]
The second through fourth pixels from the left belong to the uncovered background area before the foreground and the background are separated, the background component is 0, and the foreground component is left as it is. The eleventh to thirteenth pixels from the left belong to the covered background area before the foreground and the background are separated, the background component is set to 0, and the foreground component is left as it is. The fifth through tenth pixels from the left are made up of only the foreground components and are left as they are.
[0356]
FIG. 48B shows an example of a background component image corresponding to frame #n in FIG. The leftmost pixel and the fourteenth pixel from the left are left as they are because they consisted only of the background components before the foreground and the background were separated.
[0357]
The second through fourth pixels from the left belong to the uncovered background area before the foreground and the background are separated, the foreground components are set to 0, and the background components are left as they are. The eleventh to thirteenth pixels from the left belong to the covered background area before the foreground and the background are separated, and the foreground components are set to 0 and the background components are left as they are. Since the fifth through tenth pixels from the left consist of only the foreground components before the foreground and the background are separated, the pixel value is set to zero.
[0358]
Next, foreground / background separation processing by the foreground /
[0359]
In step S202, the
[0360]
In step S204, the uncovered
[0361]
In step S205, the uncovered
[0362]
In step S206, the covered
[0363]
In step S207, the covered
[0364]
In step S208, the
[0365]
In step S209, the
[0366]
In step S210, the
[0367]
As described above, the foreground /
[0368]
Next, adjustment of the amount of motion blur from the foreground component image will be described.
[0369]
FIG. 50 is a block diagram illustrating an example of the configuration of the motion
[0370]
The processing
[0371]
The processing unit generated by the processing
[0372]
The
[0373]
For example, when the number of pixels corresponding to the processing unit is 12 and the amount of motion v within the shutter time is 5, the
[0374]
Note that the
[0375]
The
[0376]
The
[0377]
When the foreground components corresponding to the shutter time / v included in the foreground component image are F01 / v to F08 / v, the relationship between F01 / v to F08 / v and the pixel values C01 to C12 is expressed by Equations (29) to (29) It is represented by Formula (40).
[0378]
C01 = F01 / v (29)
C02 = F02 / v + F01 / v (30)
C03 = F03 / v + F02 / v + F01 / v (31)
C04 = F04 / v + F03 / v + F02 / v + F01 / v (32)
C05 = F05 / v + F04 / v + F03 / v + F02 / v + F01 / v (33)
C06 = F06 / v + F05 / v + F04 / v + F03 / v + F02 / v (34)
C07 = F07 / v + F06 / v + F05 / v + F04 / v + F03 / v (35)
C08 = F08 / v + F07 / v + F06 / v + F05 / v + F04 / v (36)
C09 = F08 / v + F07 / v + F06 / v + F05 / v (37)
C10 = F08 / v + F07 / v + F06 / v (38)
C11 = F08 / v + F07 / v (39)
C12 = F08 / v (40)
[0379]
The
C01 = 1 ・ F01 /
+0 ・ F06 /
C02 = 1 ・ F01 /
+0 ・ F06 /
C03 = 1 ・ F01 /
+0 ・ F06 /
C04 = 1 ・ F01 /
+0 ・ F06 /
C05 = 1 ・ F01 /
+0 ・ F06 /
C06 = 0 ・ F01 /
+1 ・ F06 /
C07 = 0 ・ F01 /
+1 ・ F06 /
C08 = 0 ・ F01 /
+1 ・ F06 /
C09 = 0 ・ F01 /
+1 ・ F06 /
C10 = 0 ・ F01 /
+1 ・ F06 /
C11 = 0 ・ F01 /
+0 ・ F06 /
C12 = 0 ・ F01 /
+0 ・ F06 /
[0380]
Expressions (41) to (52) can also be expressed as Expression (53).
[0381]
[Equation 8]
In Expression (53), j indicates the position of the pixel. In this example, j has any one value of 1 to 12. I indicates the position of the foreground value. In this example, i has any one value of 1 to 8. aij has a value of 0 or 1 corresponding to the values of i and j.
[0382]
When expressed in consideration of the error, Expression (53) can be expressed as Expression (54).
[0383]
[Equation 9]
In Expression (54), ej is an error included in the target pixel Cj.
[0384]
Expression (54) can be rewritten as Expression (55).
[0385]
[Expression 10]
[0386]
Here, in order to apply the method of least squares, an error square sum E is defined as shown in Expression (56).
[0387]
## EQU11 ##
[0388]
In order to minimize the error, the partial differential value of the variable Fk with respect to the square sum E of the error may be zero. Fk is obtained so as to satisfy Expression (57).
[0389]
[Expression 12]
[0390]
In Expression (57), since the motion amount v is a fixed value, Expression (58) can be derived.
[0390]
[Formula 13]
[0392]
When equation (58) is expanded and transferred, equation (59) is obtained.
[0393]
[Expression 14]
[0394]
This is expanded into eight equations obtained by substituting any one of
[0395]
An example of a normal equation generated by the
[0396]
[Expression 15]
[0397]
When Expression (60) is expressed as A · F = v · C, C, A, v are known, and F is unknown. A and v are known at the time of modeling, but C is known by inputting a pixel value in the adding operation.
[0398]
By calculating the foreground component using a normal equation based on the method of least squares, the error included in the pixel C can be dispersed.
[0399]
The
[0400]
Based on the processing unit supplied from the processing
[0401]
The
[0402]
In the foreground component image from which the motion blur shown in FIG. 53 is removed, each of F01 to F08 is set for each of C03 to C10 because the position of the foreground component image with respect to the screen is not changed. It can correspond to an arbitrary position.
[0403]
The motion
[0404]
The motion
[0405]
The
[0406]
Thus, the motion
[0407]
Also, for example, as shown in FIG. 55, when the number of pixels corresponding to the processing unit is 8 and the motion amount v is 4, the motion
[0408]
[Expression 16]
[0409]
The motion
[0410]
FIG. 56 is a diagram illustrating another configuration of the motion
[0411]
Based on the selection signal, the
[0412]
In this way, the processing
[0413]
As described above, the motion
[0414]
Next, a process for adjusting the amount of motion blur included in the foreground component image by the motion
[0415]
In step S251, the processing
[0416]
In step S252, the
[0417]
In step S254, the adding
[0418]
If it is determined in step S255 that the pixel values of all the pixels in the processing unit have been set, the process proceeds to step S256, and the
[0419]
As described above, the motion
[0420]
That is, it is possible to adjust the amount of motion blur included in the pixel value that is the sample data.
[0421]
Note that the configuration of the motion
[0422]
As described above, the
[0423]
FIG. 58 is a block diagram showing another configuration of the function of the
[0424]
The same parts as those shown in FIG. 4 are denoted by the same reference numerals, and description thereof will be omitted as appropriate.
[0425]
The
[0426]
The mixture
[0427]
The foreground /
[0428]
The synthesizing
[0429]
FIG. 59 is a diagram illustrating a configuration of the combining
[0430]
The mixed region
[0431]
The
[0432]
As described above, the combining
[0433]
An image obtained by combining the foreground component image with an arbitrary background image based on the mixing ratio α, which is a feature amount, is more natural than an image obtained by simply combining pixels.
[0434]
FIG. 60 is a block diagram illustrating still another configuration of the function of the
[0435]
Parts that are the same as those shown in the block diagram of FIG. 4 are given the same reference numerals, and descriptions thereof are omitted.
[0436]
The input image is supplied to the mixture
[0437]
Based on the input image, the mixture
[0438]
FIG. 61 is a block diagram illustrating an example of the configuration of the mixture
[0439]
The estimated mixture
[0440]
The estimated mixture
[0441]
The estimated mixture
[0442]
The foreground /
[0443]
FIG. 62 is a block diagram illustrating an example of the configuration of the foreground /
[0444]
Parts that are the same as those of the foreground /
[0445]
The
[0446]
The
[0447]
The
[0448]
The synthesizing
[0449]
The motion
[0450]
60, for example, based on a selection signal corresponding to the user's selection, the foreground component image supplied from the foreground /
[0451]
As described above, the
[0452]
FIG. 63 is a block diagram illustrating another configuration of the function of the
[0453]
The same parts as those shown in the block diagram of FIG. 60 are denoted by the same reference numerals, and the description thereof is omitted.
[0454]
The mixture
[0455]
The foreground /
[0456]
The synthesizing
[0457]
FIG. 64 is a diagram illustrating a configuration of the
[0458]
The
[0459]
The background
[0460]
The mixed region
[0461]
The
[0462]
As described above, the
[0463]
The mixing ratio α has been described as the ratio of the background component included in the pixel value, but may be the ratio of the foreground component included in the pixel value.
[0464]
Further, although the direction of the foreground object has been described as being from left to right, it is needless to say that the direction is not limited thereto.
[0465]
In the above, the case where the image of the real space having the three-dimensional space and the time axis information is projected onto the time space having the two-dimensional space and the time axis information by using a video camera is taken as an example. In addition to this example, when the first information of more first dimensions is projected onto the second information of fewer second dimensions, distortion generated by the projection is corrected or significant It is possible to adapt to extracting information or synthesizing an image more naturally.
[0466]
The
[0467]
As shown in FIG. 3, a recording medium recording a program for performing signal processing according to the present invention is distributed to provide a program to a user separately from a computer. Disk), optical disk 52 (including CD-ROM (Compaut Disk-Read Only Memory), DVD (Digital Versatile Disk)), magneto-optical disk 53 (including MD (Mini-Disk)),
[0468]
In the present specification, the step of describing the program recorded on the recording medium is not limited to the processing performed in chronological order according to the described order, but is not necessarily performed in chronological order. It also includes processes that are executed individually.
[0469]
【The invention's effect】
As described above, the signal processing device according to
[Brief description of the drawings]
FIG. 1 is a diagram illustrating the principle of the present invention.
FIG. 2 is a block diagram illustrating a configuration example of a system to which the present invention is applied.
3 is a block diagram illustrating a configuration example of a signal processing unit in FIG. 2;
4 is a block diagram showing a
FIG. 5 is a diagram illustrating imaging by a sensor.
FIG. 6 is a diagram illustrating an arrangement of pixels.
FIG. 7 is a diagram illustrating the operation of a detection element.
FIG. 8 is a diagram illustrating an image obtained by imaging an object corresponding to a moving foreground and an object corresponding to a stationary background.
FIG. 9 is a diagram illustrating a background area, a foreground area, a mixed area, a covered background area, and an uncovered background area.
FIG. 10 is a model diagram in which pixel values of pixels arranged in a row adjacent to each other in an image obtained by capturing an object corresponding to a stationary foreground and an object corresponding to a stationary background are developed in the time direction; It is.
FIG. 11 is a model diagram in which pixel values are developed in a time direction and a period corresponding to a shutter time is divided.
FIG. 12 is a model diagram in which pixel values are developed in a time direction and a period corresponding to a shutter time is divided.
FIG. 13 is a model diagram in which pixel values are developed in a time direction and a period corresponding to a shutter time is divided.
FIG. 14 is a diagram illustrating an example in which pixels in a foreground area, a background area, and a mixed area are extracted.
FIG. 15 is a diagram illustrating a correspondence between a pixel and a model in which pixel values are developed in the time direction.
FIG. 16 is a model diagram in which pixel values are developed in a time direction and a period corresponding to a shutter time is divided.
FIG. 17 is a model diagram in which pixel values are developed in a time direction and a period corresponding to a shutter time is divided.
FIG. 18 is a model diagram in which pixel values are developed in the time direction and a period corresponding to a shutter time is divided.
FIG. 19 is a model diagram in which pixel values are developed in a time direction and a period corresponding to a shutter time is divided.
FIG. 20 is a model diagram in which pixel values are developed in a time direction and a period corresponding to a shutter time is divided.
FIG. 21 is a flowchart illustrating processing for adjusting the amount of motion blur.
22 is a block diagram illustrating an example of a configuration of a
FIG. 23 is a diagram illustrating an image when an object corresponding to the foreground is moving.
FIG. 24 is a model diagram in which pixel values are developed in a time direction and a period corresponding to a shutter time is divided.
FIG. 25 is a model diagram in which pixel values are developed in a time direction and a period corresponding to a shutter time is divided.
FIG. 26 is a model diagram in which pixel values are developed in a time direction and a period corresponding to a shutter time is divided.
FIG. 27 is a diagram for explaining region determination conditions;
FIG. 28 is a diagram illustrating an example of the result of specifying a region by the
FIG. 29 is a diagram illustrating an example of a result of specifying a region by the
FIG. 30 is a flowchart illustrating an area specifying process.
31 is a block diagram showing a configuration of a mixture
FIG. 32 is a diagram illustrating an example of an ideal mixing ratio α.
FIG. 33 is a model diagram in which pixel values are developed in a time direction and a period corresponding to a shutter time is divided.
FIG. 34 is a model diagram in which pixel values are developed in the time direction and a period corresponding to a shutter time is divided.
FIG. 35 is a diagram for explaining approximation using the correlation of foreground components.
FIG. 36 is a diagram for explaining the relationship between C, N, and P;
FIG. 37 is a block diagram showing a configuration of an estimated mixture
FIG. 38 is a diagram illustrating an example of an estimated mixture ratio.
39 is a block diagram illustrating another configuration of the mixture
FIG. 40 is a flowchart illustrating processing for calculating a mixture ratio.
FIG. 41 is a flowchart illustrating processing for calculating an estimated mixture ratio.
42 is a block diagram illustrating an exemplary configuration of a foreground /
FIG. 43 is a diagram illustrating an input image, a foreground component image, and a background component image.
FIG. 44 is a model diagram in which pixel values are expanded in the time direction and a period corresponding to a shutter time is divided.
FIG. 45 is a model diagram in which pixel values are developed in a time direction and a period corresponding to a shutter time is divided.
FIG. 46 is a model diagram in which pixel values are developed in the time direction and a period corresponding to a shutter time is divided.
47 is a block diagram illustrating an example of a configuration of a
FIG. 48 is a diagram illustrating an example of separated foreground component images and background component images.
FIG. 49 is a flowchart illustrating a process for separating the foreground and the background.
50 is a block diagram illustrating an example of a configuration of a motion
FIG. 51 is a diagram illustrating a processing unit.
FIG. 52 is a model diagram in which pixel values of a foreground component image are developed in a time direction and a period corresponding to a shutter time is divided.
FIG. 53 is a model diagram in which pixel values of a foreground component image are developed in the time direction and a period corresponding to a shutter time is divided.
FIG. 54 is a model diagram in which pixel values of a foreground component image are developed in a time direction and a period corresponding to a shutter time is divided.
FIG. 55 is a model diagram in which pixel values of a foreground component image are developed in a time direction and a period corresponding to a shutter time is divided.
56 is a diagram showing another configuration of the motion
FIG. 57 is a flowchart for describing adjustment processing of the amount of motion blur included in the foreground component image by the motion
58 is a block diagram showing another configuration of the function of the
FIG. 59 is a diagram illustrating a configuration of a combining
60 is a block diagram showing still another configuration of the function of the
61 is a block diagram illustrating a configuration of a mixture
62 is a block diagram showing a configuration of a foreground /
63 is a block diagram illustrating another configuration of the function of the
FIG. 64 is a diagram illustrating a configuration of a combining
[Explanation of symbols]
11 sensors, 12 signal processing units, 21 CPU, 22 ROM, 23 RAM, 26 input units, 27 output units, 28 storage units, 29 communication units, 51 magnetic disks, 52 optical disks, 53 magneto-optical disks, 54 semiconductor memories, 101 Object extraction unit, 102 motion detection unit, 103 region identification unit, 104 mixing ratio calculation unit, 105 foreground / background separation unit, 106 motion blur adjustment unit, 107 selection unit, 121 frame memory, 122-1 to 122-4 static motion determination , 123-1 to 123-3 area determination unit, 124 determination flag storage frame memory, 125 synthesis unit, 126 determination flag storage frame memory, 201 estimated mixture ratio processing unit, 202 estimated mixture ratio processing unit, 203 mixing ratio determination unit 221 frame memory 222 Frame memory, 223 mixing ratio calculation unit, 231 selection unit, 232 estimation mixing ratio processing unit, 233 estimation mixing ratio processing unit, 234 selection unit, 251 separation unit, 252 switch, 253 combining unit, 254 switch, 255 combining unit, 301 Frame memory, 302 separation processing block, 303 frame memory, 311 uncovered area processing section, 312 covered area processing section, 313 combining section, 314 combining section, 351 processing unit determining section, 352 modeling section, 353 equation generating section, 354 Addition unit, 355 calculation unit, 356 motion blur addition unit, 357 selection unit, 361 selection unit, 371 synthesis unit, 381 background component generation unit, 382 mixed region image synthesis unit, 383 image synthesis unit, 401 mixing ratio calculation unit, 402 Jing background separator, 421 selector, 431 combining unit, 441 selector
Claims (4)
前記入力画像の画素ごとに、連続する2つのフレームの前記入力画像の同じ位置の前記画素の画素値の差分の絶対値と、予め定められた閾値とを比較することで、前記入力画像の前記画素のフレーム間の動きの有無を判定する静動判定手段と、
前記入力画像の前記画素ごとに、所定フレームと、前記所定フレームの1つ前のフレームとの間の動きの有無の判定結果、および前記所定フレームと、前記所定フレームの1つ後のフレームとの間の動きの有無の判定結果に基づいて、前記画素が、前景となるオブジェクトを構成する前景オブジェクト成分のみからなる前景領域、背景となるオブジェクトを構成する背景オブジェクト成分のみからなる背景領域、または前記前景オブジェクト成分と前記背景オブジェクト成分が混合されてなる混合領域の何れの領域であるかを特定し、その特定結果を示す領域情報を生成する領域特定手段と、
処理対象フレームの前記入力画像における、前記領域情報により示される前記混合領域を構成する前記画素について、前記処理対象フレームの前記画素の画素値と、前記処理対象フレームに隣接するフレームの前記画素の画素値との差を、前記処理対象フレームの前後に隣接するフレームの前記画素の画素値の差で除算することにより、前記画素における前記背景オブジェクト成分の混合比を算出する混合比算出手段と
を備えることを特徴とする信号処理装置。In a signal processing device that processes input images of successive frames imaged by an imaging device composed of a plurality of detection elements having a time integration effect,
For each pixel of the input image, by comparing the absolute value of the difference between the pixel values of the pixels at the same position of the input image in two consecutive frames with a predetermined threshold value, the input image Static motion determining means for determining the presence or absence of motion between the frames of pixels;
For each pixel of the input image, a determination result of the presence / absence of motion between a predetermined frame and a frame immediately before the predetermined frame, and the predetermined frame and a frame immediately after the predetermined frame Based on the determination result of the presence or absence of motion between the foreground region, the pixel is composed of only the foreground object component constituting the foreground object, the background region composed only of the background object component constituting the background object, or the Region specifying means for specifying which region of the mixed region formed by mixing the foreground object component and the background object component, and generating region information indicating the specifying result;
For the pixels constituting the mixed region indicated by the region information in the input image of the processing target frame, the pixel value of the pixel of the processing target frame and the pixel of the pixel of the frame adjacent to the processing target frame the difference between the value, divided by the difference between the pixel values of the pixels adjacent frames before and after the processing target frame, and a mixing ratio calculating means for calculating a mixing ratio of the background object components in the pixel A signal processing apparatus.
前記領域特定手段は、
前記処理対象フレームと、前記処理対象フレームの1つ後のフレームとの間の動きの有無の判定結果、および前記処理対象フレームの1つ後のフレームと、前記処理対象フレームの2つ後のフレームとの間の動きの有無の判定結果から、前記アンカバードバックグラウンド領域である前記画素を特定するアンカバードバックグラウンド領域特定手段と、
前記処理対象フレームと、前記処理対象フレームの1つ前のフレームとの間の動きの有無の判定結果、および前記処理対象フレームの1つ前のフレームと、前記処理対象フレームの2つ前のフレームとの間の動きの有無の判定結果から、前記カバードバックグラウンド領域である前記画素を特定するカバードバックグラウンド領域特定手段と、
前記処理対象フレームと、前記処理対象フレームの1つ後のフレームとの間の動きの有無の判定結果、および前記処理対象フレームと、前記処理対象フレームの1つ前のフレームとの間の動きの有無の判定結果から、前記前景領域である前記画素、および前記背景領域である前記画素を特定する前景領域/背景領域特定手段と、
前記アンカバードバックグラウンド領域特定手段、前記カバードバックグラウンド領域特定手段、および前記前景領域/背景領域特定手段による特定結果から、前記領域情報を生成する領域情報生成手段と
を備え、
前記混合比算出手段は、
前記アンカバードバックグラウンド領域の前記画素について、前記処理対象フレームの前記画素の画素値と、前記処理対象フレームの1つ前のフレームの前記画素の画素値との差を、前記処理対象フレームの前後に隣接するフレームの前記画素の画素値の差で除算することにより前記混合比を算出する第1の混合比算出手段と、
前記カバードバックグラウンド領域の前記画素について、前記処理対象フレームの前記画素の画素値と、前記処理対象フレームの1つ後のフレームの前記画素の画素値との差を、前記処理対象フレームの前後に隣接するフレームの前記画素の画素値の差で除算することにより前記混合比を算出する第2の混合比算出手段と
を備る
ことを特徴とする請求項1に記載の信号処理装置。 The mixed area comprises an uncovered background area and a covered background area,
The region specifying means includes
The determination result of the presence / absence of motion between the processing target frame and the frame immediately after the processing target frame, the frame immediately after the processing target frame, and the second frame after the processing target frame From the determination result of the presence or absence of movement between the uncovered background area specifying means for specifying the pixel that is the uncovered background area,
Determination result of presence / absence of motion between the processing target frame and the frame immediately before the processing target frame, the frame immediately before the processing target frame, and the frame two before the processing target frame From the determination result of the presence or absence of movement between and a covered background area specifying means for specifying the pixel that is the covered background area,
The determination result of the presence / absence of motion between the processing target frame and the frame immediately after the processing target frame, and the motion between the processing target frame and the frame immediately before the processing target frame From the presence / absence determination result, foreground area / background area specifying means for specifying the pixel that is the foreground area and the pixel that is the background area;
Area information generating means for generating the area information from the specified results by the uncovered background area specifying means, the covered background area specifying means, and the foreground area / background area specifying means;
With
The mixing ratio calculating means includes
For the pixel in the uncovered background area, the difference between the pixel value of the pixel in the processing target frame and the pixel value of the pixel in the frame immediately before the processing target frame is calculated before and after the processing target frame. First mixing ratio calculating means for calculating the mixing ratio by dividing by a difference in pixel values of the pixels in the frame adjacent to
For the pixel in the covered background area, the difference between the pixel value of the pixel of the processing target frame and the pixel value of the pixel of the frame immediately after the processing target frame is set before and after the processing target frame. Second mixing ratio calculating means for calculating the mixing ratio by dividing by a difference in pixel values of the pixels of adjacent frames;
The signal processing apparatus according to claim 1, characterized in that the備Ru.
前記入力画像の画素ごとに、連続する2つのフレームの前記入力画像の同じ位置の前記画素の画素値の差分の絶対値と、予め定められた閾値とを比較することで、前記入力画像の前記画素のフレーム間の動きの有無を判定する静動判定ステップと、
前記入力画像の前記画素ごとに、所定フレームと、前記所定フレームの1つ前のフレームとの間の動きの有無の判定結果、および前記所定フレームと、前記所定フレームの1つ後のフレームとの間の動きの有無の判定結果に基づいて、前記画素が、前景となるオブジェクトを構成する前景オブジェクト成分のみからなる前景領域、背景となるオブジェクトを構成する背景オブジェクト成分のみからなる背景領域、または前記前景オブジェクト成分と前記背景オブジェクト成分が混合されてなる混合領域の何れの領域であるかを特定し、その特定結果を示す領域情報を生成する領域特定ステップと、
処理対象フレームの前記入力画像における、前記領域情報により示される前記混合領域を構成する前記画素について、前記処理対象フレームの前記画素の画素値と、前記処理対象フレームに隣接するフレームの前記画素の画素値との差を、前記処理対象フレームの前後に隣接するフレームの前記画素の画素値の差で除算することにより、前記画素における前記背景オブジェクト成分の混合比を算出する混合比算出ステップと
を含むことを特徴とする信号処理方法。In a signal processing method for processing an input image of successive frames imaged by an imaging device composed of a plurality of detection elements having a time integration effect,
For each pixel of the input image, by comparing the absolute value of the difference between the pixel values of the pixels at the same position of the input image in two consecutive frames with a predetermined threshold value, the input image A static determination step for determining the presence or absence of movement between frames of pixels;
For each pixel of the input image, a determination result of the presence / absence of motion between a predetermined frame and a frame immediately before the predetermined frame, and the predetermined frame and a frame immediately after the predetermined frame Based on the determination result of the presence or absence of motion between the foreground region, the pixel is composed of only the foreground object component constituting the foreground object, the background region composed only of the background object component constituting the background object, or the An area specifying step for specifying which area of the mixed area is formed by mixing the foreground object component and the background object component, and generating area information indicating the specifying result;
For the pixels constituting the mixed region indicated by the region information in the input image of the processing target frame, the pixel value of the pixel of the processing target frame and the pixel of the pixel of the frame adjacent to the processing target frame A mixing ratio calculating step of calculating a mixing ratio of the background object component in the pixel by dividing a difference from the value by a difference in pixel value of the pixel in adjacent frames before and after the processing target frame. And a signal processing method.
前記入力画像の画素ごとに、連続する2つのフレームの前記入力画像の同じ位置の前記画素の画素値の差分の絶対値と、予め定められた閾値とを比較することで、前記入力画像の前記画素のフレーム間の動きの有無を判定する静動判定ステップと、
前記入力画像の前記画素ごとに、所定フレームと、前記所定フレームの1つ前のフレームとの間の動きの有無の判定結果、および前記所定フレームと、前記所定フレームの1つ後のフレームとの間の動きの有無の判定結果に基づいて、前記画素が、前景となるオブジェクトを構成する前景オブジェクト成分のみからなる前景領域、背景となるオブジェクトを構成する背景オブジェクト成分のみからなる背景領域、または前記前景オブジェクト成分と前記背景オブジェクト成分が混合されてなる混合領域の何れの領域であるかを特定し、その特定結果を示す領域情報を生成する領域特定ステップと、
処理対象フレームの前記入力画像における、前記領域情報により示される前記混合領域を構成する前記画素について、前記処理対象フレームの前記画素の画素値と、前記処理対象フレームに隣接するフレームの前記画素の画素値との差を、前記処理対象フレームの前後に隣接するフレームの前記画素の画素値の差で除算することにより、前記画素における前記背景オブジェクト成分の混合比を算出する混合比算出ステップと
を含む処理をコンピュータに実行させることを特徴とするプログラムが記録されている記録媒体。A program for signal processing that processes an input image of continuous frames imaged by an imaging device composed of a plurality of detection elements having a time integration effect,
For each pixel of the input image, by comparing the absolute value of the difference between the pixel values of the pixels at the same position of the input image in two consecutive frames with a predetermined threshold value, the input image A static determination step for determining the presence or absence of movement between frames of pixels;
For each pixel of the input image, a determination result of the presence / absence of motion between a predetermined frame and a frame immediately before the predetermined frame, and the predetermined frame and a frame immediately after the predetermined frame Based on the determination result of the presence or absence of motion between the foreground region, the pixel is composed of only the foreground object component constituting the foreground object, the background region composed only of the background object component constituting the background object, or the An area specifying step for specifying which area of the mixed area is formed by mixing the foreground object component and the background object component, and generating area information indicating the specifying result;
For the pixels constituting the mixed region indicated by the region information in the input image of the processing target frame, the pixel value of the pixel of the processing target frame and the pixel of the pixel of the frame adjacent to the processing target frame A mixing ratio calculating step of calculating a mixing ratio of the background object component in the pixel by dividing a difference from the value by a difference in pixel value of the pixel in adjacent frames before and after the processing target frame. A recording medium on which a program for causing a computer to execute processing is recorded.
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2000389043A JP4479098B2 (en) | 2000-12-21 | 2000-12-21 | Signal processing apparatus and method, and recording medium |
| TW89128040A TWI237196B (en) | 1999-12-28 | 2000-12-27 | Signal processing equipment and method as well as recorded medium |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2000389043A JP4479098B2 (en) | 2000-12-21 | 2000-12-21 | Signal processing apparatus and method, and recording medium |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2002190028A JP2002190028A (en) | 2002-07-05 |
| JP4479098B2 true JP4479098B2 (en) | 2010-06-09 |
Family
ID=18855680
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2000389043A Expired - Fee Related JP4479098B2 (en) | 1999-12-28 | 2000-12-21 | Signal processing apparatus and method, and recording medium |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4479098B2 (en) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002373338A (en) * | 2001-06-15 | 2002-12-26 | Sony Corp | Image processing apparatus and method, recording medium, and program |
| JP2003016452A (en) * | 2001-06-27 | 2003-01-17 | Sony Corp | Image processing apparatus and method, recording medium, and program |
Families Citing this family (19)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP4596201B2 (en) * | 2001-02-01 | 2010-12-08 | ソニー株式会社 | Image processing apparatus and method, and recording medium |
| JP4596209B2 (en) * | 2001-06-05 | 2010-12-08 | ソニー株式会社 | Image processing apparatus and method, recording medium, and program |
| JP4596217B2 (en) * | 2001-06-22 | 2010-12-08 | ソニー株式会社 | Image processing apparatus and method, recording medium, and program |
| JP4596215B2 (en) * | 2001-06-19 | 2010-12-08 | ソニー株式会社 | Image processing apparatus and method, recording medium, and program |
| JP4596218B2 (en) * | 2001-06-22 | 2010-12-08 | ソニー株式会社 | Image processing apparatus and method, recording medium, and program |
| KR100904340B1 (en) | 2001-06-15 | 2009-06-23 | 소니 가부시끼 가이샤 | Image processing apparatus and method and imaging device |
| KR100859381B1 (en) | 2001-06-15 | 2008-09-22 | 소니 가부시끼 가이샤 | Image processing apparatus and method and imaging device |
| JP4596216B2 (en) | 2001-06-20 | 2010-12-08 | ソニー株式会社 | Image processing apparatus and method, recording medium, and program |
| JP4596219B2 (en) * | 2001-06-25 | 2010-12-08 | ソニー株式会社 | Image processing apparatus and method, recording medium, and program |
| JP4596220B2 (en) | 2001-06-26 | 2010-12-08 | ソニー株式会社 | Image processing apparatus and method, recording medium, and program |
| JP4596222B2 (en) * | 2001-06-26 | 2010-12-08 | ソニー株式会社 | Image processing apparatus and method, recording medium, and program |
| JP4596221B2 (en) * | 2001-06-26 | 2010-12-08 | ソニー株式会社 | Image processing apparatus and method, recording medium, and program |
| KR100895744B1 (en) * | 2001-06-26 | 2009-04-30 | 소니 가부시끼 가이샤 | Image processing apparatus, method and recording medium, and imaging device |
| JP4596225B2 (en) * | 2001-06-27 | 2010-12-08 | ソニー株式会社 | Image processing apparatus and method, recording medium, and program |
| JP4596226B2 (en) * | 2001-06-27 | 2010-12-08 | ソニー株式会社 | Image processing apparatus and method, recording medium, and program |
| JP4596227B2 (en) | 2001-06-27 | 2010-12-08 | ソニー株式会社 | COMMUNICATION DEVICE AND METHOD, COMMUNICATION SYSTEM, RECORDING MEDIUM, AND PROGRAM |
| JP4840630B2 (en) | 2001-06-27 | 2011-12-21 | ソニー株式会社 | Image processing apparatus and method, recording medium, and program |
| JP4596224B2 (en) | 2001-06-27 | 2010-12-08 | ソニー株式会社 | Image processing apparatus and method, recording medium, and program |
| JP4088819B2 (en) * | 2002-02-08 | 2008-05-21 | ソニー株式会社 | Image processing apparatus and method, recording medium, and program |
Family Cites Families (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3179475B2 (en) * | 1990-11-30 | 2001-06-25 | ソニー株式会社 | Signal processing device and signal processing method |
| JP3804836B2 (en) * | 1995-05-12 | 2006-08-02 | ソニー株式会社 | KEY SIGNAL GENERATION DEVICE, IMAGE SYNTHESIS DEVICE, KEY SIGNAL GENERATION METHOD, AND IMAGE SYNTHESIS METHOD |
| JP3713689B2 (en) * | 1995-05-31 | 2005-11-09 | ソニー株式会社 | KEY SIGNAL GENERATION DEVICE, KEY SIGNAL GENERATION METHOD, AND IMAGE SYNTHESIS DEVICE |
| JP2000030040A (en) * | 1998-07-14 | 2000-01-28 | Canon Inc | Image processing apparatus and computer-readable storage medium |
| JP4491965B2 (en) * | 1999-12-28 | 2010-06-30 | ソニー株式会社 | Signal processing apparatus and method, and recording medium |
| JP4507045B2 (en) * | 2000-12-21 | 2010-07-21 | ソニー株式会社 | Signal processing apparatus and method, and recording medium |
| JP4507044B2 (en) * | 2000-12-21 | 2010-07-21 | ソニー株式会社 | Image processing apparatus and method, and recording medium |
-
2000
- 2000-12-21 JP JP2000389043A patent/JP4479098B2/en not_active Expired - Fee Related
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002373338A (en) * | 2001-06-15 | 2002-12-26 | Sony Corp | Image processing apparatus and method, recording medium, and program |
| JP2003016452A (en) * | 2001-06-27 | 2003-01-17 | Sony Corp | Image processing apparatus and method, recording medium, and program |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2002190028A (en) | 2002-07-05 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4507044B2 (en) | Image processing apparatus and method, and recording medium | |
| JP4507045B2 (en) | Signal processing apparatus and method, and recording medium | |
| JP4491965B2 (en) | Signal processing apparatus and method, and recording medium | |
| JP4479098B2 (en) | Signal processing apparatus and method, and recording medium | |
| KR100725192B1 (en) | Signal processing apparatus and method, and recording medium | |
| JP4596216B2 (en) | Image processing apparatus and method, recording medium, and program | |
| JP4596222B2 (en) | Image processing apparatus and method, recording medium, and program | |
| JP4596220B2 (en) | Image processing apparatus and method, recording medium, and program | |
| JP4596221B2 (en) | Image processing apparatus and method, recording medium, and program | |
| US20040105493A1 (en) | Image processing apparatus and method, and image pickup apparatus | |
| US20030156203A1 (en) | Image processing device | |
| JP4596201B2 (en) | Image processing apparatus and method, and recording medium | |
| US20030174899A1 (en) | Image processing apparatus | |
| JP4596219B2 (en) | Image processing apparatus and method, recording medium, and program | |
| US20040028259A1 (en) | Image processing apparatus and method, and image pickup apparatus | |
| JP2003016452A (en) | Image processing apparatus and method, recording medium, and program | |
| JP4596209B2 (en) | Image processing apparatus and method, recording medium, and program | |
| JP2003016446A (en) | Image processing apparatus and method, recording medium, and program |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070226 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20091116 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091119 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100107 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100223 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100308 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130326 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140326 Year of fee payment: 4 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| LAPS | Cancellation because of no payment of annual fees |