<本発明について>
本発明では、例えば符号側における従来の符号化信号に加えて、符号化前の入力信号に含まれていた雑音の特性を表す情報を雑音パラメータとして出力することで、復号化装置において入力信号に含まれていた雑音を高精度に再現させる。
また復号側では、復号化信号に含まれる雑音と、符号化側での入力信号に含まれていた元々の雑音との間の差異を補償する雑音とを重畳して出力信号として出力し、出力信号と入力信号間の雑音の特性を揃える。その結果、出力信号と入力信号との間の知覚上の品質等をより近似させることができる。以下に、上述したような特徴を有する本発明における復号化装置及び復号化プログラムを好適に実施した形態について、図面を用いて詳細に説明する。
<符号化・復号化システム:概略構成例>
まず、本実施形態における符号化装置、復号化装置を用いた符号化・復号化システムの概略構成例について、図を用いて説明する。図1は、本実施形態における符号化・復号化システムの概略構成の一例を示す図である。図1に示す符号化・復号化システム10は、第1の実施形態としての符号化装置11と復号化装置12とを有する。
第1の実施形態としての符号化装置11は、符号化手段21と、雑音検出手段22とを有するよう構成されている。また、第1の実施形態としての復号化装置12は、復号化手段31と、雑音検出手段32と、比較手段33と、雑音生成手段34と、重畳手段35とを有するよう構成されている。
第1の実施形態において、符号化装置11には入力信号が入力される。符号化手段21は、入力信号に対して予め設定された符号化方式を用いて符号化を行い、得られた符号化信号を復号化装置12に送信する。雑音検出手段22は、入力信号から雑音を検出し、その雑音を定量化した雑音パラメータを復号化装置12に出力する。なお、雑音検出手段22における雑音検出の詳細については後述する。
ここで、図1に示す符号化・復号化システム10において、復号化装置12が符号化装置11から符号化信号及び雑音パラメータを取得する場合には、例えば電波等の伝送系、インターネットやLAN(Local Area Network)等の通信ネットワーク、又はCD−ROMやDVD(Digital Versatile Disc)、USB(Universal Serial Bus)メモリ等の記録媒体等を介して取得することができる。このとき、符号化信号及び雑音パラメータは、上述した各取得方式のうち、同一の方式で取得してもよく、また別々の方式で取得してもよい。
また、第1の実施形態では、符号化装置11から出力される符号化信号及び雑音パラメータを、例えば符号化装置や復号化装置12の外部や内部等に設けられた蓄積手段等に蓄積しておき、復号化装置12が必要なときにその蓄積手段に蓄積された符号化信号及び雑音パラメータを読み出す構成としてもよい。このとき、符号化信号及び雑音パラメータは、同一の蓄積手段に蓄積されてもよく、また別々の蓄積手段に蓄積されてもよい。
更に、第1の実施形態においては、上述した内容に限定されるものではなく、例えば復号化装置12側から通信ネットワーク等を用いて符号化装置11にアクセスし、符号化装置11に蓄積された符号化信号及び雑音パラメータをダウンロードすることで取得することもできる。
また、図1に示す符号化・復号化システム10における入力信号の種類としては、例えば画像(静止画像)信号や映像(動画像)信号、音声信号等があるが、本発明においてはこれに限定されるものではない。
また、上述した雑音パラメータとしては、例えば雑音成分の分散値、雑音成分(列)を周波数領域に変換したときのパワースペクトル系列、パワースペクトル系列の包絡線を曲線近似したパラメータ(スプライン曲線のパラメータ、ベジエ曲線のパラメータ等)のうち、何れか1つ又は複数を組み合わせて適用することができる。
また、雑音パラメータとして、例えば情報源符号化又は通信路符号化、又はそれら両符号化を適用してもよい。ここで、情報源符号化手法の例としては、例えば「標本化→変換→量子化→符号語割り当て」等を用い、以下の任意の組み合わせで構成することができる。ここで、標本化の例としては、例えば均一標本化(例えば、入力信号(ここでは、雑音パラメータ)を時間や空間上に一定間隔で配置された標本点上で標本化を行い、予測処理に渡す)、不均一標本化(例えば、入力信号を、時間や空間上に不均一に配置した標本点上で標本化を行い、予測処理に渡す)等を用いることができる。
また、変換の例としては、例えば変換なし(例えば、標本点毎の標本値(雑音パラメータ)を変換せずそのまま出力)、差分予測(例えば、注目する標本点の標本値と、隣接する標本点(例えば、前時点や左隣等の標本点)の標本値の差分値を出力)、動き補償(例えば映像の場合に、前時点の標本値列と、現時点の標本値列との対応付けをブロック毎に行い、その対応付け情報(動きベクトル)と対応付けされたブロック間の差分値列(残差信号)とを出力)、直交変換(例えば、標本値列(又は動き補償の残差信号列)に直交変換(離散コサイン変換等)を施し、その結果の変換係数列を出力)等を用いることができる。
また、量子化の例としては、例えば等間隔量子化(例えば、変換処理出力の数値列を、一定間隔の量子化レベルで量子化することで、その数値列の値を離散化する)、不等間隔量子化(例えば、変換処理出力の数値列を、不均一間隔の量子化レベルで量子化することで、その数値列の値を離散化する)、ベクトル量子化(例えば、変換処理出力の数値列を複数標本ずつ纏めてベクトル化し、そのベクトルが、不均一に分割されたベクトル空間のどの分割領域に属するかのインデックスを出力する)等を用いることができる。
また、符号語割り当ての例としては、例えば、単純な割り当て(例えば、量子化処理出力(シンボル列)の性質を考慮せず、単純にシンボル値を二進数表現する)、エントロピー符号化(例えば、量子化処理出力(シンボル列)をその出現頻度に応じて符号語を割り当てる(ハフマン符号化、算術符号化等))等を用いることができる。
また、上述した通信路符号化の例としては、例えば、情報源符号化から出力された符号を伝送路の帯域、雑音、妨害等に応じて再度符号化することで、誤り耐性を与えるもの(例えば、パリティビットの付加、畳み込み符号、ターボ符号)等を用いることができる。
また、雑音パラメータは、例えば符号化信号のシンタクス内に記述してもよい。更に、雑音パラメータは、例えば符号化信号と雑音パラメータとを多重化して伝送又は蓄積してもよい。
また、復号化装置12において、復号化手段31は、符号化装置11から取得した符号化信号を、符号化に用いた符号化方式に対応する復号化方式を用いて符号化信号を復号化し、復号化信号を取得する。また、復号化手段31は、雑音検出手段32及び重畳手段35に復号化信号を出力する。
雑音検出手段32は、復号化手段31により得られる復号化信号に対する雑音を検出し、雑音パラメータを検出する。比較手段33は、雑音検出手段32により得られる雑音パラメータと、符号化装置11から送信された雑音パラメータとを比較し、差分情報を取得する。雑音生成手段34は、比較手段33により得られた差分情報を用いて雑音を生成する。
重畳手段35は、復号化手段31により得られた復号化信号に、雑音生成手段34により得られた雑音を重畳して出力信号を出力する。なお、重畳手段35は、復号化された復号化された信号系列と、雑音生成手段34により得られた雑音系列とを、系列の先頭から重畳していくことで2つの信号が同期した所望の復号信号を出力することができる。また、本発明においては、これに限定されるものではなく、例えば予めそれぞれの信号に時間情報を付加しておき、重畳手段35は、その時間情報に基づいて重畳してもよい。また、他の例としては、例えば各信号の符号列に対し同期ビット列を付加しておき、重畳手段35は、その同期ビット列に基づいて重畳してもよい。
これにより、第1の実施形態によれば、入力信号と同様の雑音パラメータを重畳して、より入力信号に類似する出力信号を取得することができる。
ここで、上述した符号化手段21と復号化手段31とは、対をなす符号化器と復号化器であり、何れも既に標準化されている等の公知の符号化方式によるものを用いることができる。また、符号化手段21と復号化手段31として、例えば例えば、動画像におけるHEVC(High Efficiency Video Coding)方式等、今後利用可能となる符号化方式を採用してもよい。
また、例えば、符号化手段21と復号化手段31として、入力信号が音声信号の場合、その音声符号化として、例えば、LPCM(Linear Pulse Code Modulation)、Window Media Audio、Dolby Digital Plus、AC−3、ATRAC(Adaptive TRansform Acoustic Coding)、MPEG(Moving Picture Experts Group)オーディオ用コーデック(例えば、AAC(Advanced Audio Coding)、MP1、MP2、MP3等)、Twin VQ(Transform−domain Weighted Interleave Vector Quantization)等の任意の符号化方式を用いることができる。
また、第1の実施形態では、入力信号が画像信号の場合、JPEG(Joint Photographic Experts Group)、JPEG2000、GIF(Graphic Interchange Format)、PNG(Portable Network Graphics)等の任意の符号化方式を用いることができる。
更に、第1の実施形態では、入力信号が動画信号の場合、H.261、H.263、MPEG−4 AVC/H.264、MPEG−1、MPEG−2、MPEG−4、Motion JPEG、Motion JPEG2000、WMV(Windows(登録商標) Media Video)9、Real Video等の任意の符号化方式を用いることができる。なお、第1の実施形態においては、上述した符号化方式に限定されるものではない。
<雑音検出手段について>
次に、上述した雑音検出手段22,32の具体的な機能構成例について、図を用いて説明する。図2は、雑音検出手段の機能構成の一例を示す図である。以下の説明では、復号化装置12に設けられた雑音検出手段32を用いて説明するが、符号化装置11に設けられた雑音検出手段22も同様の構成及び動作等を行うため、ここでの詳細な説明は省略する。なお、雑音検出手段32では、復号化信号が入力され、雑音検出手段22は、元の入力信号が入力される点のみが異なる。
図2に示す雑音検出手段32は、雑音信号抽出手段41と、パラメータ化手段42とを有するよう構成されている。雑音信号抽出手段41は、入力される復号化信号から雑音信号を抽出する。
パラメータ化手段42は、雑音信号抽出手段41により抽出された雑音の内容に対応させて雑音パラメータを生成する。ここで、雑音信号抽出手段41の具体例について説明する。
<雑音信号抽出としてトータルバリエーションノルム正則化を用いる場合>
まず、具体例として、雑音信号抽出にトータルバリエーションノルム正則化を用いる場合について説明する。
ここで、第1の実施形態におけるトータルバリエーションノルムとは、信号を上昇区間と下降区間に分け、各区間の変化量(差の絶対値)を全て加えたものを意味し、トータルバリエーションノルムは、信号の上下の回数やその大きさが大きいほど、値が大きくなるという性質を有する。また、第1の実施形態におけるトータルバリエーションノルム正則化法とは、例えば「評価値=Σ信号区間|平滑化信号−入力信号(ここでは、復号化信号)|+(信号区間のトータルバリエーション値)」等の式により定義される評価値を小さくするような平滑化信号を求める手法を意味する。なお、上述した平滑化信号は、例えば最急降下法等で求めることができ、上述の式もこれに限定されるものではなく、例えばΣの中を絶対値ではなく2乗等にした式を用いこともできる。
すなわち、トータルバリエーションノルム正則化法で得られる平滑化信号は、入力信号(ここでは、復号化信号)を近似しつつもトータルバリエーション値を抑えた信号となる。したがって、この平滑化信号は、信号波形の不規則かつ小刻みな上下動のみを取り除いた信号となる。
また、上述の式に示すように(平滑化信号−入力信号)を計算することで、雑音である不規則な上下動だけを分離して取り出すことができる。これにより、トータルバリエーションノルム正則化法による雑音分離を行うことができる。
具体的に説明すると、雑音信号抽出手段41は、例えば入力信号(ここでは、復号化信号)が雑音のない信号成分Sと雑音信号Lとの合成であるものとしてモデル化を行い、復号化信号又は雑音信号Lの信号の性質(例えば、波形の特徴や統計的性質等)を考慮して入力信号を信号成分Sestと雑音成分Lestとに分離する。
例えば、入力信号の標本点位置tにおける標本値をX(t)とおくと、雑音信号抽出手段41は、以下に示す式(1)により、信号成分Sestと雑音成分Lestとを分離する。
なお、標本点位置tは、例えば、入力信号が音声信号等の1次元信号の場合にはスカラーを示し、画像信号や動画像信号等の場合にはベクトルを示す。また、上述した式(1)において、f[X,S]は、二つの関数X及びSが類似しているほど、小さな値を取る汎関数である。一方、g[S]は、関数Sの波形が単純であるほど、小さな値を取る汎関数である。また、λは、例えば予め設定される適当な係数であり、典型的には正の実定数(例えば、1.0等)である。更に、arg minは、例えばその引数(式(1)中の括弧()内)の値が最小となるような信号波形S(t)を求める演算である。
ここで、類似度を測る汎関数fは、例えば、以下に示す式(2)或いは式(3)に示すように関数X及びSの誤差の積分値等により定義することができる。
なお、標本点位置tが離散化されている場合には、例えば上述した式(2)や式(3)の積分演算を総和演算に代えて実行してもよい。第1の実施形態では、以下同様に、積分演算を総和演算に置き換えてもよいものとする。
一方、信号成分Sの単純さを測る汎関数gは、例えば以下に示す式(4)に示すようにトータルバリエーションノルムにより定義することができる。
なお、上述した式(4)の右辺の積分記号内のノルムは、任意のノルムを用いることができる。また、上述したノルムは、例えばLlノルムやL2ノルム(ユークリッドノルム)を用いるのが好ましい。
また、第1の実施形態では、ベクトル(K次元、各成分zi)に対するノルムをより一般的に、以下に示す式(5)とした場合に、信号成分Sの単純さを測る汎関数gを、以下に示す式(6)と定義することもできる。
なお、上述した式(5)において、Kは標本点位置tの次元を表す自然数を示し、pは適当な0以上(無限大∞を含む)の実数を示し、nは適当な正の実数を示す。具体的には、例えばp=2かつn=2とすることができる(このとき、上述した式(5)は、ユークリッドノルムの2乗となる)。
また、雑音信号抽出手段41は、入力信号(ここでは、復号化信号)と、その入力信号を平滑化した信号との比較により雑音信号を抽出してもよい。したがって、以下に一例として、雑音信号抽出手段41が、平滑化に移動平均処理法を用いる場合、順序統計処理法を用いる場合、及びモルフォロジ処理法を用いる場合について説明する。
<雑音信号抽出手段41が移動平均処理法を用いる場合>
例えば、雑音信号抽出手段41が移動平均処理法を用いる場合、雑音信号抽出手段41は、以下の式(7)に示すように、局所領域内における入力信号(ここでは、復号化信号)の移動平均による平滑化により信号成分Sestを取得し、その入力信号と信号成分Sestとの差分から雑音成分Lestを求めるように動作させる。
なお、上述した式(7)において、Wは平滑化を行う窓の領域形状を表す集合を示す。
<雑音信号抽出手段41が順序統計処理法を用いる場合>
例えば、雑音信号抽出手段41が順序統計処理法を用いる場合、雑音信号抽出手段41は、局所領域内における入力信号(ここでは、復号化信号)の順序統計処理により信号成分Sestを取得し、その入力信号と信号成分Sestとの差分から雑音成分Lestを求めるよう動作させる。
ここで、順序統計処理とは、例えば標本値列を昇順(又は降順)に整順し、整順結果の所定の順位にある標本値を求めて出力する処理である。順序統計処理には、例えば最大値抽出処理、最小値抽出処理、中央値抽出処理等が含まれる。
例えば、ある標本値列の中央値を求める演算をmedとしたとき、以下に示す式(8)により信号成分Sestと雑音成分Lestとを求めることができる。
<雑音信号抽出手段41がモルフォロジ処理法を用いる場合>
例えば、雑音信号抽出手段41がモルフォロジ処理法を用いる場合、雑音信号抽出手段41は、以下の式(9)に示すように、入力信号(ここでは、復号化信号)のモルフォロジ演算処理により信号成分S
estを取得し、その入力信号と信号成分S
estとの差分から雑音成分L
estを求めるよう動作させる。
なお、上述した式(9)において、closeはクローズ演算を示し、波形の凹みを埋める効果がある。またopenは、オープン演算を示し、波形の突出部を消す効果がある。また、dilは、膨張演算(ダイレーション;dilation)を示し、波形を太らせる効果があり、max演算で定義することができる。また、eroは、収縮演算(エロージョン;erosion)を示し、波形を細らせる効果があり、min演算で定義することができる。
このように、第1の実施形態によれば、信号波形の不規則な上下のみを選択的に抽出することができ、音声や映像等の構造(例えば、被写体の像の輝度パターン等)に起因する有意な波形とはみなし難い信号を雑音として抽出することができる。これにより、復号化装置(符号化装置も含む)の雑音検出手段は、有意ではない信号成分を雑音とみなして、適切な雑音パラメータを出力することができる。
<雑音信号抽出手段41の代わりに局部復号を用いて雑音信号を抽出する場合>
ここで、本実施形態では、例えば上述した雑音信号抽出手段41の代わりに局部復号処理等を用いて雑音信号を抽出することができる。この場合、雑音検出手段22は、図2の雑音信号抽出手段41に代えて、復号化手段と比較手段とを有する。
ここで、上述した構成を有する符号化装置を第2の実施形態として、図を用いて説明する。なお、以下の説明では、上述の機能構成と同様の処理を行う部分については、同一の符号化を付するものとし、ここでの具体的な説明は省略する。
<符号化装置:第2の実施形態>
図3は、第2の実施形態における符号化装置の機能構成例を示す図である。図3に示す符号化装置51は、符号化手段21と、雑音検出手段52とを有するよう構成されている。また、雑音検出手段52は、復号化手段53と、比較手段54と、パラメータ化手段42とを有するよう構成されている。
符号化装置51において、復号化手段53は、符号化手段21から出力された符号を復号し、その結果を局部復号化信号として出力する。復号化手段53は、符号化手段21と対をなす復号化器であり、上述した復号化装置12側の復号化手段31と同様の入出力関係にあるものとする。なお、符号化手段21が、例えば局部復号化器(例えば、ローカルデコーダ等)を有する符号化方式である場合には、その局部復号化器の出力を、上述した局部復号化信号として流用することもできる。これにより、局部復号を有する符号化方式を符号化手段として用いる場合には、その局部復号化の結果を雑音検出に流用することができるため、符号化装置の規模や演算コストを削減することができる。
比較手段54は、入力信号と復号化手段53から得られる局部復号化信号とを比較する。具体的には、比較手段54は、例えば信号の標本点毎に入力信号と局部復号化信号との差分を取得し、取得した差分の系列を雑音信号として出力する。
パラメータ化手段42は、比較手段54により得られた雑音信号の雑音成分Lestをパラメータ化し、雑音パラメータに変換する。ここで、雑音パラメータは、例えば雑音成分Lestの統計量に基づいて定義してもよく、フーリエ変換等を実施した結果の変換係数に基づいて定義してもよい。
<雑音パラメータが統計量に基づき定義される場合>
ここで、雑音パラメータが統計量に基づき定義される場合について具体的に説明する。雑音パラメータが統計量に基づき定義される場合、パラメータ化手段42は、例えば、以下の式(10)に示すように、雑音成分Lestの分散値σ2を用いて雑音パラメータNを定義することができる。
ここで、上述した式(10)のEは分散を求める際の演算対象とする標本点位置の集合を示す。集合Eは、例えば、音声信号や画像信号、動画像信号の1フレームを構成する標本点の集合、又は画像信号や動画像信号のフレーム内の1ブロックを構成する標本点の集合等、時空間内に設定される局所領域であってもよく、信号系列全体の標本点の集合であってもよい。
<雑音パラメータがスペクトルに基づき定義される場合>
次に、雑音パラメータがスペクトルに基づき定義される場合について具体的に説明する。スペクトルに基づき定義される場合、パラメータ化手段42は、例えば、雑音成分Lestを周波数領域に変換し、その周波数領域におけるスペクトルに基づいて雑音パラメータNを定義することができる。
例えば、パラメータ化手段42は、雑音成分の系列(Lest(t))t∈Tを周波数領域に変換する。ここで、集合Tは、変換対象とする標本点の集合を示し、例えば、音声信号等の1次元信号おいては、あるフレームの標本点系列全体としたり、あるフレーム内に設定されるブロック内の標本点系列とすることができる。また、周波数領域への変換には、例えば、離散フーリエ変換、離散コサイン変換、離散サイン変換、アダマール変換等を用いることができる。
ここで、本実施形態では、雑音成分の系列(Lest(t))t∈Tを周波数領域に変換した結果をスペクトル系列(G(f))f∈Fとおく。なお、上述のfは周波数(例えば、音声信号等1次元信号においては周波数、画像信号や動画像信号等多次元信号においては空間周波数等)を示し、Fは変換結果の周波数の値域を示す。
パラメータ化手段42は、スペクトル系列(G(f))f∈Fを雑音パラメータNに変換する。例えば、雑音パラメータNとして、パワースペクトル系列(P(f))f∈Fを用いて、以下に示す式(11)のように表すことができる。
また、パラメータ化手段42は、例えば雑音パラメータNとして、パワースペクトル系列(P(f))f∈Fの包絡線の情報を用いることができる。このとき、パラメータ化手段42は、パワースペクトル系列(P(f))f∈Fの包絡線を、例えばスプライン曲線やベジエ曲線等のパラメトリックな曲線で近似し、その曲線のパラメータを雑音パラメータとしてもよい。
<復号化装置:第2の実施形態>
次に、復号化装置の第2の実施形態について図を用いて説明する。図4は、第2の実施形態における復号化装置の機能構成例を示す図である。復号化装置の第2の実施形態では、フィードバック型の復号化装置を示している。なお、上述した復号化装置と同様の機能を有する部分については同一の符号を付するものとし、ここでの具体的な説明は省略する。
図4に示す復号化装置61は、復号化手段31と、雑音検出手段62と、比較手段63と、ラッチ64と、積算手段65と、雑音生成手段66と、重畳手段67とを有するよう構成されている。
雑音検出手段62は、重畳手段67により得られる出力信号を入力して上述した雑音検出手段32と同様の手法を用いて雑音を検出し、検出された雑音から雑音パラメータを生成する。なお、雑音検出手段62により出力されるパラメータを雑音パラメータMとする。
比較手段63は、符号化装置側の雑音検出手段22,52により得られる雑音パラメータ(例えば、雑音パラメータN)と、上述した雑音検出手段62で検出された雑音パラメータMとの比較を行い、その雑音の差を定量化し、雑音差分情報として出力する。なお、雑音の差としては、例えば標準偏差の差、分散の差、振幅の差、パワーの差、周波数特性の差、又はこれらの組み合わせ等があるが、本発明においてはこれに限定されるものではない。
例えば、比較手段63は、雑音パラメータNの値から雑音パラメータMの値を減じた数値(N−M)を差分雑音情報として出力する。なお、比較手段63は、時系列の雑音パラメータが入力された場合に、雑音パラメータNの系列の各項から雑音パラメータMの系列の対応する各項を減じた系列(N−M)を差分雑音情報として出力することもできる。
なお、雑音パラメータN及び雑音パラメータMが、雑音の特性を表すパラメータ(例えば、包絡線のパラメータ等)である場合、比較手段63は、該パラメータに基づいて各スペクトル包絡を求め、両スペクトル包絡の差分の波形を出力するよう動作することもできる。
ラッチ64は、ある区間(例えば、信号区間、パラメータ時系列の区間、画像のフレーム区間)のデータを一時的に保持するメモリであり、例えば予め設定された区間の処理を遅延させる遅延手段として動作する。また、ラッチ64の初期値は任意であるが、例えば値を0とすることが好ましい。
なお、図4において、ラッチ64は、比較手段63と積算手段65との間に設けられているが、本発明においては、これに限定されるものではなく、例えば雑音検出手段62の入力直前、雑音検出手段62と比較手段63との間、積算手段65と雑音生成手段66との間、雑音生成手段66と重畳手段67との間の何れに設けられていてもよい。
積算手段65は、比較手段63により得られる雑音パラメータの比較結果(例えば、差分雑音情報等)を積算する。ここで、本実施形態における積算とは、これまでの積算結果に入力値を加算した結果を意味し、例えばスペクトルのように複数成分を有するものについては、成分毎の和、すなわちベクトルとしての和等を意味する。つまり、積算手段65は、これまでの積算結果を蓄積しておき、次に入力された入力値を新たな積算結果としつつ、その新たな積算結果を出力する。ここで、積算結果の初期値は任意であるが、例えば0(スペクトルの場合には、全成分0)とするのが好ましい。
雑音生成手段66は、積算手段65により得られる積算値に基づいて雑音を生成する。具体的には、雑音生成手段66は、上述した雑音差分情報に基づいて雑音系列を生成し、生成された雑音系列を出力する。例えば、雑音差分情報が雑音パラメータの差分による場合に、雑音生成手段66は、その差分値(N−M)に基づいて雑音系列を生成する。また、例えば、雑音パラメータが分散値による場合に、雑音生成手段66は、分散値を以下に示す式(12)で表し、かつ平均値が0である雑音系列を生成する。なお、式(12)では、雑音検出手段22で検出された分散値をσN 2とし、雑音検出手段62で検出された分散値をσM 2としている。
また、例えば生成する雑音系列をガウス雑音とした場合に、雑音生成手段66は、正規分布N(0,σ
G 2)に従う雑音系列を生成する。
ここで、上述した雑音パラメータN及び雑音パラメータMが、雑音の周波数特性の包絡線を近似するパラメータであり、かつ、比較手段63が雑音パラメータN及び雑音パラメータMに基づいて、パワースペクトル包絡EN(f)及びEM(f)を求め、両パワースペクトル包絡の差分の波形D(f)=EN(f)−EM(f)を出力するよう動作する場合について、雑音生成手段66の動作を以下に説明する。なお、上述したfは周波数を示し、例えば音声信号の場合には1次元の周波数を示し、映像信号の場合には2次元の空間周波数を示す。
雑音生成手段66は、出力すべき雑音のパワースペクトルDG(f)を以下に示す式(13)からなる「確率分布からの標本抽出」によって、周波数f毎にスペクトル値DG(f)を定める。
なお、第2の実施形態では、実装上、周波数fを離散化し、有限可算個の周波数成分を標本抽出によって生成するものとしてもよい。
重畳手段67は、復号化手段31から出力された復号化信号に、雑音生成手段66で生成された雑音を加算等により重畳し、出力信号として出力する。なお、重畳手段67は、雑音生成手段66で生成された雑音が無雑音(例えば、値0のみからなる雑音系列等)である場合には、結果として復号化手段31により得られる復号化信号をそのまま出力することになるが、通常は復号化信号自体にも雑音が含まれる。また、重畳手段67は、例えば復号化手段31から出力された復号化信号に、雑音生成手段66を加算した後で、量子化を行ったり、加算の結果が所定の範囲を超えないように値を制限してもよい。例えば、出力信号を0以上255以下の整数(8ビット信号等)に限定し、加算結果が0未満の場合には値0を出力し、加算結果が255を超える場合には値255を出力し、それ以外の場合には、加算結果を近似する整数に丸めた結果を出力するよう動作させることができる。
したがって、第2の実施形態では、例えば入力信号を画像信号とし、フレーム単位の区間で処理する場合には、1フレーム過去の雑音検出結果に基づいて現フレームの出力信号を得るIIR(Infinite Impulse Response)的な動作を行うこととなる。
<復号化装置:第3の実施形態>
ここで、上述した復号化装置の第2の実施形態では、特に雑音パラメータがフレームと共に緩やかに変化する場合等に適用することができるが、例えばフレームが進むにつれて雑音パラメータが急激に変化するような場合には繰り返し最適化を行う構成が好ましい。そこで、上述した構成を有する復号化装置の第3の実施形態について以下に説明する。
図5は、第3の実施形態における復号化装置の機能構成例を示す図である。復号化装置の第3の実施形態では、フィードバック型の復号化装置を示している。なお、上述した復号化装置と同様の機能を有する部分については同一の符号を付するものとし、ここでの具体的な説明は省略する。
図5に示す復号化装置71は、復号化手段31と、雑音検出手段62と、比較手段63と、ラッチ64,72,73と、積算手段65と、雑音生成手段66と、重畳手段67と、最適化手段74とを有するよう構成されている。
ここで、上述した第2の実施形態における復号化装置と第3の実施形態における復号化装置との違いは、各ブロックの接続の仕方である。第3の実施形態における復号化装置71では、雑音を重畳した結果の雑音パラメータが、入力された雑音パラメータをできる限り近似するようにフィードバック制御による最適化が行われ、最適化の結果が出力信号として出力される。具体的には、図5に示すように最適化手段74とラッチ64とを用い、以下のように動作を行う。
復号化装置71は、例えば復号化手段31で復号化された信号を適当な領域(例えば、映像信号における所定のフレーム単位やブロック単位等)で区分し(以下、「最適化区間」という)、ラッチ64、積算手段65、雑音生成手段66、重畳手段67、雑音検出手段62、及び比較手段63からなるループを1回以上動作させることで、最適化区間内の信号について、よりよい結果となるように、出力すべき信号を最適化する。なお、上述したループは、主な構成として、例えば雑音生成手段66、重畳手段67、雑音検出手段62、及び比較手段63における各処理を含むループであればよい。また、第3の実施形態では、例えば上述したループの繰り返し処理を並列処理化し、複数回の試行を纏めて処理させてもよい。
また、第3の実施形態におけるラッチ72,73の位置は、図5の位置に限定されるものではなく、フィードバックするためのループの回数に応じて適所に適宜設定することができる。また、各ラッチ64,72,73は、それぞれがメモリを有し、入力データを一時的に記憶する手段として機能する。ここで、ラッチ64,72,73の初期値は任意であるが、例えば値を0とすることが好ましい。また、ラッチ64が値0を出力しているとき、雑音生成手段66は無雑音(例えば、値0のみからなる雑音系列等)を出力する。ラッチ64は、トリガ信号が所定の信号レベル又は信号波形となった場合に、雑音差分情報を一時的に保持する。
更に、第3の実施形態では、例えば最適化の完了を知らせるために、最適化手段74から最適化完了信号を出力させる。例えば、トリガ信号は、2値の論理値とし、その値が例えば「真」又は「偽」となった場合、又は立ち上がりエッジ又は立ち下がりエッジの何れかにおいて、ラッチ64が雑音差分情報を一時的に保持する。
最適化手段74は、最適化処理における内部状態及び比較手段63からの雑音差分情報との何れか、又は両方に応じて、最適化完了信号及びラッチ64へのトリガ信号を出力する。なお、上述した内部状態とは、例えば繰り返しの回数や雑音差分情報の履歴等である。
つまり、最適化手段74は、ラッチ72にトリガ信号を出力して復号化手段31からの復号化信号の出力タイミングを制御し、重畳手段67により所望する重畳処理を行わせる。また、最適化手段74は、出力結果の良否や最適化の完了を判定しつつ、上述したループの制御を行う。また、最適化手段74は、最適化が完了した場合には、ラッチ73に最適化完了信号を出力し、重畳手段67からの出力をラッチ73にラッチさせて出力信号を出力する。
ここで、上述した最適化完了信号は、例えば「完了」と「未完了」の2状態等を用いることができる。最適化手段74は、所定のタイミング(例えば、一定のクロック間隔等)により、上述した処理を繰り返す。
また、最適化手段74は、各処理において、内部状態と雑音差分情報の何れか一方又は両方が所定の条件(以下、「最適化完了条件」という)を満たしたとき、例えば、トリガ信号の出力を一旦停止しつつ最適化完了信号を「完了」状態とする。また、最適化手段74は、各処理において、最適化完了条件を満たさないとき、例えば最適化完了信号を「未完了」状態としつつ、トリガ信号を出力する。ここで、最適化完了条件は、例えば上述したループの繰り返しの回数(言い換えれば、比較手段63による比較回数等)が所定の回数(例えば、10回等)を満たしたときに条件成立とすることができる(これを「条件A」とする)。
また、最適化完了条件は、例えば雑音差分情報が所定の条件(例えば、所定の閾値未満となった場合等)を満たしたときに条件成立とすることができる(これを「条件B」とする)。
なお、上述した雑音差分情報に対する所定の条件とは、例えば雑音パラメータが分散値で表される場合には、雑音差分情報である分散値の差分の絶対値が、あるスカラー値(例えば、1)未満となったか否かを条件とすることができる。また、雑音パラメータがスペクトル等の波形により表わされる場合には、その波形のノルム(例えば、H∞ノルム)が、あるスカラー値(例えば、1)未満となったか否かを条件にすることができる。
更に、最適化完了条件は、例えば雑音差分情報の履歴が所定の条件(例えば、今回の処理における雑音差分情報の値が、前回の処理における雑音差分情報の値よりも小さくなくなった場合等)を満たしたときに条件成立とすることができる(これを「条件C」とする)。
また、第3の実施形態では、上述した条件A、条件B、条件Cの何れかを満たした場合に最適化完了条件の条件成立としてもよく、条件A、条件B、条件Cのうち、二つ以上の論理演算により最適化完了条件を定義してもよい。
上述した最適化手段74における最適化処理は、例えば最適化区間毎に最適化完了条件を満たすまで繰り返される。ここで、第3の実施形態において、復号化装置71から出力される出力信号は、例えばラッチ73等に最適化完了信号が「真」となったタイミングで記憶させることで、最適化の完了した出力信号のみを並べた復号結果の信号を出力することができる。なお、上述した復号化装置の各実施形態は、適宜組み合わせて適用することができる。
また、本発明では、上述した復号化装置12,61,71が有する各手段として機能させるためにコンピュータを好適に用いることができる。このようなコンピュータは、復号化装置12,61,71が有する各手段による各機能を実現する処理内容を記述したプログラム(復号化プログラム)を、当該コンピュータの記憶部等に格納しておき、当該コンピュータが有するCPU(中央演算処理装置)によって読み出して実行させることで実現することができる。
上述したように本発明によれば、復号後の信号を符号化前の信号に近似させることができる。具体的には、本発明によれば、復号化装置は、復号化手段により得た復号化信号に含まれる雑音(符号化信号により特性が変化する雑音も含む)と、符号化装置に入力された信号に含まれていた元々の雑音との間の差異を補償する雑音を、雑音生成手段に重畳して出力信号として出力するため、出力信号と入力信号間の雑音の特性を揃えることができる。その結果、出力信号と入力信号との間の知覚上の品質(例えば、音声信号における聴感や、画像符号化・映像符号化における主観画質)をより近似させることができる。
また、本発明によれば、雑音検出手段は、信号波形の不規則な上下のみを選択的に抽出することができ、音声や映像等の構造(例えば、被写体の像の輝度パターン等)に起因する有意な波形とはみなし難い信号を雑音として抽出することができる。これにより、復号化装置は、有意ではない信号成分を雑音とみなして、適切な雑音パラメータを出力することができる。
また、本発明によれば、復号化装置は、平滑化という平易な演算によって雑音パラメータを得ることができるため、符号化装置の規模や演算コストを削減することができる。
また、本発明によれば、復号化装置は、復号化処理による復号化信号における雑音成分の不足分をフィードフォワード的に補償することができ、少ないハードウェア規模及び演算量で雑音の補償を実現できる。したがって、特に雑音が加法性を有するときには好適な構成である。また、本発明によれば、復号化装置は、復号化処理による復号結果に雑音を重畳した結果得られる信号に含まれる雑音の量(雑音パラメータ)が、所望の雑音パラメータを近似するようフィードバック的な繰り返し最適化が行われる。これにより、復号化装置は、雑音が加法性を満たすか満たさないかの如何に関わらず、適切な雑音の補償が実現できる。
以上本発明の好ましい実施形態について詳述したが、本発明は係る特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形、変更が可能である。