JP4095348B2 - Noise reduction system and program - Google Patents
Noise reduction system and program Download PDFInfo
- Publication number
- JP4095348B2 JP4095348B2 JP2002159676A JP2002159676A JP4095348B2 JP 4095348 B2 JP4095348 B2 JP 4095348B2 JP 2002159676 A JP2002159676 A JP 2002159676A JP 2002159676 A JP2002159676 A JP 2002159676A JP 4095348 B2 JP4095348 B2 JP 4095348B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- noise
- variance
- estimated
- spectrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
【0001】
【発明の属する技術分野】
本発明は、音声信号等の原信号に雑音が重畳された観測信号から雑音成分を取り除く雑音除去システムおよびプログラムに関し、特にMUSIC(Multiple Signal Classification)法を用いた雑音除去システムおよびプログラムに関する。
【0002】
【従来の技術】
従来より、音声信号に含まれる雑音の除去方法として、MUSIC法が知られている(M. Kaveh and A. J. Barabell,“The statistical performance of the MUSIC and the minimum-norm algorithms in resolving plane waves in noise", IEEE Trans. ASSP-34, 331-341, 1986)。MUSIC法は部分空間法の一つで、音声信号等の原信号に雑音が重畳された観測信号の自己相関行列に固有値分解を適用し、観測信号を、原信号の情報を持つ“信号部分空間”と、雑音情報を持つ“雑音部分空間”とに分解し、得られた雑音部分空間を用いて原信号の情報を推定するものである。このMUSIC法により推定された信号情報を用いると、最尤法や一般化逆行列計算により観測信号に含まれる雑音成分を効果的に除去することができる。
【0003】
【発明が解決しようとする課題】
しかしながら、従来のMUSIC法による雑音除去方法では、▲1▼自己相関行列の固有値分解の計算が複雑で、計算量が非常に多い、▲2▼最尤法や一般化逆行列計算は行列の乗数や逆行列計算を含むので計算量が非常に多い、などの理由により多大な計算時間を必要とする。このため、リアルタイムでの処理が困難であるという問題がある。
【0004】
本発明は、このような点に鑑みなされたもので、計算量を削減することができ、リアルタイムでの雑音除去処理が可能な雑音除去システムおよびプログラムを提供することを目的とする。
【0005】
【課題を解決するための手段】
本発明に係る雑音除去システムは、原信号に雑音信号が重畳された観測信号を入力し、この観測信号を所定長さのフレーム毎に切り出すフレーム切出し部と、前記切り出されたフレーム毎に離散的フーリエ変換を施し、前記フレームの振幅スペクトルと位相スペクトルとを抽出する離散的フーリエ変換部と、前記観測信号から前記雑音信号の分散を推定する雑音分散推定部と、前記推定された雑音信号の分散に基づいて前記観測信号の信号部分空間の次元を決定する信号部分空間の次元決定部と、前記抽出されたフレームの振幅スペクトルから前記決定された次元の振幅スペクトルを抽出し、この抽出された振幅スペクトルと前記推定された雑音信号の分散とから前記原信号の振幅スペクトルを推定し、更に前記原信号の振幅スペクトルの推定値と前記フレームの位相スペクトルとから前記原信号のスペクトルを推定し、前記推定された原信号のスペクトルを逆フーリエ変換して原信号を復元することにより前記原信号に重畳された雑音信号を除去する雑音除去部と、前記雑音信号が除去された各フレームを接続して復元信号を得るフレーム接続部とを備えたものであることを特徴とする。
【0006】
本発明に係る雑音除去プログラムは、原信号に雑音信号が重畳された観測信号を入力し、この観測信号を所定長さのフレーム毎に切り出すステップと、前記切り出されたフレーム毎に離散的フーリエ変換を施し、前記フレームの振幅スペクトルと位相スペクトルとを抽出するステップと、前記観測信号から前記雑音信号の分散を推定するステップと、前記推定された雑音信号の分散に基づいて前記観測信号の信号部分空間の次元を決定するステップと、前記抽出されたフレームの振幅スペクトルから前記決定された次元の振幅スペクトルを抽出し、この抽出された振幅スペクトルと前記推定された雑音信号の分散とから前記原信号の振幅スペクトルを推定し、更に前記原信号の振幅スペクトルの推定値と前記フレームの位相スペクトルとから前記原信号のスペクトルを推定し、前記推定された原信号のスペクトルを逆フーリエ変換して原信号を復元することにより前記原信号に重畳された雑音信号を除去するステップと、前記雑音信号が除去された各フレームを接続して復元信号を得るステップとをコンピュータに実行させるように構成されたものである。
【0007】
本発明によれば、MUSIC法によって推定された信号情報を利用した雑音除去方法として、自己相関行列の固有値と固有ベクトルを求めるための行列演算を行わず、観測信号の自己相関行列の特徴に注目して観測信号に対する離散的フーリエ変換を用いて自己相関行列の固有値および固有ベクトルを求めるようにしているので、リアルタイムでの信号除去処理が可能になる。しかも、MUSIC法をベースとした雑音除去がなされるので、雑音除去能力も極めて高い。
【0008】
【発明の実施の形態】
以下、図面を参照しながら、本発明の一実施形態を詳細に説明する。
図1は、本実施形態に係る音声信号の雑音除去システムの構成を示す図である。
この情報検索支援システムは、音声信号等の原信号xに雑音nが重畳された観測信号yを入力し、この観測信号yを所定長さのフレーム毎に切出すフレーム切出し部1と、切出されたフレームに対して離散的フーリエ変換(DFT)を施して観測信号yの振幅スペクトルと位相スペクトルとを求めるDFT部2と、このDFT部2で求められた振幅スペクトルと位相スペクトルのうち、信号部分空間を占めるスペクトルを確定するため、信号部分空間の次元Pを決定する信号部分空間の次元決定部3と、決定された信号部分空間のスペクトルを逆DFT処理して雑音が除去されたフレームを生成するMUSIC法による雑音除去部4と、逆DFT処理されたフレームを接続して原信号xの復元信号を出力するフレーム接続部5と、雑音の分散を推定する雑音分散推定部6とを備えて構成されている。また、雑音分散推定部6は、フレーム切出し部1で切出されたフレームからフレームの分散を計算する分散計算部11と、DFT部2の出力と分散計算部11の出力から、観測信号の無音区間を検出する無音区間検出部12と、検出された無音区間の分散で雑音の分散値を更新する雑音分散更新部13とを備えている。なお、このシステムは、上述した各部の処理をステップとして含む雑音除去プログラムを、コンピュータに実行させることにより実現されるシステムであっても良い。
【0009】
次に、このように構成された雑音除去システムの動作について説明する。
図2は、本システムの動作を示すフローチャートである。
まず、マイクロホン等を介して入力された原信号の音声信号を含む観測信号yは、フレーム切出部1において、Nサンプルの長さを持つハニング窓によって1フレームずつ切り出される(S1)。切り出しに当たっては、図3(a)に示すように、前のフレーム(切り出し区間)とN/2サンプルだけ重複させて次のフレームを切り出すようにする。そして、切り出されたそれぞれのフレームに対して、DFT部2で離散的フーリエ変換により振幅スペクトルと位相スペクトルを求める(S2)。また、観測信号のフレームから雑音信号の分散を推定し(S3)、この雑音の分散に基づいて、信号部分空間の次元決定部3により信号部分空間の次元Pを決定する(S4)。そして、求めた観測信号yの信号部分空間の振幅スペクトルと位相スペクトルとに基づいてMUSIC法による雑音除去を行う(S5)。最後に、雑音除去されたフレームを図3(b)に示すように、N/2フレームずつ重ねて接続することにより、原信号xの復元信号が得られる。
【0010】
次に、DFT処理(S2)で求められる観測信号yの振幅スペクトルおよび位相スペクトルと、MUSIC法における原信号を構成する正弦波成分の周波数の推定値との関係について詳細に説明する。
【0011】
[1]観測信号yの自己相関行列と固有値分解
いま、ステップS1で切り出されたフレームの原信号を、Nサンプルの離散時間信号ベクトルxとすると、このxは、次のように表すことができる。
【0012】
【数1】
T:行列またはベクトルの転置
【0013】
原信号xがP個の正弦波成分から構成されているとすると、原信号xは、
【0014】
【数2】
【0015】
と表される。ここで、S,aは、
【0016】
【数3】
【0017】
【数4】
X(fl):xを構成する正弦波成分のうち周波数flにあたる成分の複素振幅値
【0018】
で与えられる。ここで、Sの列要素である複素指数ベクトルs(fl)は、
【0019】
【数5】
【0020】
で与えられる。一般に、原信号xを構成する正弦波成分の数Pとその周波数fl(l=0,1,…,P−1)は未知である。
いま、原信号xに雑音が付加された信号、
【0021】
【数6】
【0022】
が観測されたものとする。ここでnは平均0、分散σn 2で与えられる正規分布雑音信号であり、原信号xと雑音nとは互いに無相関である。このとき、観測信号yの自己相関関数行列Ryyは、
【0023】
【数7】
【0024】
で定義される。ここで、E[yyH]はyyHの期待値、Hは行列またはベクトルの複素共役転置を表す。また、RxxとRnnは、それぞれxとnの自己相関行列であり、
【0025】
【数8】
【0026】
【数9】
【0027】
で与えられる。また、式(8)の行列Aは、
【0028】
【数10】
【0029】
で与えられる。
【0030】
MUSIC法では、一般に、信号の自己相関行列を固有値分解することにより、信号部分空間と雑音部分空間とを求め、得られた雑音部分空間を用いて信号情報を推定する。しかし、一般に行列の固有値分解は計算が複雑で計算量が非常に多い。このため音声信号のようにサンプル数Nが比較的大きい場合には、実時間処理は不可能である。そこで、本発明では、自己相関行列の特徴に注目し、実時間処理が可能な新しい固有値分解の手法を提案する。
【0031】
いま、原信号xがP−N個の周波数成分X(φk)(k=0,1,…,N−1)で構成されており、その周波数φkがDFT(離散フーリエ変換)のように
【0032】
【数11】
【0033】
で与えられるものとする。このとき、式(3)で与えられるSの行要素は複素平面にある単位円の円周を等分する点に等間隔で配置されるので、Sの異なる行は互いに直交する。そのため、Sは、
【0034】
【数12】
【0035】
【数13】
【0036】
という性質を持つ。式(12)と式(13)とにより、Sの複素共役転置SHは、
【0037】
【数14】
【0038】
と表され、式(14)を式(8)に代入すると、
【0039】
【数15】
【0040】
が得られる。式(10)より、Aは対角行列なのでAにスカラー量NをかけたNAも対角行列である。よって、式(15)はRxxの固有値分解を表しており、Rxxの固有値をλk(k=0,1,…,N−1)、それに対応する固有ベクトルをνk(k=0,1,…,N−1)とすると、固有値λkおよび固有ベクトルνkは、次の式(16)、(17)により容易に求めることができる。
【0041】
【数16】
【0042】
【数17】
【0043】
以上のことから、自己相関行列とその固有値と固有ベクトルに関する次のような性質が得られる。
(1)自己相関行列の固有値は、信号のDFTから直接求めることができる。
(2)自己相関行列の固有ベクトルは、式(17)で与えられるので、自己相関行列からの計算によって求める必要がない。
(3)自己相関行列の固有値と固有ベクトルを計算するために、信号から自己相関行列を求める必要がない。
【0044】
更に、サンプル数Nを2の乗数に設定することにより、DFT部2としてFFT(高速フーリエ変換)を用いた固有値計算が可能となる。信号の自己相関行列から固有値と固有ベクトルとが得られると、MUSIC法によって信号を構成する正弦波成分の周波数を推定することができる。
【0045】
[2]MUSIC法による雑音除去
MUSIC法は、固有値分解に基づく部分空間法の一つで、雑音に埋もれた中から目的とする原信号を構成する正弦波成分の周波数を推定するものである。いま、雑音を含まない原信号x、雑音を含んだ観測信号yがそれぞれ式(2)と式(6)とで与えられるものとする。ここで、xを構成する正弦波成分の数はP<Nとする。このとき、xの自己相関行列Rxxは、ランクがPの非負定値エルミート行列となるので、Rxxの固有値λkは全て実数で、
【0046】
【数18】
【0047】
で与えられる。一方、式(7)と式(9)とにより、yの自己相関行列Ryyの固有値μkは、
【0048】
【数19】
【0049】
で与えられるので、μkは、
【0050】
【数20】
【0051】
となる。また、μkに対応する固有ベクトルをνk(k=0,1,…,N−1)とすると、それらは互いに直交する二組の部分空間に分けることができる。{ν0,ν1,…νp-1}は、Sと等価な信号部分空間を張り、一方{νp,νp+1,…νpN-1}は、Sと直交するザツサ部分空間を張る。yのMUSICスペクトラムは、雑音部分空間を張る固有ベクトルを用いて、
【0052】
【数21】
【0053】
で定義される。ここで、fは任意の周波数である。式(21)は、f=flのときに極を持つので、その点において鋭いピークが現れる。よって、xを構成する正弦波成分の周波数flは、MUSICスペクトラム上のP個のピーク点を検出することによって推定することができる。さらに、MUSICスペクトラムから推定された周波数(以下、式中においてはflの上に推定値であることを示す“^”を付加して表記する)を用いると、最尤法や一般化逆行列計算によってyからxを復元することができる。しかし、この方法は、行列の乗算や逆行列計算を含むので計算量が多く、実時間処理には不向きである。そこで本発明では、これらの方法によらない以下に述べる方法でxを復元する。
【0054】
上述したように、xはP(<N)個の周波数成分から構成される。一方、nは正規分布雑音なので、その成分は全周波数帯域にわたって分布している。つまり、yの周波数成分のうちfl以外の周波数における成分は雑音のみが含まれる。式(16)と式(19)とにより、xとyの周波数成分の間には、
【0055】
【数22】
【0056】
が成り立つ。ここで、X(fl)とY(fl)は、それぞれxとyのflにおける周波数成分である。よって、X(fl)の推定値は、
【0057】
【数23】
【0058】
で与えられる。式(23)は自己相関行列の固有値から導かれた式であるから、この式により求められるX(fl)の推定値は、位相に関する情報を一切持たない。そこで、人間の聴覚が位相の変化に対して敏感でないという性質を利用し、yの周波数成分から求められた位相スペクトルを、X(fl)の推定値の位相情報として用いる。yの周波数成分Y(fl)(但しflは推定値)の位相情報を、
【0059】
【数24】
【0060】
とする。ここでRe{・}とIm{・}とはそれぞれ複素数の実数部と虚数部とを表す。このとき、X(fl)の推定値は、
【0061】
【数25】
【0062】
によって復元される。よって、xの復元信号は、XMUSICのIDFT(逆離散フーリエ変換)によって、
【0063】
【数26】
【0064】
で求めることができる。
【0065】
次に、MUSICスペクトラムの持つ意味について考える。式(16)と式(20)より、信号部分空間に相当する固有値は、yの周波数成分のうちパワーの大きいP個の成分と対応する。同様にして、雑音部分空間に相当する固有値は、yの周波数成分のうちパワーの小さいN−P個の成分と対応している。さらに、固有ベクトルνkは、式(17)よりyを構成する正弦波成分に相当する複素指数ベクトルs(φk)で与えられる。一方、任意の周波数fにおける複素指数ベクトルs(f)は、その周波数が式(11)で与えられるときにのみ、その要素がすべて複素平面の単位円を等分する点に等間隔で配置される。よって、式(21)で表されるMUSICスペクトラムの分母は、以下のように与えられる。
【0066】
【数27】
【0067】
【数28】
【0068】
【数29】
【0069】
これらのことから、式(21)で表されるMUSICスペクトラムは、観測信号yの周波数成分のうちパワーの大きいP個の周波数成分における周波数のみに極を持つ。このことは、観測信号yのMUSICスペクトラムに現れるP個のピーク点から周波数を推定することが、観測信号yの周波数成分のうちパワーの大きいP個の成分における周波数を検出することに他ならないことを意味する。よって、MUSICスペクトラムを計算しなくても、観測信号yの振幅スペクトルから直接、MUSIC法によって推定されるものと同じ周波数を推定することができる。
【0070】
図4は、MUSIC法による雑音除去の処理(S5)の詳細を示すフローチャートであり、その左には、各処理で得られる信号又は信号のスペクトルを示している。まず、観測信号y(離散時間信号)から、DFT部2で振幅スペクトルおよび位相スペクトルが求められたら、振幅スペクトルのうち、パワーの大きいP個の成分が抽出される(S11)。次に、原信号の振幅スペクトルが求められ(S12)、この振幅スペクトルに観測信号yの位相スペクトルが付加されて位相情報が復元される(S13)。そして、これを逆DFTすることにより,フレームの復元信号が得られる(S14)。
【0071】
なお、以上では、xを構成する正弦波成分の数、つまり信号部分空間の次元Pが既知であるものとして説明した。しかし、一般にはPは未知である。そこでRyyの固有値μkの分布とnの分散σn 2を用いてPを推定する方法について説明する。
【0072】
Ryyの固有値μkは、式(20)のように分布する。実際には、サンプル数Nが有限長であるために、{μP,μP+1,…,μN-1}は一定値σn 2にならず、σn 2を平均値として、ある程度の範囲に散らばって分布するが、それでも{μ0,μ1,…,μP-1}と比較すると、それは十分σn 2とみなすことができる範囲で分布している。そこで、本発明では、σn 2をしきい値として用い、σn 2よりも大きいRyyの固有値の数をPとしている。信号部分空間の次元決定部3は、雑音分散推定部6で求められた分散σn 2の推定値よりも大きいピークを持つ成分の数を信号部分空間の次元Pとして決定する。
【0073】
しかし、観測信号には、xとnの両方が含まれているため、σn 2を推定することは現実的には困難である。そこで、人間の発する音声は文章間に無音区間を含み、また、雑音の分散は、時間変化に対して緩やかに変化すると仮定すると、音声区間に含まれる雑音の分散は、直前の無音区間から推定することができる。観測信号yから音声区間と無音区間を検出するため、次の式(30)を定義する。
【0074】
【数30】
【0075】
ここで、σn 2の上に“^”を付した値は、σn 2の推定値である。Ryyの固有値μkは、式(20)で与えられるので、DVADは無音区間では0、音声区間ではそれよりも大きな値を示す。DVAD≦0の場合、σn 2の推定値をその区間の信号の分散によって更新することにより、時間変化に対して緩やかに特性が変化する雑音に対しても雑音除去や部分空間の次元の決定が効果的に行われる。本システムでは、分散計算部11が観測信号yの分散を計算し、無音区間検出部12が、上記式(30)に基づいて無音区間を検出する。そして、雑音分散更新部13は、無音区間での分散を雑音信号の分散であるとして、分散の更新に使用する。なお、本実施形態では、マイクロホンから入力される観測信号yは必ず無音区間から始まると仮定して、観測信号の最初のフレームの分散をσn 2の推定値の初期値として用いるようにしている。
【0076】
なお、以上では、原信号が音声信号である例について説明したが、原信号が心電図における心拍信号である場合や脳波信号である場合にも、それらに重畳された雑音を除去するのに極めて有用である。
【0077】
【発明の効果】
以上述べたように本発明によれば、MUSIC法によって推定された信号情報を利用した雑音除去方法として、自己相関行列の固有値と固有ベクトルを求めるための行列演算を行わず、観測信号に対する離散的フーリエ変換を用いて自己相関行列の固有値および固有ベクトルを求めるようにしているので、精度の良い雑音除去をリアルタイムで行うことが可能になるという効果を奏する。
【図面の簡単な説明】
【図1】 本発明の一実施形態に係る雑音除去システムの構成を示すブロック図である。
【図2】 同システムの動作を示すフローチャートである。
【図3】 同システムにおけるフレーム切出しとフレーム接続を説明するための図である。
【図4】 同システムにおける雑音除去処理の詳細を示すフローチャートである。
【符号の説明】
1…フレーム切出し部
2…DFT(離散フーリエ変換)部
3…信号部分空間の次元決定部
4…MUSIC法による雑音除去部
5…フレーム接続部
6…雑音分散推定部
11…分散計算部
12…無音区間検出部
13…雑音分散更新部[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a noise removal system and program for removing a noise component from an observation signal in which noise is superimposed on an original signal such as an audio signal, and more particularly to a noise removal system and program using a MUSIC (Multiple Signal Classification) method.
[0002]
[Prior art]
Conventionally, the MUSIC method is known as a method for removing noise contained in an audio signal (M. Kaveh and AJ Barabell, “The statistical performance of the MUSIC and the minimum-norm algorithms in resolving plane waves in noise”, IEEE Trans. ASSP-34, 331-341, 1986). The MUSIC method is one of the subspace methods. By applying eigenvalue decomposition to the autocorrelation matrix of the observed signal in which noise is superimposed on the original signal such as a speech signal, the observed signal is converted into a “signal subspace having information of the original signal ”And“ noise subspace ”having noise information, and the information of the original signal is estimated using the obtained noise subspace. When signal information estimated by the MUSIC method is used, a noise component included in the observation signal can be effectively removed by a maximum likelihood method or a generalized inverse matrix calculation.
[0003]
[Problems to be solved by the invention]
However, in the conventional noise removal method using the MUSIC method, (1) the calculation of eigenvalue decomposition of the autocorrelation matrix is complicated and the calculation amount is very large. (2) The maximum likelihood method and the generalized inverse matrix calculation are matrix multipliers. And a large amount of calculation time is required because the calculation amount is very large. For this reason, there is a problem that processing in real time is difficult.
[0004]
The present invention has been made in view of these points, and an object of the present invention is to provide a noise removal system and program that can reduce the amount of calculation and can perform noise removal processing in real time.
[0005]
[Means for Solving the Problems]
The noise removal system according to the present invention inputs an observation signal in which a noise signal is superimposed on an original signal, and extracts a frame cutout unit for each frame of a predetermined length. A discrete Fourier transform unit that performs Fourier transform and extracts an amplitude spectrum and a phase spectrum of the frame; a noise variance estimation unit that estimates a variance of the noise signal from the observation signal; and a variance of the estimated noise signal A signal subspace dimension determining unit for determining a dimension of the signal subspace of the observation signal based on the extracted amplitude spectrum of the determined dimension from the amplitude spectrum of the extracted frame, and the extracted amplitude The amplitude spectrum of the original signal is estimated from the spectrum and the estimated variance of the noise signal, and the amplitude spectrum of the original signal is estimated. The spectrum of the original signal is estimated from the value and the phase spectrum of the frame, and the noise signal superimposed on the original signal is removed by performing an inverse Fourier transform on the estimated spectrum of the original signal to restore the original signal. And a frame connecting unit that connects each frame from which the noise signal has been removed to obtain a restored signal.
[0006]
The noise removal program according to the present invention inputs an observation signal in which a noise signal is superimposed on an original signal, cuts out the observation signal for each frame of a predetermined length, and discrete Fourier transform for each of the cut out frames. And extracting the amplitude spectrum and phase spectrum of the frame, estimating the variance of the noise signal from the observation signal, and the signal portion of the observation signal based on the estimated variance of the noise signal Determining the dimension of the space; extracting the amplitude spectrum of the determined dimension from the amplitude spectrum of the extracted frame; and determining the original signal from the extracted amplitude spectrum and the variance of the estimated noise signal. From the estimated amplitude spectrum of the original signal and the phase spectrum of the frame. Estimating the spectrum of the original signal, and performing inverse Fourier transform on the estimated spectrum of the original signal to restore the original signal, thereby removing the noise signal superimposed on the original signal; and removing the noise signal And connecting the frames thus obtained to obtain a restoration signal.
[0007]
According to the present invention, as a noise removal method using signal information estimated by the MUSIC method, the matrix calculation for obtaining the eigenvalues and eigenvectors of the autocorrelation matrix is not performed, and the feature of the autocorrelation matrix of the observation signal is focused. Thus, the eigenvalues and eigenvectors of the autocorrelation matrix are obtained using the discrete Fourier transform on the observed signal, so that signal removal processing in real time becomes possible. Moreover, since noise removal based on the MUSIC method is performed, the noise removal capability is extremely high.
[0008]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, an embodiment of the present invention will be described in detail with reference to the drawings.
FIG. 1 is a diagram showing a configuration of a sound signal noise removal system according to the present embodiment.
This information retrieval support system receives an observation signal y in which noise n is superimposed on an original signal x such as a speech signal, and extracts a frame cutout unit 1 that cuts out the observation signal y for each frame of a predetermined length. A
[0009]
Next, the operation of the noise removal system configured as described above will be described.
FIG. 2 is a flowchart showing the operation of the present system.
First, an observation signal y including an original audio signal input via a microphone or the like is cut out frame by frame by a Hanning window having a length of N samples in the frame cutout unit 1 (S1). In the cutout, as shown in FIG. 3A, the next frame is cut out by overlapping the previous frame (cutout section) by N / 2 samples. Then, an amplitude spectrum and a phase spectrum are obtained by discrete Fourier transform in the
[0010]
Next, the relationship between the amplitude spectrum and phase spectrum of the observation signal y obtained in the DFT process (S2) and the estimated value of the frequency of the sine wave component constituting the original signal in the MUSIC method will be described in detail.
[0011]
[1] Autocorrelation matrix and eigenvalue decomposition of observed signal y If the original signal of the frame extracted in step S1 is an N-sample discrete-time signal vector x, this x is as follows: Can be represented.
[0012]
[Expression 1]
T: Matrix or vector transpose
If the original signal x is composed of P sine wave components, the original signal x is
[0014]
[Expression 2]
[0015]
It is expressed. Here, S and a are
[0016]
[Equation 3]
[0017]
[Expression 4]
X (f 1 ): Complex amplitude value of the component corresponding to the frequency f 1 among the sine wave components constituting x
Given in. Here, the complex exponential vector s (f l ), which is a column element of S, is
[0019]
[Equation 5]
[0020]
Given in. In general, the number P of sine wave components constituting the original signal x and its frequency fl (l = 0, 1,..., P-1) are unknown.
Now, a signal with noise added to the original signal x,
[0021]
[Formula 6]
[0022]
Is observed. Here, n is a normally distributed noise signal given by mean 0 and variance σ n 2 , and the original signal x and noise n are uncorrelated with each other. At this time, the autocorrelation function matrix R yy of the observed signal y is
[0023]
[Expression 7]
[0024]
Defined by Here, E [yy H ] represents an expected value of yy H , and H represents a complex conjugate transpose of a matrix or a vector. R xx and R nn are autocorrelation matrices of x and n, respectively.
[0025]
[Equation 8]
[0026]
[Equation 9]
[0027]
Given in. Also, the matrix A in equation (8) is
[0028]
[Expression 10]
[0029]
Given in.
[0030]
In the MUSIC method, generally, a signal subspace and a noise subspace are obtained by eigenvalue decomposition of an autocorrelation matrix of a signal, and signal information is estimated using the obtained noise subspace. However, in general, the eigenvalue decomposition of a matrix is complicated and has a large amount of calculation. For this reason, when the number of samples N is relatively large like an audio signal, real-time processing is impossible. Therefore, the present invention proposes a new eigenvalue decomposition technique capable of real-time processing by paying attention to the characteristics of the autocorrelation matrix.
[0031]
Now, the original signal x is composed of PN frequency components X (φ k ) (k = 0, 1,..., N−1), and the frequency φ k is like DFT (discrete Fourier transform). [0032]
[Expression 11]
[0033]
It shall be given by At this time, the row elements of S given by the expression (3) are arranged at equal intervals at the points that equally divide the circumference of the unit circle in the complex plane, so that the rows with different S are orthogonal to each other. So S is
[0034]
[Expression 12]
[0035]
[Formula 13]
[0036]
It has the nature of From Equation (12) and Equation (13), the complex conjugate transpose S H of S is
[0037]
[Expression 14]
[0038]
And substituting equation (14) into equation (8),
[0039]
[Expression 15]
[0040]
Is obtained. From equation (10), since A is a diagonal matrix, NA obtained by multiplying A by a scalar quantity N is also a diagonal matrix. Thus, equation (15) represents the eigenvalue decomposition of R xx, the eigenvalues of R xx λ k (k = 0,1 , ..., N-1), the eigenvector corresponding thereto ν k (k = 0, 1,..., N−1), the eigenvalue λ k and the eigenvector ν k can be easily obtained by the following equations (16) and (17).
[0041]
[Expression 16]
[0042]
[Expression 17]
[0043]
From the above, the following properties regarding the autocorrelation matrix, its eigenvalues and eigenvectors can be obtained.
(1) The eigenvalue of the autocorrelation matrix can be obtained directly from the DFT of the signal.
(2) Since the eigenvector of the autocorrelation matrix is given by Expression (17), it is not necessary to obtain it by calculation from the autocorrelation matrix.
(3) In order to calculate the eigenvalue and eigenvector of the autocorrelation matrix, it is not necessary to obtain the autocorrelation matrix from the signal.
[0044]
Furthermore, by setting the number of samples N to a multiplier of 2, eigenvalue calculation using FFT (Fast Fourier Transform) as the
[0045]
[2] Noise removal by the MUSIC method The MUSIC method is one of subspace methods based on eigenvalue decomposition, and estimates the frequency of a sine wave component that constitutes a target original signal from within a noise. Now, it is assumed that the original signal x not including noise and the observation signal y including noise are given by Equation (2) and Equation (6), respectively. Here, the number of sine wave components constituting x is P <N. At this time, since the autocorrelation matrix R xx of x is a non-negative definite Hermitian matrix of rank P, all eigenvalues λ k of R xx are real numbers,
[0046]
[Formula 18]
[0047]
Given in. On the other hand, from the equations (7) and (9), the eigenvalue μ k of the autocorrelation matrix R yy of y is
[0048]
[Equation 19]
[0049]
Μ k is given by
[0050]
[Expression 20]
[0051]
It becomes. If the eigenvector corresponding to μ k is ν k (k = 0, 1,..., N−1), they can be divided into two sets of subspaces orthogonal to each other. {Ν 0 , ν 1 ,... Ν p-1 } spans a signal subspace equivalent to S, while {ν p , ν p + 1 ,. Hang. The MUSIC spectrum of y uses the eigenvector that spans the noise subspace,
[0052]
[Expression 21]
[0053]
Defined by Here, f is an arbitrary frequency. Equation (21) does have a very when f = f l, sharp peaks appear at that point. Therefore, the frequency f l of the sinusoidal components constituting the x can be estimated by detecting the P-number of peak points on MUSIC spectrum. Further, when a frequency estimated from the MUSIC spectrum (hereinafter, expressed by adding “^” indicating an estimated value to f 1 in the equation), the maximum likelihood method or the generalized inverse matrix is used. X can be restored from y by calculation. However, since this method includes matrix multiplication and inverse matrix calculation, the amount of calculation is large and is not suitable for real-time processing. Therefore, in the present invention, x is restored by the method described below that does not depend on these methods.
[0054]
As described above, x is composed of P (<N) frequency components. On the other hand, since n is normally distributed noise, its components are distributed over the entire frequency band. That is, only the noise is included in the frequency components other than f l among the frequency components of y. According to Equation (16) and Equation (19), between the frequency components of x and y,
[0055]
[Expression 22]
[0056]
Holds. Here, X ( fl ) and Y ( fl ) are frequency components in fl of x and y, respectively. Therefore, the estimated value of X (f l ) is
[0057]
[Expression 23]
[0058]
Given in. Since the equation (23) is an equation derived from the eigenvalues of the autocorrelation matrix, the estimated value of X (f 1 ) obtained by this equation has no information regarding the phase. Therefore, the phase spectrum obtained from the frequency component of y is used as the phase information of the estimated value of X (f 1 ) by utilizing the property that human hearing is not sensitive to phase changes. The phase information of the frequency component Y (f l ) of y (where f l is an estimated value)
[0059]
[Expression 24]
[0060]
And Here, Re {•} and Im {•} represent a real part and an imaginary part of a complex number, respectively. At this time, the estimated value of X (f l ) is
[0061]
[Expression 25]
[0062]
Restored by. Therefore, the restored signal of x is obtained by X MUSIC IDFT (Inverse Discrete Fourier Transform).
[0063]
[Equation 26]
[0064]
Can be obtained.
[0065]
Next, the meaning of the MUSIC spectrum will be considered. From Equation (16) and Equation (20), the eigenvalue corresponding to the signal subspace corresponds to P components with high power among the frequency components of y. Similarly, the eigenvalue corresponding to the noise subspace corresponds to NP components with low power among the frequency components of y. Further, the eigenvector ν k is given by a complex exponential vector s (φ k ) corresponding to the sine wave component constituting y from the equation (17). On the other hand, the complex exponential vector s (f) at an arbitrary frequency f is arranged at equal intervals so that all its elements are equally divided into unit circles of the complex plane only when the frequency is given by equation (11). The Therefore, the denominator of the MUSIC spectrum expressed by Equation (21) is given as follows.
[0066]
[Expression 27]
[0067]
[Expression 28]
[0068]
[Expression 29]
[0069]
From these facts, the MUSIC spectrum represented by the equation (21) has a pole only in the frequency of P frequency components having high power among the frequency components of the observation signal y. This means that estimating the frequency from the P peak points appearing in the MUSIC spectrum of the observation signal y is nothing but detecting the frequency of the P components having high power among the frequency components of the observation signal y. Means. Therefore, the same frequency as that estimated by the MUSIC method can be estimated directly from the amplitude spectrum of the observation signal y without calculating the MUSIC spectrum.
[0070]
FIG. 4 is a flowchart showing details of the noise removal processing (S5) by the MUSIC method, and the left side shows a signal obtained by each processing or a spectrum of the signal. First, when the amplitude spectrum and the phase spectrum are obtained from the observation signal y (discrete time signal) by the
[0071]
In the above description, it is assumed that the number of sine wave components constituting x, that is, the dimension P of the signal subspace is known. However, in general, P is unknown. Therefore, a method for estimating P using the distribution of eigenvalues μ k of R yy and the variance σ n 2 of n will be described.
[0072]
The eigenvalue μ k of R yy is distributed as shown in Expression (20). Actually, since the number of samples N is a finite length, {μ P , μ P + 1 ,..., Μ N-1 } does not become a constant value σ n 2 , and σ n 2 is an average value to some extent. However, compared with {μ 0 , μ 1 ,..., Μ P-1 }, it is distributed in a range that can be regarded as σ n 2 . Therefore, in the present invention, σ n 2 is used as a threshold value, and the number of eigenvalues of R yy larger than σ n 2 is P. The signal subspace
[0073]
However, since the observation signal includes both x and n, it is practically difficult to estimate σ n 2 . Therefore, assuming that the speech uttered by humans contains silence intervals between sentences, and the noise variance changes slowly with time, the noise variance contained in the speech interval is estimated from the previous silence interval. can do. In order to detect a voice section and a silent section from the observation signal y, the following equation (30) is defined.
[0074]
[30]
[0075]
Here, the value denoted by the "^" over the sigma n 2 is an estimate of the sigma n 2. Since the eigenvalue μ k of R yy is given by Equation (20), D VAD is 0 in the silent section and larger than that in the voice section. In the case of D VAD ≦ 0, the estimated value of σ n 2 is updated by the variance of the signal in the section, so that noise removal and subspace dimensions can be reduced even for noise whose characteristics change gradually with time. Decisions are made effectively. In this system, the
[0076]
In the above, an example in which the original signal is an audio signal has been described. However, even when the original signal is a heartbeat signal in an electrocardiogram or an electroencephalogram signal, it is extremely useful for removing noise superimposed thereon. It is.
[0077]
【The invention's effect】
As described above, according to the present invention, as a denoising method using signal information estimated by the MUSIC method, a matrix operation for obtaining eigenvalues and eigenvectors of an autocorrelation matrix is not performed, and discrete Fourier Since the eigenvalues and eigenvectors of the autocorrelation matrix are obtained using the transformation, there is an effect that it is possible to perform accurate noise removal in real time.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration of a noise removal system according to an embodiment of the present invention.
FIG. 2 is a flowchart showing the operation of the system.
FIG. 3 is a diagram for explaining frame cutout and frame connection in the system;
FIG. 4 is a flowchart showing details of noise removal processing in the system.
[Explanation of symbols]
DESCRIPTION OF SYMBOLS 1 ...
Claims (5)
前記切り出されたフレーム毎に離散的フーリエ変換を施し、前記フレームの振幅スペクトルと位相スペクトルとを抽出する離散的フーリエ変換部と、
前記観測信号から前記雑音信号の分散を推定する雑音分散推定部と、
前記推定された雑音信号の分散に基づいて前記観測信号の信号部分空間の次元を決定する信号部分空間の次元決定部と、
前記抽出されたフレームの振幅スペクトルから前記決定された次元の振幅スペクトルを抽出し、この抽出された振幅スペクトルと前記推定された雑音信号の分散とから前記原信号の振幅スペクトルを推定し、更に前記原信号の振幅スペクトルの推定値と前記フレームの位相スペクトルとから前記原信号のスペクトルを推定し、前記推定された原信号のスペクトルを逆フーリエ変換して原信号を復元することにより前記原信号に重畳された雑音信号を除去する雑音除去部と、
前記雑音信号が除去された各フレームを接続して復元信号を得るフレーム接続部と
を備えたものであることを特徴とする雑音除去システム。A frame cutout unit that inputs an observation signal in which a noise signal is superimposed on the original signal and cuts out the observation signal for each frame of a predetermined length;
A discrete Fourier transform is performed for each extracted frame, and a discrete Fourier transform unit that extracts an amplitude spectrum and a phase spectrum of the frame;
A noise variance estimator for estimating variance of the noise signal from the observed signal;
A signal subspace dimension determining unit that determines a signal subspace dimension of the observed signal based on the estimated variance of the noise signal;
An amplitude spectrum of the determined dimension is extracted from the amplitude spectrum of the extracted frame, and the amplitude spectrum of the original signal is estimated from the extracted amplitude spectrum and the estimated variance of the noise signal. The spectrum of the original signal is estimated from the estimated value of the amplitude spectrum of the original signal and the phase spectrum of the frame, and the original signal is restored by performing inverse Fourier transform on the estimated spectrum of the original signal. A noise removing unit for removing the superimposed noise signal;
A noise removal system comprising: a frame connection unit that connects each frame from which the noise signal has been removed to obtain a restored signal.
前記観測信号の分散を計算する分散計算部と、
前記観測信号の振幅スペクトルと前記推定された雑音信号の分散とから前記観測信号に前記原信号を含まない無信号区間を検出する無信号区間検出部と、
前記検出された無信号区間で前記観測信号の分散を求めて前記推定された雑音信号の分散を更新する雑音分散更新部と
を備えたものであることを特徴とする請求項1記載の雑音除去システム。The noise variance estimator is
A variance calculation unit for calculating the variance of the observed signal;
A no-signal section detector for detecting a no-signal section that does not include the original signal in the observed signal from the amplitude spectrum of the observed signal and the variance of the estimated noise signal;
The noise removal unit according to claim 1, further comprising a noise variance updating unit that obtains a variance of the observed signal in the detected no-signal section and updates the variance of the estimated noise signal. system.
前記切り出されたフレーム毎に離散的フーリエ変換を施し、前記フレームの振幅スペクトルと位相スペクトルとを抽出するステップと、
前記観測信号から前記雑音信号の分散を推定するステップと、
前記推定された雑音信号の分散に基づいて前記観測信号の信号部分空間の次元を決定するステップと、
前記抽出されたフレームの振幅スペクトルから前記決定された次元の振幅スペクトルを抽出し、この抽出された振幅スペクトルと前記推定された雑音信号の分散とから前記原信号の振幅スペクトルを推定し、更に前記原信号の振幅スペクトルの推定値と前記フレームの位相スペクトルとから前記原信号のスペクトルを推定し、前記推定された原信号のスペクトルを逆フーリエ変換して原信号を復元することにより前記原信号に重畳された雑音信号を除去するステップと、
前記雑音信号が除去された各フレームを接続して復元信号を得るステップと
をコンピュータに実行させるように構成された雑音除去プログラム。Inputting an observation signal in which a noise signal is superimposed on the original signal, and cutting this observation signal into frames of a predetermined length;
Performing discrete Fourier transform on each of the extracted frames, and extracting an amplitude spectrum and a phase spectrum of the frame;
Estimating a variance of the noise signal from the observed signal;
Determining a dimension of a signal subspace of the observed signal based on a variance of the estimated noise signal;
An amplitude spectrum of the determined dimension is extracted from the amplitude spectrum of the extracted frame, and the amplitude spectrum of the original signal is estimated from the extracted amplitude spectrum and the estimated variance of the noise signal. The spectrum of the original signal is estimated from the estimated value of the amplitude spectrum of the original signal and the phase spectrum of the frame, and the original signal is restored by performing inverse Fourier transform on the estimated spectrum of the original signal. Removing the superimposed noise signal;
A noise removal program configured to cause a computer to execute a step of obtaining a restored signal by connecting each frame from which the noise signal has been removed.
前記観測信号の分散を計算するステップと、
前記観測信号の振幅スペクトルと前記推定された雑音信号の分散とから前記観測信号に前記原信号を含まない無信号区間を検出するステップと、
前記検出された無信号区間で前記観測信号の分散を求めて前記推定された雑音信号の分散を更新するステップと
を備えたものであることを特徴とする請求項3記載の雑音除去プログラム。Estimating the variance of the noise signal comprises:
Calculating a variance of the observed signal;
Detecting a no-signal section that does not include the original signal in the observed signal from the amplitude spectrum of the observed signal and the variance of the estimated noise signal;
The noise removal program according to claim 3, further comprising a step of obtaining a variance of the observed signal in the detected no-signal section to update the variance of the estimated noise signal.
前記観測信号から求められた振幅スペクトルのうち前記雑音信号の分散の推定値よりも大きいピークを持つ振幅スペクトルの数を、前記信号部分空間の次元と決定するステップであることを特徴とする請求項3又は4記載の雑音除去プログラム。Determining the dimension of the signal subspace of the observed signal comprises:
The step of determining, as the dimension of the signal subspace, the number of amplitude spectra having peaks larger than an estimated value of variance of the noise signal among amplitude spectra obtained from the observed signal. 3. The noise removal program according to 3 or 4.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2002159676A JP4095348B2 (en) | 2002-05-31 | 2002-05-31 | Noise reduction system and program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2002159676A JP4095348B2 (en) | 2002-05-31 | 2002-05-31 | Noise reduction system and program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2004004286A JP2004004286A (en) | 2004-01-08 |
| JP4095348B2 true JP4095348B2 (en) | 2008-06-04 |
Family
ID=30429355
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2002159676A Expired - Fee Related JP4095348B2 (en) | 2002-05-31 | 2002-05-31 | Noise reduction system and program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4095348B2 (en) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN105976822A (en) * | 2016-07-12 | 2016-09-28 | 西北工业大学 | Audio signal extraction method and apparatus based on parameterization supergain beam former |
Families Citing this family (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7574008B2 (en) * | 2004-09-17 | 2009-08-11 | Microsoft Corporation | Method and apparatus for multi-sensory speech enhancement |
| JP4854533B2 (en) * | 2007-01-30 | 2012-01-18 | 富士通株式会社 | Acoustic judgment method, acoustic judgment device, and computer program |
| KR101471678B1 (en) * | 2009-03-03 | 2014-12-11 | 에릭슨 엘지 주식회사 | Apparatus and method for estimating noise power in an LTE system |
| CN103811019B (en) * | 2014-01-16 | 2016-07-06 | 浙江工业大学 | A kind of punch press noise power Power estimation improved method based on BT method |
| KR102093257B1 (en) * | 2017-10-20 | 2020-03-25 | 이명해 | Noise rejection filter in electrocardiograph and filtering method Therefor |
| CN108324271B (en) * | 2017-12-25 | 2020-12-01 | 中国科学院深圳先进技术研究院 | ECG signal identification method, system and ECG monitoring equipment |
-
2002
- 2002-05-31 JP JP2002159676A patent/JP4095348B2/en not_active Expired - Fee Related
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN105976822A (en) * | 2016-07-12 | 2016-09-28 | 西北工业大学 | Audio signal extraction method and apparatus based on parameterization supergain beam former |
| CN105976822B (en) * | 2016-07-12 | 2019-12-03 | 西北工业大学 | Audio signal extraction method and device based on parametric super-gain beamformer |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2004004286A (en) | 2004-01-08 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US8467538B2 (en) | Dereverberation apparatus, dereverberation method, dereverberation program, and recording medium | |
| US20150086038A1 (en) | Time-frequency directional processing of audio signals | |
| US10262678B2 (en) | Signal processing system, signal processing method and storage medium | |
| EP2187389B1 (en) | Sound processing device | |
| JP2002510930A (en) | Separation of unknown mixed sources using multiple decorrelation methods | |
| JP6195548B2 (en) | Signal analysis apparatus, method, and program | |
| EP3113508B1 (en) | Signal-processing device, method, and program | |
| US9576583B1 (en) | Restoring audio signals with mask and latent variables | |
| Simon et al. | A general framework for online audio source separation | |
| JP4095348B2 (en) | Noise reduction system and program | |
| CN105580074B (en) | Signal processing systems and methods | |
| JP6815956B2 (en) | Filter coefficient calculator, its method, and program | |
| JP5807914B2 (en) | Acoustic signal analyzing apparatus, method, and program | |
| JP6448567B2 (en) | Acoustic signal analyzing apparatus, acoustic signal analyzing method, and program | |
| JP2019144320A (en) | Signal analyzer, signal analyzing method and program | |
| JP7014682B2 (en) | Sound source separation evaluation device and sound source separation device | |
| JP6142402B2 (en) | Acoustic signal analyzing apparatus, method, and program | |
| JP6618493B2 (en) | Signal analysis apparatus, method, and program | |
| CN110992977B (en) | Method and device for extracting target sound source | |
| JP6581054B2 (en) | Sound source separation apparatus, sound source separation method, and sound source separation program | |
| US11676619B2 (en) | Noise spatial covariance matrix estimation apparatus, noise spatial covariance matrix estimation method, and program | |
| JP2007081455A (en) | Sound source position / sound receiving position estimation method, apparatus thereof, program thereof, and recording medium thereof | |
| CN107919136B (en) | An estimation method of digital speech sampling frequency based on Gaussian mixture model | |
| JP4219611B2 (en) | Noise removal system and noise removal method | |
| JP4249697B2 (en) | Sound source separation learning method, apparatus, program, sound source separation method, apparatus, program, recording medium |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050401 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080122 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080212 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080307 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110314 Year of fee payment: 3 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| LAPS | Cancellation because of no payment of annual fees |