Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP2982766B2 - Sound source direction estimation method and apparatus - Google Patents
[go: Go Back, main page]

JP2982766B2 - Sound source direction estimation method and apparatus - Google Patents

Sound source direction estimation method and apparatus

Info

Publication number
JP2982766B2
JP2982766B2 JP9302786A JP30278697A JP2982766B2 JP 2982766 B2 JP2982766 B2 JP 2982766B2 JP 9302786 A JP9302786 A JP 9302786A JP 30278697 A JP30278697 A JP 30278697A JP 2982766 B2 JP2982766 B2 JP 2982766B2
Authority
JP
Japan
Prior art keywords
sound source
cross
source direction
calculating
normalized power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP9302786A
Other languages
Japanese (ja)
Other versions
JPH11142499A (en
Inventor
一郎 辻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP9302786A priority Critical patent/JP2982766B2/en
Publication of JPH11142499A publication Critical patent/JPH11142499A/en
Application granted granted Critical
Publication of JP2982766B2 publication Critical patent/JP2982766B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Complex Calculations (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、音源方向推定方法
及びその装置に関し、特に、複数のマイクロホンで受音
した信号を用いて計算された相互相関関数により、音源
方向を推定する音源方向推定方法及びその装置に関す
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a sound source direction estimating method and apparatus, and more particularly, to a sound source direction estimating method for estimating a sound source direction by a cross-correlation function calculated using signals received by a plurality of microphones. And its device.

【0002】[0002]

【従来の技術】図3は「1992年7月、ザ・ジャーナ
ル・オブ・ザ・アコースティカル・ソサエティ・オブ・
ジャパン、第13巻、第4号、241−252ページ
(TheJournal of the Acoust
ical Society ofJapan,vol.
13,no.4,pp.241−252,July 1
992)」に記載された従来の音源方向推定装置(以下
第1の従来例)のブロック図である。
2. Description of the Related Art FIG. 3 shows "Journal of the Acoustic Society of July, 1992.
Japan, Vol. 13, No. 4, pp. 241-252 (The Journal of the Acoustic)
Ial Society of Japan, vol.
13, no. 4, pp. 241-252, July 1
FIG. 992) is a block diagram of a conventional sound source direction estimating apparatus (hereinafter, referred to as a first conventional example).

【0003】図3において、音源115からマイクロホ
ン101、102に入力された信号を増幅器(以下アン
プと略記する)103、104により増幅して、A/D
コンバータ105、106で離散信号に変換する。プリ
エンファシス処理部107、108で高域成分を強調し
た離散信号を用いて、自己回帰フィルタ係数を自己回帰
係数計算部109、110で求める。このフィルタ係数
と離散信号を逆フィルタ処理部111、112で畳み込
む。逆フィルタ処理部111、112の出力は白色化信
号となる。これらの白色化信号に対する相互相関関数を
相互相関関数計算部113で求め、方向検出部114で
相互相関関数の最大値を与える時間差に対応した方向を
音源方向として推定する。
[0003] In FIG. 3, signals input from microphones 101 and 102 from a sound source 115 are amplified by amplifiers (hereinafter abbreviated as amplifiers) 103 and 104 and A / D
The signals are converted into discrete signals by converters 105 and 106. Auto-regression filter coefficients are obtained by auto-regression coefficient calculation sections 109 and 110 using discrete signals in which high-frequency components are emphasized by pre-emphasis processing sections 107 and 108. The filter coefficients and the discrete signal are convolved by the inverse filter processing units 111 and 112. Outputs of the inverse filter processing units 111 and 112 are whitened signals. The cross-correlation function for these whitening signals is obtained by the cross-correlation function calculation unit 113, and the direction corresponding to the time difference giving the maximum value of the cross-correlation function is estimated by the direction detection unit 114 as the sound source direction.

【0004】図4は、「1996年9月、電子情報通信
学会技術報告、DSP96−77、SP96−52、2
3−29ページ」に記載された音源方向推定装置(以下
第2の従来例)のブロック図である。
FIG. 4 shows “September 1996, IEICE Technical Report, DSP96-77, DSP96-52, SP96-52,
It is a block diagram of a sound source direction estimating device (hereinafter, a second conventional example) described on page 3-29.

【0005】図4において、音源128からマイクロホ
ン116、117に入力された信号をアンプ118、1
19で増幅し、A/Dコンバータ120、121で離散
信号に変換する。この離散信号は、零交差時間系列生成
部122、123で信号レベルが0となる時の傾きが正
であるものを1、負であるものを−1、それ以外のもの
を0とする零交差時間系列に変換される。
In FIG. 4, signals input from a sound source 128 to microphones 116 and 117 are amplified by amplifiers 118 and 1.
The signal is amplified at 19 and converted to discrete signals by A / D converters 120 and 121. The discrete signal has a zero-crossing which is 1 when the signal level becomes 0 in the zero-crossing time series generation units 122 and 123, -1 when the signal level is negative, and 0 when the signal level is negative. Converted to time series.

【0006】相互相関関数計算部124でこれらの零交
差時間系列の相互相関関数を求め、正規化電力計算部1
25で、その電力を正規化する。時間平均計算部126
で、この正規化電力値は時間平均化され、方向検出部1
27において、その最大値を与える時間差に対応した方
向が音源方向として推定される。
The cross-correlation function calculator 124 calculates the cross-correlation function of these zero-crossing time series, and the normalized power calculator 1
At 25, the power is normalized. Time average calculator 126
Then, this normalized power value is time-averaged, and the direction detection unit 1
At 27, the direction corresponding to the time difference giving the maximum value is estimated as the sound source direction.

【0007】[0007]

【発明が解決しようとする課題】しかしながら、叙上の
従来技術には下記に示す如き欠点があった。
However, the prior art described above has the following drawbacks.

【0008】第1の問題点は、第1の従来例における相
互相関計算に要する演算精度が高く、ハードウェア規模
が大きいことである。
The first problem is that the calculation accuracy required for the cross-correlation calculation in the first conventional example is high and the hardware scale is large.

【0009】その理由は、A/Dコンバータ105、1
06により量子化された多ビット離散信号をそのまま用
いて相互相関関数を計算しているためである。
The reason is that the A / D converters 105, 1
This is because the cross-correlation function is calculated using the multi-bit discrete signal quantized according to 06 as it is.

【0010】第2の問題点は、上記第1の従来例は雑音
に弱いことである。
A second problem is that the first conventional example is susceptible to noise.

【0011】その理由は、相互相関関数計算部113で
計算された相互相関関数を、時間平均化せずに方向検出
部114で用いて音源方向推定を行っているためであ
る。
The reason is that the sound source direction estimation is performed by using the cross-correlation function calculated by the cross-correlation function calculation unit 113 by the direction detection unit 114 without time averaging.

【0012】第3の問題点は、上記第2の従来例におい
ては音源方向の推定精度が低いことである。
A third problem is that the accuracy of estimating the sound source direction is low in the second conventional example.

【0013】その理由は、零交差時間系列生成部12
2、123で生成される零交差時間系列は、入力信号の
零交差点においてだけ値を有し、等価的に入力信号サン
プルを間引いたことになるためである。すなわち、分解
能が低下する。
The reason is that the zero-crossing time series generation unit 12
This is because the zero-crossing time sequence generated in 2, 123 has a value only at the zero-crossing point of the input signal, and the input signal samples are equivalently thinned out. That is, the resolution decreases.

【0014】本発明は従来の上記実情に鑑み、従来の技
術に内在する上記諸欠点を解消するためになされたもの
であり、従って、本発明の目的は、必要とする演算精度
が低く、ハードウェア規模の小さい新規な音源方向推定
方法及びその装置を提供することにある。
SUMMARY OF THE INVENTION The present invention has been made in view of the above-mentioned conventional circumstances, and has been made to solve the above-mentioned drawbacks inherent in the conventional technology. It is an object of the present invention to provide a novel sound source direction estimating method and a device thereof having a small wear scale.

【0015】また、本発明の他の目的は、優れた耐雑音
性をもつ新規な音源方向推定方法及びその装置を提供す
ることにある。
It is another object of the present invention to provide a novel sound source direction estimating method and apparatus having excellent noise immunity.

【0016】本発明の更に他の目的は、精度の高い音源
方向推定を行うことのできる新規な音源方向推定方法及
びその装置を提供することにある。
Still another object of the present invention is to provide a novel sound source direction estimating method and apparatus capable of performing highly accurate sound source direction estimation.

【0017】[0017]

【課題を解決するための手段】上記目的を達成する為
に、本発明に係る音源方向推定装置は、第1のオーディ
オ信号を入力として、その信号レベルが正の時に
“1”、負の時に“−1”、0の時にそのまま“0”で
表される符号時間系列を生成する第1の符号時間系列生
成部(図1の7)と、第2のオーディオ信号を入力とし
て、その信号レベルが正の時に“1”、負の時に“−
1”、0の時にそのまま“0”で表される符号時間系列
を生成する第2の符号時間系列生成部(図1の8)と、
前記第1の符号時間系列生成部の出力と前記第2の符号
時間系列生成部の出力を用いて相関を計算する第1の相
互相関関数計算部(図1の9)と、前記第1の相互相関
関数計算部の出力を正規化する第1の正規化電力計算部
(図1の10)と、前記第1の正規化電力計算部の出力
を平均する第1の時間平均計算部(図1の11)と、前
記第1の時間平均計算部の出力を用いて音源方向を推定
する第1の方向検出部(図1の12)を有することを特
徴とする。
In order to achieve the above object, a sound source direction estimating apparatus according to the present invention receives a first audio signal as an input and outputs "1" when the signal level is positive and when the signal level is negative, A first code time sequence generation unit (7 in FIG. 1) for generating a code time sequence directly represented by “0” when “−1” or 0, and a signal level of the second audio signal as an input. Is "1" when is positive and "-" when it is negative.
A second code time sequence generation unit (8 in FIG. 1) that generates a code time sequence directly represented by “0” when the value is “1” or “0”;
A first cross-correlation function calculator (9 in FIG. 1) for calculating a correlation using an output of the first code time sequence generator and an output of the second code time sequence generator; A first normalized power calculator (10 in FIG. 1) that normalizes the output of the cross-correlation function calculator, and a first time average calculator (10 in FIG. 1) that averages the output of the first normalized power calculator. 1) and a first direction detection unit (12 in FIG. 1) for estimating the sound source direction using the output of the first time average calculation unit.

【0018】[0018]

【作用】本発明では、入力信号を白色化してから、“+
1”、“−1”または“0”の3値で表される符号時間
系列に変換する。このために、必要な演算精度が低下
し、ハードウェア規模を削減することができる。
According to the present invention, after the input signal is whitened, "+
It is converted into a code time sequence represented by a ternary value of “1”, “−1”, or “0.” For this reason, necessary calculation accuracy is reduced and the hardware scale can be reduced.

【0019】また、本発明では、相互相関関数の正規化
電力値を時間平均して音源の方向推定を行う。このため
に、雑音の影響で方向推定を誤ることがない。
In the present invention, the direction of the sound source is estimated by time-averaging the normalized power value of the cross-correlation function. For this reason, the direction estimation is not mistaken due to the influence of noise.

【0020】さらに、本発明では、零交差時間系列では
なく、符号時間系列を用いて方向推定を行う。このため
に、入力信号と同数の信号サンプルを利用することがで
き、間引きによる推定精度の劣化がない。
Further, in the present invention, direction estimation is performed using a code time sequence instead of a zero crossing time sequence. Therefore, the same number of signal samples as the input signal can be used, and there is no deterioration in estimation accuracy due to thinning.

【0021】[0021]

【発明の実施の形態】次に、本発明をその好ましい各実
施の形態について図面を参照しながら詳細に説明する。
Next, preferred embodiments of the present invention will be described in detail with reference to the drawings.

【0022】[構成の説明]図1は、本発明による第1
の実施の形態を示すブロック構成図である。
[Description of Configuration] FIG. 1 shows a first embodiment of the present invention.
FIG. 2 is a block diagram showing an embodiment.

【0023】図1を参照するに、マイクロホン1、2に
おいて方向推定すべき音源13から到来する信号X
0 (t)、Y0 (t)を入力信号として獲得する。これ
らの入力信号は、それぞれ増幅器(以下アンプと略記す
る)3、4により増幅され、A/Dコンバータ5、6に
より量子化されて離散信号に変換される。この離散信号
は、信号レベルが正の時に“1”、負の時に“−1”、
0の時にそのまま“0”で表される符号時間系列に、符
号時間系列生成部7、8で変換される。これらの符号時
間系列を用いて、相互相関関数を相互相関関数計算部9
で求める。
Referring to FIG. 1, a signal X arriving from a sound source 13 whose direction is to be estimated in microphones 1 and 2 is shown.
0 (t) and Y 0 (t) are obtained as input signals. These input signals are amplified by amplifiers (hereinafter abbreviated as amplifiers) 3 and 4, respectively, quantized by A / D converters 5 and 6, and converted into discrete signals. This discrete signal is “1” when the signal level is positive, “−1” when the signal level is negative,
When it is 0, it is converted by the code time sequence generation units 7 and 8 into a code time sequence represented as “0” as it is. Using these code time sequences, a cross-correlation function is calculated by a cross-correlation function calculator 9.
Ask for.

【0024】相互相関関数計算部9により求められた相
互相関関数は、正規化電力計算部10で正規化された電
力値に変換され、正規化電力の時間平均計算部11で時
間平均化される。方向検出部12では、時間平均化され
た正規化電力の最大値を与える時間差に対応した方向
が、音源方向として推定される。
The cross-correlation function obtained by the cross-correlation function calculator 9 is converted into a power value normalized by the normalized power calculator 10 and time-averaged by the time average calculator 11 of the normalized power. . In the direction detection unit 12, the direction corresponding to the time difference that gives the maximum value of the time-averaged normalized power is estimated as the sound source direction.

【0025】[動作の説明]次に、本発明の動作につい
て、図1を参照して説明する。
[Description of Operation] Next, the operation of the present invention will be described with reference to FIG.

【0026】図1において、音源13からマイクロホン
1に入力される信号をX0 (t)、音源13からマイク
ロホン2に入力される信号をY0 (t)とする。入力信
号X0 (t)は、アンプ3で増幅され、A/Dコンバー
タ5で量子化され、離散信号X1 (n)に変換される。
入力信号Y0 (t)は、アンプ4で増幅され、A/Dコ
ンバータ6で量子化され、離散信号Y1 (n)に変換さ
れる。
In FIG. 1, a signal input from the sound source 13 to the microphone 1 is X 0 (t), and a signal input from the sound source 13 to the microphone 2 is Y 0 (t). The input signal X 0 (t) is amplified by the amplifier 3, quantized by the A / D converter 5, and converted into a discrete signal X 1 (n).
The input signal Y 0 (t) is amplified by the amplifier 4, quantized by the A / D converter 6, and converted into a discrete signal Y 1 (n).

【0027】次に離散信号X1 (n)は符号時間系列生
成部7で信号レベルが正の時に“1”、負の時に“−
1”、0の時にそのまま“0”で表される符号時間系列
x(n)に変換される。離散信号X1 (n)に対する符
号時間系列x(n)を、式1で定義する。
Next, the discrete time signal X 1 (n) is “1” when the signal level is positive and “−” when the signal level is negative in the code time sequence generation unit 7.
When it is 1 or 0, it is directly converted into a code time sequence x (n) represented by “0.” The code time sequence x (n) for the discrete signal X 1 (n) is defined by Expression 1.

【0028】[式1][Equation 1]

【0029】 [0029]

【0030】離散信号Y1 (n)も、X1 (n)と同様
にして、符号時間系列生成部8で符号時間系列に変換さ
れる。離散信号Y1 (n)に対する符号時間系列y
(n)は、式1に準じて定義される。相互相関関数計算
部9では、符号時間系列x(n)、y(n)に対する相
互相関関数Rxy(k)を、式2よって求める。
The discrete signal Y 1 (n) is also converted into a code time sequence by the code time sequence generator 8 in the same manner as X 1 (n). Code time sequence y for discrete signal Y 1 (n)
(N) is defined according to Equation 1. The cross-correlation function calculation unit 9 calculates the cross-correlation function Rxy (k) for the code time series x (n), y (n) using Equation 2.

【0031】[式2][Equation 2]

【0032】 [0032]

【0033】本来、求める音波の入射方向(音源方向)
θ(rad)は、式3によって求めることができる。
The incident direction of the sound wave to be originally sought (sound source direction)
θ (rad) can be obtained by Expression 3.

【0034】[式3] θ=sin-1(τc/M) ここで、τ(sec)は信号X0 (t)がマイクロホン
1に到達する時間と信号Y0 (t)がマイクロホン2に
到達する時間の差、M(m)は2つのマイクロホンの間
隔、c(m/sec)は音速である。実際には、サンプ
リング周波数fs(Hz)の符号時間系列x(n)、y
(n)を用いて相関を計算するために、2つのマイクロ
ホンで受音した信号の時間差は、対応するサンプル数k
で表される。ただし、kは整数である。従って、実際に
求まる時間差τ(sec)は、式4のようになる。
[Equation 3] θ = sin −1 (τc / M) Here, τ (sec) is the time when the signal X 0 (t) reaches the microphone 1 and the signal Y 0 (t) reaches the microphone 2 M (m) is the interval between two microphones, and c (m / sec) is the speed of sound. Actually, the code time sequence x (n), y of the sampling frequency fs (Hz)
To calculate the correlation using (n), the time difference between the signals received by the two microphones is calculated by the corresponding number of samples k
It is represented by Here, k is an integer. Therefore, the time difference τ (sec) actually obtained is as shown in Expression 4.

【0035】[式4] τ=k/fs 式4を式3に代入すると式5が得られる。[Equation 4] τ = k / fs By substituting Equation 4 into Equation 3, Equation 5 is obtained.

【0036】[式5] θ=sin-1((c/M)×(k/fs)) 式5のθは[rad]で表されているが、これを[de
g]で表すためには、式5に180/πを掛けた式6を
用いなければならない。
[Equation 5] θ = sin −1 ((c / M) × (k / fs)) In Expression 5, θ is represented by [rad].
g], Expression 6 obtained by multiplying Expression 5 by 180 / π must be used.

【0037】[式6] θ=(180/π)sin-1((c/M)×(k/f
s)) 一方、時間差τ(sec)は、直線上に配置された2つ
のマイクロホンの延長線上である真横(90度)に音源
が位置する時に最大となる。従って、最大値に対応した
サンプル数kmax は、式7で求めることができる。
[Equation 6] θ = (180 / π) sin −1 ((c / M) × (k / f)
s)) On the other hand, the time difference τ (sec) is maximized when the sound source is located right beside (90 degrees) which is an extension of two microphones arranged on a straight line. Therefore, the number of samples k max corresponding to the maximum value can be obtained by Expression 7.

【0038】[式7] kmax ≦fs×(M/c) すなわち、離散信号を入力とする場合、検出できる音源
方向角度の最大値は、一般に90度より小さくなる。音
源の到来方向がkmax に相当する角度以上の時、式6で
直接、音源方向を求めることはできない。そこで、k
max +1、kmax+2まで相互相関関数を求めて、ピー
ク値がkmax +1に存在する場合には到来方向が90度
であると判定する。
[Equation 7] k max ≦ fs × (M / c) That is, when a discrete signal is input, the maximum value of the sound source direction angle that can be detected is generally smaller than 90 degrees. When the arrival direction of the sound source is equal to or larger than the angle corresponding to k max , the sound source direction cannot be directly obtained by Expression 6. So, k
The cross-correlation function is obtained up to max + 1 and kmax + 2, and when the peak value exists at kmax + 1, it is determined that the arrival direction is 90 degrees.

【0039】次に、正規化電力計算部10で、相互相関
関数Rxy(k)から、式8を用いて正規化電力p(k)
を求める。
Next, the normalized power calculation unit 10 calculates the normalized power p (k) from the cross-correlation function Rxy (k) using Expression 8.
Ask for.

【0040】[式8][Equation 8]

【0041】 [0041]

【0042】式8から求めた電力p(k)は、符号時間
系列x(n)、y(n)(n=0,1,
2,.....,N−1)に対して与えられるが、音声
信号の非定常性を考慮すると、Nを大きくとることはで
きない。そこで、音声の全データ長をLとするとき、1
フレームをNサンプルとして、uサンプルオーバーラッ
プさせてFフレームに分割し、各フレームに対応したF
個の正規化電力pf (k)(f=0,1,....,F
−1)の平均値をp(k)の代わりに用いる。時間平均
計算部11で、Pf (k)の平均値Cp (k)(k=
0,1,2,・・・・,kmax ,kmax +1,kmax
2)を式9によって求める。
The power p (k) obtained from Equation 8 is represented by code time series x (n), y (n) (n = 0, 1,
2,. . . . . , N−1), but N cannot be made large in consideration of the unsteadiness of the audio signal. Therefore, when the total data length of voice is L, 1
Assuming that a frame is N samples, u samples are overlapped and divided into F frames, and F frames corresponding to each frame are divided.
Pieces of normalized power pf (k) (f = 0, 1,..., F
Use the average of -1) instead of p (k). The time average calculator 11 calculates the average value of P f (k) C p (k) (k =
.., K max , k max +1 and k max +
2) is obtained by Expression 9.

【0043】[式9][Equation 9]

【0044】 [0044]

【0045】Pf (k)は第fフレームの電力を表し、
x(n)、y(n)(n=f(N−u),f(N−u)
+1,f(N−u)+2,....,f(N−u)+N
−1)から、式7、式8を用いて求められる。ただし、
Fは平均化における総フレーム数(分析区間数)、N−
uは各フレームで新しく入力される符号時間系列x
(n)、y(n)のサンプル数を表す。
P f (k) represents the power of the f-th frame,
x (n), y (n) (n = f (Nu), f (Nu)
+1, f (N−u) +2,. . . . , F (N−u) + N
-1) is obtained using Expressions 7 and 8. However,
F is the total number of frames in the averaging (the number of analysis sections), N-
u is a code time sequence x newly input in each frame.
(N) and y (n) represent the number of samples.

【0046】最後に、方向検出部12で、時間平均Cp
(k)の最大値を与えるk1を求め式10で対応した推
定角度θ度を得る。
Finally, the direction detector 12 calculates the time average C p
K1 that gives the maximum value of (k) is obtained, and an estimated angle θ degree corresponding to Expression 10 is obtained.

【0047】[式10][Equation 10]

【0048】 [0048]

【0049】[0049]

【実施例】図2は本発明による第2の実施の形態を示す
ブロック構成図である。
FIG. 2 is a block diagram showing a second embodiment according to the present invention.

【0050】図2を参照するに、この第2の実施の形態
の図1に示された第1の実施の形態に対する相違点は、
符号時間系列生成部24、25に、A/Dコンバータ1
8、19から供給する信号を自己回帰係数を用いた逆フ
ィルタで処理して、白色化していることである。このた
めに、自己回帰係数計算部20、21、逆フィルタ処理
部22、23を備えているが、他の構成/動作は図1と
等しいので、これらの相違点について説明する。
Referring to FIG. 2, the difference between the second embodiment and the first embodiment shown in FIG.
The A / D converter 1 is added to the code time sequence generation units 24 and 25.
That is, the signals supplied from 8 and 19 are processed by an inverse filter using an auto-regression coefficient to whiten. To this end, auto-regression coefficient calculation units 20 and 21 and inverse filter processing units 22 and 23 are provided. However, other configurations / operations are the same as those in FIG.

【0051】離散信号X1 (n)、Y1 (n)を用い
て、逆フィルタのためのフィルタ係数が、自己回帰係数
計算部20、21で求められる。これらのフィルタ係数
と対応する離散信号が逆フィルタ処理部22、23で畳
み込まれ白色化信号が生成される。
Using the discrete signals X 1 (n) and Y 1 (n), filter coefficients for the inverse filter are obtained by the auto-regression coefficient calculators 20 and 21. The discrete signals corresponding to these filter coefficients are convolved by the inverse filter processing units 22 and 23 to generate a whitened signal.

【0052】次に、離散信号X1 (n)を用いて、自己
回帰係数αk (k=1,2,....,Q)を自己回帰
係数計算部20において求める。自己回帰係数は、Le
vinson−Durbin法として知られているよう
に、入力信号の自己相関関数を表す式11を用いて、求
めることができる。Levinson−Durbin法
については、「1975年4月、プロシーディングス・
オブ・ザ・アイ・イー・イー・イー、第63巻、第4
号、561−580ページ(Proceedings
of the IEEE,vol.63,No.4,p
561−580,April,1975)」に詳述され
ているのでここではその概略を述べる。
Next, using the discrete signal X 1 (n), an auto-regression coefficient calculation section 20 obtains an auto-regression coefficient α k (k = 1, 2,..., Q). The auto-regression coefficient is Le
As known as the Vinson-Durbin method, it can be obtained by using Expression 11 representing the autocorrelation function of the input signal. For the Levinson-Durbin method, see "Proceedings
Of the iEiEi, Vol. 63, No. 4
Issue, pages 561-580 (Proceedings
of the IEEE, vol. 63, No. 4, p
561-580, April, 1975).

【0053】式11に示す自己相関関数Rxx(k)(k
=0,1,2,....,Q−1)を用いて、自己回帰
係数αk (Q) を求める。ただし、Qは自己回帰係数の次
数、σq 2 は分散、Cq は反射係数である。
The autocorrelation function Rxx (k) (k
= 0, 1, 2,. . . . , Q-1) to determine the autoregressive coefficient α k (Q) . Here, Q is the order of the autoregressive coefficient, σ q 2 is the variance, and C q is the reflection coefficient.

【0054】[式11][Equation 11]

【0055】 [0055]

【0056】初期値は、式12のように設定する。The initial value is set as shown in Expression 12.

【0057】[式12] σ0 2 =Rxx(0) α0 (0) =1 α1 (1) =C1 =−Rxx(1)/σ0 2 σ1 2 =σ0 2 (1−C1 2 ) q=1 次に、漸化式13により変数qを更新し、求めるQ次の
自己回帰係数αk (Q)を順次求める。
[Equation 12] σ 0 2 = Rxx (0) α 0 (0) = 1 α 1 (1) = C 1 = −Rxx (1) / σ 0 2 σ 1 2 = σ 0 2 (1- C 1 2 ) q = 1 Next, the variable q is updated by the recurrence formula 13, and the Q-order autoregressive coefficient α k (Q) to be obtained is sequentially obtained.

【0058】[式13][Equation 13]

【0059】 [0059]

【0060】自己回帰係数計算部20と同様な計算方法
で、離散信号Y1 (n)に対する自己回帰係数βk (k
=1,2,....,Q)を自己回帰係数計算部21に
て求める。自己回帰係数計算部20で求めた自己回帰係
数αk (k=1,2,・・・・, Q)と離散信号X
1 (n)を、逆フィルタ処理部22で式14を用いて畳
み込み、白色化信号eX (n)を求める。
In the same manner as the auto-regression coefficient calculator 20, the auto-regression coefficient β k (k) for the discrete signal Y 1 (n) is calculated.
= 1, 2,. . . . , Q) are calculated by the auto-regression coefficient calculator 21. The autoregression coefficient α k (k = 1, 2,..., Q) obtained by the autoregression coefficient calculation unit 20 and the discrete signal X
1 (n) is convolved by the inverse filter processing unit 22 using Expression 14, and a whitening signal e X (n) is obtained.

【0061】[式14][Equation 14]

【0062】 [0062]

【0063】また、自己回帰係数計算部21で求めた自
己回帰係数βk (k=1,2,.....,Q)と離散
信号Y1 (n)を、逆フィルタ処理部23で式14と同
様な計算方法で畳み込み、白色化信号eY (n)を求め
る。得られた白色化信号eX(n)とeY (n)を符号
時間系列生成部24、25で符号時間系列x(n)、y
(n)に変換することにより、図1と同様な手順で音源
方向推定を行うことができる。
The self-regression coefficient β k (k = 1, 2,..., Q) obtained by the self-regression coefficient calculation section 21 and the discrete signal Y 1 (n) are The whitening signal e Y (n) is obtained by convolution with the same calculation method as in Expression 14. The obtained whitening signals e X (n) and e Y (n) are converted into code time sequences x (n), y by code time sequence generation units 24 and 25.
By converting to (n), sound source direction estimation can be performed in the same procedure as in FIG.

【0064】[0064]

【発明の効果】本発明は以上説明したように構成され、
作用するものであり、本発明によれば以下に示すような
効果が得られる。
The present invention is configured as described above,
According to the present invention, the following effects can be obtained.

【0065】第1の効果は、相互相関関数の計算に要す
る演算精度が低下し、ハードウェア規模を削減できる。
The first effect is that the calculation accuracy required for calculating the cross-correlation function is reduced, and the hardware scale can be reduced.

【0066】その理由は、信号レベルが正の時に
“1”、負の時に“−1”、0の時にそのまま“0”に
する符号時間系列に変換しているためである。
The reason is that the signal time is converted into a code time series that is "1" when the signal level is positive, "-1" when the signal level is negative, and "0" when it is 0.

【0067】第2の効果は、耐雑音性に優れている。The second effect is excellent in noise resistance.

【0068】その理由は、相互相関関数の電力値を時間
平均化しているためである。
The reason is that the power values of the cross-correlation function are averaged over time.

【0069】第3の効果は、高精度な音源の方向推定を
行うことができる。
The third effect is that a highly accurate direction estimation of a sound source can be performed.

【0070】その理由は、入力信号を白色化しているた
めである。
The reason is that the input signal is whitened.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明による第1の実施の形態を示すブロック
構成図である。
FIG. 1 is a block diagram showing a first embodiment according to the present invention.

【図2】本発明による第2の実施の形態を示すブロック
構成図である。
FIG. 2 is a block diagram showing a second embodiment according to the present invention.

【図3】従来の音源方向推定装置の第1の例を示すブロ
ック図である。
FIG. 3 is a block diagram showing a first example of a conventional sound source direction estimating apparatus.

【図4】従来の音源方向推定装置の第2の例を示すブロ
ック図である。
FIG. 4 is a block diagram showing a second example of a conventional sound source direction estimation device.

【符号の説明】[Explanation of symbols]

1、2、14、15…マイクロホン 3、4、16、17…増幅器 5、6、18、19…A/Dコンバータ 7、8、24、25…符号時間系列生成部 9、26…相互相関関数計算部 10、27…正規化電力計算部 11、28…時間平均計算部 12、29…方向検出部 13、30…音源 20、21…自己回帰係数計算部 22、23…逆フィルタ処理部 1, 2, 14, 15 ... microphone 3, 4, 16, 17 ... amplifier 5, 6, 18, 19 ... A / D converter 7, 8, 24, 25 ... code time sequence generation unit 9, 26 ... cross-correlation function Calculation units 10, 27 Normalized power calculation unit 11, 28 Time average calculation unit 12, 29 Direction detection unit 13, 30 Sound source 20, 21 Autoregression coefficient calculation unit 22, 23 Inverse filter processing unit

フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G01S 3/80 - 3/86 G01S 5/18 - 5/30 G01S 7/52 - 7/64 G01S 15/00 - 15/96 G06F 15/336 Continued on the front page (58) Fields surveyed (Int.Cl. 6 , DB name) G01S 3/80-3/86 G01S 5/18-5/30 G01S 7/52-7/64 G01S 15/00-15 / 96 G06F 15/336

Claims (5)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 複数のマイクロホンで獲得した複数のオ
ーディオ信号の極性を抽出して前記オーディオ信号と1
対1に対応した複数の符号時間系列を生成し、前記複数
の符号時間系列の相互相関を計算し、前記相互相関の正
規化電力を計算し、前記正規化電力の時間平均を計算
し、前記時間平均により音源方向を推定することを特徴
とする音源方向推定方法。
1. A method for extracting the polarities of a plurality of audio signals obtained by a plurality of microphones, and
Generating a plurality of code time sequences corresponding to one to one, calculating a cross-correlation of the plurality of code time sequences, calculating a normalized power of the cross-correlation, calculating a time average of the normalized power, A sound source direction estimating method characterized by estimating a sound source direction by time averaging.
【請求項2】 前記符号時間系列は、信号レベルが正の
時には“1”、負の時には“−1”、0の時にはそのま
ま“0”と表されることを更に特徴とする請求項1に記
載の音源方向推定方法。
2. The code time sequence according to claim 1, wherein the code time sequence is expressed as “1” when the signal level is positive, “−1” when the signal level is negative, and “0” as it is when the signal level is 0. The described sound source direction estimation method.
【請求項3】 前記複数のマイクロホンで獲得した複数
のオーディオ信号と1対1に対応した複数の自己回帰係
数を計算し、前記複数の自己回帰係数を係数として前記
複数のオーディオ信号に対して逆フィルタ処理を施し、
前記複数の逆フィルタ処理の出力の極性を抽出して複数
の符号時間系列を生成し、前記複数の符号時間系列の相
互相関を計算し、前記相互相関の正規化電力を計算し、
前記正規化電力の時間平均を計算し、前記時間平均によ
り音源方向を推定することを特徴とする音源方向推定方
法。
3. A method for calculating a plurality of auto-regression coefficients corresponding to a plurality of audio signals acquired by the plurality of microphones in a one-to-one manner, and using the plurality of auto-regression coefficients as coefficients to inverse the plurality of audio signals. Filter,
Extracting the polarities of the outputs of the plurality of inverse filter processes to generate a plurality of code time sequences, calculating a cross-correlation of the plurality of code time sequences, calculating a normalized power of the cross-correlation,
A sound source direction estimating method, comprising calculating a time average of the normalized power and estimating a sound source direction by the time average.
【請求項4】 複数のマイクロホンで獲得した複数のオ
ーディオ信号と前記複数のオーディオ信号と1対1に対
応してこれらの極性を抽出する複数の符号時間系列生成
部と、前記複数の符号時間系列生成部の出力をすべて受
けて相互相関を計算する相互相関関数計算部と、前記相
互相関関数計算部の出力を受けて正規化電力を計算する
正規化電力計算部と、前記正規化電力計算部の出力を受
けて電力値の時間平均を計算する時間平均計算部と、前
記時間平均計算部の出力により音源方向を推定する方向
検出部とを有することを特徴とする音源方向推定装置。
4. A plurality of code time sequence generators for extracting a plurality of audio signals obtained by a plurality of microphones and a polarity of the plurality of audio signals in a one-to-one correspondence, and the plurality of code time sequences. A cross-correlation function calculator that receives all outputs of the generator and calculates a cross-correlation, a normalized power calculator that receives outputs of the cross-correlation function calculator and calculates a normalized power, and the normalized power calculator A sound source direction estimating apparatus, comprising: a time average calculating unit that calculates the time average of the power value in response to the output of the sound source direction; and a direction detecting unit that estimates the sound source direction based on the output of the time average calculating unit.
【請求項5】 複数のマイクロホンで獲得した複数のオ
ーディオ信号と前記複数のオーディオ信号と1対1に対
応してこれらの自己回帰係数を計算する複数の自己回帰
係数計算部と、前記複数の自己回帰係数計算部の出力を
係数として前記複数のオーディオ信号に対して逆フィル
タ処理を施す複数の逆フィルタ処理部と、前記複数の逆
フィルタ処理部の出力の極性を抽出する複数の符号時間
系列生成部と、前記複数の符号時間系列生成部の出力を
すべて受けて相互相関を計算する相互相関関数計算部
と、前記相互相関関数計算部の出力を受けて正規化電力
を計算する正規化電力計算部と、前記正規化電力計算部
の出力を受けて時間平均を計算する時間平均計算部と、
前記時間平均計算部の出力により音源方向を推定する方
向検出部とを有することを特徴とする音源方向推定装
置。
5. A plurality of auto-regression coefficient calculators for calculating a plurality of audio signals acquired by a plurality of microphones and auto-regression coefficients thereof in one-to-one correspondence with the plurality of audio signals; A plurality of inverse filter processing units for performing an inverse filter process on the plurality of audio signals by using an output of the regression coefficient calculation unit as a coefficient; and a plurality of code time sequence generating units for extracting polarities of outputs of the plurality of inverse filter process units , A cross-correlation function calculator that receives all outputs of the plurality of code time sequence generators and calculates a cross-correlation, and a normalized power calculator that receives output of the cross-correlation function calculator and calculates normalized power Unit, a time average calculation unit that receives the output of the normalized power calculation unit and calculates a time average,
A sound source direction estimating device, comprising: a direction detecting unit that estimates a sound source direction based on an output of the time average calculating unit.
JP9302786A 1997-11-05 1997-11-05 Sound source direction estimation method and apparatus Expired - Lifetime JP2982766B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9302786A JP2982766B2 (en) 1997-11-05 1997-11-05 Sound source direction estimation method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9302786A JP2982766B2 (en) 1997-11-05 1997-11-05 Sound source direction estimation method and apparatus

Publications (2)

Publication Number Publication Date
JPH11142499A JPH11142499A (en) 1999-05-28
JP2982766B2 true JP2982766B2 (en) 1999-11-29

Family

ID=17913110

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9302786A Expired - Lifetime JP2982766B2 (en) 1997-11-05 1997-11-05 Sound source direction estimation method and apparatus

Country Status (1)

Country Link
JP (1) JP2982766B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005049153A (en) * 2003-07-31 2005-02-24 Toshiba Corp Speech direction estimation apparatus and method
JP3862685B2 (en) * 2003-08-29 2006-12-27 株式会社国際電気通信基礎技術研究所 Sound source direction estimating device, signal time delay estimating device, and computer program
WO2020044183A1 (en) * 2018-08-31 2020-03-05 株式会社半導体エネルギー研究所 Semiconductor device

Also Published As

Publication number Publication date
JPH11142499A (en) 1999-05-28

Similar Documents

Publication Publication Date Title
KR101153093B1 (en) Method and apparatus for multi-sensory speech enhamethod and apparatus for multi-sensory speech enhancement ncement
KR20030076560A (en) Method and apparatus for removing noise from electronic signals
JPS58134698A (en) Voice recognition method and apparatus
CN101027719A (en) noise suppression device
CN101641735B (en) Method for Estimating Noise Level in Communication Systems
WO2004054319A1 (en) Method and device for measuring sound wave propagation time between loudspeaker and microphone
CN109901114A (en) A kind of delay time estimation method suitable for auditory localization
CN102592589B (en) Speech scoring method and device implemented through dynamically normalizing digital characteristics
CN116052702A (en) Kalman filtering-based low-complexity multichannel dereverberation noise reduction method
JP2982766B2 (en) Sound source direction estimation method and apparatus
JP5077847B2 (en) Reverberation time estimation apparatus and reverberation time estimation method
WO2006070560A1 (en) Noise suppressing device, noise suppressing method, noise suppressing program, and computer readable recording medium
JPH0587903A (en) Sound source direction estimation method
JP2004078021A (en) Sound collection method, sound collection device, and sound collection program
JP3135937B2 (en) Noise removal device
JP2003078423A (en) Processor for separating blind signal
JP2932996B2 (en) Harmonic pitch detector
JP3520430B2 (en) Left and right sound image direction extraction method
JPH055760Y2 (en)
CN116343817B (en) A convolutional blind source separation method for identifying relevant noise sources in gas turbines
JP2801072B2 (en) Howling detector
JP2558658B2 (en) Basic frequency analyzer
JP2989219B2 (en) Voice section detection method
Kaneda Sound source localization for wide-band signals under a reverberant condition
CN114488102B (en) Method and system for inhibiting tailing of impulse signal of underwater acoustic transducer

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees