Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP3514714B2 - Sound collection method and device - Google Patents
[go: Go Back, main page]

JP3514714B2 - Sound collection method and device - Google Patents

Sound collection method and device

Info

Publication number
JP3514714B2
JP3514714B2 JP2000249547A JP2000249547A JP3514714B2 JP 3514714 B2 JP3514714 B2 JP 3514714B2 JP 2000249547 A JP2000249547 A JP 2000249547A JP 2000249547 A JP2000249547 A JP 2000249547A JP 3514714 B2 JP3514714 B2 JP 3514714B2
Authority
JP
Japan
Prior art keywords
sound
signal
output
signals
sound collecting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000249547A
Other languages
Japanese (ja)
Other versions
JP2002062895A (en
Inventor
和則 小林
賢一 古家
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
NTT Inc USA
Original Assignee
Nippon Telegraph and Telephone Corp
NTT Inc USA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp, NTT Inc USA filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2000249547A priority Critical patent/JP3514714B2/en
Publication of JP2002062895A publication Critical patent/JP2002062895A/en
Application granted granted Critical
Publication of JP3514714B2 publication Critical patent/JP3514714B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
  • Telephone Function (AREA)

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、音声認識、ハンズ
フリー電話、テレビカメラ、通信会議、遠隔講義、異常
音監視等において、複数のマイクロホンによって受音さ
れた信号をフィルタ処理し、出力することによって、雑
音や周波数劣化を低減し、目的とする音源から発せられ
た音を高品質に収音する方法および装置に関するもので
ある。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention filters and outputs signals received by a plurality of microphones in voice recognition, hands-free telephone, TV camera, communication conference, remote lecture, abnormal sound monitoring and the like. The present invention relates to a method and apparatus for reducing noise and frequency deterioration, and collecting sound emitted from a target sound source with high quality.

【0002】[0002]

【従来の技術】まず、高品質な収音の意味について説明
する。
2. Description of the Related Art First, the meaning of high quality sound pickup will be described.

【0003】マイクロホンによって受音された信号に
は、目的とする音源から発せられた音(目的音)の他
に、空調音、電気機器のファン音、マイクロホンアンプ
や信号ケーブル等で生じる電気的雑音等の雑音が含まれ
る。また、収音の過程で目的音成分に周波数劣化が生じ
る。目的音成分の周波数劣化が小さい程、収音した音は
目的音に近い波形であるので、目的音成分の周波数劣化
は小さいほど高品質である。したがって、高品質な収音
とは、高SN比(目的信号と雑音のパワー比)であり、
しかも、目的音成分の周波数劣化が小さい収音のことで
ある。
The signal received by the microphone includes not only the sound emitted from the target sound source (target sound) but also the air conditioning sound, the fan sound of electric equipment, and the electric noise generated by the microphone amplifier, the signal cable, and the like. Etc. noise is included. In addition, frequency deterioration occurs in the target sound component during the sound collection process. As the frequency deterioration of the target sound component is smaller, the collected sound has a waveform closer to the target sound. Therefore, the smaller the frequency deterioration of the target sound component is, the higher the quality is. Therefore, high-quality sound pickup means a high SN ratio (power ratio of target signal and noise),
Moreover, it is a sound pickup in which the frequency deterioration of the target sound component is small.

【0004】次に、単一仮想目的音源を用いた適応形ア
レーについて説明する。
Next, an adaptive array using a single virtual target sound source will be described.

【0005】適応形アレーは、複数のマイクロホン(マ
イクロホンアレー)で収音された信号をそれぞれフィル
タリングし、加算して出力する方法であり、雑音の強
さ、位置、周波数等の雑音の性質に応じて、フィルタ係
数を適応的に更新することによって、雑音を抑圧し、目
的音を高品質に収音できる。
The adaptive array is a method in which signals picked up by a plurality of microphones (microphone arrays) are filtered, added, and output, depending on noise characteristics such as noise intensity, position and frequency. By adaptively updating the filter coefficient, noise can be suppressed and the target sound can be collected with high quality.

【0006】単一仮想目的音源を用いた従来の適応形ア
レーにおいて、実際に収音した雑音と、予め設定した単
一の仮想目的音源位置からマイクロホンに到来する音と
を仮想的に合成した仮想目的信号を用いて、雑音に対す
るマイクロホンアレーの感度が低く、仮想目的音源位置
に対するアレーの感度が高くなるように、フィルタ係数
を更新することによって、仮想目的音源位置に存在する
音源の音を、高品質に収音することが可能である。
In a conventional adaptive array using a single virtual target sound source, a virtual sound obtained by virtually synthesizing noise actually picked up and a sound arriving at a microphone from a preset single virtual target sound source position is used. By using the target signal, the sound of the sound source existing at the virtual target sound source position is raised by updating the filter coefficient so that the sensitivity of the microphone array to the noise is low and the sensitivity of the array to the virtual target sound source position is high. It is possible to pick up quality.

【0007】しかし、実際の目的音源は、仮想目的音源
位置からずれた位置にあったり、移動したりすることが
予想される。たとえば、目的音が人であれば、必ず動く
であろうし、毎回同じ位置で話しをすることもない。こ
のように、実際の目的音源が仮想目的音源位置からずれ
ると、従来技術では、実際の目的音源に対する仮想目的
音源位置のずれを修正することができないので、目的音
に対して周波数特性の劣化が生じ、聞き取りずらい音に
なったり、音声認識や異常音検出が困難となったりす
る。
However, it is expected that the actual target sound source will be displaced from the virtual target sound source position or will move. For example, if the target sound is a person, it will always move and will not speak at the same position every time. As described above, when the actual target sound source deviates from the virtual target sound source position, the conventional technique cannot correct the deviation of the virtual target sound source position with respect to the actual target sound source. Sound that is difficult to hear, and voice recognition and abnormal sound detection are difficult.

【0008】次に、従来技術について、詳細に説明す
る。
Next, the prior art will be described in detail.

【0009】図12は、従来の収音装置CS11を示す
図である。
FIG. 12 is a diagram showing a conventional sound collecting device CS11.

【0010】従来の収音装置CS11は、マイクロホン
111〜11Mと、加算器121〜12M、14A、14
B、15(+記号は加算、−記号は減算を表す)と、第
2の可変フィルタ13A1〜13AMと、第1の可変フィ
ルタ13B1〜13BMと、適応アルゴリズム部16と、
信号発生器17Cと、遅延器19Cと、仮想音源位置設
定部26Cと、空間特性推定部27Cと、空間特性フィ
ルタ18C1〜18CMと、適応期間検出部20とを有す
る。
The conventional sound collecting device CS11 includes microphones 11 1 to 11 M and adders 12 1 to 12 M , 14A and 14A.
B and 15 (+ sign represents addition, − sign represents subtraction), second variable filters 13A 1 to 13A M , first variable filters 13B 1 to 13B M , adaptive algorithm unit 16, and
Having a signal generator 17C, a delay circuit 19C, a virtual sound source position setting unit 26C, and the spatial characteristic estimating section 27C, and the spatial characteristic filter 18C 1 ~18C M, an adaptive period detection unit 20.

【0011】次に、以下で使用する数式の記号について
定義する。
Next, symbols of mathematical expressions used below will be defined.

【0012】サンプリング周期によって離散化された時
刻をnとし、時刻nにi番目マイクロホン11iで収音
された信号をxi(n)とし、Lサンプル分(フィルタ
が必要とするサンプル)を取り出して行列で表したもの
を、 x(n)=[xi(n),xi(n−1),…,xi(n
−L+1),x2(n),…,xM(n−L+1)]T とする。
Let n be the time discretized by the sampling period, x i (n) be the signal picked up by the i-th microphone 11 i at time n, and extract L samples (samples required by the filter). X (n) = [x i (n), x i (n-1), ..., x i (n
−L + 1), x 2 (n), ..., X M (n−L + 1)] T.

【0013】信号発生器17Cの出力信号を、v’
(n)とし、i番目マイクロホン11iに対する空間特
性フィルタを、g’i(n)で表し、空間特性フィルタ
出力を、u’i(n)=g’i(n)*v’(n)とし、
Lサンプル分を取り出して行列で表したものを、 u’(n)=[ui(n),ui(n−1),…,u
i(n−L+1),u2(n),…,uM(n−L+
1)]T とする。
The output signal of the signal generator 17C is v '
(N), the spatial characteristic filter for the i-th microphone 11 i is represented by g ′ i (n), and the spatial characteristic filter output is u ′ i (n) = g ′ i (n) * v ′ (n). age,
L's are taken out and expressed in a matrix as u '(n) = [u i (n), u i (n-1), ..., u
i (n-L + 1) , u 2 (n), ..., u M (n-L +
1)] T.

【0014】ただし、*は、畳み込み演算である。第2
の可変フィルタ13A1〜13AM、第1の可変フィルタ
13B1〜13BMは、LタップのFIRフィルタ(各デ
ータに定数を乗じ、これらを加算するフィルタ)とし、
フィルタ係数h’(n)を、 h’(n)=[hi(n),hi(n−1),…,h
i(n−L+1),h2(n),…,hM(n−L+
1)]T として行列で表す。
However, * is a convolution operation. Second
The variable filters 13A 1 to 13A M and the first variable filters 13B 1 to 13B M are L-tap FIR filters (filters that multiply each data by a constant and add these),
The filter coefficient h ′ (n) is represented by h ′ (n) = [h i (n), h i (n−1), ..., H
i (n-L + 1) , h 2 (n), ..., h M (n-L +
1)] T is represented by a matrix.

【0015】ただし、hi(n−p+1)は、時刻nに
おけるi番目マイクロホンに対するフィルタのpタップ
目のフィルタ係数を表し、第2の可変フィルタと第1の
可変フィルタとには、同一のフィルタ係数が用いられ
る。また、加算器14Aの出力を、y’(n)で表し、
加算器14Bの出力を、y(n)で表し、加算器15の
出力(誤差)を、e(n)で表し、遅延器19Cでの遅
延量を、τ’0で表す。
However, h i (n-p + 1) represents the filter coefficient of the p-tap of the filter for the i-th microphone at time n, and the same filter is used for the second variable filter and the first variable filter. The coefficient is used. Also, the output of the adder 14A is represented by y '(n),
The output of the adder 14B is represented by y (n), the output (error) of the adder 15 is represented by e (n), and the delay amount of the delay device 19C is represented by τ ′ 0 .

【0016】次に、上記従来例におけるフィルタの収束
解と修正式との導出を行う。
Next, the convergent solution of the filter and the correction formula in the above conventional example are derived.

【0017】まず、加算器15の出力(誤差)e(n)
の二乗平均を求める。この二乗平均誤差が小さくなれ
ば、加算器14A出力における雑音パワーが小さくな
り、加算器14A出力における仮想目的音の周波数劣化
が小さくなるので、この二乗平均誤差を最小とするフィ
ルタを、最適なフィルタとする。
First, the output (error) e (n) of the adder 15
Find the root mean square of. If this root mean square error becomes smaller, the noise power at the output of the adder 14A becomes smaller and the frequency deterioration of the virtual target sound at the output of the adder 14A becomes smaller. Therefore, the filter that minimizes this root mean square error is the optimum filter. And

【0018】[0018]

【数1】 ただし、オーバーラインは時間平均を意味する。[Equation 1] However, overline means time average.

【0019】雑音と仮想目的音とは無相関であるとする
と、上記式(1)を、次の式(2)のように変形するこ
とができる。
Assuming that the noise and the virtual target sound are uncorrelated, the above equation (1) can be transformed into the following equation (2).

【0020】[0020]

【数2】 第1の可変フィルタh(n)を、LタップのFIRフィ
ルタ(各データに定数を乗じ、これらを加算するフィル
タ)とし、式(2)をベクトル表記すれば、次の式
(3)のようになる。
[Equation 2] If the first variable filter h (n) is an L-tap FIR filter (a filter that multiplies each data by a constant and adds them), and the equation (2) is represented by a vector, the following equation (3) is obtained. become.

【0021】[0021]

【数3】 ただし、仮想目的信号v’(n)は、平均パワー[Equation 3] However, the virtual target signal v ′ (n) is the average power

【0022】[0022]

【数4】 の定常的な信号であるとし、また、[Equation 4] Is a stationary signal of

【0023】[0023]

【数5】 である。[Equation 5] Is.

【0024】上記式(3)を最小化するフィルタが最適
なフィルタであるので、式(3)をh(n)で偏微分
し、0とおいて、極小点を求める。
Since the filter that minimizes the above formula (3) is the optimum filter, the formula (3) is partially differentiated by h (n) and is set to 0 to find the minimum point.

【0025】[0025]

【数6】 式(4)をh(n)について解けば、式(3)を最小化
する最適フィルタh(opt,n)が求められる。
[Equation 6] By solving the equation (4) for h (n), the optimum filter h (opt, n) that minimizes the equation (3) can be obtained.

【0026】[0026]

【数7】 上記式(5)の最適フィルタを求める方法として、LM
Sアルゴリズム、NLMSアルゴリズム、射影アルゴリ
ズム等の適応アルゴリズムがある。今回は、NLMS法
を例にとって修正式を示す。
[Equation 7] As a method for obtaining the optimum filter of the above equation (5), LM
There are adaptive algorithms such as S algorithm, NLMS algorithm, and projection algorithm. This time, the modified formula is shown taking the NLMS method as an example.

【0027】修正式は、次の式(6)で表される。The correction equation is expressed by the following equation (6).

【0028】 h(n+1)=h(n)+2α[{x’’(n)e(n)}/{x’’(n) x’’T(n)}] …… 式(6) ただし、x’’(n)は、次の式(7)で表される。H (n + 1) = h (n) + 2α [{x ″ (n) e (n)} / {x ″ (n) x ″ T (n)}] ... Equation (6) , X ″ (n) are represented by the following equation (7).

【0029】 x’’(n)=u’(n)+x(n) …… 式(7) ただし、αは、更新係数であり、0よりも大きく1以下
の定数である。
X ″ (n) = u ′ (n) + x (n) (7) where α is an update coefficient and is a constant greater than 0 and 1 or less.

【0030】以上で、式(6)の修正式を用いて、式
(5)の最適フィルタを求めることができることを示し
た。
As described above, it has been shown that the modified filter of the equation (6) can be used to obtain the optimum filter of the equation (5).

【0031】次に、信号発生器17Cについて説明す
る。
Next, the signal generator 17C will be described.

【0032】信号発生器17Cは、仮想目的音源位置に
対する感度を保つという条件を盛り込んでフィルタ更新
するために使われる。したがって、全ての周波数帯で感
度を保つためには、信号発生器171〜17Jが出力する
信号は、全ての周波数成分を含む必要がある。また、逐
次修正アルゴリズムでは、白色信号(周波数成分を一様
に含む信号)に対して収束速度が高いという性質があ
る。これらの理由によって、通常は、白色雑音を発生す
る信号発生器が用いられる。
The signal generator 17C is used to update the filter by incorporating the condition of maintaining the sensitivity with respect to the virtual target sound source position. Therefore, in order to maintain sensitivity in all frequency bands, the signals output from the signal generators 17 1 to 17 J must include all frequency components. In addition, the successive correction algorithm has a property that the convergence speed is high for a white signal (a signal that uniformly includes frequency components). For these reasons, signal generators that produce white noise are commonly used.

【0033】適応期間検出部20は、実際の目的音が存
在する場合に、適応動作を停止する機能を有する。つま
り、実際の目的音が存在する場合に適応動作すると、実
際の目的音に対する感度を小さくするようにフィルタが
更新されるので、この場合におけるフィルタ更新を停止
する必要がある。適応期間検出部20は、マイクロホン
で収音された信号のパワーを監視することによって、実
際の目的音の存在を検出し、適応動作を停止する。
The adaptive period detector 20 has a function of stopping the adaptive operation when the actual target sound is present. That is, if the adaptive operation is performed when the actual target sound is present, the filter is updated so as to reduce the sensitivity to the actual target sound, so the filter update in this case needs to be stopped. The adaptive period detection unit 20 detects the presence of the actual target sound by monitoring the power of the signal picked up by the microphone, and stops the adaptive operation.

【0034】[0034]

【発明が解決しようとする課題】上記のように、従来の
収音装置CS11において、実際に収音した雑音と、予
め設定した単一の仮想目的音源位置から、マイクロホン
に到来する音とを、仮想的に合成した仮想目的信号とを
用いて、雑音に対するマイクロホンアレーの感度が低
く、仮想目的音源位置に対するマイクロホンアレーの感
度が高くなるように、フィルタ係数を更新し、目的音を
高品質に収音しようとする。
As described above, in the conventional sound collecting device CS11, the noise actually collected and the sound arriving at the microphone from the preset single virtual target sound source position are: Using the virtually synthesized virtual target signal, the filter coefficient is updated so that the sensitivity of the microphone array to noise is low and the sensitivity of the microphone array to the virtual target sound source position is high. Try to make a sound.

【0035】しかし、マイクロホンアレーの感度が高く
なる位置は、仮想目的音源位置だけであり、実際の目的
音源位置ではない。実際の目的音源位置と仮想目的音源
位置とが完全に一致していれば問題はないが、実際の目
的音源位置が仮想目的音源位置とずれた場合には、目的
音に対して周波数特性の劣化が生じる。
However, the position where the sensitivity of the microphone array is high is only the virtual target sound source position, not the actual target sound source position. There is no problem if the actual target sound source position and the virtual target sound source position are exactly the same, but if the actual target sound source position deviates from the virtual target sound source position, the frequency characteristics deteriorate with respect to the target sound. Occurs.

【0036】特に、波長が短い高周波成分(数kHz)
に対して、劣化が激しく、数Cmずれただけで、目的音
に対する特性が著しく劣化することもある。
Especially, a high frequency component (several kHz) having a short wavelength
On the other hand, the deterioration is severe, and the characteristics with respect to the target sound may be remarkably deteriorated even if the deviation is several Cm.

【0037】上記従来技術では、高品質に収音できる位
置が、仮想目的音源位置に限られるので、動く音源(人
等)や、音源位置が正確に分からない場合(異常音を監
視する場合)に用いることが難しいという問題がある。
In the above-mentioned prior art, since the position where sound can be collected with high quality is limited to the virtual target sound source position, when the moving sound source (human etc.) or the sound source position is not accurately known (when monitoring abnormal sound). There is a problem that it is difficult to use.

【0038】単一仮想目的音源を用いた従来の適応形ア
レーでは、仮想目的音源位置と実際の音源位置とにずれ
があると、目的音成分に周波数特性の劣化が生じ、動く
音源(人等)や、位置が正確に分からない場合(異常音
を監視する場合)に用いることが難しいという問題があ
る。
In the conventional adaptive array using a single virtual target sound source, if the virtual target sound source position and the actual sound source position are deviated, the frequency characteristic of the target sound component deteriorates, and the moving sound source (human etc.) ), Or when the position is not known accurately (when monitoring abnormal sound), it is difficult to use.

【0039】本発明は、適応形アレーにおいて、目的音
源が動く場合や、目的音源位置が正確に分からない場合
に生じる目的音成分の周波数特性の劣化を改善し、高品
質な収音を実現する収音方法および装置を提供すること
を目的とするものである。
According to the present invention, in the adaptive array, the deterioration of the frequency characteristic of the target sound component, which occurs when the target sound source moves or when the target sound source position is not accurately known, is improved, and high quality sound collection is realized. It is an object of the present invention to provide a sound collecting method and device.

【0040】[0040]

【課題を解決するための手段】本発明は、任意に配置さ
れている複数の収音手段が収音した収音信号を、それぞ
れ異なるフィルタ係数によってフィルタリングする第1
の可変フィルタリング手段と、上記各第1の可変フィル
タリング手段の出力信号を加算し、加算出力を出力する
加算手段とを有する収音装置において、点としての仮想
目的音源位置を設定する代わりに、所定の収音範囲内に
仮想目的音源位置を複数設定し、その範囲内の感度を保
つような拘束条件を実現するものである。
According to a first aspect of the present invention, a sound pickup signal picked up by a plurality of arbitrarily arranged sound pickup means is filtered by different filter coefficients.
In the sound collecting device having the variable filtering means and the adding means for adding the output signals of the respective first variable filtering means and outputting the addition output, instead of setting the virtual target sound source position as a point, A plurality of virtual target sound source positions are set within the sound collection range of, and a constraint condition for maintaining sensitivity within the range is realized.

【0041】[0041]

【発明の実施の形態および実施例】図1は、本発明の第
1の実施例である収音装置CS1を示すブロック図であ
る。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS FIG. 1 is a block diagram showing a sound collecting device CS1 which is a first embodiment of the present invention.

【0042】収音装置CS1は、マイクロホン111
11Mと、第1の可変フィルタ13B 1〜13BMと、第
2の可変フィルタ13A1〜13AMと、空間特性フィル
タ18 1,1〜18J,Mと、信号発生器171〜17Jと、遅
延器191〜19Jと、収音範囲設定部30と、仮想目的
音源位置設定部26と、空間特性推定部27と、適応期
間検出部20と、適応アルゴリズム部16、加算器12
1〜12M、14A、14B、15、211〜21M、22
とによって構成されている。
The sound collecting device CS1 includes a microphone 111~
11MAnd the first variable filter 13B 1~ 13BMAnd the
2 variable filter 13A1~ 13AMAnd the spatial characteristic fill
18 1,1~ 18J, MAnd the signal generator 171~ 17JAnd late
Postponement 191~ 19J, Sound collection range setting unit 30, and virtual purpose
Sound source position setting unit 26, spatial characteristic estimation unit 27, adaptation period
Interval detection unit 20, adaptive algorithm unit 16, adder 12
1~ 12M, 14A, 14B, 15, 211~ 21M, 22
It is composed of and.

【0043】収音装置CS1は、雑音を抑圧し、目的音
を高品質に収音する装置であり、予め設定した収音範囲
内にある音源の音を収音し、収音範囲外にある音源の音
を抑圧する装置である。
The sound collecting device CS1 is a device for suppressing noise and collecting a target sound with high quality. The sound collecting device CS1 collects a sound from a sound source within a preset sound collecting range and is outside the sound collecting range. It is a device that suppresses the sound of the sound source.

【0044】マイクロホン111〜11Mで収音された信
号は、それぞれ、第1の可変フィルタ13B1〜13BM
でフィルタリングされた後、加算器14Bで加算され、
出力される。
The signals picked up by the microphones 11 1 to 11 M are respectively received by the first variable filters 13B 1 to 13B M.
After being filtered by, it is added by the adder 14B,
Is output.

【0045】第1の可変フィルタ13B1〜13BMは、
収音範囲設定部30で設定された収音範囲に対して感度
が高く、収音範囲外にある雑音源位置に対して感度が低
くなるように、後述のように学習されたものである。加
算器14Bの出力は、目的音対雑音比(SN比)の高い
高品質な音となる。
The first variable filters 13B 1 to 13B M are
It is learned as described later so that the sensitivity is high for the sound collection range set by the sound collection range setting unit 30 and low for the noise source position outside the sound collection range. The output of the adder 14B becomes a high-quality sound having a high target sound-to-noise ratio (SN ratio).

【0046】収音装置CS1が従来例と異なる点は、仮
想目的音源位置を収音範囲として与えた点であり、この
ようにすることによって、その収音範囲内で目的音源が
移動する場合や、目的音源位置が正確に分からない場合
でも、目的音成分に大きな周波数劣化を生じず、安定し
て収音できる。
The sound collecting device CS1 is different from the conventional example in that the virtual target sound source position is given as a sound collecting range. By doing so, when the target sound source moves within the sound collecting range, Even if the target sound source position is not exactly known, the target sound component does not undergo a large frequency deterioration and stable sound collection is possible.

【0047】次に、収音装置CS1において、第1の可
変フィルタ13B1〜13BMの学習方法について具体的
に説明する。
Next, the learning method of the first variable filters 13B 1 to 13B M in the sound collecting device CS1 will be specifically described.

【0048】上記「学習」は、実際に収音した雑音と、
予め準備した仮想目的音源を用いて合成した仮想的な収
音信号と、第2の可変フィルタとを用いて行う。すなわ
ち、実際の目的音源を観測する場合、必ず雑音が混入し
た信号として観測され、しかも、目的音と雑音とを区別
することができないので、雑音が混入していない仮想目
的音源を用いる。
The above-mentioned "learning" includes the noise actually picked up,
This is performed using a virtual sound pickup signal synthesized using a virtual target sound source prepared in advance and a second variable filter. That is, when observing an actual target sound source, it is always observed as a signal in which noise is mixed, and since the target sound and noise cannot be distinguished, a virtual target sound source in which no noise is mixed is used.

【0049】まず、仮想目的音源を用いて仮想的な収音
信号を合成する動作について、説明する。
First, the operation of synthesizing a virtual sound pickup signal using a virtual target sound source will be described.

【0050】収音範囲設定部30は、収音する範囲(音
源の移動範囲、音源位置計測誤差の範囲等)を設定し、
仮想目的音源位置設定部26は、設定範囲内に一様に仮
想目的音源位置を設ける。たとえば、5cm間隔で、設
定範囲を埋め尽くす。仮想目的音源位置の間隔は、十分
に狭いことが必要である。つまり、ある仮想目的音源位
置に存在する音源から、最も離れている2つのマイクロ
ホンが収音した場合に、1つ目のマイクロホンが収音し
た時刻と、2つ目のマイクロホンが収音した時刻との差
を第1の相対遅延時間であるとし、上記音源が相隣る仮
想目的音源に移動したときに、上記1つ目のマイクロホ
ンが収音した時刻と、上記2つ目のマイクロホンが収音
した時刻の差を第2の相対遅延時間とすると、相対遅延
時間の変動(上記第1の相対遅延時間と上記第2の相対
遅延時間との差の時間)が、収音信号の最高周波数の周
期よりも小さくなるように、仮想目的音源位置の間隔を
設定する。
The sound collection range setting unit 30 sets a range in which sound is collected (range of movement of sound source, range of sound source position measurement error, etc.),
The virtual target sound source position setting unit 26 uniformly sets the virtual target sound source position within the set range. For example, the set range is filled up at intervals of 5 cm. The distance between the virtual target sound source positions needs to be sufficiently small. In other words, when the two microphones farthest from the sound source existing at a certain virtual target sound source position pick up sound, the time when the first microphone picks up the sound and the time when the second microphone picks up the sound. Is defined as the first relative delay time, and when the sound source moves to the adjacent virtual target sound source, the time when the first microphone picks up the sound and the second microphone picks up the sound. Assuming that the difference between the times is the second relative delay time, the fluctuation of the relative delay time (the time of the difference between the first relative delay time and the second relative delay time) is the maximum frequency of the sound pickup signal. The interval between the virtual target sound source positions is set so as to be smaller than the cycle.

【0051】空間特性推定部27は、設定した仮想目的
音源位置からマイクロホン位置に音が到達するまでの遅
延時間、減衰量を含む空間特性を推定し、空間特性フィ
ルタ181,1〜18J,Mの係数を設定する。
The spatial characteristic estimating unit 27 estimates the spatial characteristic including the delay time and the attenuation amount from the set virtual target sound source position until the sound reaches the microphone position, and the spatial characteristic filters 18 1,1 to 18 J, Set the coefficient of M.

【0052】信号発生器171〜17Jによって発生され
た互いに無相関で定常な信号は、空間特性フィルタ18
1,1〜18J,Mによってフィルタリングされ、マイクロホ
ン毎に、加算器211〜21Mで加算される。
The uncorrelated and stationary signals generated by the signal generators 17 1 to 17 J are spatial characteristic filters 18
It is filtered by 1,1 to 18 J, M and is added by adders 21 1 to 21 M for each microphone.

【0053】また、空間推定特性推定部27は、仮想目
的音源位置と、その位置から各マイクまでの伝達関数と
を対応付けて、予め記憶し、仮想目的音源位置に基づい
て、伝達関数を呼び出す。
Further, the space estimation characteristic estimating section 27 stores the virtual target sound source position and the transfer function from that position to each microphone in association with each other in advance, and calls the transfer function based on the virtual target sound source position. .

【0054】このように、信号発生器171〜17Jによ
って発生された互いに無相関で定常な信号を、空間特性
フィルタ181,1〜18J,Mがフィルタリングすることに
よって、仮想的に収音信号を合成することができる。
As described above, the spatial characteristic filters 18 1,1 to 18 J, M filter virtually uncorrelated and stationary signals generated by the signal generators 17 1 to 17 J, thereby virtually collecting the signals. Sound signals can be synthesized.

【0055】次に、仮想的に合成した収音信号と、実際
に収音した雑音信号とを、加算器121〜12Mが加算
し、この加算結果を、第2の可変フィルタ13A1〜1
3AMがフィルタリングした後に、加算器14Aで加算
する。この加算器14Aの出力が、仮想的に合成した収
音信号の出力である。
Next, the virtually synthesized sound pickup signal and the actually picked up noise signal are added by the adders 12 1 to 12 M , and the addition result is added to the second variable filter 13 A 1 to. 1
After 3A M has been filtered, it is added by the adder 14A. The output of the adder 14A is the output of the virtually collected sound pickup signal.

【0056】この仮想的に合成した収音信号の出力の雑
音成分が小さく、仮想目的音成分の劣化が小さければ、
高品質に収音できていることになり、減算手段としての
加算器15が、第5の加算手段としての加算器22の出
力信号から、仮想目的音の原音(第4の加算手段14A
の出力信号)を減算し、この加算器15の出力を、誤差
信号として、第2の可変フィルタ13A1〜13AMを更
新する。
If the noise component of the output of the virtually synthesized sound pickup signal is small and the deterioration of the virtual target sound component is small,
Since the sound is collected with high quality, the adder 15 as the subtraction means outputs the original sound of the virtual target sound (the fourth addition means 14A from the output signal of the adder 22 as the fifth addition means).
Output signal of the second variable filter 13A 1 to 13A M is updated by using the output of the adder 15 as an error signal.

【0057】ただし、入力から出力までの遅延を許容さ
せ、第2の可変フィルタ(学習フィルタ)の効率的学習
を可能とするために、遅延器191〜19Jで、仮想目的
音の原音に遅延を付加した後に、加算器22で加算した
信号を、加算器15による減算に使用する。
However, in order to allow the delay from the input to the output and enable the efficient learning of the second variable filter (learning filter), the delay devices 19 1 to 19 J change the original sound of the virtual target sound. After adding the delay, the signal added by the adder 22 is used for the subtraction by the adder 15.

【0058】適応アルゴリズム部16は、加算器15が
出力した誤差信号と、第2の可変フィルタ13A1〜1
3AMへの入力信号(学習信号)とに基づいて、誤差信
号の二乗平均誤差が最小となるように、第2の可変フィ
ルタの更新ベクトルを求める。
The adaptive algorithm unit 16 uses the error signal output from the adder 15 and the second variable filters 13A 1 to 1A 1.
Based on the input signal (learning signal) to 3A M , the update vector of the second variable filter is obtained so that the root mean square error of the error signal is minimized.

【0059】第1の可変フィルタ13B1〜13BM
は、第2の可変フィルタ13A1〜13AMと同じフィル
タ係数がセットされ、設定した収音範囲内の目的音源の
音を収音し、雑音を抑圧する。
The same filter coefficient as that of the second variable filters 13A 1 to 13A M is set in the first variable filters 13B 1 to 13B M , and the sound of the target sound source within the set sound collecting range is picked up, Suppress noise.

【0060】一方、マイクロホン111〜11Mの収音信
号に、実際の目的音が含まれる場合、実際の目的音源に
対して感度を低くするように学習されてしまうので、実
際の目的音が存在する場合には、フィルタの更新を停止
する必要がある。適応期間検出部20は、マイクロホン
111〜11Mで収音された信号のパワーを監視すること
によって、実際の目的音の存在を検出し、第1の可変フ
ィルタ13B1〜13BM、第2の可変フィルタ13A1
〜13AMによる適応動作を停止させる。
On the other hand, when the picked-up signals of the microphones 11 1 to 11 M include the actual target sound, the actual target sound is learned because the sensitivity is learned with respect to the actual target sound source. If so, you need to stop updating the filters. The adaptive period detection unit 20 detects the presence of the actual target sound by monitoring the power of the signals picked up by the microphones 11 1 to 11 M , and the first variable filters 13B 1 to 13B M and the second variable filter 13B 1 Variable filter 13A 1
Stop the adaptive operation by 13A M.

【0061】次に、適応アルゴリズム部16について、
詳細に説明する。
Next, regarding the adaptive algorithm section 16,
The details will be described.

【0062】適応アルゴリズムとしては、LMSアルゴ
リズム、NLMSアルゴリズム、射影アルゴリズム等が
ある。本明細書では、NLMS法を例にとって、以下
に、フィルタの収束解と修正式との導出を行う。
The adaptive algorithm includes LMS algorithm, NLMS algorithm, projection algorithm and the like. In the present specification, the NLMS method is taken as an example, and the convergent solution of the filter and the correction formula are derived below.

【0063】まず、数式で使用する記号について、説明
する。
First, the symbols used in the mathematical formulas will be described.

【0064】サンプリング周期によって離散化された時
刻をnとし、マイクロホン数をMとし、仮想目的音源数
をJとし、時刻nにi番目マイクロホン11iで収音さ
れた信号をxi(n)とし、Lサンプル分を取り出して
行列で表したものを、 x(n)=[xi(n),xi(n−1),…,xi(n
−L+1),x2(n),…,xM(n−L+1)]T とする。
Let n be the time discretized by the sampling period, M be the number of microphones, J be the number of virtual target sound sources, and x i (n) be the signal picked up by the i-th microphone 11 i at time n. , L samples are taken out and expressed in a matrix as x (n) = [x i (n), x i (n−1), ..., X i (n
−L + 1), x 2 (n), ..., X M (n−L + 1)] T.

【0065】j番目の信号発生器17jの出力信号を、
j(n)とし、j番目の信号発生器17jとi番目マイ
クロホン11iとに対する空間特性フィルタを、g
i&j(n)とし、空間特性フィルタ出力を、ui,j(n)
=gi,j(n)*vj(n)とし、Lサンプル分(フィル
タが必要とするサンプル)を取り出して行列で表したも
のを、 uj(n)=[ui,j(n),ui,j(n−1),…,u
i,j(n−L+1),u 2,j(n),…,uM,j(n−L
+1)]T とする。ただし、*は、畳み込み演算を表している。
Jth signal generator 17jOutput signal of
vj(N), and the j-th signal generator 17jAnd i-th my
Black phone 11iThe spatial characteristic filter for and is g
i & j(N), the spatial characteristic filter output is ui, j(N)
= Gi, j(N) * vj(N) and L samples (fill
The sample required by the data) is taken out and expressed in a matrix.
Of uj(N) = [ui, j(N), ui, j(N-1), ..., u
i, j(N-L + 1), u 2, j(N), ..., uM, j(N-L
+1)]T And However, * represents a convolution operation.

【0066】第2の可変フィルタ13A1〜13AM、第
1の可変フィルタ13B1〜13BMは、LタップのFI
Rフィルタとし、このフィルタ係数を、 h(n)=[hi(n),hi(n−1),…,hi(n
−L+1),h2(n) ,…,hM(n−L+1)]Tとして行列で表す。ただ
し、hi(n−p−1)は、時刻nにおけるi番目マイ
クロホンに対するフィルタのpタップ目のフィルタ係数
を表し、第2の可変フィルタ13A1〜13AMと第1の
可変フィルタ13B1〜13BMには、同一のフィルタ係
数が用いられている。
The second variable filters 13A 1 to 13A M and the first variable filters 13B 1 to 13B M are L-tap FIs.
And R filter, the filter coefficients, h (n) = [h i (n), h i (n-1), ..., h i (n
−L + 1), h 2 (n), ..., h M (n−L + 1)] T in a matrix. However, h i (n−p−1) represents the filter coefficient of the p-tap of the filter for the i-th microphone at the time n, and the second variable filters 13A 1 to 13A M and the first variable filter 13B 1 to The same filter coefficient is used for 13B M.

【0067】加算器14Aの出力を、y’(n)とし、
加算器14Bの出力を、y(n)とし、加算器15の出
力(誤差)を、e(n)とし、遅延器191〜19Jでの
遅延量を、τ0とし(通常、τ0は、第2の可変フィルタ
のタップ長の半分の長さである)、τ0は全て等しいと
する。
The output of the adder 14A is y '(n),
The output of the adder 14B is y (n), the output (error) of the adder 15 is e (n), and the delay amounts of the delay devices 19 1 to 19 J are τ 0 (normally τ 0 Is half the tap length of the second variable filter), and τ 0 are all equal.

【0068】まず、加算器15の出力(誤差)e(n)
の二乗平均を求める。この二乗平均誤差を最小とするフ
ィルタが、最適なフィルタである。
First, the output (error) e (n) of the adder 15
Find the root mean square of. The filter that minimizes this root mean square error is the optimum filter.

【0069】[0069]

【数8】 ただし、式(8)において、オーバーラインは、時間平
均を意味する。仮想目的信号vj(n)は、互いに無相
関であり、仮想目的信号と雑音とは無相関であるので、
式(8)は、次の式(9)のように変形される。
[Equation 8] However, in Formula (8), the overline means a time average. Since the virtual target signals v j (n) are uncorrelated with each other and the virtual target signal and noise are uncorrelated,
The formula (8) is transformed into the following formula (9).

【0070】[0070]

【数9】 第1の可変フィルタh(n)を、LタップのFIRフィ
ルタ(各データに定数を乗じ、これらを加算するフィル
タ)とし、式(9)を、ベクトル表記すれば、次の式
(10)のようになる。
[Equation 9] If the first variable filter h (n) is an L-tap FIR filter (a filter that multiplies each data by a constant and adds them), the equation (9) can be expressed as a vector as shown in the following equation (10). Like

【0071】[0071]

【数10】 ただし、仮想目的信号Vj(n)は、平均パワー[Equation 10] However, the virtual target signal V j (n) is the average power

【0072】[0072]

【数11】 の定常的な信号であると仮定し、また、[Equation 11] Suppose it is a stationary signal of

【0073】[0073]

【数12】 であるとする。[Equation 12] Suppose

【0074】式(10)を最小化するフィルタが最適な
フィルタであるので、式(10)をh(n)で偏微分
し、0とおいて、極小点を求める。
Since the filter that minimizes the equation (10) is the optimum filter, the equation (10) is partially differentiated by h (n) and is set to 0 to find the minimum point.

【0075】[0075]

【数13】 上記式(11)を、h(n)について解けば、上記式
(10)を最小化する最適フィルタh(opt,n)が
求められる。
[Equation 13] By solving the above equation (11) for h (n), the optimum filter h (opt, n) that minimizes the above equation (10) is obtained.

【0076】[0076]

【数14】 上記式(12)の最適フィルタを求める方法として、L
MSアルゴリズム、NLMSアルゴリズム、射影アルゴ
リズム等の適応アルゴリズムがある。
[Equation 14] As a method of obtaining the optimum filter of the above formula (12), L
There are adaptive algorithms such as MS algorithm, NLMS algorithm, and projection algorithm.

【0077】本明細書ではNLMSアルゴリズムを例に
とって説明することとし、修正式は、次の式(13)で
表される。
In this specification, the NLMS algorithm will be described as an example, and the modified equation is expressed by the following equation (13).

【0078】 h(n+1)=h(n)+2α[{x’(n)e(n)}/{x’(n)x’ T (n)}] …… 式(13) ただし、x’(n)は、次の式(14)で表される。[0078]   h (n + 1) = h (n) + 2α [{x '(n) e (n)} / {x' (n) x ' T (N)}] ... Equation (13) However, x '(n) is represented by the following formula (14).

【0079】[0079]

【数15】 ここまでの説明で、式(13)の修正式を用いて、式
(12)の最適フィルタを求めることができることを示
した。
[Equation 15] In the description so far, it has been shown that the optimum filter of Expression (12) can be obtained by using the modified expression of Expression (13).

【0080】収音装置CS1は、音声認識、ハンズフリ
ー電話、テレビカメラ、通信会議、遠隔講義、異常音監
視等の収音装置として利用することができ、予め設定し
た収音範囲内に仮想目的音源位置を複数設定することに
よって、その範囲内の感度を保つような拘束条件を実現
し、収音範囲内にある目的音源を、低い周波数特性の劣
化で収音でき、範囲外の雑音を抑圧することができる。
また、範囲内で目的音源が移動しても、フィルタ修正の
必要がなく、音源移動による性能低下がない。
The sound collecting device CS1 can be used as a sound collecting device for voice recognition, hands-free telephone, TV camera, communication conference, remote lecture, abnormal sound monitoring, etc., and a virtual object is set within a preset sound collecting range. By setting multiple sound source positions, a constraint condition that keeps the sensitivity within that range is realized, and the target sound source within the sound collection range can be picked up due to deterioration of low frequency characteristics, and noise outside the range is suppressed. can do.
Further, even if the target sound source moves within the range, it is not necessary to modify the filter, and the performance does not deteriorate due to the movement of the sound source.

【0081】上記のように、上記実施例は、目的音源が
動く場合や、目的音源位置が正確に分からない場合で
も、高品質な収音ができるという従来例にはない優れた
特徴を有する。
As described above, the above-described embodiment has an excellent feature that high-quality sound can be collected even when the target sound source is moving or when the position of the target sound source is not exactly known, which is not available in the prior art.

【0082】つまり、収音装置CS1は、任意に配置さ
れている複数の収音手段が収音した収音信号を、それぞ
れ異なるフィルタ係数によってフィルタリングする第1
の可変フィルタリング手段と、上記各第1の可変フィル
タリング手段の出力信号を加算し、加算出力を出力する
第1の加算手段14Bとを有する収音装置において、所
定の収音範囲を設定する収音範囲設定手段30と、上記
収音範囲内に、複数の仮想目的音源位置を設定する仮想
目的音源位置設定手段26と、上記各仮想目的音源位置
と上記各収音手段の位置とに基づいて、上記各仮想目的
音源位置から上記各収音手段の位置に音が到達するまで
の遅延時間、減衰量を含む空間特性を推定する空間特性
推定手段27と、互いに無相関で定常な擬似目的信号
を、上記仮想目的音源位置の数と同数だけ発生させる擬
似目的信号発生手段17と、上記空間特性推定手段によ
って推定された各空間特性をフィルタ係数とし、上記各
擬似目的信号のそれぞれをフィルタリングする空間特性
フィルタリング手段18と、上記各空間特性フィルタリ
ング手段の各出力信号を、上記各収音手段毎に、それぞ
れ加算することによって、擬似目的音収音信号を合成す
る第2の加算手段21と、上記各擬似目的音収音信号と
上記各収音信号とをそれぞれ加算することによって、学
習信号を合成する第3の加算手段12と、上記合成され
た学習信号を、それぞれ異なるフィルタ係数でフィルタ
リングする第2の可変フィルタリング手段13と、上記
各第2の可変フィルタリング手段の出力信号を互いに加
算する第4の加算手段14と、上記各擬似目的信号をそ
れぞれ遅延させる遅延手段19と、上記遅延手段19か
らの各遅延出力信号同士を加算する第5の加算手段22
と、上記第5の加算手段22の出力信号から、上記第4
の加算手段14の出力信号を減算することによって、誤
差信号を求める減算手段15と、上記収音信号に基づい
て、上記収音範囲内に音源が存在しない期間を検出し、
この検出された期間を、適応させるべき期間として検出
する適応期間検出部20と、上記適応期間検出部によっ
て検出された収音範囲内に音源が存在しない期間に、上
記誤差信号の二乗平均値が最小になるように、上記第2
の可変フィルタ係数と上記第1の可変フィルタ係数とを
更新する適応アルゴリズム手段16とを有する収音装置
である。
That is, the sound collecting device CS1 filters the sound collecting signals picked up by a plurality of arbitrarily arranged sound collecting means by different filter coefficients.
In the sound collecting device having the variable filtering means of No. 1 and the first adding means 14B for adding the output signals of the respective first variable filtering means and outputting the addition output. Based on the range setting means 30, the virtual target sound source position setting means 26 for setting a plurality of virtual target sound source positions within the sound collection range, the virtual target sound source positions and the positions of the sound collecting means, Spatial characteristic estimating means 27 for estimating a spatial characteristic including a delay time and an attenuation amount from the virtual target sound source position until the sound reaches the position of each sound collecting means, and a pseudo target signal which is uncorrelated with each other and is stationary. , Pseudo target signal generating means 17 for generating the same number as the number of virtual target sound source positions, and each spatial characteristic estimated by the spatial characteristic estimating means as a filter coefficient. A second addition for synthesizing the pseudo target sound pickup signal by adding the output signals of the spatial characteristic filtering means 18 for filtering it and the output signals of the spatial characteristic filtering means for each of the sound collecting means. Means 21, third adding means 12 for synthesizing a learning signal by adding each of the pseudo target sound pickup signals and each of the sound pickup signals, and the synthesized learning signal by different filters. Second variable filtering means 13 for filtering with a coefficient, fourth adding means 14 for adding output signals of the second variable filtering means to each other, and delay means 19 for delaying the pseudo target signals, respectively. Fifth addition means 22 for adding the respective delayed output signals from the delay means 19
And from the output signal of the fifth adding means 22, the fourth
Subtracting the output signal of the adding means 14 to obtain an error signal, and detecting a period during which no sound source exists within the sound collecting range based on the sound collecting signal,
During the period in which the sound source does not exist within the sound collection range detected by the adaptive period detecting unit 20 and the adaptive period detecting unit that detects the detected period as the period to be adapted, the root mean square value of the error signal is The second, above, to minimize
Of the variable filter coefficient and the adaptive algorithm means 16 for updating the first variable filter coefficient.

【0083】図2は、上記実施例の特徴を、従来例との
比較で説明する図である。
FIG. 2 is a diagram for explaining the features of the above embodiment in comparison with the conventional example.

【0084】従来例は、単一仮想目的音源を用いる装置
であり、一方、上記実施例は、単一仮想目的音源を用い
る装置(AMNOR等)において、仮想目的信号源が複
数になったものであり、図2に示すように、所定の範囲
に互いに無相関な仮想目的信号源を複数設定することに
よって、その範囲内の感度を保つような拘束条件を実現
するものである。
The conventional example is an apparatus using a single virtual target sound source, while the above embodiment is an apparatus using a single virtual target sound source (AMNOR, etc.) in which a plurality of virtual target signal sources are provided. Therefore, as shown in FIG. 2, a plurality of virtual target signal sources that are uncorrelated with each other are set in a predetermined range to realize a constraint condition that maintains the sensitivity within the range.

【0085】図3は、上記実施例の構成を、従来例の構
成との比較で説明する図である。
FIG. 3 is a diagram for explaining the configuration of the above embodiment in comparison with the configuration of the conventional example.

【0086】図3(1)は、従来例(AMNOR等単一
仮想目的音源を用いる装置)の基本構成を示す図であ
り、一方、図3(2)は、上記実施例の基本構成を示す
図である。
FIG. 3 (1) is a diagram showing the basic configuration of a conventional example (apparatus using a single virtual target sound source such as AMNOR), while FIG. 3 (2) shows the basic configuration of the above embodiment. It is a figure.

【0087】AMNOR等では、1点の位置に感度を保
つように学習させるので、話者が設定位置からずれた場
合に目的音に周波数特性の劣化が生じる。一方、上記実
施例では、互いに無相関な信号を発生する信号発生器を
複数持っており、これによって、複数の仮想目的音源が
ある状況を模擬し、設定範囲内の感度を保つような拘束
条件を実現する。このようにすることによって、設定範
囲内に存在する音源の信号は、大きな周波数特性の劣化
なしに収音でき、範囲外の雑音を抑圧することができ
る。また、範囲内で音源が移動しても、フィルタ修正の
必要がなく、音源移動による性能低下がない。
In AMNOR and the like, the learning is performed so that the sensitivity is maintained at one position, so that the frequency characteristic of the target sound deteriorates when the speaker deviates from the set position. On the other hand, in the above embodiment, a plurality of signal generators that generate mutually uncorrelated signals are provided, thereby simulating a situation in which there are a plurality of virtual target sound sources, and a constraint condition for maintaining sensitivity within a setting range. To realize. By doing so, the signal of the sound source existing within the set range can be picked up without significant deterioration of the frequency characteristic, and the noise outside the range can be suppressed. Further, even if the sound source moves within the range, it is not necessary to modify the filter, and the performance does not deteriorate due to the movement of the sound source.

【0088】図4は、本発明の第2の実施例である収音
装置CS2を示すブロック図である。
FIG. 4 is a block diagram showing a sound collecting device CS2 which is a second embodiment of the present invention.

【0089】収音装置CS2は、収音装置CS1におい
て、第1の可変フィルタ13B1〜13BMを、半固定フ
ィルタ(フィルタ係数を保持しつつ、フィルタ係数を書
き換え可能なフィルタ)231〜23Mに置き換え、マイ
クロホン111〜11Mと加算器211〜21Mとの間に、
収音信号記憶部25を設け、適応アルゴリズム部16と
半固定フィルタ231〜23Mとの間に、フィルタ係数記
憶部24を設け、適応期間検出部20を取り除いた点
が、収音装置CS1と異なる点である。
In the sound collecting device CS2, in the sound collecting device CS1, the first variable filters 13B 1 to 13B M are replaced with semi-fixed filters (filters in which the filter coefficient can be rewritten while holding the filter coefficient) 23 1 to 23. M , and between the microphones 11 1 to 11 M and the adders 21 1 to 21 M ,
The sound pickup device CS1 is provided with the sound pickup signal storage unit 25, the filter coefficient storage unit 24 provided between the adaptive algorithm unit 16 and the semi-fixed filters 23 1 to 23 M, and the adaptation period detection unit 20 removed. Is different from.

【0090】まず、収音装置CS2において、目的音の
収音を行う前に、雑音のみを収音信号記憶部25に記憶
し、次に、収音信号記憶部25が記憶した収音信号を出
力し、収音装置CS1と同様に、第2の可変フィルタ1
3A1〜13AMの更新を行い、第2の可変フィルタ13
1〜13AMが十分に収束するまで学習を行う。
First, in the sound collection device CS2, only noise is stored in the sound collection signal storage unit 25 before the collection of the target sound, and then the sound collection signal stored in the sound collection signal storage unit 25 is stored. The second variable filter 1 which outputs and outputs sound
3A 1 to 13A M are updated, and the second variable filter 13 is updated.
Performs learning to A 1 ~13A M is sufficiently converged.

【0091】このときに、上記のように、記憶している
収音信号には目的音が含まれていないので、適応動作を
停止する必要はなく、適応期間検出部20を設ける必要
がない 。
At this time, as described above, since the stored sound pickup signal does not include the target sound, it is not necessary to stop the adaptive operation, and it is not necessary to provide the adaptive period detecting section 20.

【0092】十分に学習された第2の可変フィルタ13
1〜13AMにおけるフィルタ係数と同じフィルタ係数
を、適応アルゴリズム部16からフィルタ係数記憶部2
4に転送し、フィルタ係数記憶部24は、上記転送され
たフィルタ係数を記憶する。フィルタ係数記憶部24
は、半固定フィルタ231〜23Mにフィルタ係数をセッ
トし、目的収音時には、半固定フィルタ231〜23M
を固定して使用する。
Fully learned second variable filter 13
The same filter coefficient as that of A 1 to 13 A M is supplied from the adaptive algorithm unit 16 to the filter coefficient storage unit 2
4 and the filter coefficient storage unit 24 stores the transferred filter coefficient. Filter coefficient storage unit 24
Sets the filter coefficients in the semi-fixed filter 23 1 ~ 23 M, at the time of object sound collection, a semi-fixed filter 23 1 ~23M
Fixed and used.

【0093】このようにすることによって、マイクロホ
ン111〜11Mと、半固定フィルタ231〜23Mと、加
算器14Bとを、他の部分から切り離して使用すること
が可能であり、可搬性、省スペース性に優れるという利
点がある。
By doing so, it is possible to use the microphones 11 1 to 11 M , the semi-fixed filters 23 1 to 23 M, and the adder 14 B separately from the other parts, which is portable. There is an advantage that it is excellent in space saving.

【0094】また、フィルタを学習する処理を実行する
場合、実時間で計算する必要がないので、少ないハード
ウェアで構成することができ、パーソナルコンピュータ
等の汎用計算機でも、フィルタを学習する処理のための
計算が可能である。ただし、収音装置CS2では、半固
定フィルタ231〜23Mのフィルタ係数が固定であるの
で、雑音源の移動に対しては追従できないという不利な
点もある。
Further, when the process of learning the filter is executed, since it is not necessary to perform the calculation in real time, it can be configured with a small amount of hardware, and even a general-purpose computer such as a personal computer can perform the process of learning the filter. Can be calculated. However, in the sound collecting device CS2, since the filter coefficients of the semi-fixed filters 23 1 to 23 M are fixed, there is a disadvantage that the movement of the noise source cannot be followed.

【0095】収音装置CS2におけるその他の構成につ
いては、収音装置CS1と同じであるので、説明を省略
する。
The rest of the configuration of the sound collecting device CS2 is the same as that of the sound collecting device CS1, and therefore its explanation is omitted.

【0096】なお、収音信号記憶部25は、各収音手段
11と各第3の加算手段12との間に設けられ、上記各
収音信号を記憶する収音信号記憶手段の例である。フィ
ルタ係数記憶部24は、適応アルゴリズム手段16と各
第1の可変フィルタリング手段13との間に設けられ、
上記第1の可変フィルタ係数を記憶するフィルタ係数記
憶手段の例である。
The picked-up signal storage unit 25 is an example of picked-up signal storage unit that is provided between each picked-up unit 11 and each third addition unit 12, and stores each picked-up signal. . The filter coefficient storage unit 24 is provided between the adaptive algorithm unit 16 and each first variable filtering unit 13,
It is an example of a filter coefficient storage means for storing the first variable filter coefficient.

【0097】図5は、本発明の第3の実施例である収音
装置CS3を示す構成図である。
FIG. 5 is a block diagram showing a sound collecting device CS3 which is a third embodiment of the present invention.

【0098】収音装置CS3は、収音装置CS1または
収音装置CS2において、空間特性フィルタ181,1
18J,Mを、遅延器281,1〜28J,Mに置き換え、空間
特性推定部27を、距離計算部271とマイクロホン間
相対遅延量計算部272とによって実現した装置であ
る。
The sound collecting device CS3 is the same as the sound collecting device CS1 or the sound collecting device CS2 except that the spatial characteristic filters 18 1,1 ...
18 J, M is replaced with delay devices 28 1,1 to 28 J, M , and the spatial characteristic estimating unit 27 is realized by a distance calculating unit 271 and an inter-microphone relative delay amount calculating unit 272.

【0099】これら以外の構成要素は、収音装置CS1
または収音装置CS2における構成要素と同じであるの
で、図5では、それらを省略して示してある。
The components other than these are the sound collecting device CS1.
Alternatively, since they are the same as the constituent elements of the sound collecting device CS2, they are omitted in FIG.

【0100】距離計算部271は、仮想目的音源位置と
マイクロホン位置との間の距離を計算する部分であり、
マイクロホン間相対遅延量計算部272は、距離計算部
271が出力した距離を音速で除算して遅延時間を求
め、遅延時間の最小値を、各遅延時間から減算し、マイ
クロホン間相対遅延量を求め、遅延器281,1〜28J,M
にセットする。
The distance calculation section 271 is a section for calculating the distance between the virtual target sound source position and the microphone position,
The inter-microphone relative delay amount calculation unit 272 obtains the delay time by dividing the distance output by the distance calculation unit 271 by the sound velocity, subtracts the minimum delay time value from each delay time, and obtains the inter-microphone relative delay amount. , Delay device 28 1,1 to 28 J, M
Set to.

【0101】収音装置CS3では、空間特性を遅延のみ
で置き換えることによって、計算量が軽減され、少ない
ハードウェアで構成することができるという利点があ
る。
The sound collecting device CS3 has an advantage that the calculation amount is reduced and the hardware can be configured with a small amount of hardware by replacing the spatial characteristic with only the delay.

【0102】収音装置CS3におけるその他の構成につ
いては、収音装置CS1または収音装置CS2と同じで
あるので、説明を省略する。
Since the other structure of the sound collecting device CS3 is the same as that of the sound collecting device CS1 or the sound collecting device CS2, the description thereof will be omitted.

【0103】つまり、収音装置CS3は、任意に配置さ
れている複数の収音手段が収音した収音信号を、それぞ
れ異なるフィルタ係数によってフィルタリングする第1
の可変フィルタリング手段と、上記各第1の可変フィル
タリング手段の出力信号を加算し、加算出力を出力する
第1の加算手段14Bとを有する収音装置において、所
定の収音範囲を設定する収音範囲設定手段30と、上記
収音範囲内に、複数の仮想目的音源位置を設定する仮想
目的音源位置設定手段26と、上記各仮想目的音源位置
と上記各収音手段の位置とに基づいて、上記各仮想目的
音源位置から上記各収音手段の位置に音が到達するまで
の遅延時間、減衰量を含む空間特性を推定する空間特性
推定手段であり、上記各仮想目的音源位置から上記各収
音手段11の位置までの距離を計算する距離計算手段2
71と、上記距離計算手段271によって計算された距
離と音速とから、上記各収音手段11間の相対遅延量を
求める収音手段間相対遅延量計算手段272とを含む空
間特性推定手段27と、互いに無相関で定常な擬似目的
信号を、上記仮想目的音源位置の数と同数だけ発生させ
る擬似目的信号発生手段17と、信号発生手段17が出
力した擬似目的信号を、上記収音手段間相対遅延量計算
手段272が求めた相対遅延量だけ遅延させる複数の第
1の遅延手段28と、上記各遅延手段の各出力信号を、
上記各収音手段毎に、それぞれ加算することによって、
擬似目的音収音信号を合成する第2の加算手段21と、
上記各擬似目的音収音信号と上記各収音信号とをそれぞ
れ加算することによって、学習信号を合成する第3の加
算手段12と、上記合成された学習信号を、それぞれ異
なるフィルタ係数でフィルタリングする第2の可変フィ
ルタリング手段13と、上記各第2の可変フィルタリン
グ手段の出力信号を互いに加算する第4の加算手段14
と、上記各擬似目的信号をそれぞれ遅延させる第2の遅
延手段19と、上記第2の遅延手段19からの各遅延出
力信号同士を加算する第5の加算手段22と、 上記第
5の加算手段22の出力信号から、上記第4の加算手段
14の出力信号を減算することによって、誤差信号を求
める減算手段15と、上記収音信号に基づいて、上記収
音範囲内に音源が存在しない期間を検出し、この検出さ
れた期間を、適応させるべき期間として検出する適応期
間検出部20と、上記適応期間検出部によって検出され
た収音範囲内に音源が存在しない期間に、上記誤差信号
の二乗平均値が最小になるように、上記第2の可変フィ
ルタ係数と上記第1の可変フィルタ係数とを更新する適
応アルゴリズム手段16とを有する収音装置の例であ
る。
That is, the sound collecting device CS3 filters the sound collecting signals picked up by a plurality of arbitrarily arranged sound collecting means by different filter coefficients.
In the sound collecting device having the variable filtering means of No. 1 and the first adding means 14B for adding the output signals of the respective first variable filtering means and outputting the addition output. Based on the range setting means 30, the virtual target sound source position setting means 26 for setting a plurality of virtual target sound source positions within the sound collection range, the virtual target sound source positions and the positions of the sound collecting means, It is a spatial characteristic estimating means for estimating a spatial characteristic including a delay time from the virtual target sound source position until the sound reaches the position of each of the sound collecting means, an attenuation amount, and each of the virtual target sound source positions for collecting the respective spatial characteristics. Distance calculation means 2 for calculating the distance to the position of the sound means 11.
71 and a spatial characteristic estimating means 27 including a sound collecting means relative delay amount calculating means 272 for obtaining a relative delay amount between the sound collecting means 11 from the distance and the sound velocity calculated by the distance calculating means 271. , Pseudo target signal generating means 17 for generating the same number of pseudo target signals that are uncorrelated with each other and are stationary as many as the number of virtual target sound source positions, and the pseudo target signal output from the signal generating means 17 are compared between the sound collecting means. A plurality of first delay means 28 for delaying the relative delay amount obtained by the delay amount calculation means 272, and respective output signals of the respective delay means,
By adding up for each of the above sound collecting means,
Second adding means 21 for synthesizing the pseudo target sound pickup signal,
Third adding means 12 for synthesizing a learning signal by adding each of the pseudo target sound collecting signals and each of the sound collecting signals, and the synthesized learning signal are filtered by different filter coefficients. The second variable filtering means 13 and the fourth adding means 14 for adding the output signals of the respective second variable filtering means to each other.
A second delaying means 19 for delaying the pseudo target signals, a fifth adding means 22 for adding the delayed output signals from the second delaying means 19, and a fifth adding means. A subtraction means 15 for obtaining an error signal by subtracting the output signal of the fourth adding means 14 from the output signal of 22, and a period during which no sound source exists within the sound collecting range based on the sound collecting signal. Is detected and the detected period is detected as a period to be adapted, and a period during which no sound source exists within the sound collection range detected by the adaptive period detection unit. It is an example of a sound pickup device having an adaptive algorithm means 16 for updating the second variable filter coefficient and the first variable filter coefficient so that the root mean square value is minimized.

【0104】図6は、本発明の第4の実施例である収音
装置CS4の構成を示す図である。
FIG. 6 is a diagram showing the configuration of a sound collecting device CS4 which is the fourth embodiment of the present invention.

【0105】収音装置CS4は、収音装置CS1または
収音装置CS2において、空間特性フィルタ181,1
18J,Mを、遅延器281,1〜28J,Mとゲイン(増幅
器)29 1,1〜29J,Mとに置き換え、空間特性推定部2
7を、距離計算部271と、マイクロホンとの間の相対
遅延量計算部272と、マイクロホン間相対減衰量計算
部273とによって実現した装置である。
The sound collecting device CS4 is the sound collecting device CS1 or
In the sound collection device CS2, the spatial characteristic filter 181,1~
18J, MDelay device 281,1~ 28J, MAnd gain (amplification
Vessel) 29 1,1~ 29J, MAnd the spatial characteristic estimation unit 2
7 is the relative distance between the distance calculator 271 and the microphone.
Delay amount calculation unit 272 and relative attenuation amount calculation between microphones
The device realized by the unit 273.

【0106】これら以外の構成要素は、収音装置CS1
または収音装置CS2における構成要素と同じであるの
で、図6では、それらを省略して示してある。
The components other than these are the sound collecting device CS1.
Alternatively, since they are the same as the constituent elements of the sound collecting device CS2, they are omitted in FIG.

【0107】距離計算部271は、仮想目的音源位置と
マイクロホン位置との間の距離を計算する。マイクロホ
ン間相対遅延量計算部272は、距離計算部271が出
力した距離を音速で除算し、遅延時間を求め、遅延時間
の最小値を、各遅延時間から減算して、マイクロホン間
相対遅延量を求め、遅延器281,1〜28J,Mにセットす
る。
The distance calculator 271 calculates the distance between the virtual target sound source position and the microphone position. The inter-microphone relative delay amount calculation unit 272 divides the distance output by the distance calculation unit 271 by the speed of sound to obtain the delay time, and subtracts the minimum delay time value from each delay time to obtain the inter-microphone relative delay amount. Obtained and set to the delay devices 28 1,1 to 28 J, M.

【0108】マイクロホン間相対減衰量計算部272
は、距離計算部271が出力した距離の逆数を求め、減
衰量を求め、基準となるマイクロホンの減衰量を各減衰
量から減算し、マイクロホン間相対減衰量を求め、遅延
器281,1〜28J,Mにセットする。
Inter-microphone relative attenuation amount calculation section 272
Calculates the reciprocal of the distance output by the distance calculation unit 271, obtains the attenuation amount, subtracts the attenuation amount of the reference microphone from each attenuation amount, obtains the relative attenuation amount between the microphones, and delay devices 28 1,1 ... Set to 28 J, M.

【0109】収音装置CS4では、上記空間特性を、遅
延と減衰とのみで置き換える装置であり、これによっ
て、計算量が軽減され、少ないハードウェアで構成する
ことができる。
The sound collecting device CS4 is a device that replaces the above-mentioned spatial characteristics only with delay and attenuation, and this reduces the amount of calculation and can be configured with less hardware.

【0110】また、収音装置CS4は、収音装置CS3
よりも、計算量が多いが、球面波モデルを仮定するよう
なマイクロホンの配置の場合(マイクロホンと音源との
間の距離に対して、マイクロホンアレーのサイズが長い
場合)でも、空間特性を良く近似し、良好な結果が得ら
れる。
The sound collecting device CS4 is the sound collecting device CS3.
Although it requires more calculation than the above, the spatial characteristics are well approximated even in the case of microphone placement that assumes a spherical wave model (when the microphone array size is long with respect to the distance between the microphone and the sound source). And good results are obtained.

【0111】収音装置CS4におけるその他の構成は、
収音装置CS1または収音装置CS2と同じであるの
で、説明を省略する。
Other configurations of the sound collecting device CS4 are as follows.
Since it is the same as the sound collecting device CS1 or the sound collecting device CS2, the description thereof will be omitted.

【0112】つまり、収音装置CS4は、任意に配置さ
れている複数の収音手段が収音した収音信号を、それぞ
れ異なるフィルタ係数によってフィルタリングする第1
の可変フィルタリング手段と、上記各第1の可変フィル
タリング手段の出力信号を加算し、加算出力を出力する
第1の加算手段14Bとを有する収音装置において、所
定の収音範囲を設定する収音範囲設定手段30と、上記
収音範囲内に、複数の仮想目的音源位置を設定する仮想
目的音源位置設定手段26と、上記各仮想目的音源位置
と上記各収音手段の位置とに基づいて、上記各仮想目的
音源位置から上記各収音手段の位置に音が到達するまで
の遅延時間、減衰量を含む空間特性を推定する空間特性
推定手段27であり、上記各仮想目的音源位置から上記
各収音手段の位置までの距離を計算する距離計算手段2
71と、上記距離計算手段271によって計算された距
離と音速とから、上記各収音手段間の相対遅延量を求め
る収音手段間相対遅延量計算手段272と、上記距離計
算手段272によって計算された距離から、収音手段間
の相対減衰量を求める収音手段間相対減衰量計算手段2
73とを含む空間特性推定手段27と、互いに無相関で
定常な擬似目的信号を、上記仮想目的音源位置の数と同
数だけ発生させる擬似目的信号発生手段17と、信号発
生手段が出力した擬似目的信号を、上記収音手段間相対
遅延量計算手段272が求めた相対遅延量だけ遅延させ
る複数の第1の遅延手段28と、上記複数の遅延手段2
8のそれぞれが出力した擬似目的信号を、上記収音手段
間相対減衰量計算手段273が求めた相対減衰量だけ減
衰させる複数のゲイン手段29と、上記各ゲイン手段の
各出力信号を、上記各収音手段毎に、それぞれ加算する
ことによって、擬似目的音収音信号を合成する第2の加
算手段21と、上記各擬似目的音収音信号と上記各収音
信号とをそれぞれ加算することによって、学習信号を合
成する第3の加算手段12と、上記合成された学習信号
を、それぞれ異なるフィルタ係数でフィルタリングする
第2の可変フィルタリング手段13と、上記各第2の可
変フィルタリング手段の出力信号を互いに加算する第4
の加算手段14と、上記各擬似目的信号をそれぞれ遅延
させる第2の遅延手段19と、上記第2の遅延手段19
からの各遅延出力信号同士を加算する第5の加算手段2
2と、上記第5の加算手段22の出力信号から、上記第
4の加算手段14の出力信号を減算することによって、
誤差信号を求める減算手段15と、上記収音信号に基づ
いて、上記収音範囲内に音源が存在しない期間を検出
し、この検出された期間を、適応させるべき期間として
検出する適応期間検出部20と、上記適応期間検出部に
よって検出された収音範囲内に音源が存在しない期間
に、上記誤差信号の二乗平均値が最小になるように、上
記第2の可変フィルタ係数と上記第1の可変フィルタ係
数とを更新する適応アルゴリズム手段16とを有する収
音装置の例である。
That is, the sound collecting device CS4 filters the sound collecting signals collected by a plurality of arbitrarily arranged sound collecting means by different filter coefficients.
In the sound collecting device having the variable filtering means of No. 1 and the first adding means 14B for adding the output signals of the respective first variable filtering means and outputting the addition output. Based on the range setting means 30, the virtual target sound source position setting means 26 for setting a plurality of virtual target sound source positions within the sound collection range, the virtual target sound source positions and the positions of the sound collecting means, Spatial characteristic estimating means 27 for estimating a spatial characteristic including a delay time from the virtual target sound source position until the sound reaches the position of the sound collecting means and an attenuation amount. Distance calculating means 2 for calculating the distance to the position of the sound collecting means
71, the relative delay amount calculation means 272 between the sound collecting means for obtaining the relative delay amount between the respective sound collecting means from the distance calculated by the distance calculation means 271 and the sound velocity, and the distance calculation means 272. Relative attenuation amount calculating means 2 between the sound collecting means for obtaining the relative attenuation amount between the sound collecting means from the distance
Spatial characteristic estimating means 27 including 73, pseudo target signal generating means 17 for generating the same number of pseudo target signals that are uncorrelated with each other and are stationary, and the pseudo target signal output by the signal generating means. A plurality of first delay means 28 for delaying the signal by the relative delay amount calculated by the sound pickup means relative delay amount calculation means 272, and the plurality of delay means 2
A plurality of gain means 29 for attenuating the pseudo target signal output by each of the above 8 by the relative attenuation amount calculated by the inter-sound collecting means relative attenuation amount calculating means 273, and each output signal of each gain means, Second adding means 21 for synthesizing the pseudo target sound collecting signal by adding each sound collecting means, and adding each of the pseudo target sound collecting signal and each of the sound collecting signals. , A third adding means 12 for synthesizing the learning signal, a second variable filtering means 13 for filtering the synthesized learning signal with different filter coefficients, and an output signal of each of the second variable filtering means. Fourth adding to each other
Adding means 14, second delay means 19 for delaying each of the pseudo target signals, and second delay means 19
Fifth addition means 2 for adding each delayed output signal from
2 by subtracting the output signal of the fourth adding means 14 from the output signal of the fifth adding means 22,
A subtraction unit 15 for obtaining an error signal, and an adaptive period detection unit for detecting a period during which no sound source exists within the sound collection range based on the sound collection signal and detecting the detected period as a period to be adapted. 20 and the second variable filter coefficient and the first variable filter coefficient so that the root mean square value of the error signal is minimized during a period in which no sound source exists within the sound collection range detected by the adaptive period detection unit. It is an example of a sound pickup device having an adaptive algorithm means 16 for updating a variable filter coefficient.

【0113】図7は、上記各実施例における適応期間検
出部20の1つの具体例である適応期間検出部20aを
示すブロック図である。
FIG. 7 is a block diagram showing an adaptive period detecting section 20a which is one specific example of the adaptive period detecting section 20 in each of the above embodiments.

【0114】適応期間検出部20aは、短時間平均パワ
ー計集部201と、雑音パワー設定部202と、閾値係
数乗算部205と、パワー比較部203とによって構成
されている。
The adaptive period detecting section 20a comprises a short-time average power collecting section 201, a noise power setting section 202, a threshold coefficient multiplying section 205, and a power comparing section 203.

【0115】短時間平均パワー計算部201は、マイク
ロホンで111〜11Mで収音した信号のうちで、1チャ
ネルまたは複数チャネル平均の短時間平均パワーを求
め、出力する。なお、上記短時間は、たとえば、10〜
100msecである。
The short-time average power calculation unit 201 obtains and outputs the short-time average power of the average of one channel or a plurality of channels among the signals picked up by the microphones 11 1 to 11 M. The short time is, for example, 10 to 10.
It is 100 msec.

【0116】雑音パワー設定部202は、予め測定した
雑音パワーの長時間平均を求め、その雑音パワー(一定
値)を出力する。なお、上記長時間は、たとえば、1〜
10secである。
The noise power setting unit 202 obtains a long-time average of the noise power measured in advance and outputs the noise power (constant value). Note that the above-mentioned long time is, for example, 1 to
It is 10 seconds.

【0117】閾値係数乗算部205は、雑音パワー設定
部202の出力に閾値係数を乗算し、閾値として設定す
る。上記閾値係数は、雑音の短時間平均パワーの変動の
大きさに応じて決定し、たとえば、雑音の短時間平均パ
ワーが、長時間平均を中心に10%の変動がある場合、
閾値係数は1.1に設定される。
Threshold coefficient multiplying section 205 multiplies the output of noise power setting section 202 by a threshold coefficient and sets it as a threshold. The threshold coefficient is determined according to the magnitude of the fluctuation of the short-time average power of noise. For example, when the short-time average power of noise has a fluctuation of 10% around the long-term average,
The threshold coefficient is set to 1.1.

【0118】パワー比較部203は、短時間平均パワー
計算部201の出力と、閾値係数乗算部205が設定し
た閾値とを比較し、短時間平均パワーが上記閾値を超え
た場合に、適応アルゴリズム部16に、適応動作停止信
号を出力する。
The power comparison unit 203 compares the output of the short-time average power calculation unit 201 with the threshold value set by the threshold coefficient multiplication unit 205, and if the short-time average power exceeds the threshold value, the adaptive algorithm unit. An adaptive operation stop signal is output to 16.

【0119】適応期間検出部20aを上記のように構成
すると、雑音の定常性と目的音の非定常性とに注目した
目的音検出を行っており、簡単な処理で目的音の検出が
できるという利点を持つ。
When the adaptive period detecting section 20a is configured as described above, the target sound is detected by paying attention to the steadiness of noise and the non-stationarity of the target sound, and the target sound can be detected by a simple process. Have an advantage.

【0120】つまり、適応期間検出手段20aは、収音
信号の短時間平均パワーを計算する短時間平均パワー計
算手段201と、予め測定した雑音の長時間平均パワー
を設定する雑音パワー設定手段202と、上記雑音パワ
ーに閾値係数を乗じた値を閾値として設定する閾値設定
手段205と、上記閾値と上記短時間平均パワーとを比
較して、適応期間を検出するパワー比較部203とを含
む手段の例である。
That is, the adaptive period detecting means 20a includes the short-time average power calculating means 201 for calculating the short-time average power of the picked-up signal, and the noise power setting means 202 for setting the long-time average power of noise measured in advance. , A threshold value setting means 205 for setting a value obtained by multiplying the noise power by a threshold coefficient as a threshold value, and a power comparing section 203 for comparing the threshold value with the short-time average power to detect an adaptive period. Here is an example.

【0121】図8は、上記各実施例における適応期間検
出部20の別の具体例である適応期間検出部20bを示
すブロック図である。
FIG. 8 is a block diagram showing an adaptation period detecting section 20b which is another specific example of the adaptation period detecting section 20 in each of the above embodiments.

【0122】適応期間検出部20bは、短時間平均パワ
ー計算部201と、長時間平均パワー計算部204と、
閾値係数乗算部205と、パワー比較部203とを有す
る。
The adaptive period detecting section 20b includes a short-time average power calculating section 201, a long-time average power calculating section 204,
It has a threshold coefficient multiplication unit 205 and a power comparison unit 203.

【0123】短時間平均パワー計算部201は、マイク
ロホンで111〜11Mで収音した信号のうちで、1チャ
ネルまたは複数チャネルの平均の短時間平均パワーを求
め、出力する。
The short-time average power calculation unit 201 finds and outputs the average short-time average power of one channel or a plurality of channels among the signals picked up by the microphones 11 1 to 11 M.

【0124】長時間平均パワー計算部204は、マイク
ロホンで111〜11Mで収音した信号のうちで、1チャ
ネルまたは複数チャネル平均の長時間平均パワーを求め
る。
The long-term average power calculation unit 204 obtains the long-term average power of one channel or a plurality of channels averaged from the signals picked up by the microphones 11 1 to 11 M.

【0125】閾値係数乗算部205は、長時間平均パワ
ー計算部204の出力に閾値係数を乗算し、閾値として
設定する。上記閾値係数は、雑音の短時間平均パワーの
変動の大きさに応じて決定し、たとえば、雑音の短時間
平均パワーが、長時間平均を中心に10%の変動がある
場合、上記閾値係数が1.1に設定される。
The threshold coefficient multiplication unit 205 multiplies the output of the long-time average power calculation unit 204 by the threshold coefficient and sets it as a threshold value. The threshold coefficient is determined according to the magnitude of the fluctuation of the short-time average power of noise. For example, when the short-time average power of noise has a fluctuation of 10% around the long-term average, the threshold coefficient is It is set to 1.1.

【0126】パワー比較部203は、短時間平均パワー
計算部201の出力と、閾値係数乗算部205に応じて
設定された閾値とを比較し、短時間平均パワーが、閾値
を超えた場合に、適応アルゴリズム部16に、適応動作
停止信号を出力する。
The power comparison unit 203 compares the output of the short-time average power calculation unit 201 with the threshold value set according to the threshold coefficient multiplication unit 205, and when the short-time average power exceeds the threshold value, An adaptive operation stop signal is output to the adaptive algorithm unit 16.

【0127】適応期間検出部20bを上記のように構成
すると、目的音の非定常性が、雑音の非定常性よりも強
いことに注目した目的音検出を行っており、簡単な処理
で目的音の検出ができるという利点を持つ。
When the adaptive period detecting section 20b is configured as described above, the target sound is detected by paying attention to the fact that the non-stationarity of the target sound is stronger than the non-stationarity of noise, and the target sound is detected by simple processing. Has the advantage of being able to detect

【0128】適応期間検出部20bは、適応期間検出部
20aに比べ、多少処理量は多いが、雑音パワーの緩や
かな変化に追従することができ、雑音レベルを予め測定
する必要がないという利点を持つ。
The adaptive period detecting section 20b has a slightly larger amount of processing than the adaptive period detecting section 20a, but has the advantage that it can follow a gradual change in noise power and does not need to measure the noise level in advance. To have.

【0129】つまり、適応期間検出部20bは、上記収
音信号の短時間平均パワーを計算する短時間平均パワー
計算手段201と、上記収音信号の長時間平均パワーを
計算する長時間平均パワー計算手段204と、上記長時
間平均パワーに閾値係数を乗じた値を閾値として設定す
る閾値係数乗算手段205と、上記閾値と上記短時間平
均パワーとを比較し、適応期間を検出するパワー比較部
203とを含む手段の例である。
That is, the adaptive period detecting section 20b calculates the short-time average power calculating means 201 for calculating the short-time average power of the sound pickup signal and the long-time average power calculation for calculating the long-time average power of the sound pickup signal. A means 204, a threshold coefficient multiplication means 205 for setting a value obtained by multiplying the long-term average power by a threshold coefficient as a threshold, and a power comparing section 203 for comparing the threshold with the short-time average power to detect an adaptation period. It is an example of a means including and.

【0130】図9は、上記各実施例における適応期間検
出部20aの具体例である適応期間検出部20cを示す
ブロック図である。
FIG. 9 is a block diagram showing an adaptive period detecting section 20c which is a specific example of the adaptive period detecting section 20a in each of the above embodiments.

【0131】適応期間検出部20cは、閾値係数乗算部
205を、立上り閾値係数乗算部206と、立下り閾値
係数乗算部207と、立上り立下り切替部208とによ
って実現した装置である。
The adaptive period detecting section 20c is a device in which the threshold coefficient multiplying section 205 is realized by the rising threshold coefficient multiplying section 206, the falling threshold coefficient multiplying section 207, and the rising / falling switching section 208.

【0132】立上り閾値係数乗算部206は、雑音パワ
ー設定部202が出力した値に立上り閾値係数を乗算
し、この乗算結果を、立上り閾値として設定する。
The rising threshold coefficient multiplying unit 206 multiplies the value output by the noise power setting unit 202 by the rising threshold coefficient, and sets the multiplication result as the rising threshold.

【0133】立下り閾値係数乗算部207は、雑音パワ
ー設定部202が出力した値に立下り閾値係数を乗算
し、この乗算結果を立下り閾値として設定する。
The falling threshold coefficient multiplying unit 207 multiplies the value output by the noise power setting unit 202 by the falling threshold coefficient, and sets the multiplication result as the falling threshold.

【0134】上記立上り閾値係数または立下り閾値係数
は、雑音の短時間平均パワーの変動の大きさに応じて決
定し、たとえば、雑音の短時間平均パワーが、長時間平
均を中心に10%の変動がある場合には、立上り閾値係
数は1.1に設定され、立下り閾値係数は、立上り閾値
係数に近い値に設定される。
The rising threshold coefficient or the falling threshold coefficient is determined according to the magnitude of fluctuation of the short-time average power of noise. For example, the short-time average power of noise is 10% around the long-time average. When there is fluctuation, the rising threshold coefficient is set to 1.1, and the falling threshold coefficient is set to a value close to the rising threshold coefficient.

【0135】立上り立下り切替部208は、パワー比較
部203が適応動作停止信号を出力している場合に、立
下り閾値を選択し、それ以外の場合に、立上り閾値を選
択し、閾値に設定する。通常、目的音波形の立上り立下
りは、緩やかであることが予想される。たとえば、音声
であれば、立上り部分は、子音でパワーが小さく、立下
がりも緩やかである。このため、立ち上がり部分、立下
り部分で誤り検出を起こし易い。
The rising / falling switching section 208 selects the falling threshold when the power comparing section 203 outputs the adaptive operation stop signal, and in other cases, selects the rising threshold and sets it as the threshold. To do. Normally, it is expected that the rising and falling edges of the target sound waveform will be gentle. For example, in the case of voice, the rising portion is a consonant, has low power, and falls gently. Therefore, error detection is likely to occur at the rising portion and the falling portion.

【0136】なお、適応期間検出部20cにおける閾値
係数乗算部205に、雑音パワー設定部202が出力し
た値を印加する代わりに、長時間平均パワー計算部20
4が出力した値を印加するようにしてもよい。
It should be noted that instead of applying the value output from the noise power setting unit 202 to the threshold coefficient multiplication unit 205 in the adaptive period detection unit 20c, the long-time average power calculation unit 20
You may make it apply the value which 4 output.

【0137】つまり、適応期間検出部20cは、上記雑
音パワー設定手段202または上記長時間平均パワー計
算手段204の出力に、立上り閾値を乗算する立上り閾
値係数乗算手段206と、上記雑音パワー設定手段20
2または上記長時間平均パワー計算手段204の出力
に、立下り閾値を乗算する立下り閾値係数乗算手段20
7と、上記パワー比較部出力の状態によって、立上り閾
値係数乗算出力または立下り閾値係数乗算出力を選択
し、この選択された出力を閾値として設定する立上り立
下り切替手段208とを含む手段の例である。
That is, the adaptive period detecting section 20c, the rising threshold coefficient multiplying means 206 for multiplying the output of the noise power setting means 202 or the long-time average power calculating means 204 by the rising threshold, and the noise power setting means 20.
2 or falling threshold coefficient multiplication means 20 for multiplying the output of the long-term average power calculation means 204 by the falling threshold
7 and a rising / falling edge switching means 208 for selecting a rising threshold coefficient multiplication output or a falling threshold coefficient multiplication output according to the state of the output of the power comparison unit and setting the selected output as a threshold value. Is.

【0138】なお、上記立上り閾値、立下り閾値は、雑
音パワー設定手段202で設定される。
The rising threshold and the falling threshold are set by the noise power setting means 202.

【0139】図10は、短時間平均パワーの立上り、立
下りで検出誤りを起こし易いことと、その対策とを説明
する図である。
FIG. 10 is a diagram for explaining that a detection error is likely to occur at the rise and fall of the short-time average power and a countermeasure therefor.

【0140】図10(1)は、閾値を1つだけ用いる方
法を示す図であり、短時間平均パワーの立上り部分、立
下り部分で3、検出誤りを起こしている。これは、目的
音成分のパワーが微小に上昇したために、雑音の短時間
平均パワーの微小な変動の影響を受け易くなるためであ
る。
FIG. 10 (1) is a diagram showing a method in which only one threshold value is used, and 3 detection errors occur in the rising portion and the falling portion of the short-time average power. This is because the power of the target sound component is slightly increased, which makes it more likely to be affected by minute fluctuations in the short-time average power of noise.

【0141】図9に示す適応期間検出部20を使用する
と、立上りと立下りとの2つの閾値を設定することによ
って、雑音の短時間平均パワーの微小な変動の影響を受
け難くし、より正確な目的音検出が可能になる。
When the adaptive period detector 20 shown in FIG. 9 is used, by setting two threshold values for rising and falling, it is possible to make it less susceptible to minute fluctuations in the short-time average power of noise and more accurately. It is possible to detect various target sounds.

【0142】図10(2)は、短時間平均パワーの立上
り部分、立下り部分で検出誤りを解消しているのが分か
る。
In FIG. 10 (2), it can be seen that the detection error is eliminated at the rising portion and the falling portion of the short-time average power.

【0143】次に、図9に示す適応期間検出部20を使
用した場合における上記各実施例のシミュレーション結
果を示す。
Next, the simulation results of the above-mentioned respective embodiments when the adaptive period detecting section 20 shown in FIG. 9 is used will be shown.

【0144】マイクロホンアレーとして、無指向性のマ
イクロホンを2cm間隔で7つ直線状に並べたものを用
い、マイクロホンアレーの正面方向に50cm離れた位
置を従来技術の仮想音源位置とした。
As the microphone array, seven omnidirectional microphones arranged linearly at 2 cm intervals were used, and the position 50 cm away from the front of the microphone array was set as the virtual sound source position of the prior art.

【0145】上記各実施例の収音範囲は、従来例におけ
る仮想音源位置(1ポイントの位置)から、たとえば、
左に30cmの位置と、上記従来例における仮想音源位
置から右に30cmの位置との間の範囲であるとし、1
0cm間隔で7点の仮想目的音源位置を設けた。雑音に
は、白色雑音を用い、従来技術の仮想音源位置から横に
1m離れた位置に、雑音源を配置した。このときに、従
来技術と上記各実施例とにおいて、音源−アレー出力間
の周波数特性を、図10(2)に示してある。目的音源
位置は、従来技術の仮想目的音源位置と、そこから20
cm横にずれた位置の2通りに設定した。
From the virtual sound source position (position of 1 point) in the conventional example, the sound collection range of each of the above-mentioned examples is, for example,
It is assumed that the range is between the position of 30 cm to the left and the position of 30 cm to the right from the virtual sound source position in the above conventional example.
Seven virtual target sound source positions were provided at 0 cm intervals. White noise was used as the noise, and the noise source was placed laterally 1 m away from the virtual sound source position of the prior art. At this time, the frequency characteristic between the sound source and the array output in the related art and each of the above-described embodiments is shown in FIG. 10 (2). The target sound source position is the virtual target sound source position of the related art and 20
It was set in two ways at positions shifted laterally by cm.

【0146】図11は、シミュレーション結果を示す図
である。
FIG. 11 is a diagram showing simulation results.

【0147】図11(1)は、目的音源位置が、従来技
術の仮想目的音源位置にある場合に、音源−アレー出力
間の周波数特性を示す図である。図11(2)は、目的
音源位置が従来技術の仮想目的音源位置から20cmず
れた場合に、音源−アレー出力間の周波数特性を示す図
である。
FIG. 11 (1) is a diagram showing frequency characteristics between the sound source and the array output when the target sound source position is at the virtual target sound source position of the prior art. FIG. 11 (2) is a diagram showing frequency characteristics between the sound source and the array output when the target sound source position deviates from the virtual target sound source position of the related art by 20 cm.

【0148】図11(1)に示す周波数特性では、従来
技術、上記実施例ともに、大きな周波数特性の劣化は生
じていないが、図11(2)に示す周波数特性では、従
来技術の周波数特性の高周波部分が大きく劣化してい
る。上記各実施例では、図11(2)に示す周波数特性
でも、周波数特性の大きな劣化は生じていない。
In the frequency characteristic shown in FIG. 11 (1), no large deterioration of the frequency characteristic occurs in the prior art and the above-mentioned embodiment, but in the frequency characteristic shown in FIG. The high frequency part is greatly deteriorated. In each of the above-described embodiments, even in the frequency characteristic shown in FIG. 11B, the frequency characteristic is not significantly deteriorated.

【0149】以上の結果から、従来方法では、仮想音源
位置から目的音源がずれると、周波数特性の大きな劣化
を生じることが確認された。しかし、上記各実施例は、
設定した収音範囲内で、目的音源が移動しても、周波数
特性の大きな劣化が生じず、安定して、目的音を高品質
に収音できることが確認された。
From the above results, it was confirmed that in the conventional method, when the target sound source is deviated from the virtual sound source position, the frequency characteristic is largely deteriorated. However, in each of the above embodiments,
It was confirmed that even if the target sound source moved within the set sound collection range, the frequency characteristics did not deteriorate significantly and the target sound could be stably collected with high quality.

【0150】また、このときの雑音抑圧性能は、従来技
術、上記各実施例ともに、15dB以上あり、高い雑音
抑圧が行なわれていることが確認された。
Further, the noise suppression performance at this time was 15 dB or more in both the prior art and each of the above-mentioned embodiments, and it was confirmed that high noise suppression was performed.

【0151】以上のシミュレーション結果より、上記各
実施例は、目的音源が動く場合や、目的音源位置が正確
に分からない場合でも、高い雑音抑圧、低い周波数特性
の劣化で、高品質な収音ができることが確認された。
From the above simulation results, in each of the above embodiments, even when the target sound source moves or when the target sound source position is not accurately known, high noise suppression, low frequency characteristic deterioration, and high quality sound collection are possible. It was confirmed that it was possible.

【0152】[0152]

【発明の効果】本発明によれば、収音範囲内に仮想目的
音源位置を複数設定することによって、その範囲内の感
度を保つような拘束条件を実現するので、上記収音範囲
内に存在する音源を、低い周波数特性の劣化で収音で
き、上記収音範囲外の雑音を、抑圧することができ、ま
た、上記収音範囲内で音源が移動しても、フィルタ修正
の必要がなく、音源移動による性能低下がなく、したが
って、目的音源が動く場合や、目的音源位置が正確に分
からない場合でも、雑音抑圧が高く、周波数特性の劣化
が低く、高品質な収音ができるという効果を奏する。
According to the present invention, by setting a plurality of virtual target sound source positions within the sound collection range, a constraint condition for maintaining the sensitivity within the range is realized. The sound source can be picked up by deterioration of low frequency characteristics, noise outside the picked-up range can be suppressed, and even if the sound source moves within the picked-up range, there is no need to modify the filter. The effect that there is no performance degradation due to sound source movement, and therefore even if the target sound source moves or if the target sound source position is not known accurately, noise suppression is high, frequency characteristic deterioration is low, and high-quality sound collection is possible. Play.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の第1の実施例である収音装置CS1を
示すブロック図である。
FIG. 1 is a block diagram showing a sound collecting device CS1 which is a first embodiment of the present invention.

【図2】上記実施例の特徴を、従来例との比較で説明す
る図である。
FIG. 2 is a diagram for explaining the features of the above-described embodiment in comparison with a conventional example.

【図3】上記実施例の構成を、従来例の構成との比較で
説明する図である。
FIG. 3 is a diagram illustrating a configuration of the above-described embodiment in comparison with a configuration of a conventional example.

【図4】本発明の第2の実施例である収音装置CS2を
示すブロック図である。
FIG. 4 is a block diagram showing a sound collecting device CS2 which is a second embodiment of the present invention.

【図5】本発明の第3の実施例である収音装置CS3を
示す構成図である。
FIG. 5 is a configuration diagram showing a sound collecting device CS3 which is a third embodiment of the present invention.

【図6】本発明の第4の実施例である収音装置CS4の
構成を示す図である。
FIG. 6 is a diagram showing a configuration of a sound collecting device CS4 which is a fourth embodiment of the present invention.

【図7】上記各実施例における適応期間検出部20の1
つの具体例である適応期間検出部20aを示すブロック
図である。
FIG. 7 is a block diagram of the adaptive period detector 20 in each of the above embodiments.
It is a block diagram which shows the adaptation period detection part 20a which is one specific example.

【図8】上記各実施例における適応期間検出部20の別
の具体例である適応期間検出部20bを示すブロック図
である。
FIG. 8 is a block diagram showing an adaptation period detection unit 20b which is another specific example of the adaptation period detection unit 20 in each of the embodiments.

【図9】上記各実施例における適応期間検出部20aの
具体例である適応期間検出部20cを示すブロック図で
ある。
FIG. 9 is a block diagram showing an adaptation period detection unit 20c which is a specific example of the adaptation period detection unit 20a in each of the above embodiments.

【図10】短時間平均パワーの立上り、立下りで検出誤
りを起こし易いことと、その対策とを説明する図であ
る。
FIG. 10 is a diagram illustrating that a detection error is likely to occur at the rise and fall of the short-time average power and a countermeasure against the error.

【図11】シミュレーション結果を示す図である。FIG. 11 is a diagram showing a simulation result.

【図12】従来の収音装置CS11を示す図である。FIG. 12 is a diagram showing a conventional sound collecting device CS11.

【符号の説明】[Explanation of symbols]

111〜11M…マイクロホン、 14B…第1の加算手段、 211〜21M…第2の加算手段、 121〜12M…第3の加算手段、 14A…第4の加算手段、 22…第5の加算手段、 15、…減算手段、 13A1〜13AM…第2の可変フィルタ、 13B1〜13BM…第1の可変フィルタ、 16…適応アルゴリズム部、 171〜17J、17C…信号発生器、 181,1〜18J,M、18C1〜18CM…空間特性フィル
タ、 191〜19J、19C、281,1〜28J,M…遅延器、 20…適応期間検出部、 231〜23M…半固定フィルタ、 24…フィルタ係数記憶部、 25…収音信号記憶部、 26、26C…仮想音源位置設定部、 27…空間特性推定部、 291,1〜29J,M…ゲイン、 30…収音範囲設定部、 201…短時間平均パワー計算部、 202…雑音パワー設定部、 203…パワー比較部、 204…長時間平均パワー計算部、 205…閾値係数乗算部、 206…立上り閾値係数乗算部、 207…立下り閾値係数乗算部、 208…立上り立下り切替部、 271…距離計算部、 272…マイクロホン間相対遅延量計算部、 273…マイクロホン間相対減衰量計算部。
11 1 to 11 M ... Microphone, 14 B ... 1st addition means, 21 1 to 21 M ... 2nd addition means, 12 1 to 12 M ... 3rd addition means, 14 A ... 4th addition means, 22 ... fifth addition means, 15, ... subtracting means, 13A 1 ~13A M ... second variable filters, 13B 1 13 b M ... first variable filter, 16 ... adaptive algorithm section, 17 1 to 17 J, 17C ... Signal generator, 18 1,1 to 18 J, M , 18C 1 to 18C M ... Spatial characteristic filter, 19 1 to 19 J , 19C, 28 1,1 to 28 J, M ... Delay device, 20 ... Adaptation period detection part, 23 1 ~ 23 M ... semi-fixed filter, 24 ... filter coefficient storage unit, 25 ... sound pickup signal storage unit, 26,26C ... virtual sound source position setting unit, 27 ... spatial characteristic estimating unit, 29 1,1 to 29 J, M ... gain, 30 ... sound collection range setting unit, 201 ... short Average power calculation unit, 202 ... Noise power setting unit, 203 ... Power comparison unit, 204 ... Long-term average power calculation unit, 205 ... Threshold coefficient multiplication unit, 206 ... Rising threshold coefficient multiplication unit, 207 ... Falling threshold coefficient multiplication unit , 208 ... Rise / fall switching unit, 271 ... Distance calculation unit, 272 ... Microphone relative delay amount calculation unit, 273 ... Microphone relative attenuation amount calculation unit.

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI H04R 3/00 320 G10L 3/02 301F (56)参考文献 特開 昭59−72295(JP,A) 特開 昭60−41393(JP,A) 特開 平8−271605(JP,A) 特開2001−309483(JP,A) 小林, 古家, 片岡,複数仮想音源 を用いた適応型マイクロホンアレー,電 子情報通信学会誌 A,日本,2003年 4月 1日,Vol.J86−A, N o.4,Pages 333−344 小林, 古家,複数仮想音源を用いた 適応型アレーの収束特性および仮想音源 配置に関する検討,電子情報通信学会技 術研究報告[応用音響],日本,2000年 10月27日,Vol.100, No.397, EA2000−54,Pages 23−30 小林, 古家,話者移動による適応形 アレーの性能劣化の改善,日本音響学会 2000年秋季研究発表会講演論文集 −I −,日本,2000年 9月20日,3−P− 19,Pages 485−486 (58)調査した分野(Int.Cl.7,DB名) G10L 21/00 - 21/02 G10L 15/28 G01S 3/802 H04M 1/00 H04R 3/00 ─────────────────────────────────────────────────── ─── Continuation of front page (51) Int.Cl. 7 Identification code FI H04R 3/00 320 G10L 3/02 301F (56) References JP-A-59-72295 (JP, A) JP-A-60-41393 (JP, A) JP-A-8-271605 (JP, A) JP-A-2001-309483 (JP, A) Kobayashi, Furuya, Kataoka, Adaptive microphone array using multiple virtual sound sources, Journal of the Institute of Electronics, Information and Communication Engineers A , Japan, April 1, 2003, Vol. J86-A, No. 4, Pages 333-344 Kobayashi, Furuya, A Study on Convergence Characteristics and Virtual Source Placement of Adaptive Array Using Multiple Virtual Sound Sources, Technical Report of IEICE [Applied Acoustics], Japan, October 27, 2000 , Vol. 100, No. 397, EA2000-54, Pages 23-30 Kobayashi, Furuya, Improvement of performance degradation of adaptive array due to speaker movement, The Acoustical Society of Japan 2000 Autumn Research Conference Lecture Collection-I-, Japan, September 20, 2000 Sun, 3-P-19, Pages 485-486 (58) Fields investigated (Int.Cl. 7 , DB name) G10L 21/00-21/02 G10L 15/28 G01S 3/802 H04M 1/00 H04R 3 / 00

Claims (14)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 任意に配置されている複数の収音手段が
収音した収音信号を、それぞれ異なるフィルタ係数によ
ってフィルタリングする第1の可変フィルタリング手段
と、上記各第1の可変フィルタリング手段の出力信号を
加算し、加算出力を出力する第1の加算手段とを有する
収音装置において、 所定の収音範囲を設定する収音範囲設定手段と;上記収
音範囲内に、複数の仮想目的音源位置を設定する仮想目
的音源位置設定手段と;上記各仮想目的音源位置と上記
各収音手段の位置とに基づいて、上記各仮想目的音源位
置から上記各収音手段の位置に音が到達するまでの遅延
時間、減衰量を含む空間特性を推定する空間特性推定手
段と;互いに無相関で定常な擬似目的信号を、上記仮想
目的音源位置の数と同数だけ発生させる擬似目的信号発
生手段と;上記空間特性推定手段によって推定された各
空間特性をフィルタ係数とし、上記各擬似目的信号のそ
れぞれをフィルタリングする空間特性フィルタリング手
段と;上記各空間特性フィルタリング手段の各出力信号
を、上記各収音手段毎に、それぞれ加算することによっ
て、擬似目的音収音信号を合成する第2の加算手段と;
上記各擬似目的音収音信号と上記各収音信号とをそれぞ
れ加算することによって、学習信号を合成する第3の加
算手段と;上記合成された学習信号を、それぞれ異なる
フィルタ係数でフィルタリングする第2の可変フィルタ
リング手段と;上記各第2の可変フィルタリング手段の
出力信号を互いに加算する第4の加算手段と;上記各擬
似目的信号をそれぞれ遅延させる遅延手段と;上記遅延
手段からの各遅延出力信号同士を加算する第5の加算手
段と;上記第5の加算手段の出力信号から、上記第4の
加算手段の出力信号を減算することによって、誤差信号
を求める減算手段と;上記収音信号に基づいて、上記収
音範囲内に音源が存在しない期間を検出し、この検出さ
れた期間を、適応させるべき期間として検出する適応期
間検出部と;上記適応期間検出部によって検出された収
音範囲内に音源が存在しない期間に、上記誤差信号の二
乗平均値が最小になるように、上記第2の可変フィルタ
係数と上記第1の可変フィルタ係数とを更新する適応ア
ルゴリズム手段と;を有することを特徴とする収音装
置。
1. A first variable filtering means for filtering a sound collecting signal picked up by a plurality of arbitrarily arranged sound collecting means by different filter coefficients, and outputs of the first variable filtering means. A sound collecting device having first adding means for adding signals and outputting an addition output; sound collecting range setting means for setting a predetermined sound collecting range; and a plurality of virtual target sound sources within the sound collecting range. A virtual target sound source position setting means for setting a position; a sound arrives from the virtual target sound source position to the sound collecting means based on the virtual target sound source position and the sound collecting means position Characteristic estimating means for estimating a spatial characteristic including a delay time and an attenuation amount; and pseudo target signals that generate the same number of pseudo target signals that are uncorrelated with each other and are stationary as many as the virtual target sound source positions Live means ;; spatial characteristic filtering means for filtering each of the pseudo target signals using each spatial characteristic estimated by the spatial characteristic estimating means as filter coefficients; and each output signal of each spatial characteristic filtering means, Second adding means for synthesizing the pseudo target sound collecting signal by adding each sound collecting means respectively;
Third adding means for synthesizing a learning signal by adding each of the pseudo target sound collecting signals and each of the sound collecting signals; and a third adding means for filtering the synthesized learning signal with different filter coefficients. Two variable filtering means; fourth adding means for adding the output signals of the respective second variable filtering means to each other; delay means for delaying the respective pseudo target signals; and respective delayed outputs from the delay means. Fifth adding means for adding signals; subtracting means for obtaining an error signal by subtracting the output signal of the fourth adding means from the output signal of the fifth adding means; the sound collecting signal An adaptive period detection unit that detects a period during which no sound source exists in the sound collection range based on the above, and detects the detected period as a period to be adapted; The second variable filter coefficient and the first variable filter coefficient are set so that the root mean square value of the error signal is minimized during a period in which no sound source exists within the sound collection range detected by the response period detection unit. And an adaptive algorithm means for updating the.
【請求項2】 請求項1において、 上記各収音手段と上記各第3の加算手段との間に設けら
れ、上記各収音信号を記憶する収音信号記憶手段と;上
記適応アルゴリズム手段と上記各第1の可変フィルタリ
ング手段との間に設けられ、上記第1の可変フィルタ係
数を記憶するフィルタ係数記憶手段と;を有することを
特徴とする収音装置。
2. The sound pickup signal storage device according to claim 1, which is provided between each sound collection device and each third addition device and stores each sound collection signal; and the adaptive algorithm device. And a filter coefficient storage means for storing the first variable filter coefficient, which is provided between each of the first variable filtering means.
【請求項3】 任意に配置されている複数の収音手段が
収音した収音信号を、それぞれ異なるフィルタ係数によ
ってフィルタリングする第1の可変フィルタリング手段
と、上記各第1の可変フィルタリング手段の出力信号を
加算し、加算出力を出力する第1の加算手段とを有する
収音装置において、 所定の収音範囲を設定する収音範囲設定手段と;上記収
音範囲内に、複数の仮想目的音源位置を設定する仮想目
的音源位置設定手段と;上記各仮想目的音源位置と上記
各収音手段の位置とに基づいて、上記各仮想目的音源位
置から上記各収音手段の位置に音が到達するまでの遅延
時間、減衰量を含む空間特性を推定する空間特性推定手
段であり、上記各仮想目的音源位置から上記各収音手段
の位置までの距離を計算する距離計算手段と、上記距離
計算手段によって計算された距離と音速とから、上記各
収音手段間の相対遅延量を求める収音手段間相対遅延量
計算手段とを含む空間特性推定手段と;互いに無相関で
定常な擬似目的信号を、上記仮想目的音源位置の数と同
数だけ発生させる擬似目的信号発生手段と;信号発生手
段が出力した擬似目的信号を、上記収音手段間相対遅延
量計算手段2が求めた相対遅延量だけ遅延させる複数の
第1の遅延手段と;上記各遅延手段の各出力信号を、上
記各収音手段毎に、それぞれ加算することによって、擬
似目的音収音信号を合成する第2の加算手段と;上記各
擬似目的音収音信号と上記各収音信号とをそれぞれ加算
することによって、学習信号を合成する第3の加算手段
と;上記合成された学習信号を、それぞれ異なるフィル
タ係数でフィルタリングする第2の可変フィルタリング
手段と;上記各第2の可変フィルタリング手段の出力信
号を互いに加算する第4の加算手段と;上記各擬似目的
信号をそれぞれ遅延させる第2の遅延手段と;上記第2
の遅延手段からの各遅延出力信号同士を加算する第5の
加算手段と;上記第5の加算手段の出力信号から、上記
第4の加算手段の出力信号を減算することによって、誤
差信号を求める減算手段と;上記収音信号に基づいて、
上記収音範囲内に音源が存在しない期間を検出し、この
検出された期間を、適応させるべき期間として検出する
適応期間検出部と;上記適応期間検出部によって検出さ
れた収音範囲内に音源が存在しない期間に、上記誤差信
号の二乗平均値が最小になるように、上記第2の可変フ
ィルタ係数と上記第1の可変フィルタ係数とを更新する
適応アルゴリズム手段と;を有することを特徴とする収
音装置。
3. A first variable filtering means for filtering the collected sound signals picked up by a plurality of arbitrarily arranged sound collecting means by different filter coefficients, and outputs of the respective first variable filtering means. A sound collecting device having first adding means for adding signals and outputting an addition output; sound collecting range setting means for setting a predetermined sound collecting range; and a plurality of virtual target sound sources within the sound collecting range. A virtual target sound source position setting means for setting a position; a sound arrives from the virtual target sound source position to the sound collecting means based on the virtual target sound source position and the sound collecting means position Is a spatial characteristic estimating means for estimating a spatial characteristic including a delay time and an attenuation amount, and a distance calculating means for calculating a distance from each virtual target sound source position to each sound collecting means position; Spatial characteristic estimating means including relative delay amount calculating means for obtaining relative delay amounts between the sound collecting means from the distance calculated by the calculating means and sound velocity; Pseudo target signal generating means for generating the same number of signals as the number of virtual target sound source positions; Relative delay amount obtained by the sound collecting means relative delay amount calculating means 2 for the pseudo target signal output from the signal generating means. A plurality of first delaying means for delaying only the above; and second adding means for synthesizing the pseudo target sound collecting signal by adding the respective output signals of the respective delaying means for the respective sound collecting means. Third adding means for synthesizing a learning signal by adding each of the pseudo target sound pickup signals and each of the sound pickup signals; and filtering the synthesized learning signal with different filter coefficients. Second variable filtering means for ringing; fourth adding means for adding output signals of the second variable filtering means to each other; second delay means for delaying the pseudo target signals respectively; Two
A fifth adding means for adding the respective delayed output signals from the delay means; and an error signal is obtained by subtracting the output signal of the fourth adding means from the output signal of the fifth adding means. Subtraction means; based on the sound pickup signal,
An adaptive period detection unit that detects a period during which no sound source exists within the sound collection range, and detects the detected period as a period to be adapted; a sound source within the sound collection range detected by the adaptive period detection unit An adaptive algorithm means for updating the second variable filter coefficient and the first variable filter coefficient so that the root mean square value of the error signal is minimized in the period in which the error signal does not exist. Sound pickup device.
【請求項4】 任意に配置されている複数の収音手段が
収音した収音信号を、それぞれ異なるフィルタ係数によ
ってフィルタリングする第1の可変フィルタリング手段
と、上記各第1の可変フィルタリング手段の出力信号を
加算し、加算出力を出力する第1の加算手段とを有する
収音装置において、 所定の収音範囲を設定する収音範囲設定手段と;上記収
音範囲内に、複数の仮想目的音源位置を設定する仮想目
的音源位置設定手段と;上記各仮想目的音源位置と上記
各収音手段の位置とに基づいて、上記各仮想目的音源位
置から上記各収音手段の位置に音が到達するまでの遅延
時間、減衰量を含む空間特性を推定する空間特性推定手
段であり、上記各仮想目的音源位置から上記各収音手段
の位置までの距離を計算する距離計算手段と、上記距離
計算手段によって計算された距離と音速とから、上記各
収音手段間の相対遅延量を求める収音手段間相対遅延量
計算手段と、上記距離計算手段2によって計算された距
離から、収音手段間の相対減衰量を求める収音手段間相
対減衰量計算手段とを含む空間特性推定手段と;互いに
無相関で定常な擬似目的信号を、上記仮想目的音源位置
の数と同数だけ発生させる擬似目的信号発生手段と;信
号発生手段が出力した擬似目的信号を、上記収音手段間
相対遅延量計算手段2が求めた相対遅延量だけ遅延させ
る複数の第1の遅延手段と;上記複数の遅延手段のそれ
ぞれが出力した擬似目的信号を、上記収音手段間相対減
衰量計算手段が求めた相対減衰量だけ減衰させる複数の
ゲイン手段と;上記各ゲイン手段の各出力信号を、上記
各収音手段毎に、それぞれ加算することによって、擬似
目的音収音信号を合成する第2の加算手段と;上記各擬
似目的音収音信号と上記各収音信号とをそれぞれ加算す
ることによって、学習信号を合成する第3の加算手段
と;上記合成された学習信号を、それぞれ異なるフィル
タ係数でフィルタリングする第2の可変フィルタリング
手段と;上記各第2の可変フィルタリング手段の出力信
号を互いに加算する第4の加算手段と;上記各擬似目的
信号をそれぞれ遅延させる第2の遅延手段と;上記第2
の遅延手段からの各遅延出力信号同士を加算する第5の
加算手段と;上記第5の加算手段の出力信号から、上記
第4の加算手段の出力信号を減算することによって、誤
差信号を求める減算手段と;上記収音信号に基づいて、
上記収音範囲内に音源が存在しない期間を検出し、この
検出された期間を、適応させるべき期間として検出する
適応期間検出部と;上記適応期間検出部によって検出さ
れた収音範囲内に音源が存在しない期間に、上記誤差信
号の二乗平均値が最小になるように、上記第2の可変フ
ィルタ係数と上記第1の可変フィルタ係数とを更新する
適応アルゴリズム手段と;を有することを特徴とする収
音装置。
4. A first variable filtering means for filtering the collected sound signals picked up by a plurality of arbitrarily arranged sound collecting means by different filter coefficients, and outputs of the first variable filtering means. A sound collecting device having first adding means for adding signals and outputting an addition output; sound collecting range setting means for setting a predetermined sound collecting range; and a plurality of virtual target sound sources within the sound collecting range. A virtual target sound source position setting means for setting a position; a sound arrives from the virtual target sound source position to the sound collecting means based on the virtual target sound source position and the sound collecting means position Is a spatial characteristic estimating means for estimating a spatial characteristic including a delay time and an attenuation amount, and a distance calculating means for calculating a distance from each virtual target sound source position to each sound collecting means position; From the distance calculated by the calculation means and the sound velocity, the relative delay amount calculation means for obtaining the relative delay amount between the respective sound collection means, and the distance calculated by the distance calculation means 2 from the sound collection means Spatial characteristic estimating means including relative attenuation amount calculation means between sound collecting means for obtaining relative attenuation amount between them; and pseudo purpose for generating pseudo target signals that are uncorrelated with each other and are stationary as many as the number of virtual target sound source positions Signal generating means; a plurality of first delay means for delaying the pseudo target signal output by the signal generating means by the relative delay amount calculated by the sound collecting means relative delay amount calculating means 2; and the plurality of delay means. A plurality of gain means for attenuating the pseudo target signal output by each of the sound pickup means by the relative attenuation amount obtained by the sound pickup means relative attenuation amount calculation means; and each output signal of each gain means, each sound pickup means. Every, Second adding means for synthesizing the pseudo target sound picked-up signal by adding each; and a second summing means for synthesizing the learning signal by adding each of the pseudo target sound pick-up signal and each of the sound pick-up signals 3) adding means; 2nd variable filtering means for filtering the synthesized learning signal with different filter coefficients; 4th adding means for adding output signals of the 2nd variable filtering means to each other; Second delay means for delaying each of the pseudo target signals; and second delay means.
A fifth adding means for adding the respective delayed output signals from the delay means; and an error signal is obtained by subtracting the output signal of the fourth adding means from the output signal of the fifth adding means. Subtraction means; based on the sound pickup signal,
An adaptive period detection unit that detects a period during which no sound source exists within the sound collection range, and detects the detected period as a period to be adapted; a sound source within the sound collection range detected by the adaptive period detection unit An adaptive algorithm means for updating the second variable filter coefficient and the first variable filter coefficient so that the root mean square value of the error signal is minimized in the period in which the error signal does not exist. Sound pickup device.
【請求項5】 請求項1において、 上記適応期間検出手段は、 上記収音信号の短時間平均パワーを計算する短時間平均
パワー計算手段と;予め測定した雑音の長時間平均パワ
ーを設定する雑音パワー設定手段と;上記雑音パワーに
閾値係数を乗じた値を閾値として設定する閾値設定手段
と;上記閾値と上記短時間平均パワーとを比較して、適
応期間を検出するパワー比較部と;を含む手段であるこ
とを特徴とする収音装置。
5. The short-time average power calculating means for calculating the short-time average power of the picked-up signal; the noise for setting a long-time average power of noise measured in advance. Power setting means; threshold setting means for setting a value obtained by multiplying the noise power by a threshold coefficient as a threshold; and a power comparing section for comparing the threshold and the short-time average power to detect an adaptive period. A sound collecting device, characterized in that it is a means including the sound collecting device.
【請求項6】 請求項1において、 上記適応期間検出手段は、 上記収音信号の短時間平均パワーを計算する短時間平均
パワー計算手段と;上記収音信号の長時間平均パワーを
計算する長時間平均パワー計算手段と;上記長時間平均
パワーに閾値係数を乗じた値を閾値として設定する閾値
係数乗算手段と;上記閾値と上記短時間平均パワーとを
比較し、適応期間を検出するパワー比較部と;を含む手
段であることを特徴とする収音装置。
6. The short-term average power calculating means for calculating the short-time average power of the sound pickup signal according to claim 1, and the length for calculating the long-term average power of the sound collection signal. Time average power calculation means; threshold coefficient multiplication means for setting a value obtained by multiplying the long time average power by a threshold coefficient as a threshold; power comparison for comparing the threshold with the short time average power and detecting an adaptive period A sound collecting device, characterized in that it is a means including a section and;
【請求項7】 請求項5または請求項6において、 上記適応期間検出部は、 上記雑音パワー設定手段または上記長時間平均パワー計
算手段の出力に、立上り閾値を乗算する立上り閾値係数
乗算手段と;上記雑音パワー設定手段または上記長時間
平均パワー計算手段の出力に、立下り閾値を乗算する立
下り閾値係数乗算手段と;上記パワー比較部出力の状態
によって、立上り閾値係数乗算出力または立下り閾値係
数乗算出力を選択し、この選択された出力を閾値として
設定する立上り立下り切替手段8と;を含む手段である
ことを特徴とする収音装置。
7. The rising period coefficient multiplying unit for multiplying an output of the noise power setting unit or the long-term average power calculating unit by a rising threshold value according to claim 5 or 6, Falling threshold coefficient multiplication means for multiplying the output of the noise power setting means or the long-time average power calculation means by a falling threshold; rising threshold coefficient multiplication output or falling threshold coefficient depending on the state of the power comparison section output A sound pickup device comprising: rising / falling switching means 8 for selecting a multiplication output and setting the selected output as a threshold.
【請求項8】 任意に配置されている複数の収音手段が
収音した収音信号を、それぞれ異なるフィルタ係数によ
ってフィルタリングし、このフィルタリングされた信号
を加算し、加算出力を出力する第1の加算段階を有する
収音方法において、 所定の収音範囲を設定する収音範囲設定段階と;上記収
音範囲内に、複数の仮想目的音源位置を設定する仮想目
的音源位置設定段階と;上記各仮想目的音源位置と上記
各収音手段の位置とに基づいて、上記各仮想目的音源位
置から上記各収音手段の位置に音が到達するまでの遅延
時間、減衰量を含む空間特性を推定する空間特性推定段
階と;互いに無相関で定常な擬似目的信号を、上記仮想
目的音源位置の数と同数だけ発生させる擬似目的信号発
生段階と;上記空間特性推定段階で推定された各空間特
性をフィルタ係数とし、上記各擬似目的信号のそれぞれ
をフィルタリングする空間特性フィルタリング段階と;
上記各空間特性フィルタリング段階での各出力信号を、
上記各収音手段毎に、それぞれ加算することによって、
擬似目的音収音信号を合成する第2の加算段階と;上記
各擬似目的音収音信号と上記各収音信号とをそれぞれ加
算することによって、学習信号を合成する第3の加算段
階と;上記合成された学習信号を、それぞれ異なるフィ
ルタ係数でフィルタリングする第2の可変フィルタリン
グ段階と;上記各第2の可変フィルタリング段階の出力
信号を互いに加算する第4の加算段階と;上記各擬似目
的信号をそれぞれ遅延させる遅延段階と;上記遅延段階
からの各遅延出力信号同士を加算する第5の加算段階
と;上記第5の加算段階での出力信号から、上記第4の
加算段階での出力信号を減算することによって、誤差信
号を求める減算段階と;上記収音信号に基づいて、上記
収音範囲内に音源が存在しない期間を検出し、この検出
された期間を、適応させるべき期間として検出する適応
期間検出段階と;上記適応期間検出段階で検出された収
音範囲内に音源が存在しない期間に、上記誤差信号の二
乗平均値が最小になるように、上記第2の可変フィルタ
係数と上記第1の可変フィルタ係数とを更新する適応ア
ルゴリズム段階と;を有することを特徴とする収音方
法。
8. A first sound output device, wherein sound pickup signals picked up by a plurality of arbitrarily arranged sound pickup means are filtered by different filter coefficients, the filtered signals are added, and an addition output is output. In a sound pickup method having an addition step, a sound pickup range setting step for setting a predetermined sound pickup range; a virtual target sound source position setting step for setting a plurality of virtual target sound source positions within the sound pickup range; Based on the virtual target sound source position and the position of each sound collecting unit, the spatial characteristics including the delay time and the attenuation amount from the virtual target sound source position until the sound reaches the position of each sound collecting unit are estimated. Spatial characteristic estimation step; pseudo target signal generation step for generating stationary pseudo target signals that are uncorrelated with each other and equal in number to the virtual target sound source positions; each space estimated in the spatial characteristic estimation step Sex and filter coefficients, and spatial characteristics filtering step of filtering each of the respective pseudo target signal;
Each output signal at each spatial characteristic filtering stage,
By adding up for each of the above sound collecting means,
A second adding step for synthesizing the pseudo target sound collecting signal; and a third adding step for synthesizing the learning signal by adding the pseudo target sound collecting signals and the sound collecting signals, respectively. A second variable filtering step of filtering the synthesized learning signal with different filter coefficients; a fourth adding step of adding output signals of the second variable filtering steps to each other; A delaying step for delaying each of the output signals; a fifth adding step for adding the delayed output signals from the delaying step; and an output signal for the fourth adding step from an output signal for the fifth adding step. A subtraction step for obtaining an error signal by subtracting; a period during which no sound source is present within the sound collection range is detected based on the sound collection signal, and the detected period is adapted. An adaptive period detecting step of detecting as a period to be caused; a second mean value of the error signal is minimized during a period in which no sound source exists within the sound collection range detected in the adaptive period detecting step. A variable filter coefficient and an adaptive algorithm step for updating the first variable filter coefficient;
【請求項9】 請求項8において、 上記各収音信号を記憶する収音信号記憶段階と;上記第
1の可変フィルタ係数を記憶するフィルタ係数記憶段階
と;を有することを特徴とする収音方法。
9. The sound collecting method according to claim 8, further comprising: a sound collecting signal storing step for storing each of the sound collecting signals; and a filter coefficient storing step for storing the first variable filter coefficient. Method.
【請求項10】 任意に配置されている複数の収音手段
が収音した収音信号を、それぞれ異なるフィルタ係数に
よってフィルタリングする第1の可変フィルタリング段
階と、上記各第1の可変フィルタリング段階の出力信号
を加算し、加算出力を出力する第1の加算段階とを有す
る収音方法において、 所定の収音範囲を設定する収音範囲設定段階と;上記収
音範囲内に、複数の仮想目的音源位置を設定する仮想目
的音源位置設定段階と;上記各仮想目的音源位置と上記
各収音手段の位置とに基づいて、上記各仮想目的音源位
置から上記各収音手段の位置に音が到達するまでの遅延
時間、減衰量を含む空間特性を推定する空間特性推定段
階であり、上記各仮想目的音源位置から上記各収音手段
の位置までの距離を計算する距離計算段階と、上記距離
計算段階で計算された距離と音速とから、上記各収音手
段間の相対遅延量を求める収音手段間相対遅延量計算段
階とを含む空間特性推定段階と;互いに無相関で定常な
擬似目的信号を、上記仮想目的音源位置の数と同数だけ
発生させる擬似目的信号発生段階と;信号発生段階で出
力した擬似目的信号を、上記収音手段間相対遅延量計算
段階で求めた相対遅延量だけ遅延させる複数の第1の遅
延段階と;上記各遅延段階の各出力信号を、上記各収音
手段毎に、それぞれ加算することによって、擬似目的音
収音信号を合成する第2の加算段階と;上記各擬似目的
音収音信号と上記各収音信号とをそれぞれ加算すること
によって、学習信号を合成する第3の加算段階と;上記
合成された学習信号を、それぞれ異なるフィルタ係数で
フィルタリングする第2の可変フィルタリング段階と;
上記各第2の可変フィルタリング段階の出力信号を互い
に加算する第4の加算段階と;上記各擬似目的信号をそ
れぞれ遅延させる第2の遅延段階と;上記第2の遅延段
階からの各遅延出力信号同士を加算する第5の加算段階
と;上記第5の加算段階の出力信号から、上記第4の加
算段階の出力信号を減算することによって、誤差信号を
求める減算段階と;上記収音信号に基づいて、上記収音
範囲内に音源が存在しない期間を検出し、この検出され
た期間を、適応させるべき期間として検出する適応期間
検出段階と;上記適応期間検出段階で検出された収音範
囲内に音源が存在しない期間に、上記誤差信号の二乗平
均値が最小になるように、上記第2の可変フィルタ係数
と上記第1の可変フィルタ係数とを更新する適応アルゴ
リズム段階と;を有することを特徴とする収音方法。
10. A first variable filtering step of filtering a sound pickup signal picked up by a plurality of arbitrarily arranged sound pickup means by different filter coefficients, and an output of each of the first variable filtering steps. A sound collecting method including a first adding step of adding signals and outputting an added output; a sound collecting range setting step of setting a predetermined sound collecting range; and a plurality of virtual object sound sources within the sound collecting range. A virtual target sound source position setting step of setting a position; a sound reaches the position of each sound collecting means from each virtual target sound source position based on each virtual target sound source position and each position of each sound collecting means Is a spatial characteristic estimating step of estimating a spatial characteristic including a delay time and an attenuation amount, and a distance calculating step of calculating a distance from each of the virtual target sound source positions to each of the sound collecting means positions, A spatial characteristic estimation step including a relative delay amount calculation step for obtaining the relative delay amount between the respective sound collection means from the distance calculated in the separation calculation step and the sound velocity; A pseudo target signal generating step for generating the same number of target signals as the number of the virtual target sound source positions; a relative delay amount obtained by the pseudo delay signal calculating step between the pseudo target signals output in the signal generating step A plurality of first delay stages for delaying only; a second adding stage for synthesizing the pseudo target sound pickup signal by adding the output signals of the respective delay stages for each of the sound collecting means. A third adding step of synthesizing a learning signal by adding each of the pseudo target sound pickup signals and each of the sound pickup signals; filtering the synthesized learning signal with different filter coefficients A second variable filtering stage to:
A fourth adding stage for adding the output signals of the respective second variable filtering stages to each other; a second delay stage for delaying the respective pseudo target signals; and a respective delayed output signal from the second delay stage. A fifth addition step of adding the two; a subtraction step of obtaining an error signal by subtracting the output signal of the fourth addition step from the output signal of the fifth addition step; An adaptive period detecting step of detecting a period during which no sound source is present within the sound collecting range, and detecting the detected period as a period to be adapted; a sound collecting range detected in the adaptive period detecting step. An adaptive algorithm step of updating the second variable filter coefficient and the first variable filter coefficient such that the root mean square value of the error signal is minimized during a period in which no sound source exists. Sound collecting method characterized by.
【請求項11】 任意に配置されている複数の収音手段
が収音した収音信号を、それぞれ異なるフィルタ係数に
よってフィルタリングする第1の可変フィルタリング段
階と、上記各第1の可変フィルタリング段階の出力信号
を加算し、加算出力を出力する第1の加算段階とを有す
る収音方法において、 所定の収音範囲を設定する収音範囲設定段階と;上記収
音範囲内に、複数の仮想目的音源位置を設定する仮想目
的音源位置設定段階と;上記各仮想目的音源位置と上記
各収音手段の位置とに基づいて、上記各仮想目的音源位
置から上記各収音手段の位置に音が到達するまでの遅延
時間、減衰量を含む空間特性を推定する空間特性推定段
階であり、上記各仮想目的音源位置から上記各収音手段
の位置までの距離を計算する距離計算段階と、上記距離
計算段階によって計算された距離と音速とから、上記各
収音手段間の相対遅延量を求める収音手段間相対遅延量
計算段階と、上記距離計算段階で計算された距離から、
収音手段間の相対減衰量を求める収音手段間相対減衰量
計算段階とを含む空間特性推定段階と;互いに無相関で
定常な擬似目的信号を、上記仮想目的音源位置の数と同
数だけ発生させる擬似目的信号発生段階と;信号発生段
階が出力した擬似目的信号を、上記収音手段間相対遅延
量計算段階が求めた相対遅延量だけ遅延させる複数の第
1の遅延段階と;上記複数の第1の遅延段階のそれぞれ
が出力した擬似目的信号を、上記収音手段間相対減衰量
計算段階で求めた相対減衰量だけ減衰させる複数のゲイ
ン段階と;上記各ゲイン段階の各出力信号を、上記各収
音手段毎に、それぞれ加算することによって、擬似目的
音収音信号を合成する第2の加算段階と;上記各擬似目
的音収音信号と上記各収音信号とをそれぞれ加算するこ
とによって、学習信号を合成する第3の加算段階と;上
記合成された学習信号を、それぞれ異なるフィルタ係数
でフィルタリングする第2の可変フィルタリング段階
と;上記各第2の可変フィルタリング段階の出力信号を
互いに加算する第4の加算段階と;上記各擬似目的信号
をそれぞれ遅延させる第2の遅延段階と;上記第2の遅
延段階からの各遅延出力信号同士を加算する第5の加算
段階と;上記第5の加算段階での出力信号から、上記第
4の加算段階での出力信号を減算することによって、誤
差信号を求める減算段階と;上記収音信号に基づいて、
上記収音範囲内に音源が存在しない期間を検出し、この
検出された期間を、適応させるべき期間として検出する
適応期間検出段階と;上記適応期間検出段階で検出され
た収音範囲内に音源が存在しない期間に、上記誤差信号
の二乗平均値が最小になるように、上記第2の可変フィ
ルタ係数と上記第1の可変フィルタ係数とを更新する適
応アルゴリズム段階と;を有することを特徴とする収音
方法。
11. A first variable filtering step for filtering a sound pickup signal picked up by a plurality of arbitrarily arranged sound pickup means by respective different filter coefficients, and an output of each of the first variable filtering steps. A sound collecting method including a first adding step of adding signals and outputting an added output; a sound collecting range setting step of setting a predetermined sound collecting range; and a plurality of virtual object sound sources within the sound collecting range. A virtual target sound source position setting step of setting a position; a sound reaches the position of each sound collecting means from each virtual target sound source position based on each virtual target sound source position and each position of each sound collecting means Is a spatial characteristic estimating step of estimating a spatial characteristic including a delay time and an attenuation amount, and a distance calculating step of calculating a distance from each of the virtual target sound source positions to each of the sound collecting means positions, From the calculated distance and speed of sound by releasing calculation step, and sound pickup means between the relative delay amount calculation step of obtaining a relative delay between the respective sound pickup means, a distance calculated by the distance calculation step,
A spatial characteristic estimation step including a relative attenuation amount calculation step between the sound pickup means for obtaining a relative attenuation amount between the sound pickup means; and a pseudo target signal that is uncorrelated with each other and is stationary A plurality of first delay stages for delaying the pseudo target signal generated by the signal generation stage by the relative delay amount calculated by the relative delay amount calculation step between the sound collecting means; A plurality of gain stages for attenuating the pseudo target signal output from each of the first delay stages by the relative attenuation amount calculated in the relative sounding means relative attenuation amount calculation stage; A second adding step of synthesizing the pseudo target sound collecting signals by adding the respective sound collecting means; and adding the respective pseudo target sound collecting signals and the respective sound collecting signals. Learning by A third addition step of combining the signals; a second variable filtering step of filtering the combined learning signal with different filter coefficients; and a second addition of the output signals of the respective second variable filtering steps 4; a second delay step for delaying each of the pseudo target signals; a fifth addition step for adding the delayed output signals from the second delay step; and a fifth addition step A subtraction step of obtaining an error signal by subtracting the output signal of the fourth addition step from the output signal of the step;
An adaptive period detecting step of detecting a period during which no sound source is present in the sound collecting range and detecting the detected period as a period to be adapted; a sound source within the sound collecting range detected in the adaptive period detecting step An adaptive algorithm step of updating the second variable filter coefficient and the first variable filter coefficient so that the mean square value of the error signal is minimized in the period in which the error signal does not exist. How to collect sound.
【請求項12】 請求項8において、 上記適応期間検出段階は、 上記収音信号の短時間平均パワーを計算する短時間平均
パワー計算段階と;予め測定した雑音の長時間平均パワ
ーを設定する雑音パワー設定段階と;上記雑音パワーに
閾値係数を乗じた値を閾値として設定する閾値設定段階
と;上記閾値と上記短時間平均パワーとを比較して、適
応期間を検出するパワー比較段階と;を含む段階である
ことを特徴とする収音方法。
12. The adaptive period detecting step according to claim 8, further comprising: a short-time average power calculating step for calculating a short-time average power of the picked-up signal; and a noise for setting a long-time average power of noise measured in advance. A power setting step; a threshold setting step of setting a value obtained by multiplying the noise power by a threshold coefficient as a threshold value; a power comparison step of comparing the threshold value with the short time average power to detect an adaptive period; A method for collecting sound, characterized in that it is a stage that includes.
【請求項13】 請求項8において、 上記適応期間検出段階は、 上記収音信号の短時間平均パワーを計算する短時間平均
パワー計算段階と;上記収音信号の長時間平均パワーを
計算する長時間平均パワー計算段階と;上記長時間平均
パワーに閾値係数を乗じた値を閾値として設定する閾値
係数乗算段階と;上記閾値と上記短時間平均パワーとを
比較し、適応期間を検出するパワー比較段階と;を含む
段階であることを特徴とする収音方法。
13. The adaptive period detecting step according to claim 8, further comprising: a short time average power calculating step for calculating a short time average power of the sound pickup signal; and a long time calculating for a long time average power of the sound pickup signal. A time average power calculation step; a threshold coefficient multiplication step of setting a value obtained by multiplying the long time average power by a threshold coefficient as a threshold value; a power comparison for comparing the threshold value with the short time average power and detecting an adaptive period And a step of including;
【請求項14】 請求項12または請求項13におい
て、 上記閾値係数乗算段階は、 上記雑音パワー設定段階または上記長時間平均パワー計
算段階での出力に、立上り閾値を乗算する立上り閾値係
数乗算段階と;上記雑音パワー設定段階202または上
記長時間平均パワー計算段階204での出力に、立下り
閾値を乗算する立下り閾値係数乗算段階と;上記パワー
比較段階出力の状態によって、立上り閾値係数乗算出力
または立下り閾値係数乗算出力を選択し、この選択され
た出力を閾値として設定する立上り立下り切替段階と;
を含む段階であることを特徴とする収音方法。
14. The rising threshold coefficient multiplication step according to claim 12 or 13, wherein the threshold coefficient multiplication step comprises a rising threshold coefficient multiplication step of multiplying an output in the noise power setting step or the long-time average power calculation step by a rising threshold value. A falling threshold coefficient multiplication step of multiplying the output in the noise power setting step 202 or the long-time average power calculation step 204 by a falling threshold value; a rising threshold coefficient multiplication output depending on the state of the power comparison step output; A rising / falling switching step of selecting a falling threshold coefficient multiplication output and setting the selected output as a threshold;
A method for collecting sound, characterized in that it is a stage including.
JP2000249547A 2000-08-21 2000-08-21 Sound collection method and device Expired - Fee Related JP3514714B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000249547A JP3514714B2 (en) 2000-08-21 2000-08-21 Sound collection method and device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000249547A JP3514714B2 (en) 2000-08-21 2000-08-21 Sound collection method and device

Publications (2)

Publication Number Publication Date
JP2002062895A JP2002062895A (en) 2002-02-28
JP3514714B2 true JP3514714B2 (en) 2004-03-31

Family

ID=18739272

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000249547A Expired - Fee Related JP3514714B2 (en) 2000-08-21 2000-08-21 Sound collection method and device

Country Status (1)

Country Link
JP (1) JP3514714B2 (en)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4195267B2 (en) 2002-03-14 2008-12-10 インターナショナル・ビジネス・マシーンズ・コーポレーション Speech recognition apparatus, speech recognition method and program thereof
JP4104626B2 (en) 2003-02-07 2008-06-18 日本電信電話株式会社 Sound collection method and sound collection apparatus
JP4873913B2 (en) 2004-12-17 2012-02-08 学校法人早稲田大学 Sound source separation system, sound source separation method, and acoustic signal acquisition apparatus
JP2007104546A (en) * 2005-10-07 2007-04-19 National Institute Of Advanced Industrial & Technology Safety management device
JP5139111B2 (en) * 2007-03-02 2013-02-06 本田技研工業株式会社 Method and apparatus for extracting sound from moving sound source
JP6433903B2 (en) * 2013-08-29 2018-12-05 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America Speech recognition method and speech recognition apparatus
CN115442686B (en) * 2022-11-08 2023-02-03 深圳同创音频技术有限公司 Multichannel recording intelligent management system based on big data
EP4672240A1 (en) * 2023-04-10 2025-12-31 China Petroleum & Chemical Corporation MOBILE FAULT DETECTION METHOD AND SYSTEM FOR A MOBILE DEVICE

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001309483A (en) 2000-04-19 2001-11-02 Nippon Telegr & Teleph Corp <Ntt> Sound pickup method and sound pickup device

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001309483A (en) 2000-04-19 2001-11-02 Nippon Telegr & Teleph Corp <Ntt> Sound pickup method and sound pickup device

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
小林, 古家, 片岡,複数仮想音源を用いた適応型マイクロホンアレー,電子情報通信学会誌 A,日本,2003年 4月 1日,Vol.J86−A, No.4,Pages 333−344
小林, 古家,複数仮想音源を用いた適応型アレーの収束特性および仮想音源配置に関する検討,電子情報通信学会技術研究報告[応用音響],日本,2000年10月27日,Vol.100, No.397, EA2000−54,Pages 23−30
小林, 古家,話者移動による適応形アレーの性能劣化の改善,日本音響学会2000年秋季研究発表会講演論文集 −I−,日本,2000年 9月20日,3−P−19,Pages 485−486

Also Published As

Publication number Publication date
JP2002062895A (en) 2002-02-28

Similar Documents

Publication Publication Date Title
US9210504B2 (en) Processing audio signals
US8965757B2 (en) System and method for multi-channel noise suppression based on closed-form solutions and estimation of time-varying complex statistics
KR101449433B1 (en) Noise cancelling method and apparatus from the sound signal through the microphone
CN104158990B (en) Method and audio receiving circuit for processing audio signal
US9111543B2 (en) Processing signals
US20210176558A1 (en) Earphone signal processing method and system, and earphone
US8824693B2 (en) Processing audio signals
JP5762956B2 (en) System and method for providing noise suppression utilizing nulling denoising
CN103428385B (en) For handling the method for audio signal and circuit arrangement for handling audio signal
KR102470962B1 (en) Method and apparatus for enhancing sound sources
US20190273988A1 (en) Beamsteering
CN111354368B (en) Method for compensating processed audio signal
EP1252796A1 (en) System and method for dual microphone signal noise reduction using spectral subtraction
KR101934999B1 (en) Apparatus for removing noise and method for performing thereof
WO2009117084A2 (en) System and method for envelope-based acoustic echo cancellation
TWI854590B (en) Echo cancelling method for dual-microphone array, echo cancelling device for dual-microphone array, electronic equipment, and computer-readable medium
JP3514714B2 (en) Sound collection method and device
JP4119328B2 (en) Sound collection method, apparatus thereof, program thereof, and recording medium thereof.
CN115529537B (en) A differential beamforming method, apparatus and storage medium
CN112997249B (en) Voice processing method, device, storage medium and electronic equipment
CN107452398A (en) Echo acquisition methods, electronic equipment and computer-readable recording medium
JP2004078021A (en) Sound collection method, sound collection device, and sound collection program
JP2003250193A (en) Echo canceling method, apparatus for implementing the method, program, and recording medium therefor
JP2002223182A (en) Echo canceling method, its apparatus, its program and its recording medium
JP3616341B2 (en) Multi-channel echo cancellation method, apparatus thereof, program thereof, and recording medium

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040109

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080123

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090123

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090123

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100123

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110123

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110123

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120123

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130123

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees