JP4183338B2 - Noise reduction system - Google Patents
Noise reduction system Download PDFInfo
- Publication number
- JP4183338B2 JP4183338B2 JP18305999A JP18305999A JP4183338B2 JP 4183338 B2 JP4183338 B2 JP 4183338B2 JP 18305999 A JP18305999 A JP 18305999A JP 18305999 A JP18305999 A JP 18305999A JP 4183338 B2 JP4183338 B2 JP 4183338B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- output
- adaptive
- microphone
- learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000009467 reduction Effects 0.000 title claims description 26
- 230000003044 adaptive effect Effects 0.000 claims description 99
- 238000012545 processing Methods 0.000 claims description 57
- 238000012546 transfer Methods 0.000 claims description 50
- 230000004044 response Effects 0.000 claims description 19
- 230000005540 biological transmission Effects 0.000 claims description 10
- 238000000034 method Methods 0.000 claims description 9
- 238000005259 measurement Methods 0.000 claims description 4
- 230000005236 sound signal Effects 0.000 claims description 4
- 230000015572 biosynthetic process Effects 0.000 claims description 3
- 238000003786 synthesis reaction Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 description 12
- 230000000694 effects Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000007423 decrease Effects 0.000 description 3
- 230000001934 delay Effects 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は音声認識時における話者音声信号のSN比を改善するノイズリダクションシステムに係わり、特に、AMNOR(Adaptive Microphone-array for Noise Reduction)方式に用いて好適なノイズリダクションシステムに関する。
【0002】
【従来の技術】
現在の音声認識システムは、15dB以上のSN比が確保されている場合、約95%の認識率が実現できる程の技術レベルまでに達している。しかし、周囲に存在するノイズによりSN比が低下すると、それに伴って認識率が急激に低下する性質も有している。図5はSN比と認識性能との関係をいくつかの種類のマイクロホン(無指向性、単一指向性、狭指向性等)について評価したもので、各マイクロホンのSN比と認識率はおおむねS字特性を示す帯100の中に包含されている。この図5から明らかなように、認識率はSN比の低下により急激に低下し、SN比が0dBの環境下において約50%にまで低下してしまう。
【0003】
そのため、自動車が発生するノイズ(エンジン音・ロードノイズ・パターンノイズ・風切り音など)が存在する自動車車室内において、上記のような認識性能の劣化は避けられず、音声認識システムを車載化する上で大きな問題の一つとなっている。前記したような事情から、周囲に存在するノイズの影響を少なくし、高いSN比で音声を受音するための方式が種々提案されており、AMNOR方式はその一例である。
【0004】
AMNOR方式のノイズリダクションシステムでは、複数のマイクロホンを設け、目標信号を各マイクロホン毎に相当量遅延し、各遅延信号を対応するマイクロホン出力信号に加算して参照信号とする。適応信号処理部は、学習時、各参照信号と誤差信号を入力され、誤差信号のパワーが最小となるように適応信号処理を行って適応フィルタの係数を更新し、音声認識時などの非学習時、適応フィルタの係数更新を停止し、学習時の係数を適応フィルタに設定したままにし、目標応答設定部から出力する信号と適応フィルタから出力する信号の差を音声信号としえ音声認識部に出力する。
【0005】
図6は一般的な2つのマイクを用いたAMNOR方式のノイズリダクションシステムの構成例である。図中、11,12は第1、第2のマイクロホン、13,14はアンプ、15はランダムノイズたとえばホワイトノイズを目標信号として発生するシグナルジェネレータ(SG)、16はゲイン可変アンプ、17,18は話者口元から各マイクロホン迄の信号遅延時間d1,d2に相当する遅延を目標信号に付加する遅延部、19,20は各遅延部から出力する信号をそれぞれ各マイクロホンの出力信号に加算する加算部である。
【0006】
21は2入力/1出力の適応信号処理部であり、第1、第2の2つの適応信号処理部21a,21b及び各適応信号処理部21a,21bの出力を加算して出力する加算器21cを有している。各適応信号処理部21a,21bは図示しないがLMS演算部と、FIR型ディジタルフィルタ構成の適応フィルタを有している。第1の信号処理部21aは、学習時、加算器19の出力信号を参照信号とし、エラー信号eのパワーが最小となるように適応フィルタ係数W1を更新し、音声認識時、適応フィルタの係数更新を停止し、学習時に得られている係数W1を適応フィルタに設定したままにして入力信号にフィルタリング処理を施して出力する。第2の信号処理部21bは、学習時、加算器20の出力信号を参照信号とし、エラー信号eのパワーが最小となるように適応フィルタ係数W2を更新し、音声認識時、適応フィルタの係数更新を停止し、学習時に得られている係数W2を適応フィルタに設定したままにして入力信号にフィルタリング処理を施して出力する。加算器21cは各適応フィルタ出力を加算して出力する。
【0007】
22はシグナルジェネレータ15から出力するノイズ信号を目標信号として入力される目標応答設定部であり、音響系の逆特性を精度よく近似するためのものである。適応フィルタのタップ長の半分の信号遅延時間をd′、遅延時間d1,d2の平均値をd″とするとき、目標応答設定部22は遅延時間d(=d′+d″)の遅延特性を有し、オーディオ周波数帯域でフラットな特性(ゲイン1の特性)を有する。23は減算部であり、目標応答設定部22から出力する目標応答より適応信号処理部21の出力信号を減算して誤差信号eを出力する。
【0008】
学習時、マイクロホン11、12には自動車CRが発生するノイズXn1(z),Xn2(z)のみが入力する。加算器19、20は目標信号としてのランダムノイズと各マイクロホン出力を合成し、適応信号処理部21は加算器19,20の出力信号を参照信号とし、エラー信号eのパワーが最小となるように適応信号処理を行って適応フィルタの係数W1,W2を更新する。
音声認識時、適応信号処理部21はフィルタ係数の更新をせず、学習時に得られた係数W1,W2を各適応フィルタに設定したままにし、これら適応フィルタの出力信号を合成して減算部23に入力する。減算部23は目標応答設定部22から出力する目標応答より適応信号処理部21の出力信号を減算し、差信号を音声信号として音声認識部に入力する。かかるAMNOR方式のノイズリダクションシステムによれば、音声認識時にノイズは最小になり、しかも、大きな話者音声出力が得られSN比を改善できる。
【0009】
【発明が解決しようとする課題】
(1) かかるAMNOR方式は音響伝達特性がそれほど複雑でなく、話者口元から各マイクへの音響伝達特性の差分が遅延のみであらわせる環境、例えば、比較的広い部屋などで使用する場合には有効である。しかし、車室内のように非常に複雑な音響伝達特性を持つ環境では、伝達特性の差分は遅延のみで表現できず不十分である。
(2)車室内において、ノイズ源が多数存在し、各マイクで受信するノイズは相関が低いため、マイク間距離を短くせざるを得ない。このため、話者―マイク間距離は短距離に限定されてしまい、各マイクへの音声の到来の時間差は微少であり、必ずしも遅延分を精度よく設定できず、遅延のみでは不十分である。たとえば、サンプリング周波数fsが11.025(kHz)のとき、1サンプルは、
(1/11.025×103)(sec)×340m/sec)=3.08(cm)に相当するため、距離差3(cm)以上で、かつ3(cm)単位に相当する遅延しか設定できない。
(3) AMNOR方式のマイクロホンアレイシステムにおいては、複数個のマイクを使用するが、理想的には各マイクの特性は同一である必要があるが、現実的にはマイクロホンの特性は同一でなく、このため意図するとおりのノイズ低減効果を期待できない。尚、仮に同一の特性を有するマイクロホンを用意するとすればコストがかかることになる。
【0010】
以上から、本発明は、ノイズ削減効果を向上できるノイズリダクションシステムを提供することである。
本発明の別の目的は、各マイクロホンの特性が同一でなくてもノイズ削減効果を向上できるノイズリダクションシステムを提供することである。
【0011】
【課題を解決するための手段】
上記課題は本発明によれば、▲1▼複数のマイクロホン、▲2▼ランダムノイズ信号を発生するシグナルジェネレータ、▲3▼話者口元から各マイクロホンまでの伝達特性を模擬する伝達回路、▲4▼各伝達回路を介して出力するランダムノイズ信号をそれぞれ各マイクロホンの出力信号に合成する合成部、▲5▼学習時、前記ランダムノイズ信号を目標信号、各合成部出力をそれぞれ参照信号として適応信号処理を行って適応フィルタの係数を更新し、非学習時にフィルタ係数の更新を停止する適応信号処理部、▲6▼目標信号に所定の遅延を付与する目標応答設定部、▲7▼適応フィルタの出力信号と目標応答設定部の出力信号との差を求め、非学習時、該差信号を音声信号として出力する減算部を備えたノイズリダクションシステムにより達成される。本発明によれば、従来、遅延特性のみで話者口元からマイクロホンまでの伝達特性を模擬していたものを、話者口元からマイクロホンまでの実際の伝達特性で模擬するため、ノイズ削減効果を向上することができる
【0012】
又、上記目的は、本発明によれば、話者口元から各マイクロホン出力端までの伝達特性を測定する伝達特性測定手段を伝達回路に設け、システムを伝達特性測定モード、学習モード、非学習モードに切り替えて、伝達特性の測定、フィルタ係数の学習、音声信号の出力を行うことにより達成される。このようにすれば、話者口元から各マイクロホンの出力端までの伝達特性を測定して伝達回路に設定でき、マイクロホンの特性が同一でなくてもノイズ削減効果を向上できる。
【0013】
【発明の実施の形態】
図1は本発明の第1実施例の構成図である。図中、51,52は第1、第2のマイクロホン、53,54はアンプ、55はランダムノイズたとえばホワイトノイズを目標信号として発生するシグナルジェネレータ(SG)、56はゲイン可変アンプ、57,58は話者口元から各マイクロホンの出力端迄の伝達特性(伝搬特性)CS1′、CS2′を模擬し、該伝搬特性を目標信号に付与する伝達回路、59,60は各伝達回路から出力する信号をそれぞれ各マイクロホンの出力信号に加算する加算部である。
【0014】
61は2入力/1出力の適応信号処理部であり、第1、第2の2つの適応信号処理部61a,61b及び各適応信号処理部の出力を加算して出力する加算器61cを有している。各適応信号処理部61a,61bは図示しないがLMS演算部と、FIR型ディジタルフィルタ構成の適応フィルタを有している。
第1の信号処理部61aは、学習時、加算器59の出力信号を参照信号とし、エラー信号eのパワーが最小となるように適応フィルタ係数W1を更新し、非学習時たとえば音声認識時、適応フィルタの係数更新を停止し、学習時に得られている係数W1を適応フィルタに設定したままにして入力信号にフィルタリング処理を施して出力する。第2の信号処理部21bは、学習時、加算器60の出力信号を参照信号とし、エラー信号eのパワーが最小となるように適応フィルタ係数W2を更新し、音声認識時、適応フィルタの係数更新を停止し、学習時に得られている係数W2を適応フィルタに設定したままにして入力信号にフィルタリング処理を施して出力する。加算器61cは各適応フィルタ出力を合成して出力する。
【0015】
62はシグナルジェネレータ55から出力するノイズ信号を目標信号として入力される目標応答設定部であり、音響系の逆特性を精度よく近似するためのものである。適応フィルタのタップ長の半分の信号遅延時間をdとすれば、目標応答設定部4は該遅延時間dの遅延特性を有し、オーディオ周波数帯域でフラットな特性(ゲイン1の特性)を有する。63は減算部であり、目標応答設定部62から出力する目標応答より適応信号処理部71の出力信号を減算して誤差信号eを出力する。
【0016】
学習時、マイクロホン51、52には自動車CRが発生するノイズXn1(z),Xn2(z)のみが入力する。伝達回路57、58は、目標信号としてのランダムノイズに対し、話者口元から各マイクロホン出力端迄の伝達特性CS1′、CS2′付与する。加算器59、60は伝達回路57,58の出力と各マイクロホン出力を合成し、適応信号処理部61は加算器59,60の出力信号を参照信号とし、エラー信号eのパワーが最小となるように適応信号処理を行って適応フィルタの係数W1,W2を更新する。
音声認識時、適応信号処理部61はフィルタ係数の更新をせず、学習時に得られた係数W1,W2を各適応フィルタに設定したままにし、これら適応フィルタの出力信号を合成して減算部63に入力する。減算部63は目標応答設定部62から出力する目標応答より適応信号処理部61の出力信号を減算し、差信号を音声信号として音声認識部に入力する。
以上のように、伝達特性CS1′,CS2′を目標信号に付与した信号と各マイクロホンの出力信号とを加算した信号を参照信号として適応信号処理するから、学習時にノイズ出力のパワーが最小となるように正確に適応フィルタ係数を決定でき、この結果、音声認識時にノイズを低減でき、SN比の大きな音声信号を出力できる。
【0017】
図2は話者DRの口元から各マイクロホン出力端迄の伝達特性CS1′、CS2′を測定する測定装置の構成図であり、図1と同一部分には同一符号を付している。図中、70は話者口元付近に設けたスピーカであり、シグナルジェネレータ55から出力するホワイトノイズをマイクロホン51,52に向けて出力する。
71はホワイトノイズを参照信号、マイクロホン51の出力を目標信号とし、エラーe1のパワーが最小となるように適応信号処理を行って適応フィルタの係数Wcs1を更新する適応信号処理部、72はマイクロホン51の出力と適応信号処理部71の出力との差(エラー)e1を出力する減算部である。
73はホワイトノイズを参照信号、マイクロホン52の出力を目標信号とし、エラーe2のパワーが最小となるように適応信号処理を行って適応フィルタの係数Wcs2を更新する適応信号処理部、74はマイクロホン52の出力と適応信号処理部73の出力との差(エラー)e2を出力する減算部である。
【0018】
適応信号処理部71、73において、継続して適応信号処理を行って適応フィルタ(図示せず)の係数Wcs1,Wcs2を更新すると、該係数は一定値に収束する。係数値Wcs1が一定値に収束したとき、適応信号処理部71の適応フィルタの特性は、話者口元からマイクロホン51の出力端迄の伝達関数CS1′を示す。又、係数値Wcs2が一定値に収束したとき、適応信号処理部73の適応フィルタの特性は、話者口元からマイクロホン52の出力端迄の伝達関数CS2′を示す。
従って、図1の伝達回路57、58をFIR型ディジタルフィルタで構成し、これらフィルタの係数としてWcs1,Wcs2を設定すれば、伝達回路57,58により話者口元からマイクロホン51,52の出力端迄の伝達関数CS1′,CS2′を模擬できる。
【0019】
以上より、車両毎にWcs1,Wcs2を決定するようにすれば、マイクの特性を含めて話者口元からマイクロホン出力端までの伝達特性を測定できる。しかし、車両毎にWcs1,Wcs2を決定するのは煩雑である。そこで、音声認識装置を搭載する、車種およびマイク位置が特定できる場合には、あらかじめ、1台の車両について係数Wcs1,Wcs2の値を確定し、それを図1の伝達回路57、58に設定する。しかし、この方法はマイク特性の補正効果を有しない。
【0020】
図3は話者口元から各マイクロホンの出力端迄の伝達関数を測定する機能を備えたAMNOR方式の別のノイズリダクションシステムの構成図であり、図1と同一部分には同一符号を付している。この図3のシステムはスイッチの切り替えにより、伝達関数測定時には図2に示す構成になり、学習/音声認識時には図1の構成になる。図3において、図1と異なる点は、
(1) 切替スイッチSW1〜SW4を設けている点、
(2) 話者口元近傍に伝達特性測定用のスピーカ80を設けている点、
(3) 伝達回路57,58を適応信号処理が可能な構成にし、話者口元から各マイクロホン出力端迄の伝達関数を測定できるようにした点、
である。
【0021】
伝達回路57は、適応信号処理部57aと減算部57bで構成されている。適応信号処理部57aは、ホワイトノイズを参照信号、マイクロホン51の出力を目標信号とし、エラーe1のパワーが最小となるように適応信号処理を行って適応フィルタの係数Wcs1を更新し、減算部57bはマイクロホン51の出力と適応信号処理部57aの出力との差(エラー)e1を出力する。
又、伝達回路58は、適応信号処理部58aと減算部58bで構成されている。適応信号処理部58aは、ホワイトノイズを参照信号、マイクロホン52の出力を目標信号とし、エラーe2のパワーが最小となるように適応信号処理を行って適応フィルタの係数Wcs2を更新し、減算部58bはマイクロホン52の出力と適応信号処理部58aの出力との差(エラー)e2を出力する。
【0022】
話者口元から各マイクロホンの出力端迄の伝達関数を測定するには、スイッチSW1,SW2,SW3をオンし、スイッチSW4をオフし、システムを図2に示す構成にする。しかる後、図2で説明した方法により、適応信号処理部57a,58aの適応フィルタ(図示せず)の係数が一定値Wcs1,Wcs2に収束すれば、各適応フィルタは話者口元からマイクロホン51,52の出力端迄の伝達関数CS1′,CS2′を模擬することになる。尚、測定完了によりスピーカ80を除去する。
学習/音声認識するには、スイッチSW1,SW2,SW3をオフし、スイッチSW4をオンし、システムを図1に示す構成にする。しかる後、図1で説明した方法により、学習、音声認識を行う。
【0023】
図4は図3のノイズリダクションシステムの全体の制御フローである。
最初に、話者口元から各マイクロホンの出力端迄の伝達関数を同定するモードであるかチェックし(ステップ101)、同定モードであれば、スイッチSW1,SW2,SW3をオン、スイッチSW4をオフし、システムを図2に示す構成にし、適応信号処理により係数Wcs1,Wcs2を更新する(ステップ102)。ついで、係数Wcs1,Wcs2が一定値に収束したかチェックし(ステップ103)、一定値に収束するまでステップ102の更新処理を行う。係数Wcs1,Wcs2が一定値に収束すれば、適応信号処理部57a,58aの各適応フィルタは、話者口元からマイクロホン51,52の出力端迄の伝達関数CS1′,CS2′を模擬することになる。一定値に収束すれば、スイッチSW1,SW2,SW3をオフし、スイッチSW4をオンし、システムを図1に示す構成にする。
【0024】
ついで、音声認識開始を指示するトークスイッチが操作されて音声認識状態になったかチェックする(ステップ104)。トークスイッチがオン操作されなければ、学習モードであるから、2入力/1出力の適応信号処理部61は、加算器59,60の出力信号を参照信号としてエラー信号eのパワーが最小となるように適応信号処理を行って適応フィルタの係数W1,W2を更新する(ステップ105)。以後、トークスイッチがオン操作されるまで、係数W1,W2の更新動作を行う。これにより、係数W1,W2は一定値に収束する。
ステップ104において、トークスイッチがオン操作されると音声認識モードになり、係数W1,W2の更新動作を終了する(ステップ106)。音声認識時、適応信号処理部61はフィルタ係数の更新をせず、学習時に決定したフィルタ係数W1,W2を適応フィルタに設定したままにし、減算部63は目標応答設定部62から出力する目標信号より適応信号処理部61の出力信号を減算した信号、すなわち、ノイズが低減し、SN比が向上した音声信号を図示しない音声認識部に出力する。
【0025】
以後、トークスイッチがオフ操作されて音声認識が解除される迄、ステップ106の動作を行い、トークスイッチがオフ操作されると(ステップ107)、学習モードに戻りステップ105以降の係数W1,W2の更新動作が再開する。
図3のノイズリダクションシステムによれば、車の出荷前に生産ライン等にて、あるいは、販売店等で伝達特性CS1′,CS2′を同定する作業を1回行うだけで良く、しかも、マイクロホンの特性を含めて伝達特性CS1′,CS2′を同定できるためマイクロホンに特性の不揃があっても何ら問題を生じない。又、予め、車種を特定できない場合等不確定要素を含むような場合であっても、伝達特性CS1′,CS2′を同定して設定することができる。
以上では、本発明システムから出力する音声信号を非学習時に音声認識装置に入力する場合について説明したが、かかる場合に限らず、非学習時に音声信号をハンズフリー電話器に入力したり、その他の機器に入力する場合に応用できるものである。
以上、本発明を実施例により説明したが、本発明は請求の範囲に記載した本発明の主旨に従い種々の変形が可能であり、本発明はこれらを排除するものではない。
【0026】
【発明の効果】
以上本発明によれば、従来、遅延特性のみで口元からマイクロホンまでの伝達特性を模擬していたものを、実際の口元からマイクロホンまでの伝達特性で模擬するため、ノイズ削減効果を向上することができる
又、本発明によれば、一般的なAMNOR方式では対応できない、車室内ノイズの除去が可能となる。
又、本発明によれば、マイク−話者間の伝達特性を模擬する機構をノイズリダクション装置に組み込むことで、マイク特性のバラツキ補正が可能になる。
又、本発明によれば、ノイズリダクションのための適応処理をリアルタイムに行うことができる。
【図面の簡単な説明】
【図1】本発明のノイズリダクションシステムの構成図である。
【図2】本発明の話者口元から各マイクロホン出力端までの伝達特性測定装置の構成図である。
【図3】伝達特性測定機能を備えたノイズリダクションシステムの構成図である。
【図4】本発明の全体の制御フローである。
【図5】SN比と認識率の関係図である。
【図6】従来のAMNOR方式のノイズリダクションシステムである。
【符号の説明】
51,52・・第1、第2のマイクロホン
55・・ランダムノイズを目標信号として発生するシグナルジェネレータ
57,58・・伝達特性を模擬する伝達回路
59,60・・加算部
61・・2入力/1出力の適応信号処理部
61a,61b・・第1、第2の適応信号処理部
62・・目標応答設定部
63・・減算部[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a noise reduction system for improving the S / N ratio of a speaker voice signal during speech recognition, and more particularly to a noise reduction system suitable for use in an AMNOR (Adaptive Microphone-array for Noise Reduction) system.
[0002]
[Prior art]
The current speech recognition system has reached a technical level that can achieve a recognition rate of about 95% when a signal-to-noise ratio of 15 dB or more is secured. However, when the S / N ratio is reduced due to noise present in the surrounding area, the recognition rate is rapidly lowered. Fig. 5 shows the relationship between the SN ratio and recognition performance for several types of microphones (omnidirectional, unidirectional, narrow directivity, etc.). The SNR and recognition rate of each microphone is roughly S. It is included in the
[0003]
For this reason, the above-mentioned deterioration in recognition performance is unavoidable in automobile interiors where noise generated by automobiles (engine noise, road noise, pattern noise, wind noise, etc.) is present, and a voice recognition system is mounted on the vehicle. It is one of the big problems. In view of the circumstances described above, various methods have been proposed for receiving sound with a high S / N ratio while reducing the influence of noise present in the surroundings, and the AMNOR method is one example.
[0004]
In the AMNOR noise reduction system, a plurality of microphones are provided, the target signal is delayed by a considerable amount for each microphone, and each delayed signal is added to the corresponding microphone output signal to obtain a reference signal. The adaptive signal processing unit receives each reference signal and error signal during learning, performs adaptive signal processing to minimize the power of the error signal, updates the coefficient of the adaptive filter, and performs non-learning such as during speech recognition At this time, the coefficient update of the adaptive filter is stopped, the coefficient at the time of learning is left set in the adaptive filter, and the difference between the signal output from the target response setting unit and the signal output from the adaptive filter is output as a speech signal to the speech recognition unit To do.
[0005]
FIG. 6 is a configuration example of an AMNOR type noise reduction system using two general microphones. In the figure, 11 and 12 are first and second microphones, 13 and 14 are amplifiers, 15 is a signal generator (SG) that generates random noise such as white noise as a target signal, 16 is a gain variable amplifier, and 17 and 18 are
[0006]
[0007]
[0008]
During learning, only the noises Xn 1 (z) and Xn 2 (z) generated by the automobile CR are input to the
At the time of speech recognition, the adaptive
[0009]
[Problems to be solved by the invention]
(1) The AMNOR method has less complicated sound transfer characteristics, and when used in an environment where the difference in sound transfer characteristics from the speaker's mouth to each microphone can be expressed only by a delay, such as a relatively large room. It is valid. However, in an environment having a very complicated acoustic transfer characteristic such as in a passenger compartment, the difference in transfer characteristic cannot be expressed only by a delay, and is insufficient.
(2) There are many noise sources in the passenger compartment, and the noise received by each microphone has a low correlation, so the distance between the microphones must be shortened. For this reason, the distance between the speaker and the microphone is limited to a short distance, and the time difference of arrival of the voice to each microphone is very small. The delay cannot be set accurately, and the delay alone is not sufficient. For example, when the sampling frequency fs is 11.025 (kHz), one sample is
Since it corresponds to (1 / 11.025 × 10 3 ) (sec) × 340 m / sec) = 3.08 (cm), only a delay corresponding to a distance difference of 3 (cm) or more and 3 (cm) units can be set.
(3) The AMNOR microphone array system uses a plurality of microphones, but ideally the characteristics of each microphone should be the same, but in reality the characteristics of the microphones are not the same, For this reason, the expected noise reduction effect cannot be expected. If microphones having the same characteristics are prepared, it will be costly.
[0010]
As described above, the present invention is to provide a noise reduction system that can improve the noise reduction effect.
Another object of the present invention is to provide a noise reduction system that can improve the noise reduction effect even if the characteristics of the microphones are not the same.
[0011]
[Means for Solving the Problems]
According to the present invention, (1) a plurality of microphones, (2) a signal generator for generating a random noise signal, (3) a transfer circuit for simulating transfer characteristics from the speaker's mouth to each microphone, (4) A synthesis unit that synthesizes a random noise signal output via each transmission circuit with an output signal of each microphone. (5) During learning, adaptive signal processing is performed using the random noise signal as a target signal and each synthesis unit output as a reference signal. To update the coefficient of the adaptive filter and stop updating the filter coefficient when not learning, (6) target response setting unit to give a predetermined delay to the target signal, and (7) output of the adaptive filter A noise reduction system including a subtraction unit that obtains a difference between a signal and an output signal of a target response setting unit and outputs the difference signal as an audio signal when not learning. Ri is achieved. According to the present invention, since the transfer characteristic from the speaker mouth to the microphone is simulated by the actual transfer characteristic from the speaker mouth to the microphone, the noise reduction effect is improved. Can do [0012]
Further, according to the present invention, the present invention provides a transfer circuit for measuring transfer characteristics from a speaker's mouth to each microphone output terminal in a transfer circuit, and the system is configured to transfer characteristics measurement mode, learning mode, non-learning mode. This is achieved by measuring transfer characteristics, learning filter coefficients, and outputting audio signals. In this way, the transfer characteristic from the speaker's mouth to the output end of each microphone can be measured and set in the transfer circuit, and the noise reduction effect can be improved even if the microphone characteristics are not the same.
[0013]
DETAILED DESCRIPTION OF THE INVENTION
FIG. 1 is a block diagram of a first embodiment of the present invention. In the figure, 51 and 52 are first and second microphones, 53 and 54 are amplifiers, 55 is a signal generator (SG) that generates random noise such as white noise as a target signal, 56 is a gain variable amplifier, and 57 and 58 are Simulating transfer characteristics (propagation characteristics) CS1 'and CS2' from the speaker's mouth to the output terminal of each microphone, and transfer
[0014]
First
[0015]
[0016]
During learning, only the noises Xn 1 (z) and Xn 2 (z) generated by the automobile CR are input to the
At the time of speech recognition, the adaptive
As described above, adaptive signal processing is performed using the signal obtained by adding the transfer characteristics CS1 ′ and CS2 ′ to the target signal and the output signal of each microphone as a reference signal, so that the power of the noise output is minimized during learning. Thus, the adaptive filter coefficient can be accurately determined. As a result, noise can be reduced during speech recognition, and a speech signal having a large SN ratio can be output.
[0017]
FIG. 2 is a block diagram of a measuring apparatus for measuring transfer characteristics CS1 ′ and CS2 ′ from the mouth of the speaker DR to the output terminals of the microphones. The same parts as those in FIG. In the figure, 70 is a speaker provided near the speaker's mouth, and outputs white noise output from the
71 is an adaptive signal processing unit that uses white noise as a reference signal and the output of the
73 is an adaptive
[0018]
When the adaptive
Therefore, if the
[0019]
As described above, if Wcs 1 and Wcs 2 are determined for each vehicle, the transfer characteristics from the speaker mouth to the microphone output end including the characteristics of the microphone can be measured. However, it is complicated to determine Wcs 1 and Wcs 2 for each vehicle. Therefore, when the vehicle type and the microphone position on which the voice recognition device is mounted can be specified, the values of the coefficients Wcs 1 and Wcs 2 are determined in advance for one vehicle, and the values are transferred to the
[0020]
FIG. 3 is a configuration diagram of another AMNOR type noise reduction system having a function of measuring a transfer function from the speaker's mouth to the output end of each microphone. The same parts as those in FIG. Yes. The system shown in FIG. 3 has the configuration shown in FIG. 2 when the transfer function is measured, and the configuration shown in FIG. 1 when learning / speech recognition is performed. 3 differs from FIG. 1 in that
(1) The changeover switches SW1 to SW4 are provided,
(2) A
(3) The
It is.
[0021]
The
The
[0022]
In order to measure the transfer function from the speaker's mouth to the output terminal of each microphone, the switches SW1, SW2, and SW3 are turned on, the switch SW4 is turned off, and the system is configured as shown in FIG. Thereafter, if the coefficients of the adaptive filters (not shown) of the adaptive
For learning / recognition, the switches SW1, SW2, and SW3 are turned off, the switch SW4 is turned on, and the system is configured as shown in FIG. Thereafter, learning and speech recognition are performed by the method described in FIG.
[0023]
FIG. 4 is an overall control flow of the noise reduction system of FIG.
First, it is checked whether the transfer function from the speaker's mouth to the output terminal of each microphone is identified (step 101). If the mode is the identification mode, the switches SW1, SW2, SW3 are turned on and the switch SW4 is turned off. The system is configured as shown in FIG. 2, and the coefficients Wcs 1 and Wcs 2 are updated by adaptive signal processing (step 102). Next, it is checked whether the coefficients Wcs 1 and Wcs 2 have converged to a constant value (step 103), and the update process of
[0024]
Next, it is checked whether or not the talk switch for instructing the start of voice recognition is operated to enter the voice recognition state (step 104). If the talk switch is not turned on, the learning mode is set, so that the 2-input / 1-output adaptive
In
[0025]
Thereafter, the operation of
According to the noise reduction system of FIG. 3, it is only necessary to identify the transmission characteristics CS1 ′ and CS2 ′ once in a production line or at a dealer before the vehicle is shipped. Since the transmission characteristics CS1 ′ and CS2 ′ including the characteristics can be identified, no problem occurs even if the microphones have irregular characteristics. Further, even when an uncertain element is included such as when the vehicle type cannot be specified, the transfer characteristics CS1 ′ and CS2 ′ can be identified and set in advance.
In the above, the case where the speech signal output from the system of the present invention is input to the speech recognition apparatus at the time of non-learning has been described. However, the present invention is not limited thereto, and the speech signal is input to the hands-free telephone at the time of non-learning, This can be applied when inputting to a device.
The present invention has been described with reference to the embodiments. However, the present invention can be variously modified in accordance with the gist of the present invention described in the claims, and the present invention does not exclude these.
[0026]
【The invention's effect】
As described above, according to the present invention, since the transfer characteristic from the mouth to the microphone is simulated with only the delay characteristic, the transfer characteristic from the actual mouth to the microphone is simulated, so that the noise reduction effect can be improved. In addition, according to the present invention, it is possible to remove vehicle interior noise that cannot be handled by a general AMNOR system.
Further, according to the present invention, by incorporating a mechanism for simulating the microphone-speaker transfer characteristic into the noise reduction device, it is possible to correct the variation in the microphone characteristic.
Further, according to the present invention, adaptive processing for noise reduction can be performed in real time.
[Brief description of the drawings]
FIG. 1 is a configuration diagram of a noise reduction system of the present invention.
FIG. 2 is a configuration diagram of a transfer characteristic measuring apparatus from a speaker's mouth to each microphone output terminal according to the present invention.
FIG. 3 is a configuration diagram of a noise reduction system having a transfer characteristic measurement function.
FIG. 4 is an overall control flow of the present invention.
FIG. 5 is a relationship diagram between an SN ratio and a recognition rate.
FIG. 6 is a conventional AMNOR type noise reduction system.
[Explanation of symbols]
51, 52... First and
Claims (1)
複数のマイクロホン、
ランダムノイズ信号を発生するシグナルジェネレータ、
話者口元から各マイクロホンの出力端までの伝達特性を模擬する伝達回路、
各伝達回路を介して出力するランダムノイズ信号をそれぞれ各マイクロホンの出力信号に合成する合成部、
学習時、前記ランダムノイズ信号を目標信号、各合成部出力をそれぞれ参照信号として適応信号処理を行って適応フィルタの係数を更新し、非学習時にフィルタ係数の更新を停止する適応信号処理部、
目標信号に所定の遅延を付与する目標応答設定部、
適応フィルタの出力信号と目標応答設定部の出力信号との差を音声信号として出力する演算部、
を備え、前記伝達回路は、話者口元から各マイクロホンの出力端までの伝達特性を測定する伝達特性測定手段、該測定した伝達特性で話者口元から各マイクロホンの出力端までの伝達特性を模擬する手段を備え、システムを伝達特性測定モード、学習モード、非学習モードに切り替えて、伝達特性の測定、フィルタ係数の学習、音声信号の出力を行う、
ことを特徴とするノイズリダクションシステムIn the noise reduction system AMNOR method for improving the SN ratio of the speaker's speech signal,
Multiple microphones,
A signal generator that generates random noise signals,
A transfer circuit that simulates the transfer characteristics from the speaker's mouth to the output end of each microphone,
A synthesis unit that synthesizes a random noise signal output via each transmission circuit with an output signal of each microphone,
An adaptive signal processing unit that performs adaptive signal processing by using the random noise signal as a target signal and learning by using each synthesized unit output as a reference signal during learning, and updates the coefficient of the adaptive filter during non-learning;
A target response setting unit for giving a predetermined delay to the target signal;
A calculation unit that outputs a difference between the output signal of the adaptive filter and the output signal of the target response setting unit as an audio signal;
The transfer circuit measures transfer characteristics from the speaker mouth to the output end of each microphone, and simulates the transfer characteristics from the speaker mouth to the output end of each microphone by the measured transfer characteristics. And switching the system to transfer characteristic measurement mode, learning mode, and non-learning mode to measure transfer characteristics, learn filter coefficients, and output audio signals.
Noise reduction system characterized by
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP18305999A JP4183338B2 (en) | 1999-06-29 | 1999-06-29 | Noise reduction system |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP18305999A JP4183338B2 (en) | 1999-06-29 | 1999-06-29 | Noise reduction system |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2001014000A JP2001014000A (en) | 2001-01-19 |
| JP4183338B2 true JP4183338B2 (en) | 2008-11-19 |
Family
ID=16129032
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP18305999A Expired - Fee Related JP4183338B2 (en) | 1999-06-29 | 1999-06-29 | Noise reduction system |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4183338B2 (en) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20220256267A1 (en) * | 2018-03-30 | 2022-08-11 | Panasonic Intellectual Property Management Co., Ltd. | Noise reduction device |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR100368289B1 (en) * | 2001-02-20 | 2003-01-24 | (주)성우테크노 | A voice command identifier for a voice recognition system |
-
1999
- 1999-06-29 JP JP18305999A patent/JP4183338B2/en not_active Expired - Fee Related
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20220256267A1 (en) * | 2018-03-30 | 2022-08-11 | Panasonic Intellectual Property Management Co., Ltd. | Noise reduction device |
| US11665459B2 (en) * | 2018-03-30 | 2023-05-30 | Panasonic Intellectual Property Management Co., Ltd. | Noise reduction device |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2001014000A (en) | 2001-01-19 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP1591995B1 (en) | Indoor communication system for a vehicular cabin | |
| EP2018034B1 (en) | Method and system for processing sound signals in a vehicle multimedia system | |
| KR102663259B1 (en) | Active noise control using feedback compensation | |
| CA3035364C (en) | System for automating tuning hands-free systems | |
| JP2002051392A (en) | In-vehicle conversation assisting device | |
| JPH09322299A (en) | Sound image localization controller | |
| CN111526455A (en) | Correction enhancement method and system for vehicle-mounted sound | |
| JPH10501668A (en) | Adaptive microphone device and incoming target noise signal adaptation method | |
| JP3774580B2 (en) | Voice input device | |
| JP4183338B2 (en) | Noise reduction system | |
| JP2001005463A (en) | Sound equipment | |
| CN114402630B (en) | Sound processing systems and sound processing devices | |
| JP5383008B2 (en) | Speech intelligibility improvement system and speech intelligibility improvement method | |
| JP3688934B2 (en) | Microphone system | |
| JP4141593B2 (en) | Noise / audio sound reduction device | |
| JP4162860B2 (en) | Unnecessary sound signal removal device | |
| JP2005086284A (en) | Output sound correction apparatus | |
| JP2001024459A (en) | Audio device | |
| JP2002261660A (en) | Multi-channel echo canceling method, its apparatus, its program and its recording medium | |
| JPH0937397A (en) | Method and device for localization of sound image | |
| CN119743701B (en) | Methods for determining filter parameters, audio signal processing methods and devices | |
| JP4495581B2 (en) | Audio output device | |
| JPH09116361A (en) | Automatic volume control device | |
| JP7493158B2 (en) | Audio processing device and audio processing method | |
| Namenas et al. | 12 A Recording Setup for Clean Lombard Speech Based on Acoustic Ambiance Simulation and Noise Suppression |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20050622 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050705 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050825 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20060718 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060814 |
|
| A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20061002 |
|
| A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20061215 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080902 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110912 Year of fee payment: 3 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120912 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120912 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130912 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130912 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140912 Year of fee payment: 6 |
|
| LAPS | Cancellation because of no payment of annual fees |