Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JPH0251200B2 - - Google Patents
[go: Go Back, main page]

JPH0251200B2 - - Google Patents

Info

Publication number
JPH0251200B2
JPH0251200B2 JP56048174A JP4817481A JPH0251200B2 JP H0251200 B2 JPH0251200 B2 JP H0251200B2 JP 56048174 A JP56048174 A JP 56048174A JP 4817481 A JP4817481 A JP 4817481A JP H0251200 B2 JPH0251200 B2 JP H0251200B2
Authority
JP
Japan
Prior art keywords
band
energy
audio information
voice
average energy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP56048174A
Other languages
Japanese (ja)
Other versions
JPS57161800A (en
Inventor
Toshuki Sakai
Hiroshi Saito
Masahiro Hamada
Hideki Fuje
Ryoji Suzuki
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP56048174A priority Critical patent/JPS57161800A/en
Publication of JPS57161800A publication Critical patent/JPS57161800A/en
Publication of JPH0251200B2 publication Critical patent/JPH0251200B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 本発明は、音声情報フイルタに関し、その目的
とするところは雑音の加わつた音声情報から雑音
成分を適確に取り除き、聞き取りやすい、きれい
な音声情報を再生することのできる音声情報フイ
ルタを提供することにある。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to an audio information filter, and its purpose is to accurately remove noise components from noisy audio information and reproduce clear audio information that is easy to hear. The purpose is to provide an information filter.

一般に、マイクロホンから遠く離れた地点で発
せられる音声情報、或いは周囲雑音の大きな環境
下で発声される音声情報には、雑音の重畳が避け
難い。しかし、この様な雑音の多い環境下に於い
ても、きれいな音声情報を収録したい、音声認識
装置の認識率を出来るだけ高めたい、などの要請
がつよい。このためには雑音の重畳した音声情報
から出来るだけ雑音を除去する必要がある。
In general, it is difficult to avoid noise being superimposed on voice information that is emitted at a point far away from a microphone or in an environment with large ambient noise. However, even in such a noisy environment, there are strong demands to record clear voice information and to increase the recognition rate of voice recognition devices as much as possible. For this purpose, it is necessary to remove as much noise as possible from the voice information on which noise is superimposed.

本発明はこのような要望に鑑みなされたもので
あり、以下、本発明について実施例の図面と共に
説明する。
The present invention has been made in view of such demands, and will be described below with reference to drawings of embodiments.

本発明は、入力信号を複数の周波数帯域に分割
する帯域分割手段と、同数の帯域信号遅延手段
と、同数の遅延信号減衰手段と、同数の帯域信号
平均エネルギ計測手段と、1個の減衰信号加算出
力手段と、上記各減衰手段の減衰量を制御するこ
とができる一組の制御手段とを有する音声情報フ
イルタを特長とするものであり、信号の周期性の
度合を計測する手段が不要になるために装置の実
現がより簡単な構成で行なえることの他、強い周
期性を有する雑音に対しても除去することができ
る等の利点を有するものである。
The present invention provides band dividing means for dividing an input signal into a plurality of frequency bands, the same number of band signal delay means, the same number of delayed signal attenuation means, the same number of band signal average energy measuring means, and one attenuated signal. It is characterized by an audio information filter having an addition output means and a set of control means capable of controlling the amount of attenuation of each of the above-mentioned attenuation means, eliminating the need for means for measuring the degree of periodicity of the signal. Therefore, it has the advantage that the device can be realized with a simpler configuration and that even noise having strong periodicity can be removed.

本発明は、音声情報がその声道特性により周波
数軸上でエネルギ分布の偏り一所謂フオルマント
構造−を持つているのに対して、除去しようとす
る雑音のうち大部分のものがこの様なエネルギの
明確な偏りを持たず、広い周波数帯域に分散して
存在することが多いとという事実に着目するもの
である。即ち、雑音の重畳した音声情報では音声
エネルギと雑音エネルギとの比(SN比)が周波
数軸上の帯域により異なつているため、この信号
を周波数軸上で予め定められたn個の帯域(チヤ
ネル)に分割し、その内の音声エネルギの伸中し
たmチヤネルのみを通し、他のチヤネルの信号は
これを減衰すことにより、SN比の改善を図り、
雑音除去を行なうことが可能となる。
In the present invention, while voice information has a biased energy distribution on the frequency axis due to its vocal tract characteristics, a so-called formant structure, most of the noise to be removed has such an energy distribution. This study focuses on the fact that the frequency band often exists dispersed over a wide frequency band without having a clear bias. In other words, in voice information with superimposed noise, the ratio of voice energy to noise energy (SN ratio) differs depending on the band on the frequency axis, so this signal is divided into n predetermined bands (channels) on the frequency axis. ), and pass only the m channels in which the audio energy has been expanded, and attenuate the signals of the other channels to improve the S/N ratio.
It becomes possible to perform noise removal.

次に図面を用いて更に詳しく説明する。第1図
は本発明の音声情報フイルタの一実施例を示すブ
ロツク図である。本装置への入力信号x(t)は入力
端子100より印加され、先ず帯域フイルタ20
i(i=1、2、…n)によつて複数の周波数帯
域信号Ui(t)(i=1、2、…n)に分割される。
各帯域信号Ui(t)は、それぞれ遅延時間長τi秒(i
=1、2、…n)からなる遅延回路30i(i=
1、2、…n)に導かれると同時に平均エネルギ
計測回路60i(i=1、2、…n)にも導かれ
る。平均エネルギ計測回路60iは一定時間毎に
各帯域信号Ui(t)の短時間平均エネルギWi(k)(i=
1、2、…n)(kは一定時間毎の区間番号を示
す離散的パラメータで、以後これらの区間をフレ
ームと呼ぶ。)を計測し、これらを制御回路70
0に出力する。制御回路700は、後に述べる方
法で減衰器40i(i=1、2、…n)の通過量
giを決定するように減衰器40iを制御するが、
このとき遅延回路30iから出力された各帯域遅
延信号Vi(t)(i=1、2、…n)がちようど減
衰器40iに印加されるように各部の応答時間が
設定されているものとする。即ち、平均エネルギ
計測回路60iの応答時間と制御回路700の応
答時間との和が遅延回路30iの遅延時間τiと等
しくなるように選ぶことにより、エネルギ計測の
対象となつたちようどその時刻の帯域信号Ui(t)
を減衰制御することができる。さらに、平均エネ
ルギ計測と減衰制御とは先に述べたフレーム毎に
行なわれているため、入力信号の持つ帯域別エネ
ルギ情報は、いわばこのフレーム長を分解能とし
て雑音除去操作に反映されている。このように、
各帯域信号Ui(t)別に上記の如き処理を施こし
て得られる各減衰器40iの出力Zi(t)(i=
1、2、…n)は、加算出力回路500で加算さ
れ、最終出力信号y(t)として出力端子800
に出力される。
Next, a more detailed explanation will be given using the drawings. FIG. 1 is a block diagram showing one embodiment of the audio information filter of the present invention. The input signal x (t) to this device is applied from the input terminal 100, and is first applied to the bandpass filter 20.
It is divided into a plurality of frequency band signals Ui (t) (i=1, 2, . . . n) by i (i=1, 2, . . . n).
Each band signal Ui (t) has a delay time τi seconds (i
A delay circuit 30i (i=1, 2,...n)
1, 2, . . . n), and at the same time, it is also guided to an average energy measuring circuit 60i (i=1, 2, . . . n). The average energy measuring circuit 60i calculates the short-term average energy W i ( k) (i=
1, 2,...n) (k is a discrete parameter indicating the section number for each fixed period of time, and these sections are hereinafter referred to as frames), and these are sent to the control circuit 70.
Output to 0. The control circuit 700 controls the amount of passage through the attenuator 40i (i=1, 2,...n) using a method described later.
Attenuator 40i is controlled to determine g i ,
At this time, the response time of each part is set so that each band delayed signal V i (t) (i=1, 2,...n) outputted from the delay circuit 30i is applied to the attenuator 40i. shall be. That is, by selecting the sum of the response time of the average energy measurement circuit 60i and the response time of the control circuit 700 to be equal to the delay time τ i of the delay circuit 30i, it is possible to determine the time when the energy measurement becomes a target. Band signal U i (t)
The damping can be controlled. Furthermore, since the average energy measurement and attenuation control are performed for each frame as described above, the band-specific energy information of the input signal is reflected in the noise removal operation with the frame length as the resolution. in this way,
The output Z i ( t) (i=
1, 2,...n) are added by the addition output circuit 500, and output to the output terminal 800 as the final output signal y(t).
is output to.

次に通過量giの決定法について述べる。第2図
は決定法のフローチヤートである。図中、入力信
号の読込みステツプ1で与えられた入力信号の各
フレームでの全域平均エネルギWA(j)は、条件判
断ステツプ2で予め定められた閾値Thと比較さ
れる。この際、全帯域平均エネルギWA(j)が閾値
Thを越えた区間およびその前後の一定区間を音
声の存在する区間と見做す目的で、条件判断のス
テツプ2に於いて第(6)式が成立した場合にステツ
プ6で第kフレームは音声の存在するフレームと
判断し、成立しない場合にはステツプ3で第kフ
レームは音声の存在しない区間と判断する。
Next, the method for determining the amount of passage g i will be described. FIG. 2 is a flowchart of the decision method. In the figure, the overall average energy W A (j) in each frame of the input signal given in the input signal reading step 1 is compared with a predetermined threshold Th in the condition determination step 2. In this case, the entire band average energy W A (j) is the threshold
In order to consider the interval exceeding Th and the certain interval before and after it as an interval in which audio exists, if Equation (6) is satisfied in step 2 of condition judgment, the kth frame is determined as audio in step 6. If this is not true, in step 3, the k-th frame is determined to be a section in which no audio exists.

WA(j)Th ………(6) (但し、j=k、k±1、k±2) 第kフレームが音声の存在しないフレームと判
断された場合はステツプ4において第(7)式で示す
各帯域毎の雑音エネルギを推定し、さらにステツ
プ5において第(8)式で示す通過量giを決定する。
W A (j)Th ......(6) (However, j=k, k±1, k±2) If it is determined that the kth frame is a frame in which no audio exists, then in step 4, Equation (7) is The noise energy for each band is estimated, and further, in step 5, the amount of passage g i expressed by equation (8) is determined.

N^pi=Wi ………(7) gi=O ………(8) (但し、繁雑さを避けるため今後Wi、gi、S^iにお
けるフレーム番号表示(k)を省略する。) 一方、第kフレームが音声の存在するフレーム
と判断された場合は、ステツプ7において第9式
に示す条件判断式 WiN^pi ………(9) に基いてさらに場合分けを行ない、第(9)式が不成
立のときはステツプ5において第(8)式で示す通過
量giを決定し、第(9)式が成立するときはステツプ
8の部分で第(10)式に基いて音声エネルギを推定す
る。
N^ pi = W i ………(7) g i = O ………(8) (However, to avoid complexity, the frame number display (k) in W i , g i , and S^i will be omitted from now on. ) On the other hand, if the k-th frame is determined to be a frame in which audio exists, then in step 7, cases are further divided based on the conditional judgment formula W i N^ pi (9) shown in equation 9. , if Equation (9) does not hold, the amount of passage g i shown by Equation (8) is determined in Step 5, and if Equation (9) holds true, Equation (10) is determined in Step 8. The voice energy is estimated based on the

S^i=Wi−N^pi ………(10) 次に、ステツプ9においてS^iの大きさを比較
し、最も大きなS^iを与えるチヤネルからS^iの大き
さの順に計mチヤネル(O<mn)を選び、こ
れらのチヤネルに対してはステツプ10において第
(11)式に基いて通過量giを決定する。また、上記m
チヤネルに含まれなかつたチヤネルについては、
ステツプ5において第(8)式に基いて通過量giを決
定する。
S^ i = W i −N^ pi ………(10) Next, in step 9, the magnitudes of S^ i are compared and calculations are made in order of the magnitude of S^ i from the channel that gives the largest S^ i . Select m channels (O<mn) and perform the step 10 for these channels.
The amount of passage g i is determined based on equation (11). In addition, the above m
For channels that are not included in the channel,
In step 5, the amount of passage g i is determined based on equation (8).

gi=S^i/Wi ………(11) また、本装置の動作開始直後には第(6)式の成否
に拘らず、必らず第(7)式によつてN^Mを規定する
ものとする。
g i = S^ i /W i ......(11) Immediately after the start of operation of this device, N^ M is always determined by formula (7), regardless of whether formula (6) is successful or not. shall be stipulated.

以上述べたように本実施例によれば、加算出力
回路500には帯域別のSN比が高いチヤネルに
大きな加重がかけられた信号のみが集められ、そ
の結果として全帯域でのSN比の向上が期待でき
る。
As described above, according to this embodiment, only the signals in which a large weight is applied to channels with high SN ratios for each band are collected in the addition output circuit 500, and as a result, the SN ratio in all bands is improved. can be expected.

第1図に示した実施例は、例えば次に示す具体
的特性と回路とで実現可能である。周波数帯域フ
イルタ20iは、音声帯域のほぼ全域を含むよ
う、50Hz程度から7〜8KHz程度まで各々1/3オク
ターブ毎に設定する。利得周波数特性は12dB/
oct・程度の緩やかなものでも、40dB/oct.程度
の比較的鋭いものでもよい。遅延回路30iには
BBD(バスケツト・ブリゲード・デバイス)を用
いて10〜20msecの遅延時間を得、減衰回路40
iにはそれぞれ3dB程度の分解能で最大40〜
50dBの減衰まで得られる回路を用いればよい。
さらに、平均エネルギ計測回路60iには、全波
整流・平滑・サンプルホールド回路を用い、得ら
れた計n個の信号をマルチプレクサに入力して1
チヤネルにまとめた後に、A/D変換して制御回
路700に入力すればよい。
The embodiment shown in FIG. 1 can be realized using, for example, the following specific characteristics and circuit. The frequency band filter 20i is set for each 1/3 octave from about 50 Hz to about 7 to 8 KHz so as to cover almost the entire audio band. Gain frequency characteristics are 12dB/
It may be a gentle one of oct. or a relatively sharp one of about 40 dB/oct. The delay circuit 30i has
A delay time of 10 to 20 msec is obtained using a BBD (basket brigade device), and an attenuation circuit 40
i has a maximum of 40~ with a resolution of about 3 dB.
A circuit that can provide attenuation of up to 50 dB may be used.
Furthermore, the average energy measurement circuit 60i uses a full-wave rectification/smoothing/sample-hold circuit, and inputs a total of n signals obtained to a multiplexer to
After combining the signals into channels, the signals may be A/D converted and input to the control circuit 700.

第3図は本発明の音声情報フイルタの他の実施
例を示している。図中、帯域フイルタ90iは該
当する帯域に於ける入力部での帯域フイルタ20
iと同様の特性を持つものである。ところで第1
図中の減衰器40iの通過量は、一般にフレーム
長の時間間隔で離散的に更新される。このため減
衰器40iの出力信号には急激な振幅変化がもた
らされることもあり、この結果減衰器出力信号
zi(t)ひいては最終出力信号y(t)には不自然な断続音
が生じる場合がある。そこで第3図に示したよう
に減衰器40iの直後に帯域フイルタ90iを接
続し、このフイルタ90iの過渡応答を利用して
上記の急激な振幅変化を緩和することとする。フ
イルタの過渡応答による入力波形の急激な振幅変
化の緩和は、フイルタ特性が急峻な程効果が大き
いが、フイルタ特性が比較的ゆるやかな時には隣
接チヤネル間での利得の重なりも大きくなるた
め、例え特定チヤネルで急激な通過量変化が生じ
ても、これら全チヤネルの信号が加算されること
により最終波形への影響は弱められることにな
る。以上のような理由で、本実施例になる減衰器
直後への帯域フイルタの挿入は、使用する帯域フ
イルタの振幅周波数特性が急峻なとき程効果が大
きく、またその時に限つて必要となるものであ
る。
FIG. 3 shows another embodiment of the audio information filter of the present invention. In the figure, the band filter 90i is the band filter 20 at the input section in the corresponding band.
It has the same characteristics as i. By the way, the first
The amount passed through the attenuator 40i in the figure is generally updated discretely at time intervals of the frame length. Therefore, the output signal of the attenuator 40i may undergo a sudden amplitude change, and as a result, the attenuator output signal
Unnatural intermittent sounds may occur in z i(t) and ultimately in the final output signal y (t) . Therefore, as shown in FIG. 3, a bandpass filter 90i is connected immediately after the attenuator 40i, and the transient response of this filter 90i is utilized to alleviate the above-mentioned rapid amplitude change. The steeper the filter characteristics, the greater the effect of alleviating sudden amplitude changes in the input waveform caused by the filter's transient response. Even if a sudden change in the amount of passage occurs in a channel, the influence on the final waveform is weakened by adding the signals of all these channels. For the above reasons, the insertion of the bandpass filter immediately after the attenuator in this embodiment is more effective when the amplitude frequency characteristic of the bandpass filter used is steeper, and is only necessary in that case. be.

このようにして、雑音の加わつた音声情報から
雑音成分を適確に取り除き、聞き取りやすい、き
れいな音声情報を再生することのできる音声情報
フイルタを実現することができる。
In this way, it is possible to realize an audio information filter that can accurately remove noise components from audio information containing noise and reproduce clear audio information that is easy to hear.

次に代表的な2種の雑音に関して、本発明にな
る音声情報フイルタの動作を簡単に述べる。
Next, the operation of the audio information filter according to the present invention will be briefly described with regard to two typical types of noise.

第4図は音声とスペクトルの平坦な定常ランダ
ム雑音とが重畳した入力信号のスペクトルを示
す。閾値Thを、雑音のみのエネルギよりは大き
く、かつ有声音と雑音とが重畳した入力信号のエ
ネルギよりは小さく選んでおくことにより、実施
例に記述した第(6)式、第(7)式、第(10)式に従つて容
易に音声エネルギの推定が可能である。第4図中
E1,E2,E3はこの様にして得られた音声推定エ
ネルギが非負の帯域であるが、さらにこれらの中
から音声推定エネルギS^iが他に比べてより大きい
計mチヤネルの帯域のみが抽出される。この様に
して、スペクトルが比較的平坦な定常ランダム雑
音の除去が可能となる。
FIG. 4 shows the spectrum of an input signal in which voice and stationary random noise with a flat spectrum are superimposed. By selecting the threshold Th to be larger than the energy of only noise and smaller than the energy of the input signal in which voiced sound and noise are superimposed, equations (6) and (7) described in the example can be obtained. , the voice energy can be easily estimated according to equation (10). In Figure 4
E 1 , E 2 , and E 3 are bands in which the estimated speech energy obtained in this way is non-negative, but among these, there are also bands of a total of m channels in which the estimated speech energy S^ i is larger than the others. only are extracted. In this way, stationary random noise whose spectrum is relatively flat can be removed.

また第5図は音声とスペクトルの集中した共振
系雑音とが重畳した入力信号のスペクトルを示
す。雑音スペトルのQが大きいため、仮りに、雑
音の持つ周波数軸上のピークエネルギが音声のピ
ークエネルギよりも大きくても、全帯域でのエネ
ルギを比較すると音声のエネルギの方が大きくな
る。そこで適当に閾値Thを選ぶことによりN^pi
推定が可能となり、実施例に記述した第(9)式によ
つて、N^piと各フレーム・チヤネル毎の入力信号
エネルギWiとの比較判断が可能となる。この結
果、第5図中F1で示した帯域では第(9)式が不成
立のため減衰器の通過量が零に設定され、雑音除
去が可能となる。
Moreover, FIG. 5 shows the spectrum of an input signal in which voice and resonant noise with a concentrated spectrum are superimposed. Since the Q of the noise spectrum is large, even if the peak energy of the noise on the frequency axis is greater than the peak energy of the voice, the energy of the voice will be greater when comparing the energy in all bands. Therefore, by appropriately selecting the threshold Th, it is possible to estimate N^ pi , and by using equation (9) described in the embodiment, N^ pi is compared with the input signal energy W i for each frame/channel. Judgment becomes possible. As a result, in the band indicated by F 1 in FIG. 5, equation (9) does not hold, so the amount of passage through the attenuator is set to zero, making noise removal possible.

以上のように本発明によれば、簡単な回路構成
で雑音の加わつた音声情報から雑音分を適確に取
り除き、聞き取りやすい、きれいな音声情報を再
生することができるものである。
As described above, according to the present invention, noise can be accurately removed from noisy audio information with a simple circuit configuration, and clear audio information that is easy to hear can be reproduced.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の音声情報フイルタの一実施例
を示すブロツク図、第2図は同フイルタにおける
通過量決定法を説明するためのフローチヤート、
第3図は本発明の音声情報フイルタの他の実施例
を示すブロツク図、第4図、第5図は同フイルタ
の動作を説明するためのそれぞれスペクトルの平
坦な定常ランダム雑音およびスペクトルの集中し
た共振系雑音を含んだ音声の周波数スペクトル図
である。 100は入力端子、20i(i=1、…、n)
は帯域フイルタ、30i(i=1、…、n)は遅
延回路、40i(i=1、…、n)は減衰器、5
00は加算出力回路、60i(i=1、…、n)
は平均エネルギ計測回路、700は制御回路、8
00は出力端子、90i(i=1、…、n)は帯
域フイルタ。
FIG. 1 is a block diagram showing an embodiment of the audio information filter of the present invention, and FIG. 2 is a flowchart for explaining a method for determining the amount of information passed through the filter.
FIG. 3 is a block diagram showing another embodiment of the audio information filter of the present invention, and FIGS. 4 and 5 show a stationary random noise with a flat spectrum and a concentrated spectrum, respectively, to explain the operation of the same filter. FIG. 3 is a frequency spectrum diagram of audio including resonance noise. 100 is an input terminal, 20i (i=1,...,n)
is a bandpass filter, 30i (i=1,...,n) is a delay circuit, 40i (i=1,...,n) is an attenuator, 5
00 is an addition output circuit, 60i (i=1,...,n)
is an average energy measuring circuit, 700 is a control circuit, 8
00 is an output terminal, and 90i (i=1,...,n) is a band filter.

Claims (1)

【特許請求の範囲】 1 入力信号を複数の周波数帯域に分割する帯域
分割手段と、この帯域分割手段により分割された
それぞれの帯域信号を任意時間だけ遅延させる遅
延手段と、この遅延手段により遅延されたそれぞ
れの帯域信号を任意量だけ通過させる減衰手段
と、この減衰手段により減衰されたそれぞれの帯
域信号を加算して最終出力する加算出力手段と、
前記帯域分割手段の出力を受けてそれぞれの帯域
信号の平均エネルギを計測する平均エネルギ計測
手段と、前記減衰手段の通過量を制御することが
できる制御手段とを備えて成り、上記制御手段に
よる上記減衰手段の通過量の制御が前記平均エネ
ルギ計測手段の計測値に基いて行なわれるように
構成したこととを特徴とする音声情報フイルタ。 2 特許請求の範囲第1項記載の音声情報フイル
タにおいて、音声と雑音とが混在した入力信号か
ら平均エネルギを短時間毎およびそれぞれの帯域
毎に計測し、得られた平均エネルギの値に基いて
音声エネルギの推定値および雑音エネルギの推定
値を算出し、算出された音声エネルギの推定値お
よび雑音エネルギの推定値に基いて減衰手段の通
過量を決定するようにしたことを特徴とする音声
情報フイルタ。 3 特許請求の範囲第2項記載の音声情報フイル
タにおいて、入力信号の全周波帯域での短時間平
均エネルギを求め、この値が一定値を越えた区間
およびその前後一定区間を音声の存在する区間と
見做し、それ以外の区間を音声の存在しない区間
と見做してセグメンテーシヨンし、音声の存在し
ない区間における各帯域毎の平均エネルギを雑音
エネルギの推定値N^pi(但し、iは帯域番号を示
す。)とし、音声の存在している区間では(1)式に
基いて音声エネルギの推定値S^iを決定し、さらに
(2)、(3)式に基いて減衰手段の通過量qiを決定する
ことを特徴とする音声情報フイルタ。 S^i=Wi−N^pi ………(1) 但し、S^i<oのときはSi=oと置く。 ここで i:周波数帯域番号。 (i=1、2…、n) Wi:任意区間で計測された平均エネルギ。 音声区間と見做された区間では、 gi=S^i/Wi ………(2) 但し、各任意区間においても最も大きいS^iを与
える計m帯域を除く帯域においてはgi=oとす
る。o<mn 音声の存在しない区間では全ての帯域について gi=o ………(3) とする。 4 特許請求の範囲第3項記載の音声情報フイル
タにおいて、雑音エネルギの推定値N^piを算出す
る際に、一定区間毎に計測される全周波帯域での
短時間平均エネルギWAの系列上で、各々隣接す
るWAのうち後続のWAが初めて直前のWAより小
さい値を与えた時、(4)式によつて各帯域毎の雑音
エネルギの推定値N^piを決定することを特徴とす
る音声情報フイルタ。 N^pi=Wi(h)+Wi(h+1)/2 ………(4) 但し、h+1はWAが初めて直前のWAより小さ
い値を与えた時の区間の番号を示し、Wi(h+
1)は区間の番号がh+1である区間における帯
域iの平均エネルギを示す。 5 特許請求の範囲第1項記載の音声情報フイル
タにおいて、減衰された帯域信号を、加算出力手
段に入力する前にそれぞれの帯域信号の各帯域に
対応した帯域分割手段と同等の特性を持つ新たな
帯域分割手段で再度帯域分割し、この操作によつ
て得られた新たな帯域信号を前記加算出力手段に
入力することを特徴とする音声情報フイルタ。
[Scope of Claims] 1. Band dividing means for dividing an input signal into a plurality of frequency bands; Delay means for delaying each band signal divided by the band dividing means by an arbitrary time; an attenuating means for passing an arbitrary amount of each of the band signals; and an addition output means for adding and final outputting the respective band signals attenuated by the attenuating means;
The apparatus comprises an average energy measuring means for receiving the output of the band dividing means and measuring the average energy of each band signal, and a control means capable of controlling the amount of passage through the attenuation means, An audio information filter characterized in that the amount of passage through the attenuation means is controlled based on the measured value of the average energy measuring means. 2. In the audio information filter according to claim 1, the average energy is measured for each short period and for each band from an input signal containing a mixture of audio and noise, and based on the obtained average energy value, Audio information characterized in that an estimated value of audio energy and an estimated value of noise energy are calculated, and an amount of passage through an attenuation means is determined based on the calculated estimated value of audio energy and estimated value of noise energy. filter. 3. In the audio information filter according to claim 2, the short-term average energy of the input signal over the entire frequency band is determined, and the section where this value exceeds a certain value and the certain sections before and after that are determined as sections where speech exists. Segmentation is performed by regarding other sections as sections where there is no voice, and the average energy for each band in the section where there is no voice is the estimated noise energy N^ pi (where, i indicates the band number), and in the section where voice exists, the estimated value of the voice energy S^ i is determined based on equation (1), and then
An audio information filter characterized in that the amount of passage q i of the attenuation means is determined based on equations (2) and (3). S^ i = W i −N^ pi ………(1) However, when S^ i < o, set S i = o. Here, i: frequency band number. (i=1, 2..., n) W i : Average energy measured in an arbitrary interval. In the section considered to be a voice section, g i = S^ i / W i ......(2) However, in each arbitrary section, in bands other than the total m band that gives the largest S^ i , g i = o. o<mn In the section where there is no voice, g i =o (3) for all bands. 4. In the audio information filter according to claim 3, when calculating the estimated noise energy value N^ pi , on the series of short-term average energy W A in the entire frequency band measured in each fixed interval. Then, when the subsequent W A of each adjacent W A gives a smaller value than the immediately preceding W A for the first time, determine the estimated value N^ pi of the noise energy for each band using equation (4). A voice information filter featuring: N^ pi =W i(h) +W i(h+1) /2 ………(4) However, h+1 indicates the number of the interval when W A gives a smaller value than the previous W A for the first time, W i (h+
1) indicates the average energy of band i in the section whose section number is h+1. 5. In the audio information filter according to claim 1, before inputting the attenuated band signal to the addition output means, a new filter having characteristics equivalent to the band dividing means corresponding to each band of each band signal is used. An audio information filter characterized in that the band is divided again by a band dividing means, and a new band signal obtained by this operation is inputted to the addition output means.
JP56048174A 1981-03-30 1981-03-30 Voice information filter Granted JPS57161800A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56048174A JPS57161800A (en) 1981-03-30 1981-03-30 Voice information filter

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56048174A JPS57161800A (en) 1981-03-30 1981-03-30 Voice information filter

Publications (2)

Publication Number Publication Date
JPS57161800A JPS57161800A (en) 1982-10-05
JPH0251200B2 true JPH0251200B2 (en) 1990-11-06

Family

ID=12796020

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56048174A Granted JPS57161800A (en) 1981-03-30 1981-03-30 Voice information filter

Country Status (1)

Country Link
JP (1) JPS57161800A (en)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60140399A (en) * 1983-12-28 1985-07-25 松下電器産業株式会社 Noise remover
US4630304A (en) * 1985-07-01 1986-12-16 Motorola, Inc. Automatic background noise estimator for a noise suppression system
JP2836889B2 (en) * 1990-02-13 1998-12-14 松下電器産業株式会社 Signal processing device
JPH04211523A (en) * 1990-02-13 1992-08-03 Matsushita Electric Ind Co Ltd Signal processor and voice dialing telephone system
DE60142800D1 (en) 2001-03-28 2010-09-23 Mitsubishi Electric Corp NOISE IN HOUR
JP4274419B2 (en) * 2003-12-09 2009-06-10 独立行政法人産業技術総合研究所 Acoustic signal removal apparatus, acoustic signal removal method, and acoustic signal removal program
JP4274418B2 (en) * 2003-12-09 2009-06-10 独立行政法人産業技術総合研究所 Acoustic signal removal apparatus, acoustic signal removal method, and acoustic signal removal program
CA2454296A1 (en) * 2003-12-29 2005-06-29 Nokia Corporation Method and device for speech enhancement in the presence of background noise
JP4272107B2 (en) * 2004-05-13 2009-06-03 株式会社フジテレビジョン Acoustic signal removal apparatus, acoustic signal removal method, and acoustic signal removal program

Also Published As

Publication number Publication date
JPS57161800A (en) 1982-10-05

Similar Documents

Publication Publication Date Title
US12301190B2 (en) Audio control using auditory event detection
CN101625868B (en) Volume adjusting apparatus and volume adjusting method
US4959865A (en) A method for indicating the presence of speech in an audio signal
JP2004507141A (en) Voice enhancement system
JPS62274941A (en) Audio coding system
JPH0251200B2 (en)
JPH11265199A (en) Transmitter
JP2009296298A (en) Sound signal processing device and method
US8254590B2 (en) System and method for intelligibility enhancement of audio information
JP3378672B2 (en) Speech speed converter
JPH09311696A (en) Automatic gain adjustment device
JPH06289898A (en) Speech signal processor
JPH06289897A (en) Speech signal processor
JPH0239799B2 (en)
JP2002064617A (en) Echo suppression method / echo suppression device
US20080255834A1 (en) Method and Device for Evaluating the Efficiency of a Noise Reducing Function for Audio Signals
JPS634973B2 (en)
CN121967966A (en) Howling suppression method, electronic device, storage medium, and program product
JPH04223497A (en) Detection of sound section
JPS6029796A (en) voice recognition device
JPH0921693A (en) Fluctuation analyzer
HK1126902B (en) Audio gain control using specific-loudness-based auditory event detection