JP5654955B2 - Direct sound extraction device and reverberation sound extraction device - Google Patents
Direct sound extraction device and reverberation sound extraction device Download PDFInfo
- Publication number
- JP5654955B2 JP5654955B2 JP2011147021A JP2011147021A JP5654955B2 JP 5654955 B2 JP5654955 B2 JP 5654955B2 JP 2011147021 A JP2011147021 A JP 2011147021A JP 2011147021 A JP2011147021 A JP 2011147021A JP 5654955 B2 JP5654955 B2 JP 5654955B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- amplitude
- spectrum
- sound
- spectrum signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; ELECTRIC HEARING AIDS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers
- H04R3/02—Circuits for transducers for preventing acoustic reaction, i.e. acoustic oscillatory feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; ELECTRIC HEARING AIDS; PUBLIC ADDRESS SYSTEMS
- H04R2227/00—Details of public address [PA] systems covered by H04R27/00 but not provided for in any of its subgroups
- H04R2227/007—Electronic adaptation of audio signals to reverberation of the listening space for PA
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; ELECTRIC HEARING AIDS; PUBLIC ADDRESS SYSTEMS
- H04R27/00—Public address systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/305—Electronic adaptation of stereophonic audio signals to reverberation of the listening space
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Quality & Reliability (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Multimedia (AREA)
- Otolaryngology (AREA)
- General Health & Medical Sciences (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Circuit For Audible Band Transducer (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
- Stereophonic System (AREA)
Description
本発明は直接音抽出装置および残響音抽出装置に関し、より詳細には、残響音を含んだ入力信号から、直接音を抽出することが可能な直接音抽出装置と、残響音を抽出することが可能な残響音抽出装置とに関する。 The present invention relates to a direct sound extraction device and a reverberation sound extraction device. More specifically, the present invention relates to a direct sound extraction device capable of extracting a direct sound from an input signal including the reverberation sound, and to extract the reverberation sound. The present invention relates to a reverberant sound extraction device.
ホール等の残響が発生しやすい環境で演奏された音楽やスピーチなどを収録した場合には、収録された音響信号に直接音だけでなく残響音が畳み込まれて記録されることが多い。このため、残響音が畳み込まれた音響信号を他の音響環境で再生する場合には、直接音の明瞭度が低下し、再生時に非常に聞きづらくなってしまうおそれがあった。 When music or speech performed in an environment where reverberation is likely to occur such as a hall is recorded, not only direct sound but also reverberation sound is often recorded and recorded in the recorded acoustic signal. For this reason, when an acoustic signal in which reverberant sound is convoluted is reproduced in another acoustic environment, the intelligibility of the direct sound is lowered, and it may be very difficult to hear during reproduction.
また、残響音が畳み込まれたスピーチ音声を用いて、音声認識等を行った場合には、残響音による明瞭度の低下により、スピーチ内容の認識率の低下が生じてしまうという問題があった。 In addition, when speech recognition or the like is performed using speech speech in which reverberant sound is convoluted, there is a problem in that the recognition rate of speech content is reduced due to a decrease in intelligibility due to reverberant sound. .
このように残響音が畳み込まれた音響信号において、残響音を低減する技術が従来より知られている(例えば、特許文献1参照)。この技術を用いることにより、残響音の低減を図って直接音の明瞭化を実現することが可能である。 In the acoustic signal in which the reverberant sound is convoluted as described above, a technique for reducing the reverberant sound has been conventionally known (see, for example, Patent Document 1). By using this technology, it is possible to reduce the reverberant sound and to clarify the sound directly.
しかしながら、特許文献1に示した方法では、入力信号において残響音を低減するために、擬似白色化処理、マルチステップ線形予測処理、後部残響予測処理等の多様な信号処理を行う必要があり、多大な処理負担が必要とされている。このため、実際の残響音の低減には、マイクロプロセッサやデジタルシグナルプロセッサ等の高性能なデバイスが必要とされ、コスト等の観点から、特許文献1による方法をそのまま用いることが容易ではないという問題があった。 However, in the method shown in Patent Document 1, it is necessary to perform various signal processing such as pseudo whitening processing, multi-step linear prediction processing, and rear reverberation prediction processing in order to reduce reverberation in the input signal. Processing burden is required. For this reason, in order to reduce actual reverberation, a high-performance device such as a microprocessor or a digital signal processor is required, and from the viewpoint of cost and the like, it is not easy to use the method according to Patent Document 1 as it is. was there.
本発明は、上記問題に鑑みてなされたものであり、残響音が含まれる音響信号において、簡単に直接音または残響音を抽出することが可能な直接音抽出装置および残響音抽出装置を提供することを課題とする。 The present invention has been made in view of the above problems, and provides a direct sound extraction device and a reverberation sound extraction device that can easily extract a direct sound or a reverberation sound from an acoustic signal including a reverberation sound. This is the issue.
上記課題を解決するために、本発明に係る直接音抽出装置は、直接音に残響音が含まれる入力信号に対してフーリエ変換処理を施すフーリエ変換手段と、該フーリエ変換手段によりフーリエ変換処理された前記入力信号の実数と虚数の周波数スペクトルに基づいて、前記入力信号を第1振幅スペクトル信号と位相スペクトル信号とに変換するスペクトル変換手段と、前記第1振幅スペクトル信号に対して予め設定された正規化カットオフ周波数を用いて周波数毎にローパスフィルタリング処理を行うローパスフィルタ手段と、該ローパスフィルタ手段によりローパスフィルタリング処理された第2振幅スペクトル信号のマイナス側の振幅を制限してゼロにする第1リミッタ手段と、該第1リミッタ手段によりマイナス側の振幅の制限が行われた前記第2振幅スペクトル信号を前記第1振幅スペクトル信号から減算することにより第3振幅スペクトル信号を求める第1減算手段と、該第1減算手段により求められた第3振幅スペクトル信号のマイナス側の振幅を制限してゼロにする第2リミッタ手段と、前記位相スペクトル信号と、前記第2リミッタ手段によりマイナス側の振幅の制限が行われた前記第3振幅スペクトル信号とに基づいて、実数と虚数の周波数スペクトルからなる信号を求める逆スペクトル変換手段と、該逆スペクトル変換手段により求められた信号を逆フーリエ変換処理することにより、前記入力信号から前記直接音を抽出した直接音信号を生成する逆フーリエ変換手段とを備えることを特徴とする。 In order to solve the above problems, a direct sound extraction apparatus according to the present invention includes a Fourier transform unit that performs a Fourier transform process on an input signal including a reverberant sound in the direct sound, and a Fourier transform process performed by the Fourier transform unit. Further, spectrum conversion means for converting the input signal into a first amplitude spectrum signal and a phase spectrum signal based on the real and imaginary frequency spectra of the input signal, and preset for the first amplitude spectrum signal Low-pass filter means for performing low-pass filtering processing for each frequency using the normalized cut-off frequency, and first amplitude to limit the negative amplitude of the second amplitude spectrum signal low-pass filtered by the low-pass filter means to zero. The limiter means and the first limiter means limit the amplitude on the minus side. First subtraction means for obtaining a third amplitude spectrum signal by subtracting the second amplitude spectrum signal from the first amplitude spectrum signal, and a negative amplitude of the third amplitude spectrum signal obtained by the first subtraction means Of the real and imaginary numbers based on the second limiter means for limiting the value to zero, the phase spectrum signal, and the third amplitude spectrum signal whose amplitude on the negative side is limited by the second limiter means. Inverse spectrum transforming means for obtaining a signal composed of a frequency spectrum and inverse Fourier transform for generating a direct sound signal obtained by extracting the direct sound from the input signal by subjecting the signal obtained by the inverse spectrum transforming means to inverse Fourier transform processing. Conversion means.
本発明に係る直接音抽出装置は、直接音に残響音が含まれる入力信号をフーリエ変換し、スペクトル変換手段により求められた第1振幅スペクトル信号に対して、予め設定された正規化カットオフ周波数を用いてローパスフィルタリング処理を行うことにより、スペクトル毎に積分された信号(積分信号:第2振幅スペクトル信号)を求める。このようにして積分された信号は、入力信号における時間変化において定常成分をなすスペクトル信号、つまり、残響音信号に該当するものである。 The direct sound extraction apparatus according to the present invention performs a Fourier transform on an input signal including a reverberation sound in the direct sound, and sets a normalized cutoff frequency that is set in advance for the first amplitude spectrum signal obtained by the spectrum conversion means. Is used to obtain a signal integrated for each spectrum (integrated signal: second amplitude spectrum signal). The signal integrated in this way corresponds to a spectrum signal that forms a stationary component in a time change in the input signal, that is, a reverberation signal.
従って、第1減算手段において、第2振幅スペクトル信号を第1振幅スペクトル信号から減算することにより求められる第3振幅スペクトル信号は、入力信号から残響音を減算した信号であり、この処理によって、直接音信号に該当する信号を求めることが可能となる。 Accordingly, the third amplitude spectrum signal obtained by subtracting the second amplitude spectrum signal from the first amplitude spectrum signal in the first subtraction means is a signal obtained by subtracting the reverberation sound from the input signal. A signal corresponding to the sound signal can be obtained.
このため、逆スペクトル変換手段および逆フーリエ変換手段により生成される信号は、入力信号から直接音を抽出した信号となり、直接音に残響音が含まれる入力信号から、簡単に直接音を抽出することが可能となる。 For this reason, the signal generated by the inverse spectrum transforming means and the inverse Fourier transforming means is a signal obtained by extracting the direct sound from the input signal, and the direct sound can be easily extracted from the input signal including the reverberant sound in the direct sound. Is possible.
さらに、正規化カットオフ周波数を調整することにより、入力信号における直接音の抽出時間の調整を行うことが可能である。正規化カットオフ周波数の値を小さくすると、入力信号における直接音の抽出時間が長くなり、非定常音だけでなく定常音を含んだ形で直接音の抽出を行うことが可能となる。定常音を含んだ直接音の抽出を行うことにより、全く定常音を含まない直接音に比べて、音色や聞き易さなどを直接音に付加することが可能となり、聴取者が直接音を聴取した場合において違和感のない音として認識することが可能となる。 Furthermore, it is possible to adjust the extraction time of the direct sound in the input signal by adjusting the normalized cutoff frequency. When the value of the normalized cut-off frequency is reduced, the time for extracting the direct sound from the input signal becomes longer, and the direct sound can be extracted in a form including not only a non-stationary sound but also a stationary sound. By extracting direct sounds that include stationary sounds, it is possible to add timbre, ease of hearing, etc. to the direct sounds, compared to direct sounds that do not include any stationary sounds. In this case, it is possible to recognize the sound as having no sense of incongruity.
また、上述した直接音抽出装置は、前記第2リミッタ手段によりマイナス側の振幅の制限が行われた前記第3振幅スペクトル信号の振幅に対する増幅または減衰を周波数毎に行うことにより、前記第3振幅スペクトル信号に対する重み付けを行う第1ゲイン手段を備え、前記逆スペクトル変換手段が、前記位相スペクトル信号と、前記第1ゲイン手段により重み付けが行われた前記第3振幅スペクトル信号とに基づいて、実数と虚数の周波数スペクトルからなる信号を求めるものであってもよい。 Further, the direct sound extraction device described above performs amplification or attenuation for the amplitude of the third amplitude spectrum signal, on which the amplitude on the negative side is limited by the second limiter unit, for each frequency, thereby the third amplitude. First gain means for weighting the spectrum signal, wherein the inverse spectrum conversion means is based on the phase spectrum signal and the third amplitude spectrum signal weighted by the first gain means, You may obtain | require the signal which consists of an imaginary number frequency spectrum.
上記直接音抽出装置では、第1ゲイン手段が、第2リミッタ手段によりマイナス側の振幅の制限が行われた第3振幅スペクトル信号の振幅に対する増幅または減衰を周波数毎に行うことにより、第3振幅スペクトル信号に対する重み付けを行う。このようにして振幅の増幅または減衰による重み付けを周波数毎に行うことによって、入力信号から直接音を抽出する場合において、残響音が少し含まれた状態の直接音を求めることができる。 In the above direct sound extraction apparatus, the first gain means performs amplification or attenuation for the amplitude of the third amplitude spectrum signal whose amplitude on the negative side is limited by the second limiter means for each frequency. Weighting is performed on the spectrum signal. By performing weighting by amplitude amplification or attenuation in this way for each frequency, when a direct sound is extracted from an input signal, it is possible to obtain a direct sound with a little reverberation sound included.
例えば、直接音に多くの残響音が含まれる(畳み込まれる)場合には、残響音により直接音の聞き取りが困難になる場合もあるが、直接音にわずかに残響音が含まれる場合には、聴取者が聴取した直接音に残響音に伴う音色などが付加されて、聞き取りやすい音になる場合もある。このように、重み付けの調整を行うことにより、抽出される直接音に含まれる残響音の調整を行うことができ、音色などの音質の調整を行うことが可能となる。 For example, if the direct sound contains a lot of reverberant sound (convolved), it may be difficult to hear the direct sound due to the reverberant sound, but if the direct sound contains a slight amount of reverberant sound, In some cases, the direct sound heard by the listener is added with a timbre associated with the reverberant sound to make it easy to hear. As described above, by adjusting the weighting, it is possible to adjust the reverberation sound included in the extracted direct sound, and it is possible to adjust the tone quality such as the timbre.
さらに、本発明に係る残響音抽出装置は、直接音に残響音が含まれる入力信号に対してフーリエ変換処理を施すフーリエ変換手段と、該フーリエ変換手段によりフーリエ変換処理された前記入力信号の実数と虚数の周波数スペクトルに基づいて、前記入力信号を第1振幅スペクトル信号と位相スペクトル信号とに変換するスペクトル変換手段と、前記第1振幅スペクトル信号に対して予め設定された正規化カットオフ周波数を用いて周波数毎にハイパスフィルタリング処理を行うハイパスフィルタ手段と、該ハイパスフィルタ手段によりハイパスフィルタリング処理された第4振幅スペクトル信号のマイナス側の振幅を制限してゼロにする第3リミッタ手段と、該第3リミッタ手段によりマイナス側の振幅の制限が行われた前記第4振幅スペクトル信号を前記第1振幅スペクトル信号から減算することにより第5振幅スペクトル信号を求める第2減算手段と、該第2減算手段により求められた第5振幅スペクトル信号のマイナス側の振幅を制限してゼロにする第4リミッタ手段と、前記位相スペクトル信号と、前記第4リミッタ手段によりマイナス側の振幅の制限が行われた前記第5振幅スペクトル信号とに基づいて、実数と虚数の周波数スペクトルからなる信号を求める逆スペクトル変換手段と、該逆スペクトル変換手段により求められた信号を逆フーリエ変換処理することにより、前記入力信号から前記残響音を抽出した残響音信号を生成する逆フーリエ変換手段とを備えることを特徴とする。 Furthermore, the reverberant sound extraction apparatus according to the present invention includes a Fourier transform unit that performs a Fourier transform process on an input signal that includes a reverberant sound in a direct sound, and a real number of the input signal that has undergone a Fourier transform process by the Fourier transform unit. And a spectrum conversion means for converting the input signal into a first amplitude spectrum signal and a phase spectrum signal based on the imaginary frequency spectrum, and a normalized cutoff frequency preset for the first amplitude spectrum signal. A high-pass filter means for performing high-pass filtering processing for each frequency, a third limiter means for limiting the negative amplitude of the fourth amplitude spectrum signal subjected to high-pass filtering by the high-pass filter means to zero, and the third limiter means The fourth amplitude spectrum in which the amplitude on the negative side is limited by the 3 limiter means. A second subtracting means for obtaining a fifth amplitude spectrum signal by subtracting a torque signal from the first amplitude spectrum signal, and limiting a negative amplitude of the fifth amplitude spectrum signal obtained by the second subtracting means. Based on the fourth limiter means for zeroing, the phase spectrum signal, and the fifth amplitude spectrum signal whose amplitude on the negative side is limited by the fourth limiter means, it is composed of frequency spectra of real and imaginary numbers. An inverse spectrum transforming means for obtaining a signal, and an inverse Fourier transforming means for generating a reverberation sound signal obtained by extracting the reverberation sound from the input signal by performing an inverse Fourier transform process on the signal obtained by the inverse spectrum transforming means. It is characterized by providing.
本発明に係る残響音抽出装置は、直接音に残響音が含まれる入力信号をフーリエ変換し、スペクトル変換手段により求められた第1振幅スペクトル信号に対して、予め設定された正規化カットオフ周波数を用いてハイパスフィルタリング処理を行うことにより、スペクトル毎に微分された信号(微分信号:第4振幅スペクトル信号)を求める。このようにして微分された信号は、入力信号における時間変化において非定常成分をなすスペクトル信号、つまり、直接音信号に該当するものである。 The reverberant sound extraction apparatus according to the present invention performs a Fourier transform on an input signal including a reverberant sound in a direct sound, and sets a normalized cutoff frequency that is set in advance for the first amplitude spectrum signal obtained by the spectrum converting means. Is used to obtain a signal differentiated for each spectrum (differentiated signal: fourth amplitude spectrum signal). The signal thus differentiated corresponds to a spectral signal that forms an unsteady component in the time change in the input signal, that is, a direct sound signal.
従って、第2減算手段において、第4振幅スペクトル信号を第1振幅スペクトル信号から減算することにより求められる第5振幅スペクトル信号は、入力信号から直接音を減算した信号であり、この処理によって残響音信号に該当する信号を求めることが可能となる。 Therefore, the fifth amplitude spectrum signal obtained by subtracting the fourth amplitude spectrum signal from the first amplitude spectrum signal in the second subtracting means is a signal obtained by subtracting the direct sound from the input signal. A signal corresponding to the signal can be obtained.
このため、逆スペクトル変換手段および逆フーリエ変換手段により生成される信号は、入力信号から残響音を抽出した信号となり、直接音に残響音が含まれる入力信号から、簡単に残響音を抽出することが可能となる。 For this reason, the signal generated by the inverse spectrum transform unit and the inverse Fourier transform unit is a signal obtained by extracting the reverberation sound from the input signal, and the reverberation sound can be easily extracted from the input signal in which the reverberation sound is included in the direct sound. Is possible.
さらに、正規化カットオフ周波数を調整することにより、入力信号における残響音の抽出時間の調整を行うことが可能である。正規化カットオフ周波数の値を大きくすると、入力信号における残響音の抽出時間が長くなり、定常音だけでなく非定常音を含んだ形で残響音の抽出を行うことが可能となる。また、正規化カットオフ周波数の値を小さくすると、入力信号における残響音の抽出時間が短くなり、非定常音があまり含まれない残響音の抽出を行うことが可能となる。 Furthermore, by adjusting the normalized cutoff frequency, it is possible to adjust the reverberation sound extraction time in the input signal. When the value of the normalized cut-off frequency is increased, the extraction time of the reverberant sound in the input signal becomes longer, and it becomes possible to extract the reverberant sound including not only the stationary sound but also the unsteady sound. Also, if the value of the normalized cut-off frequency is reduced, the reverberation sound extraction time in the input signal is shortened, and reverberation sound that does not contain much non-stationary sound can be extracted.
さらに、上述した残響音抽出装置は、前記第4リミッタ手段によりマイナス側の振幅の制限が行われた前記第5振幅スペクトル信号の振幅に対する増幅または減衰を周波数毎に行うことにより、前記第5振幅スペクトル信号に対する重み付けを行う第2ゲイン手段を備え、前記逆スペクトル変換手段が、前記位相スペクトル信号と、前記第2ゲイン手段により重み付けが行われた前記第5振幅スペクトル信号とに基づいて、実数と虚数の周波数スペクトルからなる信号を求めるものであってもよい。 Furthermore, the reverberation sound extraction apparatus described above performs amplification or attenuation for the amplitude of the fifth amplitude spectrum signal, on which the amplitude on the negative side is limited by the fourth limiter unit, for each frequency, thereby the fifth amplitude. Second gain means for weighting the spectrum signal, wherein the inverse spectrum conversion means is based on the phase spectrum signal and the fifth amplitude spectrum signal weighted by the second gain means, You may obtain | require the signal which consists of an imaginary number frequency spectrum.
上記残響音抽出装置では、第2ゲイン手段が、第4リミッタ手段によりマイナス側の振幅の制限が行われた第5振幅スペクトル信号の振幅に対する増幅または減衰を周波数毎に行うことにより、第5振幅スペクトル信号に対する重み付けを行う。このようにして振幅の増幅または減衰による重み付けを周波数毎に行うことによって、入力信号から残響音を抽出する場合において、直接音が少し含まれた状態の残響音を求めることができる。このように、重み付けの調整を行うことにより、抽出される残響音に含まれる直接音の調整を行うことができ、音色などの音質の調整を行うことが可能となる。 In the above reverberant sound extraction device, the second gain means performs amplification or attenuation for the amplitude of the fifth amplitude spectrum signal whose amplitude on the negative side is limited by the fourth limiter means for each frequency, thereby obtaining the fifth amplitude. Weighting is performed on the spectrum signal. By performing weighting by amplitude amplification or attenuation for each frequency in this way, when reverberation is extracted from an input signal, it is possible to obtain a reverberation that contains a small amount of direct sound. Thus, by adjusting the weighting, the direct sound included in the extracted reverberation sound can be adjusted, and the tone quality such as the timbre can be adjusted.
本発明に係る直接音抽出装置によれば、直接音に残響音が含まれる入力信号から、簡単に直接音を抽出することができる。また、本発明に係る残響音抽出装置によれば、直接音に残響音が含まれる入力信号から、簡単に残響音を抽出することが可能となる。 According to the direct sound extraction device of the present invention, it is possible to easily extract a direct sound from an input signal in which the direct sound includes a reverberant sound. Moreover, according to the reverberation sound extraction apparatus according to the present invention, it is possible to easily extract a reverberation sound from an input signal in which the direct sound includes the reverberation sound.
以下、本発明に係る直接音抽出装置および残響音抽出装置の一例である音響処理装置を示し、添付図面を参照して詳細に説明を行う。 Hereinafter, an acoustic processing apparatus which is an example of a direct sound extraction apparatus and a reverberation sound extraction apparatus according to the present invention will be described and described in detail with reference to the accompanying drawings.
なお、音声や楽器等の直接音に残響音が畳み込まれると、周波数スペクトルにおいて、非定常な音声や楽器等の信号に対して、残響時間に応じた定常性のある信号が付加される。本実施の形態に係る音響処理装置は、入力信号から非定常信号を抽出・分離することにより直接音の抽出を行い、入力信号から定常信号を抽出・分離することにより残響音を抽出するものである。 Note that when a reverberant sound is convoluted with a direct sound such as a voice or a musical instrument, a signal having a steadiness according to the reverberation time is added to a signal such as an unsteady voice or a musical instrument in the frequency spectrum. The sound processing apparatus according to the present embodiment extracts direct sound by extracting and separating an unsteady signal from an input signal, and extracts reverberation sound by extracting and separating a steady signal from the input signal. is there.
図1は、音響処理装置の概略構成を示したブロック図である。音響処理装置1は、図1に示すように、FFT部(フーリエ変換手段、スペクトル変換手段)3と、周波数スペクトル領域フィルタリング部4と、IFFT部(逆フーリエ変換手段、逆スペクトル変換手段)5a,5bとを有している。
FIG. 1 is a block diagram showing a schematic configuration of the sound processing apparatus. As shown in FIG. 1, the sound processing apparatus 1 includes an FFT unit (Fourier transform unit, spectrum transform unit) 3, a frequency spectrum
FFT部3には、図示を省略した音源部から、直接音(例えばスピーチなどの音声)に残響音(例えば、スピーチにおける反射音)が畳み込まれた(含まれた)2チャンネル(LチャンネルとRチャンネル)の入力信号L,Rとが入力される。FFT部3は、残響音が畳み込まれた2チャンネルの入力信号L,Rのそれぞれに対して窓関数により重み付けを行う役割を有している。
The
そして、FFT部3は、窓関数による重み付けを行った後に、それぞれの入力信号L,Rに対して、短時間フーリエ変換処理を施すことにより、それぞれの入力信号L,Rを時間領域から周波数領域に変換し、実数と虚数の周波数スペクトルを求める。図2は、FFT部3において入力信号L(あるいは入力信号R)に対して短時間フーリエ変換処理を行う場合のフーリエ変換長とオーバーラップ長を模式的に示した図である。ここで、FFT部3は、入力信号に対してフーリエ変換処理を施すため、本発明に係るフーリエ変換手段に該当することになる。
The
さらに、FFT部3は、周波数領域変換により求められた2チャンネルの周波数スペクトルを、それぞれ振幅スペクトル信号Lfa,Rfa(第1振幅スペクトル信号)と位相スペクトル信号Lfp,Rfpに変換する。そして、FFT部3は、変換された2チャンネルの振幅スペクトル信号Lfa,Rfaを、周波数スペクトル領域フィルタリング部4に出力する。また、FFT部3は、2チャンネルの位相スペクトル信号Lfp,Rfpを、IFFT部5aとIFFT部5bとにそれぞれ出力する。ここで、FFT部3は、入力信号を、振幅スペクトル信号Lfa,Rfaと位相スペクトル信号Lfp,Rfpとに変換するため、本発明に係るスペクトル変換手段に該当することになる。
Further, the
図3は、周波数スペクトル領域フィルタリング部4の概略構成を示したブロック図である。周波数スペクトル領域フィルタリング部4は、スペクトル毎の簡易なフィルタリング処理により、非定常信号と定常信号の抽出を行う役割を有している。なお、周波数スペクトル領域フィルタリング部4における処理では、振幅スペクトル信号Lfa,Rfaに対してのみフィルタリング処理を行い、位相スペクトル信号Lfp,Rfpに関してはフィルタリング処理を行わない。
FIG. 3 is a block diagram showing a schematic configuration of the frequency spectrum
周波数スペクトル領域フィルタリング部4は、図3に示すように、LPF部(ローパスフィルタ手段)10と、HPF部(ハイパスフィルタ手段)11と、第1リミッタ部(第1リミッタ手段)12と、第2リミッタ部(第2リミッタ手段)13と、第3リミッタ部(第3リミッタ手段)14と、第4リミッタ部(第4リミッタ手段)15と、第1ゲイン部(第1ゲイン手段)16と、第2ゲイン部(第2ゲイン手段)17と、第1減算部(第1減算手段)18と、第2減算部(第2減算手段)19とを有している。図3は、振幅スペクトル信号Lfaに対して処理を行う機能部(LPF部10、HPF部11、リミッタ部12〜15、ゲイン部16,17、減算部18,19)のみが示されており、振幅スペクトル信号Rfaに対して処理を行う機能部の図示を省略している。しかしながら、振幅スペクトル信号Rfaに対して処理を行う機能部においても、同様の機能部が設けられており、同様のフィルタリング処理が行われる。
As shown in FIG. 3, the frequency spectrum
LPF部10は、FFT部3より入力された振幅スペクトル信号Lfaに対して、所定の正規化カットオフ周波数に基づいて、スペクトル毎(周波数毎)にローパスフィルタリング処理を行う役割を有している。第1リミッタ部12は、LPF部10によりローパスフィルタリング処理された振幅スペクトル信号(第2振幅スペクトル信号)のマイナス側の振幅を制限して、0にする役割を有している。そして、第1ゲイン部16は、マイナス側の振幅制限が行われた振幅スペクトル信号の振幅を増幅もしくは減衰する役割を有している。このようにして、LPF部10において振幅スペクトル信号Lfaに対してローパスフィルタリング処理を行うことにより、スペクトル毎に積分された信号(積分信号:第2振幅スペクトル信号)Lfa1が生成されることになる。
The
そして、第1減算部18は、FFT部3より入力された振幅スペクトル信号Lfaから、積分信号Lfa1の減算を行い、時間変動のある非定常のスペクトル信号(第3振幅スペクトル信号)を求める。その後、第2リミッタ部13は、第1減算部18において求められたスペクトル信号(第3振幅スペクトル信号)のマイナス側の振幅を制限して0にする。第2リミッタ部13において振幅の制限が行われた信号は、直接音信号LfdとしてIFFT部5aへ出力される。
Then, the
HPF部11は、FFT部3より入力された振幅スペクトル信号Lfaに対して、所定の正規化カットオフ周波数に基づいて、スペクトル毎(周波数毎)にハイパスフィルタリング処理を行う役割を有している。第3リミッタ部14は、HPF部11によりハイパスフィルタリング処理された振幅スペクトル信号(第4振幅スペクトル信号)のマイナス側の振幅を制限して、0にする役割を有している。そして、第2ゲイン部17は、マイナス側の振幅制限が行われた振幅スペクトル信号の振幅を増幅もしくは減衰する役割を有している。このようにして、HPF部11において振幅スペクトル信号Lfaに対してハイパスフィルタリング処理を行うことにより、スペクトル毎に微分された信号(微分信号:第4振幅スペクトル信号)Lfa2が生成されることになる。
The
そして、第2減算部19は、FFT部3より入力された振幅スペクトル信号Lfaから、微分信号Lfa2の減算を行い、時間変動の少ない定常のスペクトル信号(第5振幅スペクトル信号)を求める。その後、第4リミッタ部15は、第2減算部19において求められたスペクトル信号(第5振幅スペクトル信号)のマイナス側の振幅を制限して0にする。第4リミッタ部15において振幅の制限が行われた信号は、残響音信号LfrとしてIFFT部5bへ出力される。
Then, the
なお、LPF部10における振幅スペクトル毎のローパスフィルタの正規化カットオフ周波数および、HPF部11における振幅スペクトル毎のハイパスフィルタの正規化カットオフ周波数は、直接音と残響音の分割時間を調節するもの(直接音の抽出時間を調節し、また、残響音の抽出時間を調節するもの)である。また、第1ゲイン部16および第2ゲイン部17において、増幅および減衰の重み付け量を変化させることにより、直接音と残響音との混合比率を調節する(直接音に含まれる残響音の割合を調節し、また、残響音に含まれる直接音の割合を調節する)ことが可能となる。
The normalization cutoff frequency of the low pass filter for each amplitude spectrum in the
図4(a)は、本実施の形態に係るLPF部10における振幅スペクトル毎のフィルタ係数の一例を示したものであり、図4(b)は、HPF部11における振幅スペクトル毎のフィルタ係数の一例を示している。図4(a)(b)に示すLPF部10およびHPF部11は、それぞれ1次のバタワースフィルタであり、図4に示すように、正規化カットオフ周波数を、0.000001、0.000002、0.000004、・・・・・、0.0655に変化させたものである。カットオフ周波数の値が低いほど、直接音の抽出時間と残響音の抽出時間とが長くなる。なお、本実施の形態に係る周波数スペクトル領域フィルタリング部4では、LPF部10およびHPF部11のカットオフ周波数を、振幅スペクトルに共通に設定しているが、振幅スペクトル毎に独立に設定する構成とすることも可能である。
4A shows an example of the filter coefficient for each amplitude spectrum in the
図5(a)は、本実施の形態に係る第1ゲイン部16の増幅および減衰の重み付け量の周波数変化の一例を示した図であり、図5(b)は、第2ゲイン部17の重み付け量の周波数変化の一例を示した図である。図5(a)(b)に示すように、本実施の形態に係る第1ゲイン部16および第2ゲイン部17では、ゲイン(信号レベル)が小さいほど混合量は大きくなる。また、図5(a)(b)に示すように、直接音側である第1ゲイン部16は、500Hz以下の振幅スペクトルにおいて、直接音と残響音の分離はほとんど行わない。
FIG. 5A is a diagram showing an example of a frequency change in the weighting amount of amplification and attenuation of the
図6〜図9は、周波数スペクトル領域フィルタリング部4の各部の動作例を示したものであり、周波数スペクトル領域フィルタリング部4に入力される入力信号(振幅スペクトル信号Lfa)の振幅と、積分信号Lfa1の振幅と、微分信号Lfa2の振幅と、直接音信号Lfdの振幅と、残響音信号Lfrの振幅との時間変化を例示した図である。図6〜図9の波形は、いずれも1kHz付近の振幅スペクトルの時間変化を観測したものである。
6 to 9 show an example of the operation of each part of the frequency spectrum
なお、図6〜図9に示す動作例における入力信号のサンプリングレートは、44.1kHzであり、FFT部3のフーリエ変換長は4,096sample(サンプル)、オーバーラップ長はフーリエ変換長の15/16倍の3,840sample、フーリエ変換の窓関数はブラックマンである。また、図6〜図8に示す入力信号は、再生時間が1sec(秒)の1kHzの正弦波であり、図9に示す入力信号は音楽である。
6 to 9, the sampling rate of the input signal is 44.1 kHz, the Fourier transform length of the
また、図8、図9には、第1ゲイン部16および第2ゲイン部17において、図5(a)および図5(b)に示したスペクトル毎(周波数毎)の重み付けを行った場合が示されており、図6、図7には、第1ゲイン部16および第2ゲイン部17において重み付けを行わずに、全ての振幅スペクトルに対するゲイン(信号レベル)を0dBに設定した場合が示されている。
8 and 9, the
まず、図6(a)に示した直接音側の信号では、LPF部10のローパスフィルタリング処理により、矩形状を呈する入力信号が積分処理される。このため、矩形状の入力信号の立ち上がり部分が抽出されて、振幅の立ち上がりが緩やかな積分信号Lfa1が生成される。その後、第1減算部18において、入力信号から積分信号Lfa1の減算が行われて、入力信号の矩形形状から積分信号Lfa1の緩やかな立ち上がり部分の振幅が減算されるため、矩形状の信号の立ち上がり部分、すなわち非定常成分が、直接音信号Lfdとして抽出されることになる。
First, in the direct sound side signal shown in FIG. 6A, the rectangular input signal is integrated by the low pass filtering process of the
なお、第1減算部18における減算処理によって、直接音信号Lfdの振幅がマイナスになるが、第2リミッタ部13で振幅を制限して0にしているため、図6(a)に示されるように、直接音信号Lfdはマイナスの値にはなっていない。
Although the amplitude of the direct sound signal Lfd becomes negative due to the subtraction processing in the
つぎに、図6(b)に示す残響音側の信号では、HPF部11のハイパスフィルタリング処理により、矩形状を呈する入力信号が微分処理される。このため、矩形状の入力信号の鋭い立ち上がり部分と、その後の緩やかな減衰部分からなる微分信号Lfa2が生成される。その後、第2減算部19において、入力信号から微分信号Lfa2の減算が行われて、入力信号の矩形形状から微分信号Lfa2の鋭い立ち上がり部分等の振幅が減算されるため、矩形状の信号の立ち上がり以外の部分、すなわち定常成分が残響音信号Lfrとして抽出されることになる。
Next, in the reverberation sound side signal shown in FIG. 6B, the rectangular input signal is differentiated by the high-pass filtering process of the
なお、第2減算部19における減算処理においても、残響音信号Lfrの振幅がマイナスになるが、第4リミッタ部15で振幅を制限して0にしているため、図6(b)に示されるように、残響音信号Lfrはマイナスの値にはなっていない。
In the subtraction processing in the
図7は、図6に示した状態において、HPF部11およびLPF部10の正規化カットオフ周波数を変更した図である。具体的に、図7(b)に示したHPF部11の正規化カットオフ周波数は、図6に示したHPF部11の正規化カットオフ周波数0.0082に対して低い値である0.0041に設定されている。また、図7(a)に示したLPF部10の正規化カットオフ周波数は、図6に示したLPF部の正規化カットオフ周波数0.0082に対して高い値である0.0164に設定されている。
FIG. 7 is a diagram in which the normalized cutoff frequencies of the
図6、図7に示すように、正規化カットオフ周波数を低くすると、フィルタの応答が遅くなり、信号の立ち上がりの応答が長くなる。また、正規化カットオフ周波数を高くすると、フィルタの応答が速くなり、信号の立ち上がりの応答が短くなる。このようにして、カットオフ周波数を調整することにより、直接音と残響音の分割時間を調節(直接音の抽出時間の調節、また、残響音の抽出時間の調節)を行うことか可能となる。 As shown in FIGS. 6 and 7, when the normalized cut-off frequency is lowered, the response of the filter becomes slow and the response of the rising edge of the signal becomes long. Further, when the normalized cutoff frequency is increased, the response of the filter becomes faster and the response of the rising edge of the signal becomes shorter. In this way, by adjusting the cut-off frequency, it is possible to adjust the division time of the direct sound and the reverberation sound (adjustment of the extraction time of the direct sound and the extraction time of the reverberation sound). .
図8は、図6に示した状態において、第1ゲイン部16および第2ゲイン部17におけるスペクトル毎の重み付け量を設定した場合を示した図である。重み付け量の設定により、直接音や残響音では、重み付け量に応じたオフセット(振幅のかさ上げ)が生じる。このため、図8(a)に示す直接音信号には、オフセットに伴う残響音が付加(図8(a)に示す高さL1の振幅のかさ上げ)され、図8(b)に示す残響音信号には、オフセットに伴う直接音が付加(図8(b)に示す高さL1の振幅のかさ上げ)される。このように、重み付け量の設定に応じて生ずるオフセットにより、直接音と残響音との混合比率を調節する(直接音に含まれる残響音の割合を調節し、また、残響音に含まれる直接音の割合を調節する)ことが可能となる。
FIG. 8 is a diagram showing a case where the weighting amount for each spectrum in the
図9は、図8に示した状態において、入力信号を音楽信号として時間と共に減衰する1kHz付近の成分を抽出して示した図である。直接音側の信号においては、図9(a)に示すように、振幅の大きい前半部分において直接音の信号が抽出されており、残響音側の信号においては、図9(b)に示すように、入力信号の振幅が減衰している後半部分において残響音の信号が抽出されていることがわかる。 FIG. 9 is a diagram in which components in the vicinity of 1 kHz that attenuate with time are extracted from the input signal as a music signal in the state shown in FIG. In the direct sound side signal, as shown in FIG. 9A, the direct sound signal is extracted in the first half portion having a large amplitude, and in the reverberant sound side signal, as shown in FIG. 9B. Further, it can be seen that a reverberant signal is extracted in the latter half of the case where the amplitude of the input signal is attenuated.
IFFT部5aは、周波数スペクトル領域フィルタリング部4においてフィルタリング処理された直接音からなる振幅スペクトル信号(直接音信号Lfd,Rfd)と、FFT部3より取得した位相スペクトル信号Lfp,Rfpとに基づいて実数と虚数の周波数スペクトルに変換した後、窓関数により重み付けを行う処理を行う。そして、IFFT部5aは、重み付け処理された信号に対して短時間逆フーリエ変換処理とオーバーラップ加算とを行うことにより、周波数領域から時間領域に信号を変換して、直接音からなる直接音信号Ld、Rdを生成する。
The
また、IFFT部5bも同様に、周波数スペクトル領域フィルタリング部4においてフィルタリング処理された残響音からなる振幅スペクトル信号(残響音信号Lfr,Rfr)と、FFT部3より取得した位相スペクトル信号Lfp,Rfpとに基づいて実数と虚数の周波数スペクトルに変換した後、窓関数により重み付けを行う処理を行う。そして、IFFT部5bは、重み付け処理された信号に対して短時間逆フーリエ変換処理とオーバーラップ加算とを行うことにより、周波数領域から時間領域に信号を変換して、残響音からなる残響音信号Lr、Rrを生成する。
Similarly, the
なお、IFFT部5a,5bは、振幅スペクトル信号と位相スペクトル信号とに基づいて実数と虚数の周波数スペクトルに変換する処理を行うため、本発明に係る逆スペクトル変換手段に該当する。さらに、IFFT部5a,5bは、重み付け処理された信号に対して短時間逆フーリエ変換処理を行うため、本発明に係る逆フーリエ変換手段に該当する。
The
図10〜図14は、音響処理装置1に対する入力信号の振幅と、音響処理装置1において抽出(生成)された直接音信号と残響音信号との振幅の時間変化を例示した図である。図10と図11は、入力信号として再生時間が1secの1kHzの正弦波が入力される場合を示し、図12と図13とは、入力信号として音楽が入力される場合を示し、図14は、ホール(残響音の発生しやすい環境)におけるインパルス応答が入力信号として入力される場合を示している。 10 to 14 are diagrams exemplifying the time change of the amplitude of the input signal to the sound processing apparatus 1 and the amplitude of the direct sound signal and the reverberation sound signal extracted (generated) by the sound processing apparatus 1. 10 and 11 show a case where a 1 kHz sine wave having a playback time of 1 sec is inputted as an input signal, and FIGS. 12 and 13 show a case where music is inputted as an input signal, and FIG. The impulse response in the hall (environment where reverberation is likely to occur) is input as an input signal.
また、図10〜図14において、HPF部11およびLPF部10における正規化カットオフ周波数は、全て0.0082であり、図10、図12、図14は、スペクトル毎の重み付け処理がなしの場合、図11と図13とは、スペクトル毎(周波数毎)の重み付け処理がある場合を示している。
10 to 14, the normalized cut-off frequencies in the
また、図10〜図14におけるIFFT部5の逆フーリエ変換長は4,096sample、オーバーラップ長はフーリエ変換長の15/16倍である3,840sample、逆フーリエ変換の窓関数はブラックマンとなっており、FFT部3においても同様となっている。
10 to 14, the inverse Fourier transform length of the
図10および図11においては、矩形をなす入力信号の振幅の時間変化に対して、非定常成分である直接音信号と、定常成分である残響音信号とがそれぞれ抽出された状態が示されている。また、図10に示す直接音信号および残響音信号に対して、図11に示す直接音信号および残響音信号は、スペクトル毎の重み付け処理により振幅の値がオフセットされている。このため、オフセットされた部分(図11において、直接音信号および残響音信号の振幅がL2の高さだけかさ上げされた部分)において、直接音と残響音とが混合した部分が含まれることになり、第1ゲイン部16および第2ゲイン部17による重み付け処理に応じて、直接音と残響音との混合比率を調節することが可能となる。
FIGS. 10 and 11 show a state in which a direct sound signal that is an unsteady component and a reverberation sound signal that is a stationary component are extracted with respect to a temporal change in the amplitude of a rectangular input signal. Yes. Further, with respect to the direct sound signal and the reverberation sound signal shown in FIG. 10, the amplitude values of the direct sound signal and the reverberation sound signal shown in FIG. 11 are offset by the weighting process for each spectrum. For this reason, in the offset portion (in FIG. 11, the portion where the amplitudes of the direct sound signal and the reverberation sound signal are raised by the height of L2), a portion where the direct sound and the reverberation sound are mixed is included. Thus, the mixing ratio of the direct sound and the reverberant sound can be adjusted according to the weighting process by the
図12および図13においては、音楽(入力信号)の波形に対して、直接音と残響音とをそれぞれ抽出した波形を確認することができる。また、分離された直接音と残響音とをそれぞれ別々に聴取した場合にも、音楽の直接音と残響音とをそれぞれ確認することができ、直接音と残響音との抽出(あるいは分離)を聴覚的に認識することが可能となる。 In FIG. 12 and FIG. 13, it is possible to confirm a waveform obtained by extracting a direct sound and a reverberation sound from the music (input signal) waveform. In addition, even when the separated direct sound and reverberation sound are listened to separately, the direct sound and reverberation sound of music can be confirmed respectively, and the extraction (or separation) of the direct sound and reverberation sound can be performed. Auditory recognition is possible.
また、図13では、スペクトル毎の重み付けの設定を行っているため、直接音において残響音が一部付加され、また残響音においては直接音が一部付加された波形(図13における直接音信号および残響音信号の振幅の高さが、図12に比べて高くなっている)が確認でき、直接音と残響音の混合比率をスペクトル毎の重み付け設定により調節することが可能であることが確認できる。また、図13に示した直接音と残響音とをそれぞれ聴取した場合においても、混合比率に応じて直接音と残響音とが混合された出力音を確認することができる。 In FIG. 13, since the weighting is set for each spectrum, a waveform in which a part of the reverberation sound is added to the direct sound and a part of the direct sound is added to the reverberation sound (the direct sound signal in FIG. 13). And the amplitude of the reverberant signal is higher than that of FIG. 12), and it is confirmed that the mixing ratio of the direct sound and the reverberant sound can be adjusted by the weight setting for each spectrum. it can. Further, even when the direct sound and the reverberation sound shown in FIG. 13 are respectively listened to, the output sound in which the direct sound and the reverberation sound are mixed can be confirmed according to the mixing ratio.
図14においては、ホールにおけるインパルス応答が入力信号として入力されている。インパルス応答であるため、非常に短い信号を入力したときの出力あって、短い時間で振幅が収束する特性を有するが、ホールという残響音の発生しやすい環境でのインパルス応答であるため、直接音に加えて多分に残響音が含まれることになる。 In FIG. 14, the impulse response in the hall is input as an input signal. Since it is an impulse response, it has an output when an extremely short signal is input and the amplitude converges in a short time. In addition to this, a reverberant sound is probably included.
図14においては、入力信号の振幅の収束に比較して、より短い時間で振幅の収束が行われた直接音と、直接音の振幅の収束よりも長い時間だけ振幅が維持されている残響音とを確認することができる。図14においては、HPF部11とLPF部10の正規化カットオフ周波数が0.0082に設定されているが、この正規化カットオフ周波数の値を調整することによって、直接音の抽出時間と残響音の抽出時間とを調節することが可能である。
In FIG. 14, compared to the convergence of the amplitude of the input signal, the direct sound in which the amplitude is converged in a shorter time and the reverberant sound in which the amplitude is maintained for a longer time than the convergence of the amplitude of the direct sound. And can be confirmed. In FIG. 14, the normalized cutoff frequency of the
図15(a)は、図14に示した直接音の波形が正規化カットオフ周波数の値の調整状態に応じて変化する様子と、入力信号とを模式的に示した図である。図15(a)に示すように、正規化カットオフ周波数の値が大きくなると、インパルス応答の振幅の収束までの時間が短くなり、正規化カットオフ周波数の値が小さくなると、インパルス応答の振幅の収束までの時間が長くなって、入力信号の振幅の収束状態に近い波形形状を示すことになる。 FIG. 15A is a diagram schematically showing a state in which the waveform of the direct sound shown in FIG. 14 changes according to the adjustment state of the value of the normalized cutoff frequency and the input signal. As shown in FIG. 15A, when the value of the normalized cutoff frequency increases, the time until the amplitude of the impulse response converges decreases, and when the value of the normalized cutoff frequency decreases, the amplitude of the impulse response decreases. The time until convergence becomes longer, and a waveform shape close to the convergence state of the amplitude of the input signal is shown.
このように、正規化カットオフ周波数の値を調整することにより、入力信号における直接音の抽出時間を変更することが可能となる。従って、正規化カットオフ周波数の値を小さくすると、入力信号における直接音の抽出時間が長くなり、非定常音だけでなく定常音を含んだ形で直接音の抽出を行うことが可能となる。例えば、図14に示す程度に、定常音を含んだ直接音の抽出を行うことにより、全く定常音を含まない直接音に比べて、音色や聞き易さなどを直接音に付加することが可能となり、聴取者が直接音を聴取した場合において違和感のない音として認識することが可能となる。 In this way, by adjusting the value of the normalized cutoff frequency, it is possible to change the direct sound extraction time in the input signal. Therefore, if the value of the normalized cut-off frequency is reduced, the time for extracting the direct sound from the input signal becomes longer, and it becomes possible to extract the direct sound in a form including not only the unsteady sound but also the stationary sound. For example, by extracting a direct sound including a stationary sound as shown in FIG. 14, it is possible to add a timbre, ease of hearing, etc. to the direct sound as compared to a direct sound that does not include a stationary sound at all. Thus, when the listener listens directly to the sound, it can be recognized as a sound without any sense of incongruity.
一方で、図15(b)は、図14に示した残響音の波形が正規化カットオフ周波数の値の調整状態に応じて変化する様子と、入力信号とを模式的に示した図である。図15(b)に示すように、正規化カットオフ周波数の値が大きくなると、残響音の振幅の増大が早い時間から生じるようになり、残響音の振幅の増大が早い段階から大きく立ち上がる傾向がある。一方で、正規化カットオフ周波数の値が小さくなると、残響音の振幅の増大(立ち上がり部分)が緩やかになる。 On the other hand, FIG. 15 (b) is a diagram schematically showing how the reverberant waveform shown in FIG. 14 changes according to the adjustment state of the value of the normalized cutoff frequency and the input signal. . As shown in FIG. 15 (b), when the value of the normalized cut-off frequency increases, the amplitude of the reverberant sound increases from an early time, and the increase in the amplitude of the reverberant sound tends to rise greatly from an early stage. is there. On the other hand, when the value of the normalized cut-off frequency becomes small, the increase (rise part) of the amplitude of the reverberant sound becomes moderate.
このため、正規化カットオフ周波数の値を調節することにより、入力信号における直接音の抽出時間を変更することが可能となり、正規化カットオフ周波数の値を小さくすると、残響音信号に含まれる直接音の影響を少なくすることが可能となり、正規化カットオフ周波数の値を大きくすると、直接音が少し含まれた残響音信号の抽出が可能となる。 For this reason, it is possible to change the extraction time of the direct sound in the input signal by adjusting the value of the normalized cutoff frequency. When the value of the normalized cutoff frequency is decreased, the direct sound included in the reverberant sound signal is changed. It becomes possible to reduce the influence of sound, and if the value of the normalized cut-off frequency is increased, it is possible to extract a reverberant sound signal containing a little direct sound.
以上、本発明に係る直接音抽出装置および残響音抽出装置について、図面を用いて詳細に説明を行ったが、本発明に係る直接音抽出装置および残響音抽出装置は、上述した実施の形態に示される構成には限定されない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。 Although the direct sound extraction device and the reverberation sound extraction device according to the present invention have been described in detail with reference to the drawings, the direct sound extraction device and the reverberation sound extraction device according to the present invention are described in the above-described embodiments. It is not limited to the configuration shown. It will be apparent to those skilled in the art that various changes and modifications can be made within the scope of the claims, and these are naturally within the technical scope of the present invention. Understood.
また、本発明に係る直接音抽出装置および残響音抽出装置を利用することにより、様々な音響環境を構築することも可能である。例えば、直接音に残響音が含まれた入力信号から、直接音抽出装置により直接音信号を抽出し、聴取者に近い位置に設置されるスピーカから出力することにより、入力信号をそのままスピーカより出力する場合に比べて、ボーカル音などを鮮明にして聞き取り易くすることが可能となる。また、残響音抽出装置により入力信号から残響音信号を抽出し、聴取者から遠い位置に設置されるスピーカから出力することにより、残響音を効果的に出力させることが可能となる。 Various acoustic environments can also be constructed by using the direct sound extraction device and the reverberation sound extraction device according to the present invention. For example, a direct sound extraction device extracts a direct sound signal from an input signal that includes a reverberant sound in the direct sound, and outputs it from a speaker installed at a position close to the listener so that the input signal is directly output from the speaker. Compared to the case, the vocal sound and the like can be made clearer and easier to hear. Moreover, a reverberant sound can be effectively output by extracting a reverberant sound signal from an input signal by the reverberant sound extracting device and outputting it from a speaker installed at a position far from the listener.
1 …音響処理装置(直接音抽出装置および残響音抽出装置)
3 …FFT部(フーリエ変換手段、スペクトル変換手段)
4 …周波数スペクトル領域フィルタリング部
5a、5b …IFFT部(逆フーリエ変換手段、逆スペクトル変換手段)
10 …LPF部(ローパスフィルタ手段)
11 …HPF部(ハイパスフィルタ手段)
12 …第1リミッタ部(第1リミッタ手段)
13 …第2リミッタ部(第2リミッタ手段)
14 …第3リミッタ部(第3リミッタ手段)
15 …第4リミッタ部(第4リミッタ手段)
16 …第1ゲイン部(第1ゲイン手段)
17 …第2ゲイン部(第2ゲイン手段)
18 …第1減算部(第1減算手段)
19 …第2減算部(第2減算手段)
L、R …入力信号
Lfa、Rfa …振幅スペクトル信号
Lfp、Rfp …位相スペクトル信号
Lfa1 …積分信号
Lfa2 …微分信号
Lfd、Ld、Rfd、Rd …直接音信号
Lfr、Lr、Rfr、Rr …残響音信号
1 ... Sound processing device (direct sound extraction device and reverberation sound extraction device)
3 ... FFT section (Fourier transform means, spectrum transform means)
4 ... frequency spectrum
10 ... LPF section (low-pass filter means)
11 ... HPF section (high-pass filter means)
12 ... 1st limiter part (1st limiter means)
13 ... 2nd limiter part (2nd limiter means)
14 ... Third limiter section (third limiter means)
15 ... Fourth limiter section (fourth limiter means)
16 ... 1st gain part (1st gain means)
17 ... 2nd gain part (2nd gain means)
18 ... 1st subtraction part (1st subtraction means)
19 ... 2nd subtraction part (2nd subtraction means)
L, R ... input signals Lfa, Rfa ... amplitude spectrum signals Lfp, Rfp ... phase spectrum signal Lfa1 ... integration signal Lfa2 ... differential signals Lfd, Ld, Rfd, Rd ... direct sound signals Lfr, Lr, Rfr, Rr ... reverberation sound signals
Claims (4)
該フーリエ変換手段によりフーリエ変換処理された前記入力信号の実数と虚数の周波数スペクトルに基づいて、前記入力信号を第1振幅スペクトル信号と位相スペクトル信号とに変換するスペクトル変換手段と、
前記第1振幅スペクトル信号に対して予め設定された正規化カットオフ周波数を用いて周波数毎にローパスフィルタリング処理を行うローパスフィルタ手段と、
該ローパスフィルタ手段によりローパスフィルタリング処理された第2振幅スペクトル信号のマイナス側の振幅を制限してゼロにする第1リミッタ手段と、
該第1リミッタ手段によりマイナス側の振幅の制限が行われた前記第2振幅スペクトル信号を前記第1振幅スペクトル信号から減算することにより第3振幅スペクトル信号を求める第1減算手段と、
該第1減算手段により求められた第3振幅スペクトル信号のマイナス側の振幅を制限してゼロにする第2リミッタ手段と、
前記位相スペクトル信号と、前記第2リミッタ手段によりマイナス側の振幅の制限が行われた前記第3振幅スペクトル信号とに基づいて、実数と虚数の周波数スペクトルからなる信号を求める逆スペクトル変換手段と、
該逆スペクトル変換手段により求められた信号を逆フーリエ変換処理することにより、前記入力信号から前記直接音を抽出した直接音信号を生成する逆フーリエ変換手段と
を備えることを特徴とする直接音抽出装置。 Fourier transform means for performing a Fourier transform process on an input signal in which reverberant sound is included in the direct sound;
Spectrum conversion means for converting the input signal into a first amplitude spectrum signal and a phase spectrum signal based on the real and imaginary frequency spectra of the input signal Fourier-transformed by the Fourier transform means;
Low-pass filter means for performing a low-pass filtering process for each frequency using a preset normalization cutoff frequency for the first amplitude spectrum signal;
First limiter means for limiting the negative amplitude of the second amplitude spectrum signal low-pass filtered by the low-pass filter means to zero,
First subtraction means for obtaining a third amplitude spectrum signal by subtracting from the first amplitude spectrum signal the second amplitude spectrum signal in which the negative-side amplitude is limited by the first limiter;
Second limiter means for limiting the minus-side amplitude of the third amplitude spectrum signal obtained by the first subtraction means to zero, and
Inverse spectrum conversion means for obtaining a signal composed of a real number and an imaginary number frequency spectrum based on the phase spectrum signal and the third amplitude spectrum signal on which the amplitude of the negative side is limited by the second limiter means;
Direct sound extraction comprising: an inverse Fourier transform means for generating a direct sound signal obtained by extracting the direct sound from the input signal by subjecting the signal obtained by the inverse spectrum transform means to an inverse Fourier transform process. apparatus.
前記逆スペクトル変換手段は、前記位相スペクトル信号と、前記第1ゲイン手段により重み付けが行われた前記第3振幅スペクトル信号とに基づいて、実数と虚数の周波数スペクトルからなる信号を求めること
を特徴とする請求項1に記載の直接音抽出装置。 First gain means for weighting the third amplitude spectrum signal by amplifying or attenuating the amplitude of the third amplitude spectrum signal whose amplitude on the negative side is limited by the second limiter means for each frequency. With
The inverse spectrum converting means obtains a signal composed of a real number and an imaginary number frequency spectrum based on the phase spectrum signal and the third amplitude spectrum signal weighted by the first gain means. The direct sound extraction device according to claim 1.
該フーリエ変換手段によりフーリエ変換処理された前記入力信号の実数と虚数の周波数スペクトルに基づいて、前記入力信号を第1振幅スペクトル信号と位相スペクトル信号とに変換するスペクトル変換手段と、
前記第1振幅スペクトル信号に対して予め設定された正規化カットオフ周波数を用いて周波数毎にハイパスフィルタリング処理を行うハイパスフィルタ手段と、
該ハイパスフィルタ手段によりハイパスフィルタリング処理された第4振幅スペクトル信号のマイナス側の振幅を制限してゼロにする第3リミッタ手段と、
該第3リミッタ手段によりマイナス側の振幅の制限が行われた前記第4振幅スペクトル信号を前記第1振幅スペクトル信号から減算することにより第5振幅スペクトル信号を求める第2減算手段と、
該第2減算手段により求められた第5振幅スペクトル信号のマイナス側の振幅を制限してゼロにする第4リミッタ手段と、
前記位相スペクトル信号と、前記第4リミッタ手段によりマイナス側の振幅の制限が行われた前記第5振幅スペクトル信号とに基づいて、実数と虚数の周波数スペクトルからなる信号を求める逆スペクトル変換手段と、
該逆スペクトル変換手段により求められた信号を逆フーリエ変換処理することにより、前記入力信号から前記残響音を抽出した残響音信号を生成する逆フーリエ変換手段と
を備えることを特徴とする残響音抽出装置。 Fourier transform means for performing a Fourier transform process on an input signal in which reverberant sound is included in the direct sound;
Spectrum conversion means for converting the input signal into a first amplitude spectrum signal and a phase spectrum signal based on the real and imaginary frequency spectra of the input signal Fourier-transformed by the Fourier transform means;
High-pass filter means for performing high-pass filtering processing for each frequency using a normalization cutoff frequency set in advance for the first amplitude spectrum signal;
Third limiter means for limiting the negative amplitude of the fourth amplitude spectrum signal subjected to high-pass filtering by the high-pass filter means to zero,
Second subtracting means for obtaining a fifth amplitude spectrum signal by subtracting the fourth amplitude spectrum signal, the amplitude of which has been negatively limited by the third limiter means, from the first amplitude spectrum signal;
Fourth limiter means for limiting the minus-side amplitude of the fifth amplitude spectrum signal obtained by the second subtracting means to zero, and
Inverse spectrum conversion means for obtaining a signal composed of a real number and an imaginary number frequency spectrum based on the phase spectrum signal and the fifth amplitude spectrum signal in which the negative amplitude is limited by the fourth limiter means;
Reverberation sound extraction, comprising: inverse Fourier transform means for generating a reverberation sound signal obtained by extracting the reverberation sound from the input signal by performing an inverse Fourier transform process on the signal obtained by the inverse spectrum conversion means apparatus.
前記逆スペクトル変換手段は、前記位相スペクトル信号と、前記第2ゲイン手段により重み付けが行われた前記第5振幅スペクトル信号とに基づいて、実数と虚数の周波数スペクトルからなる信号を求めること
を特徴とする請求項3に記載の残響音抽出装置。 Second gain means for weighting the fifth amplitude spectrum signal by amplifying or attenuating the amplitude of the fifth amplitude spectrum signal, the amplitude of which is negatively limited by the fourth limiter means, for each frequency. With
The inverse spectrum conversion unit obtains a signal composed of a real number and an imaginary number frequency spectrum based on the phase spectrum signal and the fifth amplitude spectrum signal weighted by the second gain unit. The reverberation sound extraction device according to claim 3.
Priority Applications (5)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2011147021A JP5654955B2 (en) | 2011-07-01 | 2011-07-01 | Direct sound extraction device and reverberation sound extraction device |
| EP12807065.3A EP2690623B1 (en) | 2011-07-01 | 2012-06-14 | Direct sound extraction device and reverberant sound extraction device |
| CN201280015523.2A CN103503066B (en) | 2011-07-01 | 2012-06-14 | Direct sound extraction device and reverberant sound extraction device |
| US14/112,941 US9241214B2 (en) | 2011-07-01 | 2012-06-14 | Direct sound extraction device and reverberant sound extraction device |
| PCT/JP2012/065222 WO2013005550A1 (en) | 2011-07-01 | 2012-06-14 | Direct sound extraction device and reverberant sound extraction device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2011147021A JP5654955B2 (en) | 2011-07-01 | 2011-07-01 | Direct sound extraction device and reverberation sound extraction device |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2013015606A JP2013015606A (en) | 2013-01-24 |
| JP5654955B2 true JP5654955B2 (en) | 2015-01-14 |
Family
ID=47436907
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2011147021A Expired - Fee Related JP5654955B2 (en) | 2011-07-01 | 2011-07-01 | Direct sound extraction device and reverberation sound extraction device |
Country Status (5)
| Country | Link |
|---|---|
| US (1) | US9241214B2 (en) |
| EP (1) | EP2690623B1 (en) |
| JP (1) | JP5654955B2 (en) |
| CN (1) | CN103503066B (en) |
| WO (1) | WO2013005550A1 (en) |
Families Citing this family (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP5898534B2 (en) * | 2012-03-12 | 2016-04-06 | クラリオン株式会社 | Acoustic signal processing apparatus and acoustic signal processing method |
| JP5985306B2 (en) * | 2012-08-27 | 2016-09-06 | クラリオン株式会社 | Noise reduction apparatus and noise reduction method |
| JP6212348B2 (en) * | 2013-10-11 | 2017-10-11 | 日本放送協会 | Upmix device, sound reproduction device, sound amplification device, and program |
| DE102015110938B4 (en) * | 2015-07-07 | 2017-02-23 | Christoph Kemper | Method for modifying an impulse response of a sound transducer |
| US10037750B2 (en) * | 2016-02-17 | 2018-07-31 | RMXHTZ, Inc. | Systems and methods for analyzing components of audio tracks |
| US10425730B2 (en) * | 2016-04-14 | 2019-09-24 | Harman International Industries, Incorporated | Neural network-based loudspeaker modeling with a deconvolution filter |
| EP3896625A1 (en) * | 2020-04-17 | 2021-10-20 | Tata Consultancy Services Limited | An adaptive filter based learning model for time series sensor signal classification on edge devices |
| CN115938376A (en) * | 2021-08-06 | 2023-04-07 | Jvc建伍株式会社 | Treatment device and treatment method |
| CN115862665B (en) * | 2023-02-27 | 2023-06-16 | 广州市迪声音响有限公司 | Visual curve interface system of echo reverberation effect parameters |
| CN118032122B (en) * | 2024-04-11 | 2024-06-28 | 国网山东省电力公司潍坊供电公司 | Anomaly detection method, device and medium based on GIS operation sound |
Family Cites Families (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5710862A (en) * | 1993-06-30 | 1998-01-20 | Motorola, Inc. | Method and apparatus for reducing an undesirable characteristic of a spectral estimate of a noise signal between occurrences of voice signals |
| JP3616139B2 (en) * | 1994-07-26 | 2005-02-02 | ローレルバンクマシン株式会社 | Display device in banknote handling machine |
| JPH0844390A (en) * | 1994-07-26 | 1996-02-16 | Matsushita Electric Ind Co Ltd | Voice recognition device |
| US6507623B1 (en) * | 1999-04-12 | 2003-01-14 | Telefonaktiebolaget Lm Ericsson (Publ) | Signal noise reduction by time-domain spectral subtraction |
| US8116471B2 (en) * | 2004-07-22 | 2012-02-14 | Koninklijke Philips Electronics, N.V. | Audio signal dereverberation |
| JP4041154B2 (en) * | 2005-05-13 | 2008-01-30 | 松下電器産業株式会社 | Mixed sound separator |
| JP4568193B2 (en) * | 2005-08-29 | 2010-10-27 | 日本電信電話株式会社 | Sound collecting apparatus and method, program and recording medium |
| JP2007065204A (en) * | 2005-08-30 | 2007-03-15 | Nippon Telegr & Teleph Corp <Ntt> | Reverberation removing apparatus, dereverberation removing method, dereverberation program and recording medium therefor |
| US8433074B2 (en) * | 2005-10-26 | 2013-04-30 | Nec Corporation | Echo suppressing method and apparatus |
| EP1993320B1 (en) * | 2006-03-03 | 2015-01-07 | Nippon Telegraph And Telephone Corporation | Reverberation removal device, reverberation removal method, reverberation removal program, and recording medium |
| JP4950971B2 (en) | 2008-09-18 | 2012-06-13 | 日本電信電話株式会社 | Reverberation removal apparatus, dereverberation method, dereverberation program, recording medium |
| WO2012159217A1 (en) * | 2011-05-23 | 2012-11-29 | Phonak Ag | A method of processing a signal in a hearing instrument, and hearing instrument |
-
2011
- 2011-07-01 JP JP2011147021A patent/JP5654955B2/en not_active Expired - Fee Related
-
2012
- 2012-06-14 US US14/112,941 patent/US9241214B2/en active Active
- 2012-06-14 CN CN201280015523.2A patent/CN103503066B/en not_active Expired - Fee Related
- 2012-06-14 WO PCT/JP2012/065222 patent/WO2013005550A1/en not_active Ceased
- 2012-06-14 EP EP12807065.3A patent/EP2690623B1/en not_active Not-in-force
Also Published As
| Publication number | Publication date |
|---|---|
| CN103503066B (en) | 2015-07-01 |
| JP2013015606A (en) | 2013-01-24 |
| EP2690623A1 (en) | 2014-01-29 |
| WO2013005550A1 (en) | 2013-01-10 |
| EP2690623B1 (en) | 2021-03-17 |
| CN103503066A (en) | 2014-01-08 |
| EP2690623A4 (en) | 2015-04-15 |
| US9241214B2 (en) | 2016-01-19 |
| US20140044273A1 (en) | 2014-02-13 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5654955B2 (en) | Direct sound extraction device and reverberation sound extraction device | |
| JP5898534B2 (en) | Acoustic signal processing apparatus and acoustic signal processing method | |
| CN102016984B (en) | System and method for dynamic sound delivery | |
| CN103999487B (en) | Stability and speech audibility improvement of hearing devices | |
| JP2005530432A (en) | Method for digital equalization of sound from loudspeakers in a room and use of this method | |
| CN103874002A (en) | Audio processing device comprising reduced artifacts | |
| CN110024418B (en) | Sound enhancement device, sound enhancement method, and computer-readable recording medium | |
| CN103796136A (en) | Equipment and method for ensuring output loudness and tone quality of different sound effect modes | |
| KR20220080146A (en) | Subband spatial and crosstalk processing using spectrally orthogonal audio components | |
| JP6533959B2 (en) | Audio signal processing apparatus and audio signal processing method | |
| CN109862463A (en) | Earphone voice playback method, earphone and computer readable storage medium thereof | |
| JP5058844B2 (en) | Audio signal conversion apparatus, audio signal conversion method, control program, and computer-readable recording medium | |
| JP2021157134A (en) | Signal processing method, signal processing device and hearing device | |
| RU2589298C1 (en) | Method of increasing legible and informative audio signals in the noise situation | |
| JP2011141540A (en) | Voice signal processing device, television receiver, voice signal processing method, program and recording medium | |
| JP2006333396A (en) | Audio signal loudspeaker | |
| CN109862470A (en) | Method for broadcasting to ear patient, earphone and computer readable storage medium thereof | |
| WO2013050605A1 (en) | Stability and speech audibility improvements in hearing devices | |
| KR20070022206A (en) | System for Audio Signal Processing |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140613 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141105 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141121 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 5654955 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| LAPS | Cancellation because of no payment of annual fees |