JP7770883B2 - IMAGING DEVICE, CONTROL METHOD, AND PROGRAM - Google Patents
IMAGING DEVICE, CONTROL METHOD, AND PROGRAMInfo
- Publication number
- JP7770883B2 JP7770883B2 JP2021190620A JP2021190620A JP7770883B2 JP 7770883 B2 JP7770883 B2 JP 7770883B2 JP 2021190620 A JP2021190620 A JP 2021190620A JP 2021190620 A JP2021190620 A JP 2021190620A JP 7770883 B2 JP7770883 B2 JP 7770883B2
- Authority
- JP
- Japan
- Prior art keywords
- noise
- audio
- audio signal
- external
- microphone
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Studio Devices (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
本発明は雑音を低減することができる撮影装置に関する。 The present invention relates to an imaging device that can reduce noise.
従来、外部音声を記録するための主マイクロホンのほかに、カメラ筐体内部に設置された雑音参照マイクを用いてレンズ駆動雑音を低減する処理を実行する処理が知られている。特許文献1では、雑音参照マイクから主マイクロホンの伝達系のインパルス応答を減算結果が最小になるように逐次推定し、レンズ駆動雑音を低減することが開示されている。 Conventionally, a process for reducing lens drive noise is known that uses a noise reference microphone installed inside the camera housing in addition to a main microphone for recording external audio. Patent Document 1 discloses a method for reducing lens drive noise by iteratively estimating the impulse response of the transfer system of the main microphone from the noise reference microphone so that the result is minimized.
しかしながら、雑音参照マイクにはレンズ駆動雑音以外にもマイクの電気ノイズなどのセルフノイズや外部音声の漏れ込みといった、レンズ駆動以外の要因から発生した雑音が混入する。加えて、主マイクロホンによって取得された外部音声には、レンズ駆動雑音と同程度の周波数帯の音が含まれる場合がある。この場合に、主マイクロホンによって取得された外部音声に対して、その外部音声の大きさを考慮せずに雑音参照マイクを用いた減算処理を実施した場合、主マイクロホンの信号を過剰に低減しすぎてしまうおそれがあった。 However, in addition to lens drive noise, the noise reference microphone is contaminated with noise generated by factors other than lens drive, such as self-noise such as electrical noise from the microphone and leakage of external sound. Additionally, the external sound picked up by the main microphone may contain sound in the same frequency band as the lens drive noise. In this case, if subtraction processing is performed using the noise reference microphone on the external sound picked up by the main microphone without taking into account the volume of that external sound, there is a risk that the signal from the main microphone will be reduced excessively.
そこで本発明では、過剰な雑音低減を抑制することを目的とする。 The purpose of this invention is to prevent excessive noise reduction.
本発明は、撮影装置であって、前記撮影装置の外部音声を取得する外部音声用マイクと、前記撮影装置の駆動部、または撮影装置に接続された外部装置の駆動雑音を取得する雑音参照マイクと、前記雑音参照マイクにより取得された信号から前記駆動雑音の音声信号を算出する雑音算出手段と、前記外部音声用マイクにより取得された前記外部音声に関する音声信号を記憶し、前記雑音参照マイクにより取得された信号に基づいて前記外部音声に関する音声信号を更新すると判断した場合に前記記憶された前記外部音声に関する音声信号を更新する更新手段と、前記更新手段に記憶された前記外部音声に関する音声信号と、前記雑音算出手段により算出された前記駆動雑音の音声信号とに基づいて、前記外部音声用マイクにより取得された音声信号から前記駆動雑音を低減する処理を行う低減手段と
を有し、前記更新手段は、前記外部音声用マイクにより取得された音声信号の平均値を前記外部音声に関する音声信号として記憶し、前記外部音声に関する音声信号を更新すると判断した場合に、前記記憶された前記外部音声に関する音声信号と前記外部音声用マイクから入力された音声信号との平均値により前記記憶された前記外部音声に関する音声信号を更新する。
The present invention is an imaging device comprising: an external audio microphone that acquires external audio of the imaging device; a noise reference microphone that acquires drive noise of a drive unit of the imaging device or an external device connected to the imaging device; a noise calculation means that calculates an audio signal of the drive noise from a signal acquired by the noise reference microphone; an update means that stores the audio signal related to the external audio acquired by the external audio microphone and updates the stored audio signal related to the external audio when it is determined that the audio signal related to the external audio should be updated based on the signal acquired by the noise reference microphone; and a reduction means that performs processing to reduce the drive noise from the audio signal acquired by the external audio microphone based on the audio signal related to the external audio stored in the update means and the audio signal of the drive noise calculated by the noise calculation means, wherein the update means stores an average value of the audio signal acquired by the external audio microphone as the audio signal related to the external audio, and when it is determined that the audio signal related to the external audio should be updated, updates the stored audio signal related to the external audio with the average value of the stored audio signal related to the external audio and the audio signal input from the external audio microphone.
本発明によれば、過剰な雑音低減を抑制することができる。 This invention makes it possible to prevent excessive noise reduction.
以下、本発明の実施形態について、図面を参照して説明する。なお、以下の実施形態は本発明を限定するものではなく、また、本実施形態で説明されている特徴の組み合わせの全てが本発明の解決手段に必須のものとは限らない。なお、以下、同一の構成については、同じ符号を付して説明する。 Embodiments of the present invention will be described below with reference to the drawings. Note that the following embodiments do not limit the present invention, and not all of the combinations of features described in the present embodiments are necessarily essential to the solution of the present invention. Note that the same components will be denoted by the same reference numerals in the following descriptions.
[第一の実施形態]
図1は本発明に係る音声処理装置の一例である撮影装置100の構成の一例を示すブロック図である。
[First embodiment]
FIG. 1 is a block diagram showing an example of the configuration of an image capturing apparatus 100 which is an example of an audio processing apparatus according to the present invention.
撮影装置100はレンズ部101、レンズ制御部102、撮像部103、画像処理部104、制御部105、操作部106、表示・再生部107、記録部108、音声処理部200、および収音部300からなる。 The imaging device 100 consists of a lens unit 101, a lens control unit 102, an imaging unit 103, an image processing unit 104, a control unit 105, an operation unit 106, a display/playback unit 107, a recording unit 108, an audio processing unit 200, and an audio pickup unit 300.
レンズ部101はレンズ制御部102からの信号に基づきオートフォーカスやズームなどの動作を行う。ここで、レンズ部101は撮影装置100に対して着脱可能なように構成されていてもよい。本実施形態では、レンズ部101は撮影装置100に接続されているものとして説明する。撮像部103は結像された被写体の光学像をCMOSセンサなどの撮像素子により撮像し、デジタル化した撮像信号を画像処理部104に出力する。画像処理部104は撮像部103から入力された撮像信号に画質調整を行い出力する。制御部105はプロセッサ等からなり、撮影装置100の各ブロックに制御信号を送る。操作部106はタッチパネルやダイヤルなどで、ユーザの撮影開始、終了指示、あるいは撮影設定などを入力する。表示・再生部107は撮影した画像、動画像を表示あるいは動画像に付随する音声信号を再生する。記録部108は撮影された画像、動画像を記録する。 The lens unit 101 performs operations such as autofocus and zooming based on signals from the lens control unit 102. The lens unit 101 may be configured to be detachable from the image capture device 100. In this embodiment, the lens unit 101 is described as being connected to the image capture device 100. The imaging unit 103 captures an optical image of the subject using an imaging element such as a CMOS sensor, and outputs a digitized image signal to the image processing unit 104. The image processing unit 104 adjusts the image quality of the image signal input from the imaging unit 103 and outputs the result. The control unit 105 is composed of a processor or the like, and sends control signals to each block of the image capture device 100. The operation unit 106 inputs user commands to start and stop capture, or capture settings, using a touch panel, dial, or the like. The display/playback unit 107 displays captured images and videos, or plays audio signals accompanying the videos. The recording unit 108 records captured images and videos.
図2を用いて、音声処理部200、収音部300について、詳細に説明する。 The audio processing unit 200 and audio collection unit 300 will be described in detail using Figure 2.
<音声処理部200の説明>
音声処理部200はA/D変換部201、波形切出部202、時間周波数変換部203、雑音検出部204、雑音比算出部205、雑音算出部206、外部環境音更新部207、雑音低減部208、音声補正部209、および周波数時間変換部210からなる。
<Description of Audio Processing Unit 200>
The audio processing unit 200 comprises an A/D conversion unit 201, a waveform extraction unit 202, a time-frequency conversion unit 203, a noise detection unit 204, a noise ratio calculation unit 205, a noise calculation unit 206, an external environmental sound update unit 207, a noise reduction unit 208, an audio correction unit 209, and a frequency-time conversion unit 210.
A/D変換部201は収音部300から入力される複数のマイクのアナログ信号を同じタイミングでサンプリングし、デジタル信号に変換する。図2では1つのブロックで表現されているが、収音部300からの入力チャンネル数に対応する数のA/D変換器を備える。変換したデジタルマイク信号は波形切出部202へ出力される。 The A/D conversion unit 201 samples the analog signals from multiple microphones input from the sound collection unit 300 at the same time and converts them into digital signals. Although it is represented as a single block in Figure 2, it has the same number of A/D converters as the number of input channels from the sound collection unit 300. The converted digital microphone signals are output to the waveform extraction unit 202.
波形切出部202はA/D変換部201から入力されたデジタル音声信号をチャンネルごとに所定の長さに切り出し、窓かけ処理を行い、時間周波数変換部203へ出力する。波形切出部202よる一連の処理は例えば、一般的な音声処理で使用されるハーフオーバラップ処理で行われる。本実施形態では、波形切出部202は、512サンプルごとに時間シフトしながら、1024サンプルで切り出しを行い、サイン窓あるいはハン窓で窓かけ処理を行って音声信号を出力する。以後、撮影が行われている間、信号処理は上記のサンプル数(以下、フレームと呼ぶ)単位で処理が行われる。 The waveform extraction unit 202 extracts the digital audio signal input from the A/D conversion unit 201 to a predetermined length for each channel, performs windowing processing, and outputs the extracted signal to the time-frequency conversion unit 203. The series of processes performed by the waveform extraction unit 202 is, for example, half-overlap processing used in general audio processing. In this embodiment, the waveform extraction unit 202 extracts 1024 samples while shifting the time every 512 samples, performs windowing processing using a sine window or Hann window, and outputs the audio signal. Thereafter, while filming is being performed, signal processing is performed in units of the above number of samples (hereinafter referred to as frames).
時間周波数変換部203は波形切出部202から入力された音声信号をフーリエ変換などの処理により時間領域の音声信号から周波数領域の音声スペクトルに変換する。外部音声用マイク301から入力された音声信号から生成された音声スペクトルは、外部環境音更新部207および雑音低減部208へ出力される。以下、外部音声用マイク301によって収音されるべき音声を外部音声または環境音という。一方で雑音参照マイク302から入力された音声信号から生成された音声スペクトルである雑音参照音スペクトルは、雑音検出部204、雑音比算出部205および雑音算出部206へ出力される。 The time-frequency conversion unit 203 converts the audio signal input from the waveform extraction unit 202 from a time-domain audio signal to a frequency-domain audio spectrum using processing such as a Fourier transform. The audio spectrum generated from the audio signal input from the external audio microphone 301 is output to the external environmental sound update unit 207 and the noise reduction unit 208. Hereinafter, the audio to be picked up by the external audio microphone 301 is referred to as external audio or environmental sound. On the other hand, the noise reference sound spectrum, which is the audio spectrum generated from the audio signal input from the noise reference microphone 302, is output to the noise detection unit 204, noise ratio calculation unit 205, and noise calculation unit 206.
雑音検出部204は、時間周波数変換部203から入力された雑音参照音スペクトルに基づいて雑音検出を行う。そして、雑音検出部204は、入力された雑音参照音スペクトルをフレームごとに雑音が検出されたか否かを判定する。本実施形態では、雑音検出部204は、雑音源であるレンズ部101などの駆動部の動作によって発生する一定時間継続される長期雑音と、駆動部の動作の開始や終了などによって発生する短期の雑音とをそれぞれ検出する。 The noise detection unit 204 performs noise detection based on the noise reference sound spectrum input from the time-frequency conversion unit 203. Then, the noise detection unit 204 determines whether noise has been detected for each frame of the input noise reference sound spectrum. In this embodiment, the noise detection unit 204 detects long-term noise that continues for a certain period of time and is generated by the operation of a driving unit such as the lens unit 101, which is a noise source, and short-term noise that is generated by the start or end of the operation of the driving unit.
また雑音検出部204は、雑音参照音スペクトルに基づき、背景雑音スペクトルを検出する。本実施形態では、背景雑音は、例えばマイクの電子ノイズやホワイトノイズなどの恒常的に存在する雑音である。ここで本実施形態の背景雑音スペクトルは、例えば、長期雑音および短期雑音が検出さなかったフレームの雑音参照音スペクトルを一定期間平均化することで算出される。 The noise detection unit 204 also detects a background noise spectrum based on the noise reference sound spectrum. In this embodiment, the background noise is constantly present noise, such as electronic noise from a microphone or white noise. Here, the background noise spectrum in this embodiment is calculated, for example, by averaging, over a certain period of time, the noise reference sound spectra of frames in which long-term noise and short-term noise are not detected.
また雑音検出部204は、他の雑音検出処理を行ってもよい。例えば、雑音検出部204は、雑音が検出されたフレームより前に入力された一定期間(所定期間)の雑音参照音スペクトルを平均化したフレームを生成し、このフレームと雑音が検出されたフレームとの音声スペクトルの差分の平均値を算出する。そして、雑音検出部204は、算出された平均値が所定の閾値を超えたか否かによって雑音を検出する。また、雑音検出部204は、雑音の種類ごとに所定の閾値を複数設けて、雑音の種類を検出してもよい。また、雑音検出部204は、雑音の検出において、所定の周波数帯の音声スペクトルのみを用いてもよい。雑音検出部204によって検出された結果は雑音比算出部205および雑音算出部206へ出力される。 The noise detection unit 204 may also perform other noise detection processes. For example, the noise detection unit 204 generates a frame by averaging the noise reference sound spectrum for a certain period (predetermined period) input before the frame in which noise is detected, and calculates the average value of the difference in the audio spectrum between this frame and the frame in which noise is detected. The noise detection unit 204 then detects noise based on whether the calculated average value exceeds a predetermined threshold. The noise detection unit 204 may also set multiple predetermined thresholds for each type of noise to detect the type of noise. The noise detection unit 204 may also use only the audio spectrum in a predetermined frequency band when detecting noise. The results detected by the noise detection unit 204 are output to the noise ratio calculation unit 205 and the noise calculation unit 206.
雑音比算出部205は、雑音検出部204において雑音が検出されたフレームの雑音参照音スペクトルと、背景雑音スペクトルとを用いて、雑音比を算出する。本実施形態では、雑音比は、雑音検出部204において雑音が検出されたフレームの雑音参照音スペクトルの周波数帯ごとの絶対値を、それぞれの周波数帯に対応する背景雑音スペクトルで除算した値の平均値として求められる。なお、雑音比の算出には所定の周波数帯域の雑音参照音スペクトル並びに背景雑音スペクトルのみを用いるように限ってもよい。算出された雑音比は、外部環境音更新部207へ出力される。 The noise ratio calculation unit 205 calculates the noise ratio using the noise reference sound spectrum of a frame in which noise was detected by the noise detection unit 204 and the background noise spectrum. In this embodiment, the noise ratio is calculated as the average value of the absolute value for each frequency band of the noise reference sound spectrum of a frame in which noise was detected by the noise detection unit 204 divided by the background noise spectrum corresponding to each frequency band. Note that the calculation of the noise ratio may be limited to using only the noise reference sound spectrum and background noise spectrum of a specified frequency band. The calculated noise ratio is output to the external environmental sound update unit 207.
雑音算出部206は、雑音検出部204から入力された雑音参照音スペクトルから背景雑音スペクトルを減じることで、雑音参照マイク302の信号に含まれる雑音成分スペクトルを算出する。雑音成分とは、音声信号に含まれる雑音の音声信号である。雑音算出部206は、この雑音参照マイクから入力された音声信号の雑音成分を外部音声用マイク301から入力された音声信号に含まれる雑音成分に近づけるための補正を行う。ここで、雑音算出部206は、その補正のための補正係数テーブルを備え、雑音参照マイクから入力された音声信号の雑音成分スペクトルに応じた補正係数を乗ずることで補正後の雑音スペクトルを得る。雑音算出部206は補正後の雑音スペクトルを雑音低減部208へ出力する。 The noise calculation unit 206 calculates the noise component spectrum contained in the signal from the noise reference microphone 302 by subtracting the background noise spectrum from the noise reference sound spectrum input from the noise detection unit 204. The noise component is the audio signal of noise contained in the audio signal. The noise calculation unit 206 performs correction to bring the noise component of the audio signal input from the noise reference microphone closer to the noise component contained in the audio signal input from the external audio microphone 301. Here, the noise calculation unit 206 is provided with a correction coefficient table for this correction, and obtains the corrected noise spectrum by multiplying the correction coefficient according to the noise component spectrum of the audio signal input from the noise reference microphone. The noise calculation unit 206 outputs the corrected noise spectrum to the noise reduction unit 208.
一方、外部環境音更新部207は、外部環境音スペクトルを記憶する記憶部(不図示)を有し、記憶された外部環境音スペクトルを適宜更新する。外部環境音スペクトルは、外部音声用マイクによって収音された音声信号を音声スペクトルに変換されたものである。外部環境音スペクトルは、動画像として記録される音声信号になるため、レンズ駆動雑音などのノイズを含まないことが望ましい。本実施形態では、外部環境音スペクトルへのレンズ駆動雑音の影響を低減するために、各処理フレームにおいて雑音比算出部205が算出した雑音比が所定の閾値未満である場合に、数式1に示すように外部環境音スペクトルを更新する。
[数式1] S′Senv(ω,t)=(SSenv(ω,t)*α+|Smic(ω,t)|)/(α+1)
On the other hand, the external environmental sound update unit 207 has a storage unit (not shown) that stores the external environmental sound spectrum, and updates the stored external environmental sound spectrum as appropriate. The external environmental sound spectrum is obtained by converting an audio signal picked up by an external audio microphone into an audio spectrum. Since the external environmental sound spectrum becomes an audio signal that is recorded as a moving image, it is desirable that it does not contain noise such as lens driving noise. In this embodiment, in order to reduce the influence of lens driving noise on the external environmental sound spectrum, the external environmental sound spectrum is updated as shown in Equation 1 when the noise ratio calculated by the noise ratio calculation unit 205 in each processed frame is less than a predetermined threshold.
[Formula 1] S' Senv (ω, t)=(S Senv (ω, t)*α+|S mic (ω, t)|)/(α+1)
ここで、Smic(ω,t)は外部音声用マイク301から入力された音声信号の音声スペクトル(外部音声スペクトル)、SSenv(ω,t)は外部環境音スペクトルである。ωは周波数、tは処理フレーム、αは所与の係数である。S′Senv(ω,t)は、更新された後の新しい外部環境音スペクトルである。このように、更新された後の新しい外部環境音スペクトルは、外部環境音スペクトルを加重平均したものである。尚、t=0つまり雑音低減処理開始時は、外部環境音スペクトルの初期値SSenv(ω,0)は、|Smic(ω,0)|としてもよい。あるいは、外部環境音スペクトルの初期値SSenv(ω,0)は、予め算出した外部音声用マイク301の暗騒音などの背景雑音の平均値を用いてもよい。 Here, S mic (ω, t) is the audio spectrum (external audio spectrum) of the audio signal input from the external audio microphone 301, and S Senv (ω, t) is the external environmental sound spectrum. ω is the frequency, t is the processing frame, and α is a given coefficient. S' Senv (ω, t) is the new external environmental sound spectrum after updating. In this way, the new external environmental sound spectrum after updating is a weighted average of the external environmental sound spectrum. Note that at t = 0, i.e., at the start of the noise reduction process, the initial value S Senv (ω, 0) of the external environmental sound spectrum may be set to |S mic (ω, 0)|. Alternatively, the initial value S Senv (ω, 0) of the external environmental sound spectrum may use a pre-calculated average value of background noise such as background noise of the external audio microphone 301.
ここで数式1では、現在の処理フレームtにおける前フレームの外部音声スペクトルが次のフレームに与える影響は1/(α+1)となる。例えばα=1の場合、図4に示すように、ある1つのフレームの影響はフレームが1つ進むごとに半減することになる。このように、あるフレームにおいては直前のフレームほど影響が強く出ることになる。これにより、記録される音声の外部音声の変化への追従性が向上する。 In Equation 1, the influence that the external audio spectrum of the previous frame has on the next frame at the current processing frame t is 1/(α+1). For example, when α=1, as shown in Figure 4, the influence of a given frame is halved with each frame. In this way, the influence of the previous frame on a given frame is stronger. This improves the ability of the recorded audio to follow changes in the external audio.
なお、雑音比算出部205によって算出された雑音比が所定の閾値以上の場合は、外部音声用マイク301から入力された音声信号に雑音成分が多く含まれていることを意味するため、外部環境音更新部207による外部環境音スペクトルの更新は行われない。 Note that if the noise ratio calculated by the noise ratio calculation unit 205 is equal to or greater than a predetermined threshold, this means that the audio signal input from the external audio microphone 301 contains a large amount of noise components, and therefore the external environmental sound update unit 207 does not update the external environmental sound spectrum.
雑音低減部208は、時間周波数変換部203から入力された外部音声スペクトルに対して、雑音算出部206から入力された補正後の雑音成分スペクトルを用いて雑音を低減し、雑音低減された音声スペクトルを生成する。雑音低減部208は雑音低減手段として例えばウィーナーフィルタを用いる。 The noise reduction unit 208 reduces noise from the external audio spectrum input from the time-frequency conversion unit 203 using the corrected noise component spectrum input from the noise calculation unit 206, generating a noise-reduced audio spectrum. The noise reduction unit 208 uses, for example, a Wiener filter as noise reduction means.
音声補正部209は、雑音低減部208から入力された音声スペクトルと外部環境音更新部207で更新された外部環境音スペクトルとを周波数帯ごとに比較する。雑音低減部208から入力された音声スペクトルが外部環境音スペクトルより小さい帯域では、元々環境音に含まれているべき周波数の信号が過度に低減されている可能性が高い。そこで本実施形態では、音声補正部209は、雑音低減部208から入力された音声スペクトルの当該周波数帯において、音声スペクトルを下記の数式2を用いて補正する。
[数式2] S′S(ω,t)=(|SS(ω,t)|+|S′env(ω,t)|)/2*phas(SS(ω,t))
The audio correction unit 209 compares, for each frequency band, the audio spectrum input from the noise reduction unit 208 with the external environmental sound spectrum updated by the external environmental sound update unit 207. In bands where the audio spectrum input from the noise reduction unit 208 is smaller than the external environmental sound spectrum, there is a high possibility that frequency signals that should originally be included in the environmental sound have been excessively reduced. Therefore, in this embodiment, the audio correction unit 209 corrects the audio spectrum in the frequency band of the audio spectrum input from the noise reduction unit 208 using the following Equation 2.
[Formula 2] S' S (ω, t) = (|S S (ω, t) | + | S' env (ω, t) |)/2*phas (S S (ω, t))
ここで、SS(ω,t)は雑音低減部208から入力された音声スペクトル、S′S(ω,t)は補正された雑音低減後の音声スペクトルである。phas(N)はNの位相成分を取り出すための関数(すなわち、各周波数成分の振幅を1にする関数)である。この処理により、過度な雑音低減が補正(抑制)されるため、音質の劣化を抑えることができる。なお、雑音低減部208から入力された音声スペクトルが外部環境音スペクトルに等しいか大きい帯域については補正を行わない。 Here, S S (ω, t) is the audio spectrum input from the noise reduction unit 208, and S' S (ω, t) is the audio spectrum after corrected noise reduction. phas(N) is a function for extracting the phase component of N (i.e., a function that sets the amplitude of each frequency component to 1). This process corrects (suppresses) excessive noise reduction, thereby suppressing deterioration in sound quality. Note that no correction is made to bands in which the audio spectrum input from the noise reduction unit 208 is equal to or larger than the external environmental sound spectrum.
音声補正部209は、補正処理を行ったか否かに関わらず、音声スペクトルを周波数時間変換部210へ出力する。 The audio correction unit 209 outputs the audio spectrum to the frequency-time transform unit 210 regardless of whether correction processing has been performed.
周波数時間変換部210は、音声補正部209から入力された音声スペクトルを逆フーリエ変換などの処理により時間領域の波形信号に変換する。本実施形態では、周波数時間変換部210は、ハーフオーバラップによってフレームを加算しながら出力する。 The frequency-time transform unit 210 converts the audio spectrum input from the audio correction unit 209 into a time-domain waveform signal using processing such as an inverse Fourier transform. In this embodiment, the frequency-time transform unit 210 outputs the audio spectrum while adding frames using half overlap.
出力された信号は、記録部108で、画像処理部104からの画像信号とともに記録される。 The output signal is recorded in the recording unit 108 together with the image signal from the image processing unit 104.
<収音部300の説明>
収音部300は外部音声用マイク301と雑音参照マイク302からなる。
<Explanation of sound pickup unit 300>
The sound collection unit 300 comprises an external sound microphone 301 and a noise reference microphone 302 .
外部音声用マイク301は2つのマイクからなり、主に被写体の音声を取得するように設置される。本実施形態では、2つのマイクは、ステレオ音声のRchとLchのそれぞれの音声信号に対応する音声を取得する。 The external audio microphone 301 consists of two microphones and is installed to mainly capture the audio of the subject. In this embodiment, the two microphones capture audio corresponding to the audio signals of the Rch and Lch of stereo audio.
雑音参照マイク302は、カメラ筐体内部の駆動雑音が主に取得できるように設置される。例えば、雑音参照マイク302は外部音声が入力されないように、外部との開口部を持たず、外装に遮蔽された状態で設置される。また、雑音参照マイクは外部音声用マイク301に入力される雑音により近い雑音を検出するため外部音声用マイク301の近傍に設置される。あるいは、雑音参照マイクは雑音をより正確に取得するため雑音源の近傍に設置されてもよい。 The noise reference microphone 302 is installed so that it can mainly capture driving noise inside the camera housing. For example, the noise reference microphone 302 is installed without an opening to the outside and is shielded by an exterior to prevent external sound from being input. The noise reference microphone is also installed near the external sound microphone 301 to detect noise that is closer to the noise input to the external sound microphone 301. Alternatively, the noise reference microphone may be installed near the noise source to capture noise more accurately.
以上説明した各部の働きにより、外部音声マイクに入力される外部音声の音量に見合ったレンズ駆動雑音の低減が行われ過度な雑音削減を抑えることができるため、雑音低減後の音質劣化が抑制される。 The functions of each component described above reduce lens drive noise in accordance with the volume of the external audio input to the external audio microphone, preventing excessive noise reduction and minimizing deterioration in sound quality after noise reduction.
図3は本実施形態の音声処理のフローチャートである。本フローチャートの処理は、動画像の録画の開始をトリガに実行される。以下の処理は、撮影装置100が有するプロセッサ等の制御部が、音声処理部200および収音部300等の撮影装置100の各部を制御することにより実現される。また、制御部は、撮影装置100に記録されたソフトウェアをメモリに展開して実行することで本フローチャートの処理を実現する。 Figure 3 is a flowchart of audio processing in this embodiment. The processing of this flowchart is executed when the start of video recording is triggered. The following processing is realized by a control unit, such as a processor, included in the image capture device 100 controlling each unit of the image capture device 100, such as the audio processing unit 200 and sound collection unit 300. The control unit also realizes the processing of this flowchart by expanding software recorded in the image capture device 100 into memory and executing it.
ステップS101において、A/D変換部201の出力であるデジタル信号に対して波形切出部202で波形の切り出しが行われる。切り出された信号は時間周波数変換部203へ出力される。 In step S101, the waveform extraction unit 202 extracts a waveform from the digital signal output by the A/D conversion unit 201. The extracted signal is output to the time-frequency conversion unit 203.
ステップS102において、時間周波数変換部203に入力されたデジタル信号に対して高速フーリエ変換(FFT)処理が行われる。外部音声用マイク301の信号に対してFFT処理した信号は外部環境音更新部207および雑音低減部208へ出力され、雑音参照マイク302の信号に対してFFT処理した信号は雑音検出部204、雑音比算出部205および雑音算出部206へ出力される。 In step S102, a fast Fourier transform (FFT) is performed on the digital signal input to the time-frequency conversion unit 203. The signal obtained by FFT processing of the signal from the external audio microphone 301 is output to the external environmental sound update unit 207 and the noise reduction unit 208, and the signal obtained by FFT processing of the signal from the noise reference microphone 302 is output to the noise detection unit 204, noise ratio calculation unit 205, and noise calculation unit 206.
ステップS103において、雑音検出部204の雑音検出処理が行われる。ここで雑音が検出されなかったフレームから背景雑音スペクトルが求められ、雑音の検出結果とともに雑音比算出部205および雑音算出部206へ出力される。 In step S103, the noise detection unit 204 performs noise detection processing. Here, a background noise spectrum is calculated from frames in which noise is not detected, and is output together with the noise detection results to the noise ratio calculation unit 205 and noise calculation unit 206.
ステップS104において、雑音比算出部205によって雑音比算出処理が行われる。ここで、雑音比は、雑音検出部204において雑音が検出されたフレームの雑音参照音スペクトルと背景雑音スペクトルとを用いて算出される。そして、ステップS105では、雑音比が、所定の閾値未満か否かを判定される。雑音比が所定の閾値未満である場合、ステップS106の処理が実行され、外部環境音更新部207にて数式1に従い外部環境音スペクトルが更新される。なお、本実施形態では、雑音比が所定の閾値未満である場合にステップS106の処理が実行されたが、ステップS106の処理は所定の閾値以下の場合に実行されるようにしてもよい。 In step S104, the noise ratio calculation unit 205 performs a noise ratio calculation process. Here, the noise ratio is calculated using the noise reference sound spectrum and background noise spectrum of the frame in which noise was detected by the noise detection unit 204. Then, in step S105, it is determined whether the noise ratio is less than a predetermined threshold. If the noise ratio is less than the predetermined threshold, the process of step S106 is performed, and the external environmental sound update unit 207 updates the external environmental sound spectrum according to Equation 1. Note that, in this embodiment, the process of step S106 is performed when the noise ratio is less than the predetermined threshold, but the process of step S106 may also be performed when the noise ratio is equal to or less than the predetermined threshold.
ステップS107では、雑音参照マイク信号に含まれる雑音成分スペクトルに対し、雑音参照マイク信号の雑音成分スペクトルに応じた補正係数を乗ずることで、補正後の雑音スペクトルが算出される。ここで、補正前の雑音成分スペクトルは、雑音算出部206において雑音検出部204で雑音が検出されたフレームの雑音参照信号の音声スペクトルから背景雑音スペクトルを減じることで算出される。算出された補正後の雑音スペクトルは雑音低減部208へ出力される。 In step S107, the noise component spectrum contained in the noise reference microphone signal is multiplied by a correction coefficient corresponding to the noise component spectrum of the noise reference microphone signal to calculate a corrected noise spectrum. Here, the pre-correction noise component spectrum is calculated in the noise calculation unit 206 by subtracting the background noise spectrum from the speech spectrum of the noise reference signal for the frame in which noise was detected by the noise detection unit 204. The calculated corrected noise spectrum is output to the noise reduction unit 208.
ステップS108では、雑音低減部208において外部音声用マイク301から入力された音声信号に含まれる雑音成分を低減する処理が行われる。ここでは、ステップS102で算出された外部音声スペクトルから、ステップS107で算出された補正後の雑音成分スペクトルを用いて、雑音が低減され、雑音低減後の音声スペクトルが生成される。ステップS108は、雑音低減手段として例えばウィーナーフィルタを用いられる。なお、ステップS108の雑音低減手段として、例えば、周波数領域での波形減算が行われてもよい。 In step S108, the noise reduction unit 208 performs processing to reduce noise components contained in the audio signal input from the external audio microphone 301. Here, noise is reduced from the external audio spectrum calculated in step S102 using the corrected noise component spectrum calculated in step S107, and a noise-reduced audio spectrum is generated. In step S108, a Wiener filter, for example, is used as the noise reduction means. Note that the noise reduction means in step S108 may also be waveform subtraction in the frequency domain, for example.
ステップS109では、雑音低減後の音声スペクトルは周波数帯ごとに雑音低減後の音声スペクトルと外部環境音更新部207で更新された外部環境音スペクトルとが比較される。雑音低減後音声スペクトルの方が小さい周波数帯域では、ステップS110において、雑音低減後の音声スペクトルが補正される。本実施形態では、この補正において、数式2が用いられる。なお、雑音低減後の音声スペクトルはステップS110において補正されたか否かにかかわらず周波数時間変換部210へ出力される。 In step S109, the noise-reduced audio spectrum is compared for each frequency band with the external environmental sound spectrum updated by the external environmental sound update unit 207. In frequency bands where the noise-reduced audio spectrum is smaller, the noise-reduced audio spectrum is corrected in step S110. In this embodiment, Equation 2 is used for this correction. Note that the noise-reduced audio spectrum is output to the frequency-time transform unit 210 regardless of whether it has been corrected in step S110.
ステップS111では、周波数時間変換部210へ入力された音声スペクトルに対して、逆高速フーリエ変換処理(IFFT)処理が行われる。変換された信号は逐次、記録部108へ出力され、画像(動画像)とともに記録される。 In step S111, an inverse fast Fourier transform (IFFT) is performed on the audio spectrum input to the frequency-time transform unit 210. The converted signals are sequentially output to the recording unit 108 and recorded together with the image (moving image).
そして、ステップS112において撮影が終了したと判断されるまで、ステップS101からステップS111までの各ステップの処理が繰り返される。撮影が終了したと判断される場合は、例えば、ユーザによって動画像の記録を終了するための操作が行われた場合である。 Then, the processing of each step from step S101 to step S111 is repeated until it is determined in step S112 that filming has ended. Filming is determined to have ended when, for example, the user performs an operation to end video recording.
以上説明した処理制御を行うことにより、外部音声マイクに入力される外部音声の音量に見合ったレンズ駆動雑音の低減が行われ過度な雑音削減を抑えることができるため、雑音低減後の音質劣化が抑制される。 By performing the processing control described above, lens drive noise is reduced in accordance with the volume of the external audio input to the external audio microphone, preventing excessive noise reduction and minimizing deterioration in sound quality after noise reduction.
なお、外部環境音更新部207は、雑音比ではなく、雑音参照マイクによって取得された音声信号のゲインに基づいて更新を行ってもよい。雑音参照マイクによって取得された音声信号が十分大きい場合、その音声信号には駆動雑音が含まれている可能性が高いと判断できるからである。 The external environmental sound update unit 207 may perform the update based on the gain of the audio signal acquired by the noise reference microphone, rather than the noise ratio. This is because if the audio signal acquired by the noise reference microphone is sufficiently large, it can be determined that there is a high possibility that the audio signal contains drive noise.
尚、本実施形態においては、雑音低減部208での雑音低減処理後に音声補正部209にて補正を行った(ステップS109ならびにステップS110)が、他の方法によって処理を行ってもよい。例えば、ステップS108において雑音低減部208で予め雑音低減の下限値として外部環境音スペクトルを用いた雑音低減処理を行うことで、音声補正部209ならびにステップS109、ステップS110の処理を省いても良い。 In this embodiment, correction is performed by the audio correction unit 209 after noise reduction processing by the noise reduction unit 208 (steps S109 and S110), but processing may be performed using other methods. For example, in step S108, the noise reduction unit 208 may perform noise reduction processing in advance using the external environmental sound spectrum as the lower limit value for noise reduction, thereby omitting the processing by the audio correction unit 209 and steps S109 and S110.
また、音声補正部209における補正処理は、雑音低減部208における雑音低減の度合いが低い場合に、さらなる雑音低減処理を行ってもよい。 In addition, the correction processing in the audio correction unit 209 may perform further noise reduction processing if the degree of noise reduction in the noise reduction unit 208 is low.
本実施形態において記録部108の記録媒体は、例えば、SDカードやCFExpressカード等の半導体メモリである。 In this embodiment, the recording medium of the recording unit 108 is, for example, a semiconductor memory such as an SD card or a CFExpress card.
撮影装置100はさらにデータ圧縮部を備え、記録される画像、動画像のデータを圧縮してもよい。 The imaging device 100 may further include a data compression unit to compress the image and video data being recorded.
本実施形態において駆動雑音はレンズ駆動雑音としたが、他の撮影装置本体側の駆動部によって発生する雑音に対しても同様に低減してもよい。 In this embodiment, the drive noise is lens drive noise, but noise generated by other drive units on the image capture device body may also be reduced in a similar manner.
本実施形態において音声処理部200を構成する各部のうちA/D変換部201を除く各部は、CPUを用いたプログラム処理であってもよい。また、音声処理部200を構成する各部のうちA/D変換部201を除く各部は、DSP、専用LSIなどを含むその他電子回路など、ハードウェアで処理してもよい。 In this embodiment, each of the components constituting the audio processing unit 200, except for the A/D conversion unit 201, may be processed by a program using a CPU. Furthermore, each of the components constituting the audio processing unit 200, except for the A/D conversion unit 201, may be processed by hardware, such as a DSP, a dedicated LSI, or other electronic circuitry.
本実施形態において雑音検出部204は雑音参照マイク302からの信号に基づき雑音検出を行っているが、雑音の発生源である駆動部の制御情報を取得し、その情報に基づいて雑音検出を行ってもよい。例えば、レンズ制御部102からレンズを駆動する制御信号を取得し、雑音検出を行ってもよい。駆動情報は例えば駆動部の駆動速度、駆動方向、駆動部の位置などを含む。また駆動情報は、たとえばレンズ制御部がレンズ部にレンズの駆動を開始または終了させる指示情報でも良い。あるいは駆動情報は、レンズ制御部がレンズを駆動させる判断を行うための内部情報、たとえば非合焦状態検知、合焦状態検知などでも良い。また外部音声用マイク301の信号を用いるようにしてもよい。 In this embodiment, the noise detection unit 204 performs noise detection based on a signal from the noise reference microphone 302, but it may also obtain control information from the drive unit, which is the source of the noise, and perform noise detection based on that information. For example, it may obtain a control signal for driving the lens from the lens control unit 102 and perform noise detection. The drive information may include, for example, the drive speed, drive direction, and position of the drive unit of the drive unit. The drive information may also be, for example, instruction information from the lens control unit to instruct the lens unit to start or end lens drive. Alternatively, the drive information may be internal information used by the lens control unit to determine whether to drive the lens, such as detection of an out-of-focus state or an in-focus state. A signal from the external audio microphone 301 may also be used.
なお、雑音算出部206では雑音検出部204の検出した雑音種別に応じて異なる雑音推定処理を実施してもよい。 The noise calculation unit 206 may perform different noise estimation processes depending on the type of noise detected by the noise detection unit 204.
なお、本実施形態において雑音算出部206は補正係数テーブルをあらかじめ備えるようにしたが、逐次計算するようになっていてもよい。例えば、外部音声用マイク301の信号と雑音参照マイク302の信号とに基づいて適切な補正係数テーブルを算出および更新するようになっていてもよい。 In this embodiment, the noise calculation unit 206 is provided with a correction coefficient table in advance, but it may also be configured to calculate the correction coefficient table sequentially. For example, it may be configured to calculate and update an appropriate correction coefficient table based on the signal from the external audio microphone 301 and the signal from the noise reference microphone 302.
なお、本実施形態において外部環境音更新部207で雑音比算出部205が算出した雑音比と閾値を比較しているが、この閾値は、聴感試験等の結果に基づき予め適切な値を指定しておいてもよいし逐次計算するようになっていてもよい。例えば、外部音声用マイク301の信号と雑音参照マイク302の信号とに基づいて適切な閾値を算出および更新するようになっていてもよい。 In this embodiment, the external environmental sound update unit 207 compares the noise ratio calculated by the noise ratio calculation unit 205 with a threshold value, but this threshold value may be specified in advance as an appropriate value based on the results of an auditory test or the like, or may be calculated sequentially. For example, an appropriate threshold value may be calculated and updated based on the signal from the external audio microphone 301 and the signal from the noise reference microphone 302.
なお、本実施形態において雑音低減部208はウィーナーフィルタを用いるとしたが、その他の手法を用いてもよい。例えば、雑音低減部208は、スペクトルサブトラクションを用いてもよいし、時間領域での波形減算を行ってもよい。さらに所定の閾値以下の音量レベルの特定の周波数ビンの信号に対してさらに音量レベルを低減する処理を施すようにしてもよい。また、雑音低減部208では雑音検出部204の検出した雑音種別に応じて異なる雑音低減処理を実施してもよいし、雑音種別に応じた補正係数テーブルを選択するものとしても良い。さらにレンズの種別に応じてそれらの処理や補正係数テーブルを切り替えるようにしてもよい。 In this embodiment, the noise reduction unit 208 uses a Wiener filter, but other methods may also be used. For example, the noise reduction unit 208 may use spectral subtraction, or may perform waveform subtraction in the time domain. Furthermore, it may be configured to perform processing to further reduce the volume level of signals in specific frequency bins with volume levels below a predetermined threshold. Furthermore, the noise reduction unit 208 may perform different noise reduction processing depending on the type of noise detected by the noise detection unit 204, or may select a correction coefficient table depending on the noise type. Furthermore, these processes and correction coefficient tables may be switched depending on the type of lens.
なお、本実施形態において、外部音声用マイク301は2つのマイク(ステレオマイク)としたが、モノラル、サラウンド、あるいはアンビソニックス方式などチャンネル数が異なっていても同様に処理可能である。 In this embodiment, the external audio microphone 301 is two microphones (stereo microphones), but processing can be performed in the same way even if the number of channels is different, such as monaural, surround, or Ambisonics.
なお、本実施形態において、音声処理部200は簡単のため雑音低減処理のみを行っているが、さらに、その他の処理を行ってもよい。例えば音声を聞きやすくするためのイコライジングなどのスペクトル補正処理や、再生される音声のステレオ感を強調する処理などを行う構成になっていてもよい。さらにMP3やAACなどの各種音声コーデックを用いた符号化を行う構成になっていてもよい。 In this embodiment, the audio processing unit 200 only performs noise reduction processing for simplicity, but it may also perform other processing. For example, it may be configured to perform spectral correction processing such as equalization to make the audio easier to hear, or processing to emphasize the stereo effect of the audio being played back. It may also be configured to perform encoding using various audio codecs such as MP3 and AAC.
なお、本実施形態において、雑音参照マイク302は1つのマイクからなるとしたが、さらに多くのマイクを備えてもよい。さらに、雑音参照マイク302の一部はレンズ側に装着されるように構成されてもよい。さらに、雑音参照マイク302の一部、あるいはすべては空気の振動を取得するマイクではなく、物体の振動を検出する振動センサであってもよい。 In this embodiment, the noise reference microphone 302 consists of one microphone, but more microphones may be provided. Furthermore, part of the noise reference microphone 302 may be configured to be attached to the lens side. Furthermore, part or all of the noise reference microphone 302 may be vibration sensors that detect vibrations of objects, rather than microphones that capture vibrations in the air.
なお、また、雑音参照マイク302のマイクの設置位置を外部音声用マイク301の近傍や、雑音源の近傍に設置するとしたが、外部音声用マイク301に入力される雑音成分が推定できる雑音が取得できれば設置場所は問わない。 Furthermore, although the noise reference microphone 302 is described as being installed near the external audio microphone 301 or near the noise source, the installation location does not matter as long as noise can be acquired that can be used to estimate the noise components input to the external audio microphone 301.
Claims (10)
前記撮影装置の外部音声を取得する外部音声用マイクと、
前記撮影装置の駆動部、または撮影装置に接続された外部装置の駆動雑音を取得する雑音参照マイクと、
前記雑音参照マイクにより取得された信号から前記駆動雑音の音声信号を算出する雑音算出手段と、
前記外部音声用マイクにより取得された前記外部音声に関する音声信号を記憶し、前記雑音参照マイクにより取得された信号に基づいて前記外部音声に関する音声信号を更新すると判断した場合に前記記憶された前記外部音声に関する音声信号を更新する更新手段と、
前記更新手段に記憶された前記外部音声に関する音声信号と、前記雑音算出手段により算出された前記駆動雑音の音声信号とに基づいて、前記外部音声用マイクにより取得された音声信号から前記駆動雑音を低減する処理を行う低減手段と
を有し、
前記更新手段は、前記外部音声用マイクにより取得された音声信号の平均値を前記外部音声に関する音声信号として記憶し、前記外部音声に関する音声信号を更新すると判断した場合に、前記記憶された前記外部音声に関する音声信号と前記外部音声用マイクから入力された音声信号との平均値により前記記憶された前記外部音声に関する音声信号を更新することを特徴とする撮影装置。 An imaging device,
an external sound microphone for acquiring external sound from the imaging device;
a noise reference microphone for acquiring driving noise from a driving unit of the imaging device or an external device connected to the imaging device;
a noise calculation means for calculating an audio signal of the driving noise from a signal acquired by the noise reference microphone;
an updating means for storing an audio signal relating to the external audio acquired by the external audio microphone, and updating the stored audio signal relating to the external audio when it is determined to update the audio signal relating to the external audio based on the signal acquired by the noise reference microphone;
a reduction unit that performs processing to reduce the drive noise from the audio signal acquired by the external audio microphone based on the audio signal related to the external audio stored in the update unit and the audio signal of the drive noise calculated by the noise calculation unit ,
The updating means stores an average value of the audio signal acquired by the external audio microphone as the audio signal related to the external audio, and when it determines to update the audio signal related to the external audio, updates the stored audio signal related to the external audio with the average value of the stored audio signal related to the external audio and the audio signal input from the external audio microphone .
前記雑音検出手段により検出された前記駆動雑音の値と前記背景雑音の値の比を求める雑音比算出手段と、
をさらに有し、
前記更新手段は、前記雑音比算出手段により算出された前記比が閾値未満である場合に、前記記憶された前記外部音声に関する音声信号を更新することを特徴とする請求項1から4のいずれか1項に記載の撮影装置。 a noise detection means for detecting the driving noise and background noise from the signal acquired by the noise reference microphone;
a noise ratio calculation means for calculating a ratio between the value of the driving noise detected by the noise detection means and the value of the background noise;
and
The photographing device according to any one of claims 1 to 4 , characterized in that the update means updates the stored audio signal related to the external audio when the ratio calculated by the noise ratio calculation means is less than a threshold value.
前記雑音算出手段は、前記変換手段からの前記雑音参照音スペクトルから、前記駆動雑音の雑音成分スペクトルを算出し、
前記低減手段は、前記雑音成分スペクトルに基づいて前記変換手段からの前記外部環境音スペクトルから前記駆動雑音を低減し、前記駆動雑音が低減された音声スペクトルを出力することを特徴とする請求項1から7のいずれか1項に記載の撮像装置。 a conversion means for converting the signal from the external audio microphone from a time domain signal to a frequency domain signal to output an external environmental sound spectrum, and for converting the signal from the noise reference microphone from a time domain signal to a frequency domain signal to output a noise reference sound spectrum,
the noise calculation means calculates a noise component spectrum of the driving noise from the noise reference sound spectrum from the conversion means;
8. The imaging device according to claim 1, wherein the reduction means reduces the drive noise from the external environmental sound spectrum from the conversion means based on the noise component spectrum, and outputs an audio spectrum in which the drive noise has been reduced.
前記撮影装置の駆動部、または前記撮影装置に接続された外部装置の駆動雑音を取得する雑音参照マイクと、を有する前記撮影装置の制御方法であって、
前記雑音参照マイクにより取得された信号から前記駆動雑音の音声信号を算出する雑音算出ステップと、
前記外部音声用マイクにより取得された前記外部音声に関する音声信号を記憶し、前記雑音参照マイクにより取得された信号に基づいて前記外部音声に関する音声信号を更新すると判断した場合に前記記憶された前記外部音声に関する音声信号を更新する更新ステップと、
前記更新ステップによって記憶された前記外部音声に関する音声信号と、前記雑音算出ステップにより算出された前記駆動雑音の音声信号とに基づいて、前記外部音声用マイクにより取得された音声信号から前記駆動雑音を低減する低減ステップと
を有し、
前記更新ステップは、前記外部音声用マイクにより取得された音声信号の平均値を前記外部音声に関する音声信号として記憶し、前記外部音声に関する音声信号を更新すると判断した場合に、前記記憶された前記外部音声に関する音声信号と前記外部音声用マイクから入力された音声信号との平均値により前記記憶された前記外部音声に関する音声信号を更新することを特徴とする制御方法。 an external audio microphone for picking up external audio from the imaging device;
a noise reference microphone that acquires driving noise from a driving unit of the image capturing device or from an external device connected to the image capturing device,
a noise calculation step of calculating an audio signal of the driving noise from the signal acquired by the noise reference microphone;
an updating step of storing an audio signal related to the external audio acquired by the external audio microphone, and updating the stored audio signal related to the external audio when it is determined to update the audio signal related to the external audio based on the signal acquired by the noise reference microphone;
a reduction step of reducing the drive noise from the audio signal acquired by the external audio microphone based on the audio signal related to the external audio stored in the update step and the audio signal of the drive noise calculated in the noise calculation step ,
The update step is a control method characterized in that the average value of the audio signal acquired by the external audio microphone is stored as the audio signal related to the external audio, and when it is determined that the audio signal related to the external audio should be updated, the stored audio signal related to the external audio is updated with the average value of the stored audio signal related to the external audio and the audio signal input from the external audio microphone .
前記撮影装置の駆動部、または前記撮影装置に接続された外部装置の駆動雑音を取得する雑音参照マイクと、を有する前記撮影装置のコンピュータに制御方法を実行させるためのプログラムであって、前記制御方法は、
前記雑音参照マイクにより取得された信号から前記駆動雑音の音声信号を算出する雑音算出ステップと、
前記外部音声用マイクにより取得された前記外部音声に関する音声信号を記憶し、前記雑音参照マイクにより取得された信号に基づいて前記外部音声に関する音声信号を更新すると判断した場合に前記記憶された前記外部音声に関する音声信号を更新する更新ステップと、
前記更新ステップによって記憶された前記外部音声に関する音声信号と、前記雑音算出ステップにより算出された前記駆動雑音の音声信号とに基づいて、前記外部音声用マイクにより取得された音声信号から前記駆動雑音を低減する低減ステップと
を有し、
前記更新ステップは、前記外部音声用マイクにより取得された音声信号の平均値を前記外部音声に関する音声信号として記憶し、前記外部音声に関する音声信号を更新すると判断した場合に、前記記憶された前記外部音声に関する音声信号と前記外部音声用マイクから入力された音声信号との平均値により前記記憶された前記外部音声に関する音声信号を更新することを特徴とするプログラム。 an external audio microphone for picking up external audio from the imaging device;
a noise reference microphone that acquires driving noise from a driving unit of the imaging device or from an external device connected to the imaging device, the computer of the imaging device executing a control method, the control method comprising:
a noise calculation step of calculating an audio signal of the driving noise from the signal acquired by the noise reference microphone;
an updating step of storing an audio signal related to the external audio acquired by the external audio microphone, and updating the stored audio signal related to the external audio when it is determined to update the audio signal related to the external audio based on the signal acquired by the noise reference microphone;
a reduction step of reducing the drive noise from the audio signal acquired by the external audio microphone based on the audio signal related to the external audio stored in the update step and the audio signal of the drive noise calculated in the noise calculation step ,
The update step is a program characterized in that it stores an average value of the audio signal acquired by the external audio microphone as an audio signal related to the external audio, and when it is determined that the audio signal related to the external audio should be updated, it updates the stored audio signal related to the external audio with the average value of the stored audio signal related to the external audio and the audio signal input from the external audio microphone .
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021190620A JP7770883B2 (en) | 2021-11-24 | 2021-11-24 | IMAGING DEVICE, CONTROL METHOD, AND PROGRAM |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021190620A JP7770883B2 (en) | 2021-11-24 | 2021-11-24 | IMAGING DEVICE, CONTROL METHOD, AND PROGRAM |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JP2023077339A JP2023077339A (en) | 2023-06-05 |
| JP2023077339A5 JP2023077339A5 (en) | 2024-11-21 |
| JP7770883B2 true JP7770883B2 (en) | 2025-11-17 |
Family
ID=86610071
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2021190620A Active JP7770883B2 (en) | 2021-11-24 | 2021-11-24 | IMAGING DEVICE, CONTROL METHOD, AND PROGRAM |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7770883B2 (en) |
Citations (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2004164303A (en) | 2002-11-13 | 2004-06-10 | Sumiden Asahi Industries Ltd | Self-propelled machine for monitoring |
| US20050152563A1 (en) | 2004-01-08 | 2005-07-14 | Kabushiki Kaisha Toshiba | Noise suppression apparatus and method |
| JP2006279757A (en) | 2005-03-30 | 2006-10-12 | Casio Comput Co Ltd | Imaging apparatus, audio recording method, and program |
| US20070156399A1 (en) | 2005-12-29 | 2007-07-05 | Fujitsu Limited | Noise reducer, noise reducing method, and recording medium |
| JP2008252389A (en) | 2007-03-29 | 2008-10-16 | Casio Comput Co Ltd | Imaging apparatus, noise removal method, and program |
| WO2012098579A1 (en) | 2011-01-19 | 2012-07-26 | 三菱電機株式会社 | Noise suppression device |
| JP2014225731A (en) | 2013-05-15 | 2014-12-04 | 株式会社ニコン | Signal processing device, imaging device, and program |
-
2021
- 2021-11-24 JP JP2021190620A patent/JP7770883B2/en active Active
Patent Citations (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2004164303A (en) | 2002-11-13 | 2004-06-10 | Sumiden Asahi Industries Ltd | Self-propelled machine for monitoring |
| US20050152563A1 (en) | 2004-01-08 | 2005-07-14 | Kabushiki Kaisha Toshiba | Noise suppression apparatus and method |
| JP2005195955A (en) | 2004-01-08 | 2005-07-21 | Toshiba Corp | Noise suppression device and noise suppression method |
| JP2006279757A (en) | 2005-03-30 | 2006-10-12 | Casio Comput Co Ltd | Imaging apparatus, audio recording method, and program |
| US20070156399A1 (en) | 2005-12-29 | 2007-07-05 | Fujitsu Limited | Noise reducer, noise reducing method, and recording medium |
| JP2007183306A (en) | 2005-12-29 | 2007-07-19 | Fujitsu Ltd | Noise suppression device, noise suppression method, and computer program |
| JP2008252389A (en) | 2007-03-29 | 2008-10-16 | Casio Comput Co Ltd | Imaging apparatus, noise removal method, and program |
| WO2012098579A1 (en) | 2011-01-19 | 2012-07-26 | 三菱電機株式会社 | Noise suppression device |
| US20130216058A1 (en) | 2011-01-19 | 2013-08-22 | Mitsubishi Electric Corporation | Noise suppression device |
| JP2014225731A (en) | 2013-05-15 | 2014-12-04 | 株式会社ニコン | Signal processing device, imaging device, and program |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2023077339A (en) | 2023-06-05 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US9495950B2 (en) | Audio signal processing device, imaging device, audio signal processing method, program, and recording medium | |
| JP2008263498A (en) | Wind noise reducing device, sound signal recorder and imaging apparatus | |
| CN111968662A (en) | Audio signal processing method and device and storage medium | |
| US10535363B2 (en) | Audio processing apparatus and control method thereof | |
| JP5998483B2 (en) | Audio signal processing apparatus, audio signal processing method, program, and recording medium | |
| KR20120056106A (en) | Method for removing audio noise and Image photographing apparatus thereof | |
| US12335695B2 (en) | Imaging apparatus and method for controlling the same | |
| US20150271439A1 (en) | Signal processing device, imaging device, and program | |
| JP7616785B2 (en) | Method and device for processing binaural recordings | |
| JP6610725B2 (en) | Sound processing apparatus and sound processing program | |
| JP6300464B2 (en) | Audio processing device | |
| JP6902961B2 (en) | Speech processing device and its control method | |
| JP7770883B2 (en) | IMAGING DEVICE, CONTROL METHOD, AND PROGRAM | |
| JP7781535B2 (en) | Audio processing device, control method, and program | |
| JP2018066963A (en) | Sound processing device | |
| JP2022038611A5 (en) | ||
| JP5473786B2 (en) | Audio signal processing apparatus and control method thereof | |
| JP2014232267A (en) | Signal processing device, imaging device and program | |
| JP2012168345A (en) | Mechanical sound removal device, mechanical sound detection device, and video imaging apparatus | |
| JP2014026032A (en) | Signal processing device, imaging device, and program | |
| JP2018207316A (en) | Speech processing apparatus and control method thereof | |
| JP5246134B2 (en) | Signal processing apparatus and imaging apparatus | |
| JP2018207313A (en) | Speech processing apparatus and control method thereof | |
| JP6877246B2 (en) | Speech processing device and its control method | |
| JP2016051091A (en) | Device and method for voice processing |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20231213 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20241113 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20241113 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20250807 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20250819 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250926 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20251007 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20251105 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7770883 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |