JP7485982B2 - Processing device, playback system, processing method, and processing program - Google Patents
Processing device, playback system, processing method, and processing program Download PDFInfo
- Publication number
- JP7485982B2 JP7485982B2 JP2022529167A JP2022529167A JP7485982B2 JP 7485982 B2 JP7485982 B2 JP 7485982B2 JP 2022529167 A JP2022529167 A JP 2022529167A JP 2022529167 A JP2022529167 A JP 2022529167A JP 7485982 B2 JP7485982 B2 JP 7485982B2
- Authority
- JP
- Japan
- Prior art keywords
- filter
- speaker
- reward function
- processing device
- constraint condition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; ELECTRIC HEARING AIDS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; ELECTRIC HEARING AIDS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers
Landscapes
- Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
本発明は、処理装置、再生システム、処理方法および処理プログラムに関する。 The present invention relates to a processing device, a playback system, a processing method and a processing program.
近年、駅のホーム、美術館、および博物館などの公共空間において、特定のエリアにのみ音を提示するエリア再生技術が、普及している。特定のエリアのみに音を提示するエリア再生技術は、家庭においてテレビを見ている人にのみ音を届けたり、車内において運転者にのみナビゲーションの音を提示し、その他の同乗者には音楽を提示したりするなどの、小規模空間への適用考えられている。In recent years, area playback technology that presents sound only to specific areas has become widespread in public spaces such as train stations, art galleries, and museums. Area playback technology that presents sound only to specific areas is being considered for application to small spaces, such as delivering sound only to people watching television at home, or presenting navigation sounds only to the driver in a car and music to other passengers.
このようなエリア再生技術において特に、超音波を用いた鋭い指向性を持つスピーカ、または通常のスピーカを複数並べて構成したスピーカアレイにより、音場を制御する方法が検討されている。一般的に、超音波スピーカは超音波を可聴音に復調しているため、復調の際に歪みが発生することで音質を劣化させ、特に高音域の再生が困難になる。音楽など様々なコンテンツを再生することを考えると、高音質な再生が可能なエリア再生が求められる。 In particular, methods of controlling the sound field using ultrasonic speakers with sharp directionality or speaker arrays consisting of multiple regular speakers lined up are being considered for this type of area reproduction technology. Generally, ultrasonic speakers demodulate ultrasonic waves into audible sound, but distortion occurs during the demodulation, degrading the sound quality, making it particularly difficult to reproduce high-pitched sounds. When considering the reproduction of various content such as music, area reproduction that enables high-quality sound reproduction is required.
例えば、スピーカアレイを用いて任意の特定のエリアにのみを音を提示し、それ以外のエリアには音が漏れないようにするエリア再生方法がある(特許文献1参照)。For example, there is an area playback method that uses a speaker array to present sound only to any specific area, preventing the sound from leaking out to other areas (see Patent Document 1).
スピーカアレイを用いてエリア再生を実現する手法として、指向性制御技術や音響コントラスト最大化技術(ACM:Acoustic Contrast Maximization)を用いる場合がある。ACMを用いて、任意に設定した音を提示するエリア(Bright-zone)と、音を抑圧するエリア(Dark-zone)との間の音響コントラストをスピーカアレイにより最大化するエリア再生が検討される(非特許文献1)。非特許文献1において、罰則項の重みである正則化パラメータとして、周波数ごとの所望の音場の再現精度とフィルタゲインの大きさから、実験的に全ての周波数に対して同じ値が用いられる。As a method for realizing area reproduction using a speaker array, directivity control technology and acoustic contrast maximization (ACM) technology may be used. Using ACM, area reproduction that maximizes the acoustic contrast between an area where an arbitrarily set sound is presented (bright zone) and an area where the sound is suppressed (dark zone) using a speaker array is considered (Non-Patent Document 1). In
フィルタを導出する目的関数に対して罰則項を用いることで、フィルタを設計する方法がある(非特許文献2参照)。非特許文献2において、フィルタゲインを抑圧するために、フィルタ係数の二乗和が、罰則項として用いられる。There is a method for designing a filter by using a penalty term for the objective function from which the filter is derived (see Non-Patent Document 2). In
任意の周波数帯域に対してACMまたは指向性制御によってフィルタを設計する場合、フィルタを設計することは可能であるものの、低域のフィルタゲインが大きくなってしまう場合がある。設計されたフィルタゲインにより得られた駆動信号がスピーカの許容振動を超えた場合、出力される音が割れてしまうという課題がある。 When designing a filter using ACM or directional control for any frequency band, it is possible to design a filter, but the filter gain in the low range may become large. If the drive signal obtained by the designed filter gain exceeds the allowable vibration of the speaker, the output sound may become distorted.
本発明は、上記事情に鑑みてなされたものであり、本発明の目的は、複数のスピーカのそれぞれに加わるゲインを抑圧して、目標とする指向特性を実現する技術を提供することである。The present invention has been made in consideration of the above circumstances, and the object of the present invention is to provide a technology that suppresses the gain applied to each of multiple speakers to achieve a target directional characteristic.
本発明の一態様の処理装置は、目標とする指向特性から、報酬関数を取得する報酬関数取得部と、目標とする指向特性を実現する複数のスピーカが再生可能な駆動信号を生成するためのフィルタ係数の範囲を制約条件として取得する制約条件取得部と、複数のスピーカのそれぞれについて、制約条件を満たし、報酬関数を最大とするフィルタを算出する算出部と、入力音響信号を、算出されたフィルタで畳み込み、各スピーカに入力する駆動信号を生成する畳み込み演算部を備える。A processing device according to one embodiment of the present invention includes a reward function acquisition unit that acquires a reward function from a target directional characteristic, a constraint condition acquisition unit that acquires as constraint conditions a range of filter coefficients for generating drive signals that can be reproduced by multiple speakers that achieve the target directional characteristic, a calculation unit that calculates, for each of the multiple speakers, a filter that satisfies the constraint conditions and maximizes the reward function, and a convolution calculation unit that convolves an input acoustic signal with the calculated filter to generate drive signals to be input to each speaker.
本発明の一態様の再生システムは、上記処理装置と、畳み込み演算部が算出した駆動信号を再生する複数のスピーカを備える。 A playback system according to one embodiment of the present invention comprises the above-mentioned processing device and a plurality of speakers that play back the drive signals calculated by the convolution calculation unit.
本発明の一態様の処理方法は、コンピュータが、目標とする指向特性から、報酬関数を取得するステップと、コンピュータが、目標とする指向特性を実現する複数のスピーカが再生可能な駆動信号を生成するためのフィルタ係数の範囲を制約条件として取得するステップと、コンピュータが、複数のスピーカのそれぞれについて、制約条件を満たし、報酬関数を最大とするフィルタを算出するステップと、コンピュータが、入力音響信号を、算出されたフィルタで畳み込み、各スピーカに入力する駆動信号を生成するステップを備える。 A processing method according to one aspect of the present invention includes a step in which a computer obtains a reward function from a target directional characteristic, a step in which the computer obtains, as a constraint condition, a range of filter coefficients for generating drive signals that can be reproduced by multiple speakers that achieve the target directional characteristic, a step in which the computer calculates, for each of the multiple speakers, a filter that satisfies the constraint condition and maximizes the reward function, and a step in which the computer convolves an input acoustic signal with the calculated filter to generate a drive signal to be input to each speaker.
本発明の一態様は、上記処理装置として、コンピュータを機能させる処理プログラムである。 One aspect of the present invention is a processing program that causes a computer to function as the above-mentioned processing device.
本発明によれば、複数のスピーカのそれぞれに加わるゲインを抑圧して、目標とする指向特性を実現する技術を提供することができる。 The present invention provides a technology that suppresses the gain applied to each of multiple speakers to achieve a desired directional characteristic.
以下、図面を参照して、本発明の実施形態を説明する。図面の記載において同一部分には同一符号を付し説明を省略する。Hereinafter, an embodiment of the present invention will be described with reference to the drawings. In the description of the drawings, the same parts are given the same reference numerals and the description will be omitted.
(再生システム)
図1を参照して、本発明の実施の形態に係る処理装置1が用いられる再生システム3を説明する。再生システム3は、処理装置1と、スピーカアレイ2を備える。
(Playback System)
A reproduction system 3 using a
処理装置1は、入力音響信号を、スピーカ毎の駆動信号に変換するコンピュータである。処理装置1は、所望の音場の指向特性と、スピーカアレイ2を構成する各スピーカの仕様から、各スピーカに対応するフィルタを生成する。処理装置1は、入力音響信号を、生成したスピーカ毎のフィルタで畳み込み、スピーカ毎の駆動信号に変換する。The
スピーカアレイ2は、複数のスピーカによって形成される。複数のスピーカはそれぞれ、再生システム3で音場を再現する会場に設置される。各スピーカは、それぞれ、処理装置1から出力されたスピーカ毎の駆動信号を再生する。ここで駆動信号が再生されることによって、所望の指向特定が実現された出力音響信号が得られる。The
(処理方法)
図2を参照して、処理装置1による処理の概要を説明する。
(Processing method)
An overview of the processing performed by the
ステップS1において処理装置1は、所望の音場とスピーカの仕様を取得する。ステップS2において処理装置1は、ステップS1で取得した所望の音場から生成された報酬関数を取得する。ステップS3において処理装置1は、スピーカの仕様から生成された制約条件を取得する。In step S1, the
ステップS4において処理装置1は、強化学習によって、音場を制御するフィルタを算出する。このとき処理装置1は、ステップS3で取得した制約条件を満たし、ステップS2で取得した報酬関数を最大にするように、フィルタを設定する。In step S4, the
ステップS5において処理装置1は、入力音響信号をステップS4で設計したフィルタで畳み込み、各スピーカに入力する駆動信号を生成する。駆動信号が各スピーカに入力されることにより、所望の音場が実現される。In step S5, the
(処理装置)
処理装置1は、報酬関数として所望の音場を生成する関数が、フィルタゲインがスピーカアレイ2を構成する各スピーカが再生可能な一定の範囲に収まる制約条件下において、最大となる最適化問題を強化学習により、各スピーカのフィルタを生成する。処理装置1は、報酬関数取得部11、制約条件取得部12、算出部13および畳み込み演算部14を備える。
(Processing Equipment)
The
報酬関数取得部11は、目標とする指向特性から設定された報酬関数を取得する。報酬関数取得部11は、目標とする指向特性の音場を実現するための報酬関数を取得する。報酬関数は、音場を実現する関数から任意に設定される。報酬関数取得部11は、ユーザが生成した報酬関数を取得しても良いし、コンピュータ処理により目標とする指向特性を実現するための報酬関数を生成して、生成された報酬関数を取得しても良い。報酬関数取得部11は、取得した報酬関数を、後述の算出部13が参照可能なように処理装置1内に設定する。The reward
報酬関数として、最小二乗法による指向性制御のフィルタ設計における目標関数が示す所望の音場と制御点で観測される音場との誤差について、誤差が大きいほど報酬関数が小さく、誤差が小さいほど報酬関数が大きくなるように変換した関数を用いても良い。 As a reward function, a function may be used that is transformed so that the larger the error is, the smaller the reward function becomes, and vice versa, for the error between the desired sound field indicated by the target function in the filter design for directional control using the least squares method and the sound field observed at the control point.
具体的には、例えば図3に示す観測系において、スピーカを複数個並べたスピーカアレイの周囲に制御点を配置し、スピーカから制御点までの伝達の特性を基に、各スピーカの振幅、位相を制御するフィルタが設計される方法がある。この方法は、スピーカから強く音が伝搬する方向、または音が伝搬しない方向を制御することができる。このような方法において、各制御点で観測される信号は、式(1)で表される。 Specifically, for example, in the observation system shown in Figure 3, control points are placed around a speaker array in which multiple speakers are lined up, and a filter is designed to control the amplitude and phase of each speaker based on the transmission characteristics from the speaker to the control point. This method makes it possible to control the direction in which sound propagates strongly from the speaker, or the direction in which sound does not propagate. In this method, the signal observed at each control point is expressed by equation (1).
ここで、指向性制御のフィルタを求める最小二乗法は、所望の指向特性と、制御点にて観測される指向特性との誤差の二乗和を最小化するフィルタを求める最小化問題となる。従って、最小化する目的関数Jは、式(3)で表される。Here, the least squares method for finding a filter for directional control is a minimization problem for finding a filter that minimizes the sum of squares of the error between the desired directional characteristic and the directional characteristic observed at the control point. Therefore, the objective function J to be minimized is expressed by equation (3).
本発明の実施の形態において、式(3)から報酬関数が導かれる。報酬関数は、式(3)で表される目的関数における所望の指向特性と制御点で観測される指向特性との誤差が大きいほど報酬関数が小さく、誤差が小さいほど報酬関数が大きくなるように変換した関数である。報酬関数は、例えば、式(3)に示す目的関数に-1を乗算することにより、得られる。In an embodiment of the present invention, a reward function is derived from equation (3). The reward function is a function that is transformed so that the larger the error between the desired directional characteristic in the objective function expressed by equation (3) and the directional characteristic observed at the control point, the smaller the reward function becomes, and vice versa. The reward function is obtained, for example, by multiplying the objective function shown in equation (3) by -1.
一般的に、式(3)に示す目的関数を最小化するフィルタを算出することにより、式(4)に示す指向性制御のフィルタが得られるが、本発明の実施の形態においては、後述の算出部13で得られたフィルタを用いる。Generally, a directional control filter shown in equation (4) is obtained by calculating a filter that minimizes the objective function shown in equation (3), but in an embodiment of the present invention, a filter obtained by
他の例の報酬関数として、ACMにおける音響コントラストを用いる例を説明する。音響コントラストを用いる場合、図4に示すように、スピーカが設定されるエリアにおいて、任意に設定した音を提示するエリア(Bright-zone)、と音を抑圧するエリア(Dark-zone)とが、任意に設定される。ACMにおいて、ブライトゾーンとダークゾーンの間の音響コントラストがスピーカアレイにより最大化するように、フィルタが設計される。As another example of a reward function, we will explain an example of using acoustic contrast in ACM. When using acoustic contrast, as shown in Figure 4, an area where speakers are set is arbitrarily set to present an arbitrarily set sound (bright-zone) and an area where sound is suppressed (dark-zone). In ACM, a filter is designed so that the acoustic contrast between the bright zone and the dark zone is maximized by the speaker array.
任意のスピーカアレイをフィルタで駆動した場合、それぞれのエリアで観測される音場は以下の式(5)および式(6)で表すことができる。 When an arbitrary speaker array is driven by a filter, the sound field observed in each area can be expressed by the following equations (5) and (6).
各エリアの音響エネルギーは、式(7)および式(8)で表される。 The acoustic energy in each area is expressed by equations (7) and (8).
音響コントラストは、式(9)に示すように、ブライトゾーンの音響エネルギーとダークゾーンの音響エネルギーの比で得られる。 Acoustic contrast is given by the ratio of acoustic energy in the bright zone to the acoustic energy in the dark zone, as shown in equation (9).
本発明の実施の形態において、式(9)の音響コントラストの式が、報酬関数となる。In an embodiment of the present invention, the acoustic contrast equation in equation (9) is the reward function.
一般的に、式(9)に示す音響コントラストを、式(10)に示すように最大化する最適化問題となるが、本発明の実施の形態においては、後述の算出部13で得られたフィルタを用いる。
Generally, this is an optimization problem of maximizing the acoustic contrast shown in equation (9) as shown in equation (10), but in an embodiment of the present invention, a filter obtained by the
なお、本発明の実施の形態において2種の報酬関数の例を示したがこれに限らない。音場を表現可能な報酬関数であれば、どのようなものでも良い。In the embodiment of the present invention, two types of reward functions are shown as examples, but the present invention is not limited to these. Any reward function that can express a sound field may be used.
ここで報酬関数取得部11が、コンピュータ処理により目標とする指向特性を実現するための報酬関数を生成する処理の一例を説明する。Here, we will explain an example of the process in which the reward
例えば、図3に示す観察系において、指向性制御のフィルタ設計から報酬関数を生成する方法を説明する。まずユーザが、目標とする指向特性として、スピーカからのビームの方向とビーム幅を入力する。ビームの方向とビーム幅は、例えばスピーカを中心とする角度で指定される。報酬関数取得部11は、入力された指向特性から式(3)のdを生成して、式(3)の目的関数を報酬関数として生成することができる。
For example, in the observation system shown in Figure 3, a method for generating a reward function from a filter design for directivity control will be described. First, the user inputs the direction and beam width of the beam from the speaker as the target directional characteristics. The beam direction and beam width are specified, for example, as an angle centered on the speaker. The reward
他の例として、図4に示す観察系において、ACMにおける音響コントラストから報酬関数を生成する方法を説明する。報酬関数取得部11は、ブライトゾーンとダークゾーンのそれぞれの制御点について、式(5)および式(6)の各音場を生成して、式(9)により得られる音響コントラストを、報酬関数として生成する。As another example, we will explain a method of generating a reward function from the acoustic contrast in ACM in the observation system shown in Figure 4. The reward
このように報酬関数取得部11は、コンピュータ処理により報酬関数を生成することもできる。
In this way, the reward
制約条件取得部12は、目標とする指向特性を実現する複数のスピーカが再生可能な駆動信号を生成するためのフィルタ係数の範囲を制約条件として取得する。制約条件取得部12は、ユーザが生成した制約条件を取得しても良いし、コンピュータ処理によりスピーカアレイ2のスピーカの仕様から制約条件を生成して、生成された制約条件を取得しても良い。制約条件取得部12は、取得した制約条件を、後述の算出部13が参照可能なように処理装置1内に設定する。The constraint
スピーカアレイにより音場を制御するフィルタは、フィルタからの出力音源に影響を与えるフィルタゲインを含んで算出される。ある各周波数における、あるスピーカに対応するフィルタゲインは、式(11)で表現される。 The filter that controls the sound field using the speaker array is calculated including the filter gain that affects the output sound source from the filter. The filter gain corresponding to a certain speaker at each frequency is expressed by equation (11).
式(11)に示すように、フィルタゲインが大きいと、スピーカに入力される信号も比例して大きくなり、スピーカに大きな負荷がかかるため再生が困難となる場合がある。特に任意の周波数帯域に対してACMまたは指向性制御のフィルタを設計する場合、低域のフィルタゲインが大きくなってしまう。そこで本発明の実施の形態において制約条件は、目標とする指向特性を実現する複数のスピーカが再生可能な駆動信号を生成するためのフィルタ係数の範囲である。制約条件は、各スピーカに対応するフィルタ係数が一定の範囲に収まるように拘束する。As shown in equation (11), if the filter gain is large, the signal input to the speaker also becomes proportionally large, which places a heavy load on the speaker and may make reproduction difficult. In particular, when designing an ACM or directional control filter for an arbitrary frequency band, the low-frequency filter gain becomes large. Therefore, in an embodiment of the present invention, the constraint is the range of filter coefficients for generating drive signals that can be reproduced by multiple speakers that achieve the target directional characteristics. The constraint is to restrict the filter coefficients corresponding to each speaker to fall within a certain range.
制約条件は、各スピーカに対応するスピーカゲインを抑圧して駆動信号を再生できるように設定される。制約条件は、各周波数帯域において同じであっても良い。The constraints are set so that the drive signal can be reproduced by suppressing the speaker gain corresponding to each speaker. The constraints may be the same for each frequency band.
また入力音響信号の大きさによって、スピーカが再生可能なフィルタの範囲が制限される場合があるので、制約条件取得部12は、入力音響信号の大きさも考慮して、制約条件を設定しても良い。
In addition, since the range of filters that the speaker can reproduce may be limited depending on the magnitude of the input acoustic signal, the constraint
なお、式(3)で得られた目的関数に、フィルタゲインを抑圧するために、フィルタ係数の二乗和を罰則項として用いると、目的関数は式(12)で表される。 In addition, if the sum of squares of the filter coefficients is used as a penalty term in order to suppress the filter gain in the objective function obtained by equation (3), the objective function is expressed by equation (12).
式(12)において正規化パラメータは、損失項と罰則項の相対的な重みを制御する。一般的に正則化パラメータは、周波数ごとの所望の音場の再現精度とフィルタゲインの大きさを基に、実験的に各周波数帯に対して同じ値が用いられる。従来、各周波数帯に対して同じ正則化パラメータが用いられる場合、周波数帯ごとに最適な正則化パラメータを与えられない問題があった。また周波数帯ごとに正則化パラメータを決定する場合、各周波数に対して実験的に値を設定するのは困難である。加えて、所望の音場の再現精度とフィルタゲインの大きさはトレードオフの関係にあるため、最適なパラメータを設定するのが困難であるといった課題がある。In equation (12), the regularization parameter controls the relative weight of the loss term and the penalty term. Generally, the same value of the regularization parameter is experimentally used for each frequency band based on the reproduction accuracy of the desired sound field for each frequency and the magnitude of the filter gain. Conventionally, when the same regularization parameter is used for each frequency band, there was a problem that the optimal regularization parameter could not be given for each frequency band. In addition, when determining the regularization parameter for each frequency band, it is difficult to experimentally set a value for each frequency. In addition, there is a problem that it is difficult to set the optimal parameter because there is a trade-off between the reproduction accuracy of the desired sound field and the magnitude of the filter gain.
そこで本発明の実施の形態において、罰則項を用いるのではなく、各スピーカおよび周波数帯域に対応するスピーカゲインを抑圧して駆動信号を再生できるように、強化学習手法における制約条件が、設定される。制約条件は、各周波数帯域において異なっても良い。これにより、各スピーカおよび各周波数帯においてフィルタ係数が一定の範囲に収まるように拘束される。Therefore, in an embodiment of the present invention, rather than using a penalty term, constraint conditions in the reinforcement learning method are set so that the drive signal can be reproduced by suppressing the speaker gain corresponding to each speaker and frequency band. The constraint conditions may be different for each frequency band. This restricts the filter coefficients for each speaker and each frequency band to fall within a certain range.
なお、一般的には、式(12)の目的関数を、式(4)と同様に最小化問題を解くことで、式(13)に示す最小二乗法のフィルタが得られるが、本発明の実施の形態においては、後述の算出部13で得られたフィルタを用いる。
In general, the least squares filter shown in equation (13) can be obtained by solving the minimization problem of the objective function of equation (12) in the same manner as equation (4), but in an embodiment of the present invention, a filter obtained by
算出部13は、複数のスピーカのそれぞれについて、制約条件を満たし、報酬関数を最大とするフィルタを算出する。制約条件は、制約条件取得部12においてスピーカアレイ2を構成するスピーカの仕様によって定められる。報酬関数は、報酬関数取得部11において目標とする音場の指向特性から決定される。The
算出部13は、フィルタ係数を行動の連続値として扱う強化学習手法により、制約条件を満たし、報酬関数を最大とするフィルタを算出する。算出部13は、DDPG(Deep Deterministic Policy Gradient)、NAF(Normalized Advantage Function)等の、行動を連続値として扱う強化学習手法により、制約条件の下、報酬関数を最大化する最適化問題を解くことで、所望の音場を生成するフィルタを算出する。The
下記に、報酬関数を音響コントラストとし、NAFを用いてフィルタを算出する処理の一例を説明する。 Below, we explain an example of a process in which the reward function is acoustic contrast and a filter is calculated using NAF.
Q関数は、状態価値関数とアドバンテージ関数により、式(14)で表される。 The Q function is expressed by equation (14) using the state value function and advantage function.
本発明の実施の形態において、上記表1の状態、行動、報酬およびクリッピングの範囲は、式(16)のように定義される。In an embodiment of the present invention, the states, actions, rewards and clipping ranges in Table 1 above are defined as in equation (16).
表1に示す処理で最終的に得られる行動a’が、所望の音場を生成するフィルタとなる。この処理を使用する全ての周波数に対して実施することで、算出部13は、各周波数における最適なフィルタが求めることができる。The action a' finally obtained by the process shown in Table 1 is the filter that generates the desired sound field. By performing this process for all frequencies to be used, the
畳み込み演算部14は、入力音響信号を、算出部13で算出されたフィルタで畳み込み、各スピーカに入力する駆動信号を生成する。畳み込み演算部14は、入力音響信号と、算出部13で算出されたフィルタから、駆動信号を生成する。畳み込み演算部14が算出した駆動信号を、複数のスピーカがそれぞれ再生することにより、所望の音場が実現される。The
このように本発明の実施の形態に係る処理装置1において、報酬関数取得部11は、所望のエリア再生を実現する音場を生成する関数を報酬関数として設定し、制約条件取得部12は、フィルタゲインが一定の範囲に収まるような拘束を制約条件として設定する。算出部13は、出力された報酬関数および制約条件から、制約条件を満たし、報酬関数を最大とする音場制御のフィルタを導出する。畳み込み演算部14は、入力音響信号と、算出部13から出力された音場制御のフィルタを畳み込み再生する。これにより所望のエリア再生を実現するために、各スピーカに入力される駆動信号を取得することができる。
In this manner, in the
ここで制約条件として、複数のスピーカが再生可能な駆動信号を生成するためのフィルタ係数の範囲が設定される。本発明の実施の形態に係る処理装置1は、複数のスピーカのそれぞれに加わるゲインを抑圧して、目標とする指向特性を実現することができる。Here, a range of filter coefficients is set as a constraint for generating a drive signal that can be reproduced by multiple speakers. The
なお本発明の実施の形態において報酬関数を算出するための観測系において、複数のスピーカが円形に配置される例を説明したが、これに限らない。複数のスピーカが1列に配置されるなど、任意の位置に配置されても良い。In the embodiment of the present invention, an example in which multiple speakers are arranged in a circle in the observation system for calculating the reward function has been described, but this is not limited to this. Multiple speakers may be arranged in any position, such as in a row.
上記説明した本実施形態の処理装置1は、例えば、CPU(Central Processing Unit、プロセッサ)901と、メモリ902と、ストレージ903(HDD:Hard Disk Drive、SSD:Solid State Drive)と、通信装置904と、入力装置905と、出力装置906とを備える汎用的なコンピュータシステムが用いられる。このコンピュータシステムにおいて、CPU901がメモリ902上にロードされた処理プログラムを実行することにより、処理装置1の各機能が実現される。The
なお、処理装置1は、1つのコンピュータで実装されてもよく、あるいは複数のコンピュータで実装されても良い。また処理装置1は、コンピュータに実装される仮想マシンであっても良い。The
処理装置1の処理プログラムは、HDD、SSD、USB(Universal Serial Bus)メモリ、CD (Compact Disc)、DVD (Digital Versatile Disc)などのコンピュータ読取り可能な記録媒体に記憶することも、ネットワークを介して配信することもできる。The processing program of the
なお、本発明は上記実施形態に限定されるものではなく、その要旨の範囲内で数々の変形が可能である。The present invention is not limited to the above-described embodiments, and many variations are possible within the scope of the invention.
1 処理装置
2 スピーカアレイ
3 再生システム
11 報酬関数取得部
12 制約条件取得部
13 算出部
14 畳み込み演算部
901 CPU
902 メモリ
903 ストレージ
904 通信装置
905 入力装置
906 出力装置
REFERENCE SIGNS
902
Claims (6)
前記目標とする指向特性を実現する複数のスピーカが再生可能な駆動信号を生成するためのフィルタ係数の範囲を制約条件として取得する制約条件取得部と、
前記複数のスピーカのそれぞれについて、前記制約条件を満たし、前記報酬関数を最大とするフィルタを算出する算出部と、
入力音響信号を、前記算出されたフィルタで畳み込み、各スピーカに入力する駆動信号を生成する畳み込み演算部
を備え、
前記制約条件は、各スピーカに対応するスピーカゲインを抑圧して駆動信号を再生できるように設定される処理装置。 A reward function acquisition unit that acquires a reward function set from a target directional characteristic;
a constraint condition acquisition unit that acquires, as a constraint condition, a range of filter coefficients for generating drive signals that can be reproduced by a plurality of speakers that realize the target directional characteristic;
A calculation unit that calculates a filter that satisfies the constraint condition and maximizes the reward function for each of the plurality of speakers;
a convolution calculation unit that convolves an input sound signal with the calculated filter to generate a drive signal to be input to each speaker ,
The constraint condition is set in a processing device so that a drive signal can be reproduced by suppressing a speaker gain corresponding to each speaker .
請求項1に記載の処理装置。 The processing device according to claim 1 , wherein the calculation unit calculates a filter that satisfies the constraint condition and maximizes the reward function by a reinforcement learning method that treats a filter coefficient as a continuous value of an action.
請求項1または2に記載の処理装置。 The processing device according to claim 1 , wherein the constraint condition is set so that a drive signal can be reproduced by suppressing a speaker gain corresponding to each speaker and frequency band.
前記畳み込み演算部が算出した駆動信号を再生する複数のスピーカ
を備える再生システム。 A processing device according to any one of claims 1 to 3 ,
A reproduction system comprising a plurality of speakers that reproduce the drive signals calculated by the convolution calculation unit.
前記コンピュータが、前記目標とする指向特性を実現する複数のスピーカが再生可能な駆動信号を生成するためのフィルタ係数の範囲を制約条件として取得するステップと、
前記コンピュータが、前記複数のスピーカのそれぞれについて、前記制約条件を満たし、前記報酬関数を最大とするフィルタを算出するステップと、
前記コンピュータが、入力音響信号を、前記算出されたフィルタで畳み込み、各スピーカに入力する駆動信号を生成するステップ
を備え、
前記制約条件は、各スピーカに対応するスピーカゲインを抑圧して駆動信号を再生できるように設定される処理方法。 A step in which a computer obtains a reward function from a target directional characteristic;
The computer acquires, as a constraint condition, a range of filter coefficients for generating drive signals that can be reproduced by a plurality of speakers that realize the target directional characteristic;
The computer calculates, for each of the plurality of speakers, a filter that satisfies the constraint condition and maximizes the reward function;
The computer convolves an input acoustic signal with the calculated filter to generate a drive signal to be input to each speaker ,
A processing method in which the constraint conditions are set so that a drive signal can be reproduced by suppressing a speaker gain corresponding to each speaker .
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| PCT/JP2020/021714 WO2021245775A1 (en) | 2020-06-02 | 2020-06-02 | Processing device, replay system, processing method, and processing program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPWO2021245775A1 JPWO2021245775A1 (en) | 2021-12-09 |
| JP7485982B2 true JP7485982B2 (en) | 2024-05-17 |
Family
ID=78830238
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2022529167A Active JP7485982B2 (en) | 2020-06-02 | 2020-06-02 | Processing device, playback system, processing method, and processing program |
Country Status (2)
| Country | Link |
|---|---|
| JP (1) | JP7485982B2 (en) |
| WO (1) | WO2021245775A1 (en) |
Family Cites Families (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0541897A (en) * | 1991-08-07 | 1993-02-19 | Pioneer Electron Corp | Speaker equipment and directivity control method |
-
2020
- 2020-06-02 JP JP2022529167A patent/JP7485982B2/en active Active
- 2020-06-02 WO PCT/JP2020/021714 patent/WO2021245775A1/en not_active Ceased
Non-Patent Citations (1)
| Title |
|---|
| GU, Shixiang, LILLICRAP, Timothy, SUTSKEVER, Ilya, LEVINE, Sergey,Continuous Deep Q-Learning with Model-based Acceleration,ArXiv,米国,Cornell University,2016年03月02日,https://arxiv.org/abs/1603.00748, [オンライン],[検索日 2023.12.21],インターネット:<URL:https://arxiv.org/abs/1603.00748> |
Also Published As
| Publication number | Publication date |
|---|---|
| JPWO2021245775A1 (en) | 2021-12-09 |
| WO2021245775A1 (en) | 2021-12-09 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5457874B2 (en) | Local reproduction apparatus, method and program | |
| JP6893986B6 (en) | Voice pre-compensation filter optimized for bright and dark zones | |
| WO2018008395A1 (en) | Acoustic field formation device, method, and program | |
| CN105900456A (en) | Sound processing device and method, and program | |
| JP6718748B2 (en) | Area reproduction system and area reproduction method | |
| JP5284460B2 (en) | Device for processing audio signals | |
| JP2021180529A (en) | Acoustic system | |
| JP5679304B2 (en) | Multipole loudspeaker group and arrangement method thereof, acoustic signal output device and method thereof, active noise control device and sound field reproduction device using the method, and method and program thereof | |
| CN1805278A (en) | Method and apparatus to record a signal using a beam forming algorithm | |
| Gao et al. | Multizone sound reproduction with adaptive control of scattering effects | |
| JP5342521B2 (en) | Local reproduction method, local reproduction device and program thereof | |
| CN102905213A (en) | Audio signal processing device and audio signal processing method | |
| JP7485982B2 (en) | Processing device, playback system, processing method, and processing program | |
| JP5458041B2 (en) | Local reproduction device, filter coefficient determination device, method and program thereof | |
| JP6970366B2 (en) | Sound image reproduction device, sound image reproduction method and sound image reproduction program | |
| JP6959134B2 (en) | Area playback method, area playback program and area playback system | |
| WO2021090482A1 (en) | Acoustic field generation device, acoustic field generation method, and acoustic field generation program | |
| JP7583638B2 (en) | Object-based audio rendering device and program | |
| JP7616363B2 (en) | Area playback system and playback control device, method and program thereof | |
| JP7375904B2 (en) | Filter coefficient optimization device, latent variable optimization device, filter coefficient optimization method, latent variable optimization method, program | |
| JP6226166B2 (en) | Sound playback device | |
| JP5705162B2 (en) | Filter coefficient determination device, local reproduction device, filter coefficient determination method, and program | |
| JP6774912B2 (en) | Sound image generator | |
| JP6330098B1 (en) | Audio controller, program, ultrasonic speaker, sound source device | |
| CN116320899B (en) | Sounding method, device and equipment |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221031 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240109 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240306 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240402 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240415 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7485982 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |