Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP7583638B2 - Object-based audio rendering device and program - Google Patents
[go: Go Back, main page]

JP7583638B2 - Object-based audio rendering device and program - Google Patents

Object-based audio rendering device and program Download PDF

Info

Publication number
JP7583638B2
JP7583638B2 JP2021023419A JP2021023419A JP7583638B2 JP 7583638 B2 JP7583638 B2 JP 7583638B2 JP 2021023419 A JP2021023419 A JP 2021023419A JP 2021023419 A JP2021023419 A JP 2021023419A JP 7583638 B2 JP7583638 B2 JP 7583638B2
Authority
JP
Japan
Prior art keywords
angle
speaker
unit
sound source
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021023419A
Other languages
Japanese (ja)
Other versions
JP2022125686A (en
Inventor
陽 佐々木
岳大 杉本
敏行 西口
弘樹 久保
知美 小倉
洋幸 大久保
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2021023419A priority Critical patent/JP7583638B2/en
Publication of JP2022125686A publication Critical patent/JP2022125686A/en
Application granted granted Critical
Publication of JP7583638B2 publication Critical patent/JP7583638B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Stereophonic System (AREA)

Description

本発明は、オブジェクトベース音響の再生装置に関し、特に、WFS(Wave Field Synthesis:波面合成方式)の考え方に基づいてスピーカの駆動信号を算出するオブジェクトベース音響レンダリング装置及びプログラムに関する。 The present invention relates to an object-based audio playback device, and in particular to an object-based audio rendering device and program that calculates speaker drive signals based on the concept of WFS (Wave Field Synthesis).

近年、映画音響を中心にオブジェクトベース音響技術が脚光を浴びつつある。従来は、複数の音声素材を規定のチャンネルフォーマットへミックスダウンして記録するチャンネルベース音響が主流であった。 In recent years, object-based audio technology has been gaining attention, particularly in the field of movie sound. Previously, channel-based audio was the mainstream, in which multiple audio materials were mixed down to a specified channel format and then recorded.

オブジェクトベース音響では、個々の音声素材を音響オブジェクトとして別々に記録しておき、音響オブジェクトのレベル及び座標等が記述された音響メタデータに基づいてレンダリングを行う。 In object-based audio, each piece of audio material is recorded separately as an audio object, and rendering is performed based on audio metadata that describes the level and coordinates of the audio object.

以下、このようなオブジェクトベース音響方式の再生装置をオブジェクトベース音響レンダリング装置という。オブジェクトベース音響レンダリング装置は、音響オブジェクトに対し、音響メタデータと配置された複数のスピーカ位置に基づいて音響オブジェクトのレンダリングを行い、それぞれのスピーカの位置に応じた駆動信号を生成することで、試聴環境に応じた音響再生を行う。したがって、コンテンツの制作時とは異なるスピーカ配置で再生する場合であっても、それに適応した再生が可能となる。 Hereinafter, such an object-based audio playback device will be referred to as an object-based audio rendering device. The object-based audio rendering device renders audio objects based on audio metadata and the positions of multiple speakers arranged for the audio objects, and generates drive signals according to the positions of each speaker, thereby playing audio according to the listening environment. Therefore, even if the content is played back with a speaker arrangement different from that used when it was created, playback that is adapted to the listening environment is possible.

〔VBAP〕
従来、オブジェクトベース音響のレンダリングには、VBAP(Vector Based Amplitude Panning)と呼ばれるアルゴリズムが多く利用される(例えば、非特許文献1を参照)。
[VBAP]
Conventionally, an algorithm called Vector Based Amplitude Panning (VBAP) is often used for rendering object-based audio (see, for example, Non-Patent Document 1).

VBAPでは、再生空間を3個のスピーカからなる三角形領域で分割し、音源座標を含む三角形の各頂点に位置するスピーカに対して重みを算出する。そして、音源信号を前記算出した重みで分配することにより、振幅パンニングを行う。 In VBAP, the playback space is divided into a triangular region consisting of three speakers, and weights are calculated for the speakers located at each vertex of the triangle that contains the sound source coordinates. Amplitude panning is then performed by distributing the sound source signal using the calculated weights.

しかしながら、VBAPでは、スピーカがある特定の半径の球面状に配置され、音源がその球面上に配置されているものとして処理が行われる。そのため、音源の距離による遠近の表現をすることができない。 However, VBAP processes the sound as if the speakers are arranged on a sphere of a specific radius, and the sound source is placed on that sphere. Therefore, it is not possible to express the sense of perspective based on the distance of the sound source.

VBAPを用いて遠近も含めた音場の表現を行う際には、距離減衰及び残響等を付加して表現することがあるが(例えば、非特許文献2を参照)、それらは心理音響に基づく手法であり、音場を物理的に再現することを目的とした方法ではない。 When using VBAP to represent a sound field that includes both near and far, distance attenuation and reverberation may be added (see, for example, Non-Patent Document 2), but these are methods based on psychoacoustics and are not intended to physically reproduce the sound field.

また、VBAPの重み算出アルゴリズムによれば、スイートスポットで聴取することを想定して重みが算出されるため、そこから離れた位置で試聴する場合において、再生品質は保証されるものではない。 In addition, VBAP's weight calculation algorithm calculates weights assuming listening in the sweet spot, so playback quality is not guaranteed when listening from a position away from that sweet spot.

〔WFS〕
一方、波動音響に基づく音場の表現方法として、WFSと呼ばれる手法が知られている。WFSは、以下の式にて表されるキルヒホッフ-ヘルムホルツ積分方程式によって波動音響的に裏付けられた音場再現手法である(例えば、非特許文献3を参照)。

Figure 0007583638000001
[WFS]
On the other hand, a method called WFS is known as a method for expressing a sound field based on wave acoustics. WFS is a sound field reproduction method supported by wave acoustics using the Kirchhoff-Helmholtz integral equation expressed by the following formula (see, for example, Non-Patent Document 3):
Figure 0007583638000001

ここで、p(r)は、境界∂Vで閉じられたある領域V内の任意の点rでの音圧を示し、G(r|ro)は、境界∂V上の点roから境界∂V内の任意の点rまでのグリーン関数を示す。n(ro)は、点roにおける境界∂Vの法線方向内向きの単位ベクトルを示す。p(ro)は、境界∂V上の点roにおける音圧を示し、∂p(ro)/∂nは、境界∂V上の点roにおける単位ベクトルn(ro)方向の音圧勾配ベクトルを示す。dSOは、境界∂V上の微小面積である。 Here, p(r) denotes the sound pressure at any point r in a region V enclosed by the boundary ∂V, and G(r|r o ) denotes the Green's function from point r o on the boundary ∂V to any point r within the boundary ∂V. n(r o ) denotes the unit vector inward in the normal direction of the boundary ∂V at point r o . p(r o ) denotes the sound pressure at point r o on the boundary ∂V, and ∂p(r o )/∂n denotes the sound pressure gradient vector in the direction of unit vector n(r o ) at point r o on the boundary ∂V. dS o is an infinitesimal area on the boundary ∂V.

またここで、境界が任意の形状をしている場合に、境界∂Vにおける境界条件として、∂G(r|ro)/∂n=0なるノイマン条件を想定したグリーン関数を設定する。そして、点roにおける平均音響インテンシティI(ro)及び単位ベクトルn(ro)によって決定される以下の窓関数a(ro)を導入する。

Figure 0007583638000002
In addition, when the boundary has an arbitrary shape, a Green's function assuming the Neumann condition of ∂G(r|r o )/∂n=0 is set as the boundary condition at the boundary ∂V. Then, the following window function a(r o ) is introduced, which is determined by the average acoustic intensity I(r o ) at the point r o and the unit vector n(r o ):
Figure 0007583638000002

これにより、以下の等式が成り立つ。

Figure 0007583638000003
This results in the following equality:
Figure 0007583638000003

o(r|ro)は、点roから点rまでの自由音場グリーン関数を示す。キルヒホッフ-ヘルムホルツ積分方程式は、ある領域の外部に音源が存在する場合、その領域内部の音場は、境界面の境界法線方向の音圧勾配分布によって決定されるという事実を示している。 G o (r|r o ) denotes the free-field Green's function from point r o to point r. The Kirchhoff-Helmholtz integral equation expresses the fact that when a sound source exists outside a certain region, the sound field inside the region is determined by the sound pressure gradient distribution in the boundary normal direction of the boundary surface.

WFSでは、音場を再現したい領域の境界面上に密にスピーカを配置し、音源(点音源を想定)の座標を与えることで、キルヒホッフ-ヘルムホルツ積分方程式に基づいて、スピーカの駆動信号を決定する。 In WFS, speakers are densely arranged on the boundary surfaces of the area in which the sound field is to be reproduced, and the coordinates of the sound source (assumed to be a point source) are given, and the driving signals for the speakers are determined based on the Kirchhoff-Helmholtz integral equation.

VlLLE PULKKI,“Virtual Sound Source Positioning Using Vector Base Amplitude Panning”,J. Audio Eng. Soc., Vol. 45, No.6, 1997 JuneVlLLE PULKKI, “Virtual Sound Source Positioning Using Vector Base Amplitude Panning”, J. Audio Eng. Soc., Vol. 45, No.6, 1997 June 勧告ITU-R. BS.2127-0Recommendation ITU-R.BS.2127-0 Ahrens Jens, Rabenstein Rudolph, Spors Sascha,“The Theory of wave field synthesis revisited”, in 124th Conv. Audio Eng. Soc., 2008Ahrens Jens, Rabenstein Rudolph, Spors Sascha, “The Theory of wave field synthesis revisited”, in 124th Conv. Audio Eng. Soc., 2008

このように、WFSを用いることにより、再生領域の内側で波面を再合成することができるため、VBAPとは異なり、スイートスポットから離れた点において再生品質が低下するという問題点は生じない。 In this way, by using WFS, the wavefront can be resynthesized inside the playback area, so unlike VBAP, there is no problem with the playback quality deteriorating at points away from the sweet spot.

しかしながら、WFSを用いて厳密に波面を合成するためには、境界面に密にスピーカを配置する必要があり、また、所定の周波数特性を持つフィルタ及び遅延等の要素を加える必要がある。このため、WFSを用いた場合には、VBAPに比べてシステムの規模が大きくなるという課題があった。 However, in order to precisely synthesize wavefronts using WFS, it is necessary to place speakers closely on the boundary surfaces, and it is also necessary to add elements such as filters with specific frequency characteristics and delays. For this reason, when using WFS, there is an issue that the system size is larger than that of VBAP.

そこで、本発明は前記課題を解決するためになされたものであり、その目的は、システムの規模を拡大することなく、WFSに基づき音源の距離の遠近を表現する駆動信号を生成可能なオブジェクトベース音響レンダリング装置及びプログラムを提供することにある。 The present invention has been made to solve the above problems, and its purpose is to provide an object-based audio rendering device and program that can generate drive signals that represent the distance of a sound source based on WFS without expanding the scale of the system.

前記課題を解決するために、請求項1のオブジェクトベース音響レンダリング装置は、 音響メタデータに記述された位置に配置された音源オブジェクトに対しレンダリングを行うことで、試聴環境に配置された複数のスピーカのそれぞれに対する駆動信号を生成するオブジェクトベース音響レンダリング装置において、前記複数のスピーカの個数をL、前記スピーカの番号をl(=1,・・・,L)、第l番目の前記スピーカを第l番目スピーカ、音源信号が出力される仮想音源の座標を仮想音源座標rS、前記第l番目スピーカの座標をスピーカ座標rl、前記第l番目スピーカの位置での境界面内向き法線ベクトルをn(rl)、前記第l番目スピーカの位置を中心とする面積要素をΔSl、前記第l番目スピーカに対する前記駆動信号をd(rl)として、前記複数のスピーカのそれぞれについて、前記仮想音源座標rSの位置から前記第l番目スピーカの前記スピーカ座標rlの位置までのベクトルと前記第l番目スピーカの前記境界面内向き法線ベクトルn(rl)との成す角θlを算出する角度算出部、並びに、前記複数のスピーカのそれぞれに対応する信号増幅部、HPF(ハイパスフィルタ)、減衰付加部、面積要素付加部及び第1角度重み付加部を備え、前記信号増幅部が、前記音源信号を定数にて増幅し、前記HPFが、前記仮想音源座標rS及び前記第l番目スピーカの前記スピーカ座標rlに基づいて、HPFh(rl,rS)を設定し、前記信号増幅部により増幅された信号に対し、前記HPFh(rl,rS)を用いてフィルタ処理を施し、前記減衰付加部が、前記仮想音源座標rSの位置から前記第l番目スピーカの前記スピーカ座標rlの位置までのベクトルの絶対値を求め、前記絶対値を2乗した結果の逆数を減衰係数1/||rl-rS||2として設定し、前記フィルタ処理が施された信号に対し前記減衰係数1/||rl-rS||2を乗算し、前記面積要素付加部が、前記減衰付加部により乗算された信号に対し前記面積要素ΔSlを乗算し、前記第1角度重み付加部が、前記角度算出部により算出された前記第l番目スピーカの前記成す角θlに基づき、0から1までの範囲において、前記成す角θlの絶対値が0°に近いほど1に近い値をとり、前記成す角θlの絶対値が90°に近いほど0に近い値をとり、前記成す角θlの絶対値が0°以下または90°以上のときに0の値をとる角度重みwC(θl)を設定し、前記面積要素付加部により乗算された信号に対し前記角度重みwC(θl)を乗算することで、前記第l番目スピーカに対する前記駆動信号d(rl)を生成する、ことを特徴とする。 In order to solve the above problem, an object-based audio rendering device according to claim 1 is an object-based audio rendering device that generates a drive signal for each of a plurality of speakers arranged in a listening environment by performing rendering on a sound source object arranged at a position described in audio metadata, the object-based audio rendering device generating a drive signal for each of a plurality of speakers arranged in a listening environment, the object-based audio rendering device generating a drive signal for each of a plurality of speakers arranged in a listening environment by performing rendering on a sound source object arranged at a position described in audio metadata , the object-based audio rendering device generating a drive signal for each of a plurality of speakers by performing rendering on a sound source object arranged at a position described in audio metadata , the object- based audio rendering device generating a drive signal for each of a plurality of speakers by performing rendering on a sound source object arranged at a position described in audio metadata , the object- based audio rendering device generating a drive signal for each of a plurality of speakers by performing rendering on ), as well as signal amplification units, HPFs (high pass filters), attenuation application units, area element application units and first angle weighting units corresponding to each of the plurality of speakers, wherein the signal amplification units amplify the sound source signal by a constant, the HPF sets HPFh(r l , r S ) based on the virtual sound source coordinates r S and the speaker coordinates r l of the first speaker, and performs filtering on the signal amplified by the signal amplification units using the HPFh(r l , r S ), the attenuation application units obtain an absolute value of a vector from a position of the virtual sound source coordinates r S to a position of the speaker coordinates r l of the first speaker, set the reciprocal of the result of squaring the absolute value as an attenuation coefficient 1/||r l -r S || 2 , and apply the attenuation coefficient 1/||r l -r S || to the signal that has been subjected to the filtering processing. 2 , the area element adding unit multiplies the signal multiplied by the attenuation adding unit by the area element ΔS l , the first angle weighting adding unit sets an angle weight w C (θ l ) which, in a range from 0 to 1 based on the angle θ l of the first speaker calculated by the angle calculation unit, takes a value closer to 1 as the absolute value of the angle θ l approaches 0°, takes a value closer to 0 as the absolute value of the angle θ l approaches 90°, and takes a value of 0 when the absolute value of the angle θ l is 0° or less or 90° or more, and generates the drive signal d (r l ) for the first speaker by multiplying the signal multiplied by the area element adding unit by the angle weight w Cl ).

また、請求項2のオブジェクトベース音響レンダリング装置は、請求項1に記載のオブジェクトベース音響レンダリング装置において、さらに、前記仮想音源座標rSへの仮想音源方向の単位ベクトル及び全てのスピーカにおける前記スピーカ座標rlへのスピーカ方向の単位ベクトルに基づいて、前記仮想音源を内部に含む3つのスピーカをVBAP(Vector Based Amplitude Panning)対象の3つのスピーカとして特定し、前記VBAP対象の3つのスピーカの単位ベクトルrn1,rn2,rn3を取得し、前記仮想音源座標rSへの仮想音源方向の単位ベクトル及び前記VBAP対象の3つのスピーカの単位ベクトルrn1,rn2,rn3に基づいて、前記VBAP対象の3つのスピーカに対応する係数gl=gn1,gn2,gn3を求め、前記全てのスピーカのうち、前記VBAP対象の3つのスピーカ以外のスピーカに対応する係数gl=0を設定し、前記係数glを出力するVBAP係数算出部、並びに、前記複数のスピーカのそれぞれに対応するVBAP係数乗算部、第2角度重み付加部及び加算部を備え、前記VBAP係数乗算部が、前記面積要素付加部により乗算された信号に対し、前記VBAP係数算出部により出力された前記係数glを乗算し、前記第2角度重み付加部が、前記角度算出部により算出された前記第l番目スピーカの前記成す角θlに基づき、0から1までの範囲において、前記成す角θlの絶対値が0°に近いほど0に近い値をとり、前記成す角θlの絶対値が90°に近いほど1に近い値をとり、前記成す角θlの絶対値が0°以下または90°以上のときに0の値をとる角度重みwS(θl)を設定し、前記VBAP係数乗算部により乗算された信号に対し前記角度重みwS(θl)を乗算することで、第2駆動信号を生成し、前記第1角度重み付加部が、前記角度重みwC(θl)を設定し、前記面積要素付加部により乗算された信号に対し前記角度重みwC(θl)を乗算することで、第1駆動信号を生成し、前記加算部が、前記第1駆動信号及び前記第2駆動信号を加算することで、前記第l番目スピーカに対する前記駆動信号d(rl)を生成する、ことを特徴とする。 The object-based acoustic rendering device of claim 2 is the object-based acoustic rendering device of claim 1, further comprising: identifying three speakers including the virtual sound source therein as three speakers to be subjected to Vector Based Amplitude Panning ( VBAP ) based on a unit vector of a virtual sound source direction toward the virtual sound source coordinate rS and a unit vector of a speaker direction toward the speaker coordinate r1 of all speakers; obtaining unit vectors rn1 , rn2 , rn3 of the three speakers to be subjected to VBAP; determining coefficients gl = gn1 , gn2 , gn3 corresponding to the three speakers to be subjected to VBAP based on the unit vector of the virtual sound source direction toward the virtual sound source coordinate rS and the unit vectors rn1 , rn2 , rn3 of the three speakers to be subjected to VBAP; setting coefficient gl = 0 corresponding to speakers other than the three speakers to be subjected to VBAP among all the speakers; the VBAP coefficient multiplication unit multiplies the signal multiplied by the area element addition unit by the coefficient g output by the VBAP coefficient calculation unit, the second angle weighting unit sets an angle weight wS(θl) which, in a range from 0 to 1 , takes a value closer to 0 as the absolute value of the angle θl approaches 0°, takes a value closer to 1 as the absolute value of the angle θl approaches 90°, and takes a value of 0 when the absolute value of the angle θl is 0° or less or 90° or more, and generates a second drive signal by multiplying the signal multiplied by the VBAP coefficient multiplication unit, and the first angle weighting unit sets the angle weight wS ( θl ) which takes a value closer to 0 as the absolute value of the angle θl approaches 0°, takes a value closer to 1 as the absolute value of the angle θl approaches 90°, and takes a value of 0 when the absolute value of the angle θl is 0° or less or 90° or more, based on the angle θl of the first speaker calculated by the angle calculation unit . ), and multiplying the signal multiplied by the area element adding unit by the angle weight w Cl ) to generate a first drive signal, and the adder adds the first drive signal and the second drive signal to generate the drive signal d(r l ) for the l-th speaker.

また、請求項3のオブジェクトベース音響レンダリング装置は、請求項2に記載のオブジェクトベース音響レンダリング装置において、前記VBAP係数乗算部が、前記面積要素付加部により乗算された信号の代わりに、前記音源信号を入力し、前記音源信号に対し前記係数glを乗算する、ことを特徴とする。 The object-based acoustic rendering apparatus of claim 3 is characterized in that, in the object-based acoustic rendering apparatus of claim 2, the VBAP coefficient multiplication unit inputs the sound source signal instead of the signal multiplied by the area element addition unit, and multiplies the sound source signal by the coefficient g l .

また、請求項4のオブジェクトベース音響レンダリング装置は、請求項1から3までのいずれか一項に記載のオブジェクトベース音響レンダリング装置において、前記HPFが、予め設定されたパラメータをα、予め設定されたフィルタ次数をN、及びn=0,1,・・・,Nとして、以下の式:

Figure 0007583638000004
にて、HPF係数hn(rl,rS)を設定し、
x[t]及びy[t]を時刻tにおける当該HPFの入力及び出力として、入出力特性が以下の式:
Figure 0007583638000005
となるように、前記信号増幅部により増幅された信号に対し、前記HPF係数hn(rl,rS)を用いてフィルタ処理を施す、ことを特徴とする。 The object-based acoustic rendering apparatus of claim 4 is the object-based acoustic rendering apparatus of any one of claims 1 to 3, wherein the HPF is expressed by the following formula: where α is a preset parameter, N is a preset filter order, and n=0, 1, . . . , N:
Figure 0007583638000004
Set the HPF coefficients h n (r l , r S ) in
Let x[t] and y[t] be the input and output of the HPF at time t, and the input/output characteristics are expressed by the following formula:
Figure 0007583638000005
The signal amplified by the signal amplifier is filtered using the HPF coefficients h n (r 1 , r s ) so that:

また、請求項5のオブジェクトベース音響レンダリング装置は、請求項1から4までのいずれか一項に記載のオブジェクトベース音響レンダリング装置において、前記減衰付加部が、予め設定されたパラメータをβ1,β2として、以下の式:

Figure 0007583638000006
にて減衰係数g(rl,rS)を求め、前記フィルタ処理が施された信号に対し前記減衰係数g(rl,rS)を乗算する、ことを特徴とする。 According to a fifth aspect of the present invention, there is provided an object-based sound rendering apparatus according to any one of the first to fourth aspects, wherein the attenuation adding section calculates a value of β 1 and β 2 by the following equation:
Figure 0007583638000006
and multiplying the filtered signal by the attenuation coefficient g(r l , r S ) .

さらに、請求項6のプログラムは、コンピュータを、請求項1から5までのいずれか一項に記載のオブジェクトベース音響レンダリング装置として機能させることを特徴とする。 Furthermore, the program of claim 6 is characterized in that it causes a computer to function as an object-based audio rendering device according to any one of claims 1 to 5.

以上のように、本発明によれば、システムの規模を拡大することなく、WFSに基づき音源の距離の遠近を表現する駆動信号を生成することができる。 As described above, according to the present invention, it is possible to generate a drive signal that expresses the distance of a sound source based on WFS without expanding the scale of the system.

実施例1のオブジェクトベース音響レンダリング装置の構成例を示すブロック図である。1 is a block diagram showing an example of the configuration of an object-based acoustic rendering device according to a first embodiment. 実施例1のオブジェクトベース音響レンダリング装置の処理例を示す疑似コードである。4 is a pseudo code showing an example of processing of the object-based audio rendering device of the first embodiment. 角度算出部の構成例を示すブロック図である。4 is a block diagram showing an example of the configuration of an angle calculation unit; FIG. スピーカが疎に配置されている場合を説明する図である。FIG. 13 is a diagram illustrating a case where speakers are sparsely arranged. 実施例2のオブジェクトベース音響レンダリング装置の構成例を示すブロック図である。FIG. 11 is a block diagram showing an example of the configuration of an object-based acoustic rendering device according to a second embodiment. 実施例2のオブジェクトベース音響レンダリング装置の処理例を示す疑似コードである。11 is a pseudo code showing an example of processing of the object-based audio rendering device of the second embodiment. VBAP係数算出部の構成例を示すブロック図である。11 is a block diagram showing an example of the configuration of a VBAP coefficient calculation unit. FIG. 実施例3のオブジェクトベース音響レンダリング装置の構成例を示すブロック図である。FIG. 11 is a block diagram showing an example of the configuration of an object-based acoustic rendering device according to a third embodiment. 実施例3のオブジェクトベース音響レンダリング装置の処理例を示す疑似コードである。13 is a pseudo code showing an example of processing of the object-based audio rendering device of the third embodiment. VBAPを説明するための概念図である。FIG. 1 is a conceptual diagram for explaining VBAP. WFSを説明するための概念図である。FIG. 1 is a conceptual diagram for explaining WFS.

以下、本発明を実施するための形態について図面を用いて詳細に説明する。本発明の実施例1のオブジェクトベース音響レンダリング装置は、WFSの構成を近似により単純化することで、システムの規模を拡大することなく、WFSに基づき音源の距離の遠近を表現する駆動信号を生成する。また、実施例2,3のオブジェクトベース音響レンダリング装置は、実施例1の構成に対してVBAPの構成を組み込むことで、スピーカが疎に配置された場合に駆動信号が小さくなる問題を解決する。 The following describes in detail the embodiments of the present invention with reference to the drawings. The object-based acoustic rendering device of the first embodiment of the present invention generates a drive signal that expresses the distance of a sound source based on the WFS without expanding the scale of the system by simplifying the WFS configuration through approximation. The object-based acoustic rendering device of the second and third embodiments incorporates a VBAP configuration into the configuration of the first embodiment, thereby solving the problem of the drive signal becoming small when speakers are sparsely arranged.

本発明の実施例1,2,3のオブジェクトベース音響レンダリング装置について説明する前に、VBAP及びWFSによる音場再現手法の概要について説明する。 Before explaining the object-based acoustic rendering devices of the first, second, and third embodiments of the present invention, we will provide an overview of the sound field reproduction methods using VBAP and WFS.

〔VBAPの概要〕
まず、VBAPの概要について説明する。前述のとおり、VBAPは、再生空間を3個のスピーカからなる三角形領域で分割し、音源座標を含む三角形の各頂点に位置するスピーカに対して重みを算出し、音源信号を分配することにより、振幅パンニングを行う振幅パンニング手法である。
[Outline of VBAP]
First, an overview of VBAP will be described. As described above, VBAP is an amplitude panning technique that divides a reproduction space into triangular regions each consisting of three speakers, calculates weights for the speakers located at each vertex of a triangle including the sound source coordinates, and distributes the sound source signal to perform amplitude panning.

図10は、VBAPを説明するための概念図である。xyz空間において、受音点100を原点とし、仮想音源101方向の単位ベクトルをrnS=(xnS,ynS,znSTとする。また、分割された三角形領域のうち、仮想音源101を内部に含む3つのスピーカ102-1,102-2,102-3方向の単位ベクトルをそれぞれ、rn1=(xn1,yn1,zn1T,rn2=(xn2,yn2,zn2T,rn3=(xn3,yn3,zn3Tとする。 10 is a conceptual diagram for explaining VBAP. In the xyz space, the sound receiving point 100 is set as the origin, and the unit vector in the direction of the virtual sound source 101 is set as r nS = (x nS , ynS , z nS ) T. In addition, among the divided triangular regions, the unit vectors in the directions of the three speakers 102-1, 102-2, and 102-3 that include the virtual sound source 101 inside are set as r n1 = (x n1 , yn1 , z n1 ) T , r n2 = (x n2 , yn2 , z n2 ) T , and r n3 = (x n3 , yn3 , z n3 ) T , respectively.

このとき、仮想音源101方向の単位ベクトルrnSは、スピーカ102-1,102-2,102-3方向の単位ベクトルrn1,rn2,rn3及び係数ベクトルg=(gn1,gn2,gn3Tを用いて以下のように表される。

Figure 0007583638000007
ここで、R=[rn1n2n3]Tとする。 In this case, the unit vector r nS in the direction of the virtual sound source 101 is expressed as follows using the unit vectors r n1 , r n2 , and r n3 in the directions of the speakers 102-1, 102-2, and 102-3 and the coefficient vector g=(g n1 , g n2 , g n3 ) T :
Figure 0007583638000007
Here, let R = [ rn1rn2rn3 ] T .

係数ベクトルgは、以下の式にて算出することができる。

Figure 0007583638000008
-1はRの逆行列である。 The coefficient vector g can be calculated by the following formula.
Figure 0007583638000008
R −1 is the inverse matrix of R.

前記式(5)にて算出された係数ベクトルg=(gn1,gn2,gn3Tを用いて重み付けが行われる。そして、重み付けが行われた信号を3つのスピーカ102-1,102-2,102-3から再生することにより、聴取者は、単位ベクトルrnSの方向に音像を定位することができる。尚、仮想音源101を内部に含まない三角形を成すスピーカの重みは全て0とする。 Weighting is performed using the coefficient vector g = (g n1 , g n2 , g n3 ) T calculated by the above formula (5). Then, by playing back the weighted signals from the three speakers 102-1, 102-2, and 102-3, the listener can localize the sound image in the direction of the unit vector r nS . Note that the weights of all speakers forming a triangle that does not include the virtual sound source 101 inside are set to 0.

〔WFSの概要〕
次に、WFSの概要について説明する。前述のとおり、WFSは、音場を再現したい領域の境界面上に密にスピーカを配置し、前記式(1)のキルヒホッフ-ヘルムホルツ積分方程式に基づいて、スピーカ位置において、再現したい音場である原音場での境界面の法線方向音圧勾配を再現することで、境界面内部の音場を再現する音場再現手法である。
[Outline of WFS]
Next, an overview of WFS will be described. As described above, WFS is a sound field reproduction method in which speakers are densely arranged on the boundary surface of an area in which a sound field is to be reproduced, and the sound pressure gradient in the normal direction of the boundary surface in the original sound field, which is the sound field to be reproduced, is reproduced at the speaker positions based on the Kirchhoff-Helmholtz integral equation of the above formula (1), thereby reproducing the sound field inside the boundary surface.

図11は、WFSを説明するための概念図であり、(1)は原音場を示し、(2)は再現音場を示す。 Figure 11 is a conceptual diagram to explain WFS, where (1) shows the original sound field and (2) shows the reproduced sound field.

(1)の原音場は、xyz空間において、領域C1の外側の座標rS=(xS,yS,zSTの点に配置されている音源103から放射される音波によって形成される。このときの領域C1の境界面上の座標rl=(xl,yl,zlTにおける音圧pは、以下の式にて表される。l(エル)は、座標rlの点の番号を示し、後述するスピーカ106-lの番号(系統の番号)に相当する。

Figure 0007583638000009
ここで、kは波数である。尚、図11の座標r1は、l=1の場合を示している。 The original sound field of (1) is formed in the xyz space by sound waves radiated from a sound source 103 located at a point with coordinate r S = (x S , y S , z S ) T outside the area C1. The sound pressure p at coordinate r l = (x l , y l , z l ) T on the boundary surface of the area C1 in this case is expressed by the following formula: l (el) indicates the number of the point with coordinate r l , and corresponds to the number (system number) of the speaker 106-l described later.
Figure 0007583638000009
Here, k is the wave number. Note that the coordinate r1 in FIG. 11 indicates the case where l=1.

さらに、領域C1の境界面上の座標rl=(xl,yl,zlTの点における境界法線方向内向きの単位ベクトル(境界面内向き法線ベクトル)をn(rl)とする。また、座標rSの点から座標rlの点までを結んだベクトル(rl-rS)と境界面内向き法線ベクトルn(rl)との成す角をθlとする。座標rlの点における法線方向の音圧勾配ベクトルは、以下の式で表される。

Figure 0007583638000010
Furthermore, the unit vector inward in the boundary normal direction (boundary surface inward normal vector) at the point of coordinate r l = (x l , y l , z l ) T on the boundary surface of area C1 is defined as n(r l ). Also, the angle between the vector (r l -r S ) connecting the point of coordinate r S to the point of coordinate r l and the boundary surface inward normal vector n(r l ) is defined as θ l . The sound pressure gradient vector in the normal direction at the point of coordinate r l is expressed by the following formula.
Figure 0007583638000010

したがって、キルヒホッフ-ヘルムホルツ積分方程式によれば、(2)の再現音場において離散的に配置されたスピーカアレイ105を、各スピーカ要素の座標rlに応じて以下の式の駆動信号d(rl)にて駆動させることにより、座標rSの点に仮想音源104の点音源が配置された音場を、領域C2内部に再現することができる。

Figure 0007583638000011
Therefore, according to the Kirchhoff-Helmholtz integral equation, by driving the speaker array 105, which is discretely arranged in the reproduced sound field of (2), with a drive signal d(r l ) of the following equation according to the coordinate r l of each speaker element, it is possible to reproduce a sound field in which a point sound source of the virtual sound source 104 is arranged at the point of coordinate r S within the area C2.
Figure 0007583638000011

ここで、ΔSlは、領域C2の境界面を、スピーカ位置を中心とする面積要素に分割したときのl番目の要素の面積(面積要素)であり、スピーカ要素が密に配置されているほど小さい値をとり、疎に配置されているほど大きい値をとる。 Here, ΔS l is the area (area element) of the lth element when the boundary surface of area C2 is divided into area elements centered on the speaker position, and the more densely the speaker elements are arranged, the smaller the value, and the more sparsely the speaker elements are arranged, the larger the value.

尚、xyz空間において、rSは、仮想音源104の座標(仮想音源座標)であり、rlは、スピーカアレイ105を構成する第l番目のスピーカ要素の座標(スピーカ座標)である。 In the xyz space, r S is the coordinate of the virtual sound source 104 (virtual sound source coordinates), and r l is the coordinate of the l-th speaker element that constitutes the speaker array 105 (speaker coordinates).

また、wC(θl)は、以下の式にて定義される関数である。

Figure 0007583638000012
Furthermore, w Cl ) is a function defined by the following equation.
Figure 0007583638000012

〔オブジェクトベース音響レンダリング装置〕
次に、実施例1,2,3のオブジェクトベース音響レンダリング装置について説明する。
[Object-based audio rendering device]
Next, the object-based audio rendering apparatuses according to the first, second and third embodiments will be described.

実施例1では、WFSの音場再現手法により決定されるスピーカの駆動信号d(rl)を示す前記式(8)において、仮想音源座標rSの位置に配置された仮想音源104とスピーカ座標rlの位置に配置されたスピーカとの間の距離による時間遅延を表しているe-jk||rl-rs||の項を無視することで、厳密な波面の再現と引き換えにはなるが、システムを簡略化する。 In the first embodiment, in the above equation (8) showing the speaker drive signal d(r l ) determined by the WFS sound field reproduction method, the term e -jk||r l -rs||, which represents the time delay due to the distance between the virtual sound source 104 located at the virtual sound source coordinate r S and the speaker located at the speaker coordinate r l, is ignored, thereby simplifying the system at the expense of accurate wavefront reproduction.

また、実施例1では、前記式(8)のjk||rl-rS||+1の項は、仮想音源104とスピーカとの間の距離により変化するハイパス特性を持ち、この特性を、当該距離に依存する低次のハイパスフィルタh(rl,rS)(HPF)にて近似する。 In addition, in the first embodiment, the term jk∥r l -r S ∥+1 in the above equation (8) has a high-pass characteristic that changes depending on the distance between the virtual sound source 104 and the speaker, and this characteristic is approximated by a low-order high-pass filter h(r l , r S ) (HPF) that depends on the distance.

これにより、実施例1では、WFSの構成を近似により単純化することで、システムの規模を拡大することなく、WFSに基づき音源の距離の遠近を表現する駆動信号を生成することができる。 As a result, in Example 1, by simplifying the WFS configuration through approximation, it is possible to generate a drive signal that expresses the distance of a sound source based on the WFS without expanding the scale of the system.

また、実施例2,3では、実施例1の構成に対してVBAPの構成を組み込むことで、実施例1の効果に加え、スピーカが疎に配置された場合に駆動信号が小さくなる問題を解決する。 In addition, in Examples 2 and 3, by incorporating a VBAP configuration into the configuration of Example 1, in addition to the effects of Example 1, the problem of the drive signal becoming small when the speakers are sparsely placed is resolved.

〔実施例1〕
まず、実施例1のオブジェクトベース音響レンダリング装置について説明する。前述のとおり、実施例1は、スピーカの駆動信号d(rl)を生成する前記式(8)において、時間遅延を表すe-jk||rl-rs||の項を無視し、jk||rl-rS||+1の項をHPFとして扱い、仮想音源104とスピーカとの間の距離により変化するハイパス特性を、当該距離に依存する低次のハイパスフィルタh(rl,rS)(HPF)にて近似する。
Example 1
First, an object-based acoustic rendering device according to Example 1 will be described. As described above, in Example 1, in the above-mentioned formula (8) for generating the speaker drive signal d(r l ), the term e -jk||r l -rs|| representing a time delay is ignored, and the term jk||r l -r S ||+1 is treated as an HPF, and the high-pass characteristics that change depending on the distance between the virtual sound source 104 and the speaker are approximated by a low-order high-pass filter h(r l , r S ) (HPF) that depends on the distance.

図1は、実施例1のオブジェクトベース音響レンダリング装置の構成例を示すブロック図であり、図2は、実施例1のオブジェクトベース音響レンダリング装置の処理例を示す疑似コードである。 Figure 1 is a block diagram showing an example of the configuration of an object-based acoustic rendering device of the first embodiment, and Figure 2 is pseudocode showing an example of the processing of the object-based acoustic rendering device of the first embodiment.

このオブジェクトベース音響レンダリング装置1は、信号増幅部9-1~9-L、HPF(ハイパスフィルタ)10-1~10-L、減衰付加部11-1~11-L、面積要素付加部12-1~12-L、角度重み付加部13-1~13-L及び角度算出部20を備えている。Lはスピーカ106-1~106-Lの個数であり、系統の数でもある。 This object-based acoustic rendering device 1 includes signal amplifiers 9-1 to 9-L, HPFs (high pass filters) 10-1 to 10-L, attenuation adding units 11-1 to 11-L, area element adding units 12-1 to 12-L, angle weighting adding units 13-1 to 13-L, and an angle calculation unit 20. L is the number of speakers 106-1 to 106-L, and is also the number of systems.

以下、オブジェクトベース音響レンダリング装置1において、第l(エル)番目のスピーカ106-l(l番目の系統)に対応する構成部を、それぞれ信号増幅部9-l、HPF10-l、減衰付加部11-l、面積要素付加部12-l及び角度重み付加部13-lとする。つまり、オブジェクトベース音響レンダリング装置1は、L系統の信号増幅部9-l、HPF10-l、減衰付加部11-l、面積要素付加部12-l及び角度重み付加部13-lを備え、さらに角度算出部20を備えている。l=1,・・・,Lである。 Hereinafter, in the object-based acoustic rendering device 1, the components corresponding to the lth speaker 106-l (lth system) are respectively the signal amplifier 9-l, HPF 10-l, attenuation adding unit 11-l, surface area element adding unit 12-l, and angle weighting adding unit 13-l. In other words, the object-based acoustic rendering device 1 comprises L system signal amplifiers 9-l, HPF 10-l, attenuation adding unit 11-l, surface area element adding unit 12-l, and angle weighting adding unit 13-l, and further comprises an angle calculation unit 20. l = 1, ..., L.

図2を参照してオブジェクトベース音響レンダリング装置1の全体処理について説明する。オブジェクトベース音響レンダリング装置1は、音源信号Sを入力すると共に、仮想音源座標rSを入力する(ステップS201)。 The overall processing of the object-based sound rendering apparatus 1 will be described with reference to Fig. 2. The object-based sound rendering apparatus 1 receives a sound source signal S and virtual sound source coordinates rS (step S201).

オブジェクトベース音響レンダリング装置1は、スピーカ106-1~106-Lのそれぞれについて(スピーカ106-lの系統について)、スピーカ106-lのスピーカ座標rl、スピーカ106-lの面積要素ΔSl、及びスピーカ106-lの位置での境界面内向き法線ベクトルn(rl)を入力する(ステップS202)。 The object-based acoustic rendering device 1 inputs, for each of the speakers 106-1 to 106-L (for the speaker 106-l system), the speaker coordinates r l of the speaker 106-l, the area element ΔS l of the speaker 106-l, and the inward normal vector n(r l ) of the boundary surface at the position of the speaker 106-l (step S202).

ここで、スピーカ座標rl、面積要素ΔSl及び境界面内向き法線ベクトルn(rl)における下付けの“l”(エル)は、スピーカ106-1~106-Lの番号(系統の番号)である。 Here, the subscript "l" in the speaker coordinate r l , the surface area element ΔS l and the boundary surface inward normal vector n(r l ) is the number (system number) of the speakers 106-1 to 106-L.

また、音源信号Sは、例えば放送局から放送される信号であり、仮想音源座標rSは、例えば放送局から放送される音響メタデータに含まれるデータである。スピーカ座標rl、面積要素ΔSl及び境界面内向き法線ベクトルn(rl)は、例えば当該オブジェクトベース音響レンダリング装置1を操作するユーザにより予め設定されるスピーカレイアウト情報に含まれるデータである。 The sound source signal S is, for example, a signal broadcast from a broadcast station, and the virtual sound source coordinates r S are, for example, data included in the audio metadata broadcast from the broadcast station. The speaker coordinates r l , the area element ΔS l and the boundary surface inward normal vector n(r l ) are, for example, data included in speaker layout information preset by a user who operates the object-based audio rendering device 1.

この場合、オブジェクトベース音響レンダリング装置1は、放送局から送信された音源信号S及び仮想音源座標rSを受信し、ユーザにより予め設定されたスピーカ座標rl、面積要素ΔSl及び境界面内向き法線ベクトルn(rl)を入力する。 In this case, the object-based acoustic rendering device 1 receives a sound source signal S and virtual sound source coordinates r S transmitted from a broadcasting station, and inputs speaker coordinates r l , area element ΔS l , and boundary surface inward normal vector n(r l ) preset by the user.

オブジェクトベース音響レンダリング装置1は、スピーカ106-lについて、ステップS201にて入力した仮想音源座標rS、及びステップS202にて入力したスピーカ座標rlに基づき、所定の次数の係数を有するHPF10-lのHPFh(rl,rS)を設定する(ステップS203)。 The object-based acoustic rendering device 1 sets HPFh(r l , r S ) of the HPF 10-l having coefficients of a predetermined order for the speaker 106-l based on the virtual sound source coordinates r S input in step S201 and the speaker coordinates r l input in step S202 (step S203).

オブジェクトベース音響レンダリング装置1は、スピーカ106-lについて、ステップS201にて入力した仮想音源座標rS、及びステップS202にて入力したスピーカ座標rlに基づき、仮想音源104とスピーカ106-lとの間の距離に応じた減衰付加部11-lの減衰係数1/||rl-rS||2を設定する(ステップS204)。 The object-based acoustic rendering device 1 sets the attenuation coefficient 1/||r l -r S ∥ 2 of the attenuation adding unit 11-l for the speaker 106-l based on the virtual sound source coordinates r S input in step S201 and the speaker coordinates r l input in step S202 , in accordance with the distance between the virtual sound source 104 and the speaker 106-l (step S204).

つまり、オブジェクトベース音響レンダリング装置1は、仮想音源104位置からスピーカ106-l位置までのベクトルの絶対値||rl-rS||を求め、当該絶対値を2乗した結果||rl-rS||2の逆数を減衰係数1/||rl-rS||2として設定する。 In other words, the object-based acoustic rendering device 1 calculates the absolute value ||r l -r S || of the vector from the position of the virtual sound source 104 to the position of the speaker 106-l, and sets the inverse of the result, ||r l -r S || 2 , of squaring the absolute value as the attenuation coefficient 1/||r l -r S || 2 .

オブジェクトベース音響レンダリング装置1は、スピーカ106-lについて、ステップS201にて入力した仮想音源座標rS、並びにステップS202にて入力したスピーカ座標rl及び境界面内向き法線ベクトルn(rl)に基づき、仮想音源104位置からスピーカ106-l位置を結んだベクトル(rl-rS)とスピーカ106-l位置での境界面内向き法線ベクトルn(rl)との成す角θlを算出する(ステップS205)。この成す角θlは、角度算出部20により算出される。 The object-based acoustic rendering device 1 calculates an angle θ l between a vector (r l -r S ) connecting the position of the virtual sound source 104 to the position of the speaker 106-l and the boundary surface inward normal vector n(r l ) at the position of the speaker 106-l, based on the virtual sound source coordinate r S input in step S201, and the speaker coordinate r l and boundary surface inward normal vector n(r l ) input in step S202 (step S205). This angle θ l is calculated by the angle calculation unit 20.

オブジェクトベース音響レンダリング装置1は、スピーカ106-lについて、ステップS205にて算出した成す角θlの絶対値|θl|が0°よりも大きく、かつ90°よりも小さいか否かを判定し、前記式(9)にて角度重みwC(θl)を設定する(ステップS206)。 The object-based acoustic rendering device 1 determines whether the absolute value |θ l | of the angle θ l calculated for the speaker 106-l in step S205 is greater than 0° and less than 90°, and sets the angle weight w Cl ) in accordance with equation (9) (step S206).

具体的には、オブジェクトベース音響レンダリング装置1は、成す角|θl|が0°よりも大きく、かつ90°よりも小さいと判定した場合(前記式(9)ではcosθl>0の場合)、角度重みwC(θl)=cosθlを設定する。一方、オブジェクトベース音響レンダリング装置1は、成す角|θl|が0°以下であるか、または90°以上であると判定した場合(前記式(9)ではcosθl>0以外の場合)、角度重みwC(θl)=0を設定する。この角度重みwC(θl)は、角度重み付加部13-lにて用いられる。 Specifically, if the object-based sound rendering device 1 determines that the formed angle |θ l | is greater than 0° and less than 90° (if cos θ l > 0 in the above formula (9)), it sets the angle weight w Cl ) = cos θ l . On the other hand, if the object-based sound rendering device 1 determines that the formed angle |θ l | is less than 0° or greater than 90° (if other than cos θ l > 0 in the above formula (9)), it sets the angle weight w Cl ) = 0. This angle weight w Cl ) is used by angle weight adding section 13-l.

角度重みwC(θl)は、0から1までの範囲の値をとり、成す角|θl|が0°<|θl|<90°の範囲において、成す角|θl|が0°に近いほど1に近い値をとり、90°に近いほど0に近い値をとり、成す角|θl|が|θl|≦0°または90°≦|θl|の範囲において、0の値をとる。 The angle weight wC ( θl ) takes a value in the range from 0 to 1. When the angle | θl | is in the range of 0°<| θl |<90°, the closer the angle | θl | is to 0°, the closer the value is to 1. When the angle |θl| is closer to 90°, the closer the value is to 0. When the angle | θl | is in the range of | θl |≦0° or 90°≦| θl |, the angle weight takes a value of 0.

オブジェクトベース音響レンダリング装置1は、スピーカ106-lについて、定数u(例えばu=1/2π、系統毎に異なる値となる場合もあり得る)、ステップS201にて入力した音源信号S及び仮想音源座標rS、ステップS202にて入力したスピーカ座標rl及び面積要素ΔSl、ステップS203にて設定したHPFh(rl,rS)、ステップS204にて設定した減衰係数1/||rl-rS||2及びステップS206にて設定した角度重みwC(θl)を用いて、以下の式にて駆動信号d(rl)を算出し出力する(ステップS207)。

Figure 0007583638000013
*は畳み込みを表す。この駆動信号d(rl)は、信号増幅部9-l、HPF10-l、減衰付加部11-l、面積要素付加部12-l及び角度重み付加部13-lにより算出される。 The object-based acoustic rendering device 1 calculates and outputs a drive signal d(r l ) for the speaker 106-l using the constant u (for example, u = 1/2π, which may be a different value for each system), the sound source signal S and virtual sound source coordinates r S input in step S201, the speaker coordinates r l and area element ΔS l input in step S202, the HPFh(r l , r S ) set in step S203, the attenuation coefficient 1/||r l -r S || 2 set in step S204, and the angle weight w Cl ) set in step S206, using the following equation (step S207).
Figure 0007583638000013
The symbol * denotes convolution. This drive signal d(r l ) is calculated by a signal amplifier 9-l, a HPF 10-l, an attenuation adding section 11-l, an area element adding section 12-l and an angle weighting adding section 13-l.

次に、図1を参照してオブジェクトベース音響レンダリング装置1の構成部の処理について説明する。信号増幅部9-l(9-1~9-L)は、音源信号Sを入力し、音源信号Sに対し定数u(例えば1/2π)を乗算することで音源信号Sを増幅し、増幅した信号をHPF10-lに出力する。 Next, the processing of the components of the object-based acoustic rendering device 1 will be described with reference to Fig. 1. The signal amplifier 9-l (9-1 to 9-L) inputs the sound source signal S, amplifies the sound source signal S by multiplying it by a constant u (e.g., 1/2π), and outputs the amplified signal to the HPF 10-l.

HPF10-l(10-1~10-L)は、仮想音源座標rS及びスピーカ座標rlを入力する。そして、HPF10-lは、仮想音源座標rS及びスピーカ座標rlに基づいて、ステップS203のとおり、所定の次数の係数を有するHPFh(rl,rS)を設定する。そして、HPF10-lは、信号増幅部9-lから増幅された信号を入力し、当該信号に対し、HPFh(rl,rS)を用いてフィルタ処理を施し、フィルタ処理を施した信号を減衰付加部11-lに出力する。 The HPF 10-l (10-1 to 10-L) receives the virtual sound source coordinates r S and the speaker coordinates r L. Based on the virtual sound source coordinates r S and the speaker coordinates r L , the HPF 10-l sets an HPFh (r L , r S ) having a predetermined order of coefficients as in step S203. The HPF 10-l receives the amplified signal from the signal amplifier 9-l, filters the signal using the HPFh (r L , r S ), and outputs the filtered signal to the attenuation adder 11-l.

減衰付加部11-l(11-1~11-L)は、仮想音源座標rS及びスピーカ座標rlを入力し、仮想音源座標rS及びスピーカ座標rlに基づいて、ステップS204のとおり、減衰係数1/||rl-rS||2を設定する。そして、減衰付加部11-lは、HPF10-lからフィルタ処理が施された信号を入力し、当該信号に対し減衰係数1/||rl-rS||2を乗算することで、仮想音源104とスピーカ106-lとの間の距離に応じて信号を減衰させる。減衰付加部11-lは、減衰させた信号(減衰を付加した信号)を面積要素付加部12-lに出力する。 The attenuation adding unit 11-l (11-1 to 11-L) receives the virtual sound source coordinates r S and the speaker coordinates r L , and sets the attenuation coefficient 1/||r L -r S ∥2 based on the virtual sound source coordinates r S and the speaker coordinates r L as in step S204. The attenuation adding unit 11-l then receives the filtered signal from the HPF 10-l, and multiplies the signal by the attenuation coefficient 1/||r L -r S ∥2 to attenuate the signal in accordance with the distance between the virtual sound source 104 and the speaker 106-l. The attenuation adding unit 11-l outputs the attenuated signal (the signal with attenuation added) to the surface element adding unit 12-l.

面積要素付加部12-l(12-1~12-L)は、面積要素ΔSlを入力する。面積要素ΔSlは、スピーカ106-lが密に配置されている場合、小さい値となり、スピーカ106-lが疎に配置されている場合、大きい値となる。 The area element adding unit 12-l (12-1 to 12-L) inputs an area element ΔS l . The area element ΔS l takes a small value when the speakers 106-l are densely arranged, and takes a large value when the speakers 106-l are sparsely arranged.

そして、面積要素付加部12-lは、減衰付加部11-lから減衰が付加された信号を入力し、当該信号に対し面積要素ΔSlを乗算することで、スピーカ106-lの離散度合いに応じて面積要素を付加した信号を生成する。面積要素付加部12-lは、面積要素を付加した信号を角度重み付加部13-lに出力する。 The area element adding unit 12-l receives the signal to which attenuation has been added from the attenuation adding unit 11-l and multiplies the signal by an area element ΔS l to generate a signal to which an area element has been added according to the degree of discreteness of the speaker 106-l. The area element adding unit 12-l outputs the signal to which the area element has been added to the angle weighting unit 13-l.

角度算出部20は、仮想音源座標rS、スピーカ座標r1~rL及び境界面内向き法線ベクトルn(r1)~n(rL)を入力する。そして、角度算出部20は、ステップS205のとおり、スピーカ106-1~106-Lのそれぞれ(スピーカ106-l)について、仮想音源104位置からスピーカ106-l位置を結んだベクトル(rl-rS)を求め、当該ベクトル(rl-rS)とスピーカ106-l位置での境界面内向き法線ベクトルn(rl)との成す角θlを算出する。角度算出部20は、成す角θl(θ1~θL)を、対応する角度重み付加部13-l(13-1~13-L)に出力する。 The angle calculation unit 20 inputs the virtual sound source coordinates r S , the speaker coordinates r 1 to r L and the boundary surface inward normal vectors n (r 1 ) to n (r L ). Then, as in step S205, the angle calculation unit 20 obtains a vector (r l -r S ) connecting the virtual sound source 104 position to the speaker 106-l position for each of the speakers 106-1 to 106-L (speaker 106-l), and calculates the angle θ l between the vector (r l -r S ) and the boundary surface inward normal vector n (r l ) at the speaker 106-l position. The angle calculation unit 20 outputs the formed angle θ l1 to θ L ) to the corresponding angle weighting unit 13-l (13-1 to 13-L).

図3は、角度算出部20の構成例を示すブロック図である。この角度算出部20は、算出部30-1~30-Lを備えている。算出部30-1は、スピーカ106-1についての成す角θ1を算出する構成部であり、仮想音源座標rS、並びに第l=1番目のスピーカ座標r1及び境界面内向き法線ベクトルn(r1)を入力する。そして、算出部30-1は、仮想音源104位置からスピーカ106-l位置を結んだベクトル(r1-rS)を求め、当該ベクトル(r1-rS)とスピーカ106-1位置での境界面内向き法線ベクトルn(r1)との成す角θ1を算出する。算出部30-1は、成す角θ1を角度重み付加部13-1に出力する。 3 is a block diagram showing an example of the configuration of the angle calculation unit 20. The angle calculation unit 20 includes calculation units 30-1 to 30-L. The calculation unit 30-1 is a component that calculates the angle θ 1 for the speaker 106-1, and inputs the virtual sound source coordinate r S , the l=1st speaker coordinate r 1 , and the boundary surface inward normal vector n (r 1 ). The calculation unit 30-1 then obtains a vector (r 1 -r S ) that connects the virtual sound source 104 position to the speaker 106-l position, and calculates the angle θ 1 between the vector (r 1 -r S ) and the boundary surface inward normal vector n (r 1 ) at the speaker 106-1 position. The calculation unit 30-1 outputs the angle θ 1 to the angle weighting unit 13-1.

同様に、算出部30-Lは、スピーカ106-Lについての成す角θLを算出する構成部であり、仮想音源座標rS、並びに第l=L番目のスピーカ座標rL及び境界面内向き法線ベクトルn(rL)を入力する。そして、算出部30-Lは、仮想音源104位置からスピーカ106-l位置を結んだベクトル(rL-rS)を求め、当該ベクトル(rL-rS)とスピーカ106-L位置での境界面内向き法線ベクトルn(rL)との成す角θLを算出する。算出部30-Lは、成す角θLを角度重み付加部13-Lに出力する。 Similarly, the calculation unit 30-L is a component that calculates the angle θ L for the speaker 106-L, and receives as input the virtual sound source coordinates r S , the l=Lth speaker coordinates r L and the boundary surface inward normal vector n(r L ). The calculation unit 30-L then obtains a vector (r L -r S ) connecting the position of the virtual sound source 104 to the position of the speaker 106-l, and calculates the angle θ L between the vector (r L -r S ) and the boundary surface inward normal vector n(r L ) at the speaker 106-L position. The calculation unit 30-L outputs the angle θ L to the angle weighting unit 13-L.

算出部30-2~30-(L-1)についても、同様の処理が行われ、仮想音源104位置からスピーカ106-2~106-(L-1)位置を結んだベクトル(r2~rL-1-rS)とスピーカ106-2~106-(L-1)位置での境界面内向き法線ベクトルn(r2)~n(rL-1)との成す角θ2~θL-1がそれぞれ算出される。 Similar processing is performed for calculation units 30-2 to 30-(L-1), and angles θ 2 to θ L-1 between the vector (r 2 to r L-1 -r S ) connecting the position of the virtual sound source 104 to the positions of the speakers 106-2 to 106-(L-1) and the inward normal vectors n(r 2 ) to n(r L-1 ) of the boundary surface at the positions of the speakers 106-2 to 106-( L-1 ) are calculated, respectively.

図1に戻って、角度重み付加部13-l(13-1~13-L)は、角度算出部20から成す角θl(θ1~θL)を入力し、成す角θlに基づいて、ステップS206のとおり、前記式(9)にて角度重みwC(θl)を設定する。そして、角度重み付加部13-lは、面積要素付加部12-lから面積要素が付加された信号を入力し、当該信号に対し角度重みwC(θl)を乗算することで、成す角θlを反映した信号を生成する。 1, angle weighting unit 13-l (13-1 to 13-L) receives angle θ l1 to θ L ) from angle calculation unit 20, and sets angle weight w Cl ) using equation (9) based on angle θ l as in step S206. Then, angle weighting unit 13-l receives a signal to which an area element has been added from area element adding unit 12-l, and multiplies the signal by angle weight w Cl ) to generate a signal reflecting angle θ l .

成す角θlを反映した信号は、成す角θlが0°に近いほど、面積要素が付加された信号に近くなる。一方、成す角θlを反映した信号は、成す角θlが90°に近いほど、0の信号に近くなる。 The signal reflecting the angle θl approaches a signal to which an area element has been added as the angle θl approaches 0°. On the other hand, the signal reflecting the angle θl approaches a signal of 0 as the angle θl approaches 90°.

角度重み付加部13-lは、成す角θlを反映した信号を駆動信号d(rl)としてスピーカ106-lへ出力する。 The angle weighting unit 13-l outputs a signal reflecting the formed angle θ l as a drive signal d(r l ) to the speaker 106-l.

尚、図1及び図2では、1つの音響オブジェクトの音源信号Sに対するオブジェクトベース音響のレンダリングの構成及び処理を示しているが、実際は、複数の音響オブジェクトの音源信号Sに対して処理が行われる。この場合、音響オブジェクト毎に生成された駆動信号d(rl)がスピーカ106-l毎に加算され、加算結果の駆動信号がスピーカ106-lへ出力される。後述する図5,6(実施例2)及び図8,9(実施例3)についても同様である。 1 and 2 show the configuration and processing of object-based audio rendering for the sound source signal S of one audio object, but in reality, processing is performed for the sound source signals S of a plurality of audio objects. In this case, the drive signals d(r l ) generated for each audio object are added for each speaker 106-l, and the drive signal resulting from the addition is output to the speaker 106-l. The same applies to Figs. 5 and 6 (Example 2) and Figs. 8 and 9 (Example 3) described later.

以上のように、実施例1のオブジェクトベース音響レンダリング装置1によれば、スピーカ106-lの駆動信号d(rl)を生成する前記式(8)において、時間遅延を表すe-jk||rl-rs||の項を無視し、jk||rl-rS||+1の項を、仮想音源104とスピーカ106-lとの間の距離に依存する低次のハイパスフィルタh(rl,rS)(HPF)として近似するようにした。 As described above, according to the object-based acoustic rendering device 1 of the first embodiment, in the above equation (8) for generating the drive signal d(r l ) for the speaker 106-l, the term e -jk||r l -rs|| representing a time delay is ignored, and the term jk||r l -r S || + 1 is approximated as a low-order high-pass filter h(r l , r S ) (HPF) that depends on the distance between the virtual sound source 104 and the speaker 106-l.

具体的には、信号増幅部9-lは、音源信号Sに対し定数u(系統毎に異なる値となる場合もあり得る)を乗算することで、音源信号Sを増幅する。HPF10-lは、仮想音源座標rS及びスピーカ座標rlに基づいて、所定の次数の係数を有するHPFh(rl,rS)を設定する。そして、HPF10-lは、信号増幅部9-lにより増幅された信号に対し、HPFh(rl,rS)を用いてフィルタ処理を施す。 Specifically, the signal amplifier 9-l amplifies the sound source signal S by multiplying the sound source signal S by a constant u (which may have a different value for each system). The HPF 10-l sets an HPFh(r l , r S ) having a coefficient of a predetermined order based on the virtual sound source coordinates r S and the speaker coordinates r l . The HPF 10-l then performs filtering on the signal amplified by the signal amplifier 9-l using the HPFh(r l , r S ).

減衰付加部11-lは、仮想音源座標rS及びスピーカ座標rlに基づいて減衰係数1/||rl-rS||2を設定する。そして、減衰付加部11-lは、フィルタ処理が施された信号に対し減衰係数1/||rl-rS||2を乗算することで、仮想音源104とスピーカ106-lとの間の距離に応じて減衰した信号を生成する。 The attenuation adding unit 11-l sets an attenuation coefficient 1/∥r l -r S2 based on the virtual sound source coordinates r S and the speaker coordinates r l . Then, the attenuation adding unit 11-l multiplies the filtered signal by the attenuation coefficient 1/∥r l -r S2 to generate a signal attenuated according to the distance between the virtual sound source 104 and the speaker 106-l.

面積要素付加部12-lは、減衰した信号に対しスピーカ106-lの面積要素ΔSlを乗算することで、面積要素を付加した信号を生成する。 The area element adding unit 12-l multiplies the attenuated signal by an area element ΔS l of the speaker 106-l to generate a signal to which an area element has been added.

角度算出部20は、仮想音源104位置からスピーカ106-l位置を結んだベクトル(rl-rS)とスピーカ106-l位置での境界面内向き法線ベクトルn(rl)との成す角θlを算出する。 The angle calculation unit 20 calculates the angle θ l between the vector (r l -r s ) connecting the position of the virtual sound source 104 to the position of the speaker 106-l and the inward normal vector n (r l ) of the boundary surface at the position of the speaker 106-l.

角度重み付加部13-lは、成す角θlに基づいて、前記式(9)にて角度重みwC(θl)を設定する。そして、角度重み付加部13-lは、面積要素が付加された信号に対し角度重みwC(θl)を乗算することで、成す角θlを反映した信号を駆動信号d(rl)としてスピーカ106-lへ出力する。 The angle weighting unit 13-l sets the angle weight w Cl ) in accordance with the equation (9) based on the angle θ l . Then, the angle weighting unit 13-l multiplies the signal to which the area element has been added by the angle weight w Cl ) to output a signal reflecting the angle θ l to the speaker 106-l as a drive signal d(r l ).

これにより、前記式(8)における時間遅延を表すe-jk||rl-rs||の項を無視するようにしたから、システムを簡略化することができる。また、jk||rl-rS||+1の項を近似したHPFh(rl,rS)のHPF10-lを用いることで、システムを簡略化することができる。 This allows the system to be simplified because the term e -jk||rl-rs|| , which indicates the time delay in equation (8), is ignored. Also, the system can be simplified by using the HPF 10-l of HPFh(r l , r S ), which approximates the term jk||r l -r S ||+1.

したがって、WFSの構成を近似により単純化することで、システムの規模を拡大することなく、WFSに基づき仮想音源104の距離の遠近を表現する駆動信号d(rl)を生成することができる。 Therefore, by simplifying the configuration of the WFS through approximation, it is possible to generate a driving signal d(r l ) that expresses the distance of the virtual sound source 104 based on the WFS without increasing the scale of the system.

(HPF10-lの他の例)
尚、図1に示したオブジェクトベース音響レンダリング装置1のHPF10-l(10-1~10-L)は、前記式(8)においてjk||rl-rS||+1の項を近似したHPFh(rl,rS)を用いて、信号増幅部9-l(9-1~9-L)により増幅された信号に対してフィルタ処理を施すようにした。
(Another example of HPF10-1)
The HPF 10-l (10-1 to 10-L) of the object-based acoustic rendering device 1 shown in FIG. 1 performs filtering on the signal amplified by the signal amplifier 9-l (9-1 to 9-L) using HPFh (r l , r S ) which approximates the term jk∥r l -r S ∥+1 in the above equation (8).

例えば、前記式(8)においてjk||rl-rS||+1の項は、以下の式で表すハイパスフィルタに置き換えて使用する。

Figure 0007583638000014
For example, the term jk∥r l -r s ∥+1 in the above equation (8) is replaced with a high-pass filter expressed by the following equation.
Figure 0007583638000014

x[t]及びy[t]は、時刻tにおける当該HPF10-lの入力と出力である。HPF係数hn(rl,rS)は、以下の式で表されるものとする。n=0,1,・・・,Nである。

Figure 0007583638000015
αは、フィルタの特性を決定するためのパラメータであり、正の実数である。Nはフィルタ次数である。これらのパラメータα及びフィルタ次数Nの値は、ユーザが任意に決定するものとする。 x[t] and y[t] are the input and output of the HPF 10-l at time t. The HPF coefficients h n (r l , r s ) are expressed by the following equation, where n=0, 1, . . . , N.
Figure 0007583638000015
Here, α is a parameter for determining the characteristics of the filter and is a positive real number, and N is the filter order. The values of the parameter α and the filter order N are determined arbitrarily by the user.

つまり、HPF10-lは、仮想音源座標rS及びスピーカ座標rlを入力すると共に、ユーザにより予め設定されたパラメータα及びフィルタ次数Nを入力する。そして、HPF10-lは、仮想音源座標rS、スピーカ座標rl、パラメータα及びフィルタ次数Nに基づいて、前記式(12)を係数として有するHPF係数を設定する。 That is, the HPF 10-l receives the virtual sound source coordinates r S and the speaker coordinates r l , as well as the parameter α and the filter order N preset by the user. Then, the HPF 10-l sets HPF coefficients having the above-mentioned formula (12) as coefficients, based on the virtual sound source coordinates r S , the speaker coordinates r l , the parameter α, and the filter order N.

そして、HPF10-lは、信号増幅部9-l(9-1~9-L)により増幅された信号を入力し、当該信号に対し、前記式(12)のHPF係数hn(rl,rS)を用いて、当該HPF10-lの入出力特性が前記式(11)となるようにフィルタ処理を施す。つまり、HPF10-lは、前記式(11)の入出力特性となるようなHPFにより構成される。 The HPF 10-l receives the signal amplified by the signal amplifier 9-l (9-1 to 9-L) and performs filtering on the signal using the HPF coefficient h n (r l , r S ) of the above formula (12) so that the input/output characteristics of the HPF 10-l satisfy the above formula (11). In other words, the HPF 10-l is configured with an HPF that has the input/output characteristics of the above formula (11).

これにより、オブジェクトベース音響レンダリング装置1全体として、システムの規模が拡大することなく、簡略化することができる。 This allows the object-based acoustic rendering device 1 as a whole to be simplified without increasing the system scale.

(減衰付加部11-lの他の例)
また、図1に示したオブジェクトベース音響レンダリング装置1の減衰付加部11-l(11-1~11-L)は、仮想音源座標rS及びスピーカ座標rlに基づいて、減衰係数1/||rl-rS||2を設定し、フィルタ処理が施された信号に対して減衰係数1/||rl-rS||2を乗算することで、仮想音源104とスピーカ106-lとの間の距離に応じて減衰した信号を生成するようにした。
(Another Example of the Attenuation Addition Unit 11-l)
In addition, the attenuation adding unit 11-l (11-1 to 11-L) of the object-based acoustic rendering device 1 shown in Figure 1 sets an attenuation coefficient 1/||r l -r S || 2 based on the virtual sound source coordinates r S and the speaker coordinates r l , and multiplies the filtered signal by the attenuation coefficient 1/||r l -r S || 2 to generate a signal that is attenuated in accordance with the distance between the virtual sound source 104 and the speaker 106-l.

しかしながら、減衰係数1/||rl-rS||2は、仮想音源座標rSとスピーカ座標rlとが一致する場合、無限大に発散してしまい、結果として信号を再生することができなくなってしまう。そこで、減衰付加部11-lは、減衰係数1/||rl-rS||2を近似した以下の式で表す減衰係数g(rl,rS)を用いる。

Figure 0007583638000016
However, when the virtual sound source coordinate r S and the speaker coordinate r l coincide with each other, the attenuation coefficient 1/||r l -r S || 2 diverges to infinity, and as a result, the signal cannot be reproduced. Therefore, the attenuation adding unit 11-l uses the attenuation coefficient g(r l , r S ) expressed by the following formula that approximates the attenuation coefficient 1/||r l -r S || 2 :
Figure 0007583638000016

β1は、信号振幅を調整するための正の実数であり、β2は、減衰係数g(rl,rS)の発散を抑えるための正の実数である。これらのパラメータβ1,β2の値は、ユーザが任意に決定するものとする。特に、パラメータβ2の値は、減衰係数g(rl,rS)の発散を抑えるように、微小な値がユーザにより設定される。 β1 is a positive real number for adjusting the signal amplitude, and β2 is a positive real number for suppressing the divergence of the attenuation coefficient g(r l , r S ). The values of these parameters β1 and β2 are determined arbitrarily by the user. In particular, the value of the parameter β2 is set by the user to a small value so as to suppress the divergence of the attenuation coefficient g(r l , r S ).

つまり、減衰付加部11-lは、仮想音源104位置からスピーカ106-l位置までのベクトルの絶対値||rl-rS||を求め、当該絶対値を2乗した結果にパラメータβ2を加算して加算結果(||rl-rS||2+β2)を求め、パラメータβ1を加算結果(||rl-rS||2+β2)で除算することで、減衰係数g(rl,rS)を求める。 In other words, the attenuation adding unit 11-l finds the absolute value ||r l -r S || of the vector from the position of the virtual sound source 104 to the position of the speaker 106-l, squares the absolute value, adds the parameter β 2 to the result to find the addition result (||r l -r S || 2 + β 2 ), and divides the parameter β 1 by the addition result (||r l -r S || 2 + β 2 ) to find the attenuation coefficient g(r l , r S ).

そして、減衰付加部11-lは、フィルタ処理が施された信号に対してg(rl,rS)を乗算することで、仮想音源104とスピーカ106-lとの間の距離に応じて減衰した信号を生成する。 Then, the attenuation adding unit 11-l multiplies the filtered signal by g(r l , r s ) to generate a signal attenuated according to the distance between the virtual sound source 104 and the speaker 106-l.

パラメータβ2の値が小さいほど、減衰係数g(rl,rS)の振る舞いは減衰係数1/||rl-rS||2に近づく。一方で、仮想音源座標rSがスピーカ座標rlに近づくほど、信号振幅が極端に増大する。 As the value of parameter β2 becomes smaller, the behavior of the attenuation coefficient g(r l , r S ) approaches the attenuation coefficient 1/||r l -r S || 2. On the other hand, as the virtual sound source coordinate r S approaches the speaker coordinate r l , the signal amplitude increases drastically.

これにより、信号の発散を抑制することができ、ユーザは、自らが設定するパラメータβ1,β2の値に応じて、音響オブジェクトの位置が変化するときの信号振幅の変動を調整することができる。 This makes it possible to suppress signal divergence, and the user can adjust the fluctuation in signal amplitude when the position of the sound object changes according to the values of parameters β 1 and β 2 that the user sets.

また、ユーザがパラメータβ1,β2の値をβ1=β2に設定した場合、仮想音源座標rSとスピーカ座標rlとが一致するときに(rS=rl)、減衰係数g(rl,rS)=1となる。 Furthermore, if the user sets the values of the parameters β1 and β2 to β1 = β2 , when the virtual sound source coordinate rS and the speaker coordinate r1 coincide ( rS = r1 ), the attenuation coefficient g( r1 , r1 ) = 1.

このため、ユーザは、信号を不要に増大または減衰させることのないように、これらのパラメータβ1,β2の値を調整の目安とすることができる。 Therefore, the user can use the values of these parameters β 1 and β 2 as a guide for adjustment so as not to unnecessarily increase or attenuate the signal.

また、ユーザがパラメータβ1,β2の値をβ1=β2/ΔSlに設定した場合、仮想音源座標rSとスピーカ座標rlとが一致するときに(rS=rl)、減衰係数g(rl,rS)ΔSl=1、さらにはh(rl,rS)g(rl,rS)ΔSlC(θl)=1となる。h(rl,rS)=1及びwC(θl)=1だからである。 Furthermore, if the user sets the values of parameters β1 and β2 to β1 = β2 / ΔS1 , when the virtual sound source coordinate rS and the speaker coordinate r1 coincide ( rS = r1 ), the attenuation coefficient g( r1 , rS ) ΔS1 = 1, and furthermore h( r1 , rS ) g( r1 , rS ) ΔS1 wC ( θl ) = 1. This is because h( r1 , rS ) = 1 and wC ( θl ) = 1.

このため、仮想音源座標rSとスピーカ座標rlとが一致するときには、角度重み付加部13-lからスピーカ106-lへ出力される駆動信号d(rl)は、信号増幅部9-lにより増幅された信号と同じになる。つまり、スピーカ座標rlに位置するスピーカ106-lから、当該オブジェクトベース音響レンダリング装置1が入力した音源信号Sに対して増幅された信号が再生されることとなる。 Therefore, when the virtual sound source coordinate r S and the speaker coordinate r l coincide with each other, the drive signal d(r l ) output from the angle weighting unit 13-l to the speaker 106-l becomes the same as the signal amplified by the signal amplifier 9-l. In other words, the speaker 106-l located at the speaker coordinate r l reproduces an amplified signal of the sound source signal S input to the object-based acoustic rendering device 1.

このように、減衰付加部11-lが前記式(13)で表される減衰係数g(rl,rS)を用いることで、仮想音源座標rSとスピーカ座標rlとが一致した場合であっても、信号が無限大に発散することがない。このため、信号を再生できなくなるという不具合を解消することができる。 In this way, by using the attenuation coefficient g(r l , r S ) expressed by the above formula (13) in the attenuation adding unit 11-l, even if the virtual sound source coordinate r S and the speaker coordinate r l match, the signal does not diverge to infinity. This makes it possible to eliminate the problem of being unable to reproduce the signal.

〔実施例2〕
次に、実施例2のオブジェクトベース音響レンダリング装置について説明する。前述のとおり、実施例2は、実施例1の構成に対してVBAPの構成を組み込むことで、実施例1の効果に加え、スピーカ106-lが疎に配置された場合に駆動信号d(rl)が小さくなる問題を解決する。より詳細には、実施例2は、実施例1に示した単純化したWFSの一部の構成とVBAPの構成とを、角度重みに応じてシームレスに切り替えることで、駆動信号d(rl)を生成する。
Example 2
Next, an object-based acoustic rendering device according to a second embodiment will be described. As described above, the second embodiment incorporates the configuration of VBAP into the configuration of the first embodiment, thereby achieving the effects of the first embodiment and solving the problem that the drive signal d(r l ) becomes small when the speakers 106-l are sparsely arranged. More specifically, the second embodiment generates the drive signal d(r l ) by seamlessly switching between the configuration of a part of the simplified WFS shown in the first embodiment and the configuration of VBAP according to the angle weight.

一般に、WFSの音場再現手法を用いる場合、多数のスピーカ106-lを密に配置することを想定する。しかし、家庭用のオーディオにおいては、多くのスピーカ106-lを密に配置することは困難であり、スピーカ106-lを疎に配置するのが通常である。 In general, when using the WFS sound field reproduction method, it is assumed that many speakers 106-l are arranged closely together. However, in home audio, it is difficult to arrange many speakers 106-l closely together, and it is common to arrange the speakers 106-l sparsely.

図4は、スピーカ106-lが疎に配置されている場合を説明する図である。図4に示すように、再現音場において、スピーカ106-lが疎に配置されており、仮想音源104の位置(仮想音源座標rS)が音場を再現したい領域の境界面に近接した場合を想定する。 4 is a diagram for explaining a case where the speakers 106-l are sparsely arranged. As shown in FIG. 4, it is assumed that the speakers 106-l are sparsely arranged in a reproduced sound field, and the position of the virtual sound source 104 (virtual sound source coordinates r S ) is close to the boundary surface of the area where the sound field is to be reproduced.

この場合、全てのスピーカ106-l(106-1~106-L)において、仮想音源104位置からスピーカ106-l位置を結んだベクトル(rl-rS)とスピーカ106-l位置での境界面内向き法線ベクトルn(rl)との成す角θlは、90°に近い値または90°を超える値となってしまう。 In this case, in all speakers 106-l (106-1 to 106-L), the angle θ l between the vector (r l -r S ) connecting the position of the virtual sound source 104 to the position of the speaker 106-l and the inward normal vector n (r l ) of the boundary surface at the position of the speaker 106- l becomes a value close to or exceeding 90°.

このため、角度重み付加部13-lにて用いる角度重みwC(θl)は、前記式(9)から0に近い値または0となる。そして、全てのスピーカ106-lに対する駆動信号d(rl)の値が小さい値または0になってしまい、仮想音源104が境界面に近接しているにも関わらず、再生信号が小さくなるという問題が生じる。 For this reason, the angle weight w Cl ) used in the angle weighting unit 13-l becomes a value close to 0 or 0 according to the above formula (9). Then, the values of the drive signals d(r l ) for all the speakers 106-l become small or 0, which causes a problem that the reproduced signal becomes small even though the virtual sound source 104 is close to the boundary surface.

この問題を解決するため、実施例2では、図1に示した実施例1のオブジェクトベース音響レンダリング装置1において、WFSの信号分配則に対し、成す角θlに応じて連続的にVBAPの信号分配則にシームレスに切り替わるように、VBAPの構成を追加する。 In order to solve this problem, in the second embodiment, a VBAP configuration is added to the object-based acoustic rendering device 1 of the first embodiment shown in FIG. 1 so that the signal distribution law of the WFS is continuously and seamlessly switched to the VBAP signal distribution law in accordance with the angle θl .

ここで、図1に示した単純化したWFSである実施例1のオブジェクトベース音響レンダリング装置1において、HPF10-lのHPFh(rl,rS)は、周波数の補正に関する項である。また、減衰付加部11-lの減衰係数1/||rl-rS||2を、仮想音源104の位置による距離減衰に関する項、面積要素付加部12-lの面積要素ΔSlを、スピーカ106-lを離散化することによる補正に関する項であると解釈する。さらに、角度重み付加部13-lの角度重みwC(θl)を、各スピーカ106-lに対する信号の分配側に関する項であると解釈する。 Here, in the object-based acoustic rendering device 1 of the first embodiment, which is the simplified WFS shown in Fig. 1, the HPFh(r l , r S ) of the HPF 10-l is a term related to frequency correction. Also, the attenuation coefficient 1/||r l -r S || 2 of the attenuation adding unit 11-l is interpreted as a term related to distance attenuation due to the position of the virtual sound source 104, and the area element ΔS l of the area element adding unit 12-l is interpreted as a term related to correction by discretizing the speaker 106-l. Furthermore, the angle weight w Cl ) of the angle weight adding unit 13-l is interpreted as a term related to the distribution side of the signal to each speaker 106-l.

実施例2では、WFSにおける角度重み付加部13-lの角度重みwC(θl)による各スピーカ106-lに対する信号の分配則に関する項に、VBAPにより決定される各スピーカ106-lに対する信号の分配則に関する項を並列に接続する。 In the second embodiment, a term relating to the distribution law of signals for each speaker 106-l determined by VBAP is connected in parallel to a term relating to the distribution law of signals for each speaker 106- l based on the angle weight w C (θ l ) of the angle weighting unit 13-l in WFS.

図5は、実施例2のオブジェクトベース音響レンダリング装置の構成例を示すブロック図であり、図6は、実施例2のオブジェクトベース音響レンダリング装置の処理例を示す疑似コードである。 Figure 5 is a block diagram showing an example of the configuration of an object-based acoustic rendering device of the second embodiment, and Figure 6 is pseudocode showing an example of the processing of the object-based acoustic rendering device of the second embodiment.

このオブジェクトベース音響レンダリング装置2は、信号増幅部9-1~9-L、HPF10-1~10-L、減衰付加部11-1~11-L、面積要素付加部12-1~12-L、角度重み付加部13-1~13-L、VBAP係数乗算部14-1~14-L、角度重み付加部15-1~15-L、加算部16-1~16-L、角度算出部20及びVBAP係数算出部21を備えている。 This object-based acoustic rendering device 2 includes signal amplifiers 9-1 to 9-L, HPFs 10-1 to 10-L, attenuation adding units 11-1 to 11-L, surface area element adding units 12-1 to 12-L, angle weighting adding units 13-1 to 13-L, VBAP coefficient multipliers 14-1 to 14-L, angle weighting adding units 15-1 to 15-L, adders 16-1 to 16-L, an angle calculation unit 20, and a VBAP coefficient calculation unit 21.

以下、オブジェクトベース音響レンダリング装置2において、第l(エル)番目のスピーカ106-l(l番目の系統)に対応する構成部を、信号増幅部9-l、HPF10-l、減衰付加部11-l、面積要素付加部12-l、角度重み付加部13-l、VBAP係数乗算部14-l、角度重み付加部15-l及び加算部16-lとする。つまり、オブジェクトベース音響レンダリング装置2は、L系統分の信号増幅部9-l、HPF10-l、減衰付加部11-l、面積要素付加部12-l、角度重み付加部13-l、VBAP係数乗算部14-l、角度重み付加部15-l及び加算部16-lを備え、さらに、角度算出部20及びVBAP係数算出部21を備えている。 Hereinafter, in the object-based acoustic rendering device 2, the components corresponding to the lth speaker 106-l (lth system) are the signal amplifier 9-l, HPF 10-l, attenuation adding unit 11-l, area element adding unit 12-l, angle weight adding unit 13-l, VBAP coefficient multiplier 14-l, angle weight adding unit 15-l, and adder 16-l. In other words, the object-based acoustic rendering device 2 comprises signal amplifiers 9-l, HPF 10-l, attenuation adding unit 11-l, area element adding unit 12-l, angle weight adding unit 13-l, VBAP coefficient multiplier 14-l, angle weight adding unit 15-l, and adder 16-l for L systems, and further comprises an angle calculation unit 20 and a VBAP coefficient calculation unit 21.

信号増幅部9-l、HPF10-l、減衰付加部11-l、面積要素付加部12-l及び角度重み付加部13-lは、WFSの構成部である。VBAP係数乗算部14-l及び角度重み付加部15-lは、VBAPの構成部であり、WFSの角度重み付加部13-lに並列に接続されている。 The signal amplifier 9-l, HPF 10-l, attenuation adding unit 11-l, surface area element adding unit 12-l, and angle weight adding unit 13-l are components of the WFS. The VBAP coefficient multiplier 14-l and angle weight adding unit 15-l are components of the VBAP, and are connected in parallel to the angle weight adding unit 13-l of the WFS.

図1に示した実施例1のオブジェクトベース音響レンダリング装置1とこの実施例2のオブジェクトベース音響レンダリング装置2とを比較すると、両オブジェクトベース音響レンダリング装置1,2は、信号増幅部9-l、HPF10-l、減衰付加部11-l、面積要素付加部12-l、角度重み付加部13-l及び角度算出部20を備えている点で共通する。 Comparing the object-based acoustic rendering device 1 of the first embodiment shown in FIG. 1 with the object-based acoustic rendering device 2 of the second embodiment, both object-based acoustic rendering devices 1 and 2 have in common the fact that they are equipped with a signal amplifier 9-l, HPF 10-l, attenuation adding unit 11-l, surface element adding unit 12-l, angle weighting adding unit 13-l, and angle calculation unit 20.

一方、オブジェクトベース音響レンダリング装置2は、VBAP係数乗算部14-l、角度重み付加部15-l及び加算部16-l、並びにVBAP係数算出部21を備えている点で、これらの構成部を備えていないオブジェクトベース音響レンダリング装置1と相違する。 On the other hand, the object-based acoustic rendering device 2 differs from the object-based acoustic rendering device 1, which does not have these components, in that it has a VBAP coefficient multiplication unit 14-l, an angle weighting unit 15-l, an addition unit 16-l, and a VBAP coefficient calculation unit 21.

図6を参照してオブジェクトベース音響レンダリング装置2の全体処理について説明する。オブジェクトベース音響レンダリング装置2は、図2のステップS201と同様に、音源信号Sを入力すると共に、仮想音源104の仮想音源座標rSを入力する(ステップS601)。 The overall processing of the object-based acoustic rendering apparatus 2 will be described with reference to Fig. 6. As in step S201 of Fig. 2, the object-based acoustic rendering apparatus 2 inputs the sound source signal S and the virtual sound source coordinates rS of the virtual sound source 104 (step S601).

オブジェクトベース音響レンダリング装置2は、図2のステップS202と同様に、スピーカ106-lについて、スピーカ座標rl、面積要素ΔSl及び境界面内向き法線ベクトルn(rl)を入力する(ステップS602)。 As in step S202 in FIG. 2, the object-based acoustic rendering apparatus 2 inputs the speaker coordinates r l , the area element ΔS l and the boundary surface inward normal vector n(r l ) for the speaker 106-l (step S602).

オブジェクトベース音響レンダリング装置2は、図2のステップS203と同様に、スピーカ106-lについて、仮想音源座標rS及びスピーカ座標rlに基づき、HPFh(rl,rS)を設定する(ステップS603)。 The object-based acoustic rendering apparatus 2 sets HPFh(r l , r S ) for the speaker 106-l based on the virtual sound source coordinates r S and the speaker coordinates r l (step S603), similarly to step S203 in FIG.

オブジェクトベース音響レンダリング装置2は、図2のステップS204と同様に、スピーカ106-lについて、仮想音源座標rS及びスピーカ座標rlに基づき、減衰係数1/||rl-rS||2を設定する(ステップS604)。 The object-based acoustic rendering apparatus 2 sets an attenuation coefficient 1/∥r l -r S2 for the speaker 106-l based on the virtual sound source coordinates r S and the speaker coordinates r l (step S604), similarly to step S204 in FIG.

オブジェクトベース音響レンダリング装置2は、図2のステップS205と同様に、スピーカ106-lについて、仮想音源座標rS、スピーカ座標rl及び境界面内向き法線ベクトルn(rl)に基づき、成す角θlを算出する(ステップS605)。 Similar to step S205 in FIG. 2, the object-based acoustic rendering apparatus 2 calculates an angle θ l for the speaker 106- l based on the virtual sound source coordinates r s , the speaker coordinates r l and the boundary surface inward normal vector n(r l ) (step S605).

オブジェクトベース音響レンダリング装置2は、スピーカ106-lについて、成す角θlの絶対値|θl|が0°よりも大きく、かつ90°よりも小さいか否かを判定し、前記式(9)にてWFSの角度重みwC(θl)、及び以下に示す式(14)にてVBAPの角度重みwS(θl)を設定する(ステップS606)。

Figure 0007583638000017
The object-based acoustic rendering device 2 determines whether the absolute value |θ l | of the angle θ l formed by the speaker 106-l is greater than 0° and less than 90°, and sets the angle weight w Cl ) of the WFS using the above equation (9) and the angle weight w Sl ) of the VBAP using the following equation (14) (step S606).
Figure 0007583638000017

具体的には、オブジェクトベース音響レンダリング装置2は、成す角|θl|が0°よりも大きく、かつ90°よりも小さいと判定した場合(前記式(9)(14)ではcosθl>0の場合)、角度重みwC(θl)=cosθl及び角度重みwS(θl)=|1-cosθl|を設定する。一方、オブジェクトベース音響レンダリング装置2は、成す角|θl|が0°以下であるか、または90°以上であると判定した場合(前記式(9)(14)ではcosθl>0以外の場合)、角度重みwC(θl)=0及び角度重みwS(θl)=0を設定する。この角度重みwC(θl)は角度重み付加部13-lにより用いられ、角度重みwS(θl)は、角度重み付加部15-lにて用いられる。 Specifically, when the object-based sound rendering device 2 determines that the formed angle |θ l | is greater than 0° and less than 90° (when cos θ l > 0 in the above formulas (9) and (14)), it sets the angle weight w Cl ) = cos θ l and the angle weight w Sl ) = |1 - cos θ l |. On the other hand, when the object-based sound rendering device 2 determines that the formed angle |θ l | is less than or equal to 0° or greater than or equal to 90° (when other than cos θ l > 0 in the above formulas (9) and (14)), it sets the angle weight w Cl ) = 0 and the angle weight w Sl ) = 0. This angle weight w Cl ) is used by the angle weight adding unit 13-l, and the angle weight w Sl ) is used by the angle weight adding unit 15-l.

角度重みwC(θl)は、0から1までの範囲の値をとり、成す角|θl|が0°<|θl|<90°の範囲において、成す角|θl|が0°に近いほど1(cosθl)に近い値をとり、90°に近いほど0に近い値をとり、成す角|θl|が|θl|≦0°または90°≦|θl|の範囲において、0の値をとる。 The angle weight wC ( θl ) takes a value in the range from 0 to 1. When the angle | θl | is in the range of 0°<| θl |<90°, the closer the angle | θl | is to 0°, the closer it is to 1 (cos θl ), and the closer it is to 90°, the closer it is to 0. When the angle | θl | is in the range of | θl |≦0° or 90°≦| θl |, the angle weight wC(θl) takes a value of 0.

角度重みwS(θl)は、成す角|θl|が0°<|θl|<90°の範囲において、成す角|θl|が0°に近いほど0に近い値をとり、90°に近いほど1(|1-cosθl|)に近い値をとり、成す角|θl|が|θl|≦0°または90°≦|θl|の範囲において、0の値をとる。 The angle weight w Sl ) takes a value closer to 0 as the angle |θ l | is closer to 0° when the angle |θ l | is in the range of 0°<|θ l |<90°, and takes a value closer to 1 (|1-cos θ l |) as the angle |θ l | is closer to 90°, and takes a value of 0 when the angle |θ l | is in the range of |θ l |≦0° or 90°≦|θ l |.

オブジェクトベース音響レンダリング装置2は、所定の受音点(聴取者の位置)から仮想音源座標rSへの仮想音源方向の単位ベクトル及び全てのスピーカ106-lにおける所定の受音点からスピーカ座標rlへのスピーカ方向の単位ベクトルに基づいて、仮想音源104を内部に含む3つのスピーカをVBAP対象の3つのスピーカ106-n1,106-n2,106-n3として特定する。 The object-based acoustic rendering device 2 identifies three speakers that include the virtual sound source 104 therein as three VBAP target speakers 106- n1 , 106-n2, 106-n3 based on the unit vector of the virtual sound source direction from a specific sound receiving point (listener's position) to the virtual sound source coordinate r S and the unit vector of the speaker direction from a specific sound receiving point in all speakers 106-l to the speaker coordinate r l .

そして、オブジェクトベース音響レンダリング装置2は、VBAP対象の3つのスピーカ106-n1,106-n2,106-n3におけるスピーカ方向の単位ベクトルrn1,rn2,rn3を取得する(ステップS607)。単位ベクトルrn1,rn2,rn3は、所定の受音点及びスピーカ106-n1,106-n2,106-n3の座標(スピーカ座標)に基づいて、それぞれ取得することができる。n1,n2,n3は、VBAP対象の3つのスピーカ106-n1,106-n2,106-n3のインデックスである。 The object-based acoustic rendering device 2 then obtains unit vectors r n1 , r n2 , and r n3 in the speaker directions of the three speakers 106-n1, 106-n2, and 106-n3 targeted for VBAP (step S607). The unit vectors r n1 , r n2 , and r n3 can be obtained based on the coordinates (speaker coordinates) of the predetermined sound receiving point and the speakers 106-n1, 106-n2, and 106-n3, respectively. n1, n2, and n3 are indexes of the three speakers 106-n1, 106-n2, and 106-n3 targeted for VBAP.

オブジェクトベース音響レンダリング装置2は、仮想音源座標rSへの仮想音源方向の単位ベクトル及びスピーカ方向の単位ベクトルrn1,rn2,rn3に基づいて、以下の式にてスピーカ106-n1,106-n2,106-n3に対応する係数gl=gn1,gn2,gn3を算出する(ステップS608)。

Figure 0007583638000018
前記式(15)のrnSは、仮想音源座標rSへの仮想音源方向の単位ベクトルである。 The object-based acoustic rendering device 2 calculates coefficients g l = g n1 , g n2 , g n3 corresponding to speakers 106-n1, 106-n2, 106-n3 using the following formula based on the unit vector of the virtual sound source direction to the virtual sound source coordinate r S and the unit vectors r n1 , r n2 , r n3 of the speaker directions (step S608).
Figure 0007583638000018
In the above equation (15), r nS is a unit vector of the virtual sound source direction to the virtual sound source coordinate r S .

また、オブジェクトベース音響レンダリング装置2は、スピーカ106-1~106-Lのうちスピーカ106-n1,106-n2,106-n3以外のスピーカ106-lの係数gl=0を設定する。これらの係数gl=gn1,gn2,gn3,0は、VBAP係数算出部21により算出及び設定される。 Furthermore, the object-based acoustic rendering device 2 sets the coefficient g l of the speaker 106-l other than the speakers 106-n1, 106-n2, and 106-n3 among the speakers 106-1 to 106-L to 0. These coefficients g l =g n1 , g n2 , g n3 , and 0 are calculated and set by the VBAP coefficient calculation unit 21.

オブジェクトベース音響レンダリング装置2は、インデックスがl=n1,n2,n3のスピーカ106-n1,106-n2,106-n3について、定数u(例えばu=1/2π)、ステップS601にて入力した音源信号S及び仮想音源座標rS、ステップS602にて入力したスピーカ座標rl及び面積要素ΔSl、ステップS603にて設定したHPFh(rl,rS)、ステップS604にて設定した減衰係数1/||rl-rS||2及びステップS606にて設定した角度重みwC(θl)及び角度重みwS(θl)に基づき、以下の式にて駆動信号d(rl)を算出し出力する(ステップS609)。

Figure 0007583638000019
For the speakers 106-n1, 106-n2, and 106-n3 with indexes l=n1, n2, and n3, the object-based acoustic rendering device 2 calculates and outputs a drive signal d(r l ) using the following equation based on a constant u (for example, u=1/2π), the sound source signal S and virtual sound source coordinates r S input in step S601, the speaker coordinates r l and area element ΔS l input in step S602, the HPFh(r l , r S ) set in step S603, the attenuation coefficient 1/||r l -r S || 2 set in step S604, and the angle weights w Cl ) and w Sl ) set in step S606 (step S609).
Figure 0007583638000019

この式において、係数gl=gn1,gn2,gn3である。また、*は畳み込みを表す。駆動信号d(rl)は、信号増幅部9-l、HPF10-l、減衰付加部11-l、面積要素付加部12-l、角度重み付加部13-l、VBAP係数乗算部14-l、角度重み付加部15-l及び加算部16-lにより算出される。 In this formula, the coefficients g l = g n1 , g n2 , g n3 . * indicates convolution. The drive signal d(r l ) is calculated by a signal amplifier 9-l, HPF 10-l, attenuation adding unit 11-l, surface area element adding unit 12-l, angle weighting adding unit 13-l, VBAP coefficient multiplier 14-l, angle weighting adding unit 15-l, and adder 16-l.

一方、オブジェクトベース音響レンダリング装置2は、インデックスがl=n1,n2,n3以外について、すなわちスピーカ106-n1,106-n2,106-n3以外のスピーカ106-lについて、定数u、音源信号S、仮想音源座標rS、スピーカ座標rl及び面積要素ΔSl、HPFh(rl,rS)、減衰係数1/||rl-rS||2及び角度重みwC(θl)に基づき、以下の式にて駆動信号d(rl)を算出し出力する(ステップS610)。

Figure 0007583638000020
この式(17)は、前記式(10)と同じである。 On the other hand, for indexes other than l=n1, n2, n3, i.e., for speakers 106-l other than speakers 106-n1, 106-n2, 106-n3, the object-based acoustic rendering device 2 calculates and outputs a drive signal d(r l ) using the following formula based on the constant u, sound source signal S, virtual sound source coordinates r S , speaker coordinates r l and area element ΔS l , HPFh(r l , r S ), attenuation coefficient 1/||r l -r S || 2 and angle weighting w Cl ) (step S610).
Figure 0007583638000020
This formula (17) is the same as the above formula (10).

この駆動信号d(rl)は、信号増幅部9-l、HPF10-l、減衰付加部11-l、面積要素付加部12-l及び角度重み付加部13-lにより算出される。 This drive signal d(r l ) is calculated by a signal amplifier 9-l, HPF 10-l, attenuation adding section 11-l, surface area element adding section 12-l and angle weighting section 13-l.

次に、図5を参照してオブジェクトベース音響レンダリング装置2の構成部の処理について説明する。信号増幅部9-l(9-1~9-L)、HPF10-l(10-1~10-L)、減衰付加部11-l(11-1~11-L)、面積要素付加部12-l(12-1~12-L)、角度重み付加部13-l(13-1~13-L)及び角度算出部20は、図1に示した構成部と同じであるため、説明を省略する。 Next, the processing of the components of the object-based acoustic rendering device 2 will be described with reference to Figure 5. The signal amplifier 9-l (9-1 to 9-L), HPF 10-l (10-1 to 10-L), attenuation adding unit 11-l (11-1 to 11-L), area element adding unit 12-l (12-1 to 12-L), angle weight adding unit 13-l (13-1 to 13-L) and angle calculation unit 20 are the same as the components shown in Figure 1, so their description will be omitted.

ここで、角度重み付加部13-lは、成す角θlを反映したWFSの駆動信号を第1駆動信号として、対応する加算部16-lに出力する。角度算出部20は、成す角θlを、対応する角度重み付加部13-l及び角度重み付加部15-lに出力する。 Here, the angle weighting unit 13-l outputs the WFS drive signal reflecting the formed angle θ l as a first drive signal to the corresponding adding unit 16-l. The angle calculation unit 20 outputs the formed angle θ l to the corresponding angle weighting unit 13-l and angle weighting unit 15-l.

VBAP係数算出部21は、仮想音源座標rS及びスピーカ座標r1~rLを入力する。そして、VBAP係数算出部21は、ステップS607,S608のとおり、所定の受音点から仮想音源座標rSへの仮想音源方向の単位ベクトル及び全てのスピーカ106-1~106-Lにおける所定の受音点からスピーカ座標r1~rLへのスピーカ方向の単位ベクトルに基づいて、仮想音源104を内部に含むVBAP対象の3つのスピーカ106-n1,106-n2,106-n3に対応する係数gn1,gn2,gn3を算出する。 The VBAP coefficient calculation unit 21 inputs the virtual sound source coordinate r S and the speaker coordinates r 1 to r L. Then, as in steps S607 and S608, the VBAP coefficient calculation unit 21 calculates coefficients g n1 , g n2 , and g n3 corresponding to the three speakers 106- n1 , 106-n2, and 106-n3 that are VBAP targets and include the virtual sound source 104 therein, based on the unit vector of the virtual sound source direction from a predetermined sound receiving point to the virtual sound source coordinate r S and the unit vectors of the speaker directions from predetermined sound receiving points in all the speakers 106-1 to 106-L to the speaker coordinates r 1 to r L.

VBAP係数算出部21は、係数gl=gn1,gn2,gn3を、スピーカ106-n1,106-n2,106-n3に対応するVBAP係数乗算部14-n1,14-n2,14-n3にそれぞれ出力する。また、VBAP係数算出部21は、係数gl=0を、スピーカ106-n1,106-n2,106-n3以外のスピーカ106-lに対応するVBAP係数乗算部14-lにそれぞれ出力する。 The VBAP coefficient calculation unit 21 outputs the coefficients g l =g n1 , g n2 , g n3 to the VBAP coefficient multiplication units 14-n1, 14-n2, 14-n3 corresponding to the speakers 106-n1, 106-n2, 106-n3, respectively. Also, the VBAP coefficient calculation unit 21 outputs the coefficient g l =0 to the VBAP coefficient multiplication unit 14-l corresponding to the speaker 106-l other than the speakers 106-n1, 106-n2, 106-n3.

図7は、VBAP係数算出部21の構成例を示すブロック図である。このVBAP係数算出部21は、スピーカ決定部31及び算出部32を備えている。スピーカ決定部31は、仮想音源座標rS及び全てのスピーカ106-1~106-Lのスピーカ座標r1~rLを入力する。そして、スピーカ決定部31は、仮想音源座標rS及びスピーカ座標r1~rLに基づいて、仮想音源104を内部に含むVBAP対象の3つのスピーカ106-n1,106-n2,106-n3を特定する。 7 is a block diagram showing an example of the configuration of the VBAP coefficient calculation unit 21. This VBAP coefficient calculation unit 21 includes a speaker determination unit 31 and a calculation unit 32. The speaker determination unit 31 inputs the virtual sound source coordinate r S and the speaker coordinates r 1 to r L of all the speakers 106-1 to 106-L. Then, the speaker determination unit 31 specifies three speakers 106-n1, 106-n2, and 106-n3 that are VBAP targets and include the virtual sound source 104 therein, based on the virtual sound source coordinates r S and the speaker coordinates r 1 to r L.

スピーカ決定部31は、VBAP対象の3つのスピーカ106-n1,106-n2,106-n3におけるスピーカ方向の単位ベクトルrn1,rn2,rn3を取得し、仮想音源座標rS及びスピーカ方向の単位ベクトルrn1,rn2,rn3を算出部32に出力する。 The speaker determination unit 31 acquires unit vectors r n1 , r n2 , r n3 of the speaker directions for the three speakers 106-n1, 106-n2, 106-n3 that are VBAP targets, and outputs the virtual sound source coordinates r S and the unit vectors r n1 , r n2 , r n3 of the speaker directions to the calculation unit 32.

算出部32は、スピーカ決定部31から仮想音源座標rS及びスピーカ方向の単位ベクトルrn1,rn2,rn3を入力する。そして、算出部32は、仮想音源座標rSへの仮想音源方向の単位ベクトル及びスピーカ方向の単位ベクトルrn1,rn2,rn3に基づいて、前記式(15)にてスピーカ106-n1,106-n2,106-n3に対応する係数gn1,gn2,gn3を算出する。そして、算出部32は、係数gn1,gn2,gn3を、対応するVBAP係数乗算部14-n1,14-n2,14-n3に出力する。 The calculation unit 32 inputs the virtual sound source coordinate r S and the unit vectors r n1 , r n2 , r n3 of the speaker direction from the speaker determination unit 31. Then, the calculation unit 32 calculates the coefficients g n1 , g n2 , g n3 corresponding to the speakers 106-n1, 106-n2, 106- n3 using the above formula (15) based on the unit vector of the virtual sound source direction to the virtual sound source coordinate r S and the unit vectors r n1 , r n2 , r n3 of the speaker direction. Then, the calculation unit 32 outputs the coefficients g n1 , g n2 , g n3 to the corresponding VBAP coefficient multiplication units 14-n1, 14-n2, 14-n3.

また、算出部32は、スピーカ106-n1,106-n2,106-n3以外のスピーカ106-lに対応する係数gl=0を設定し、対応するVBAP係数乗算部14-lに出力する。 Furthermore, the calculation unit 32 sets the coefficient g l =0 corresponding to the speaker 106-l other than the speakers 106-n1, 106-n2, and 106-n3, and outputs it to the corresponding VBAP coefficient multiplication unit 14-l.

図5に戻って、VBAP係数乗算部14-l(14-1~14-L)は、VBAP係数算出部21から係数gl(gn1,gn2,gn3,0のうちのいずれかの値)を入力する。そして、VBAP係数乗算部14-lは、面積要素付加部12-lから面積要素が付加された信号を入力し、当該信号に対し係数glを乗算することで、係数glを反映した信号を生成する。 5, VBAP coefficient multiplication unit 14-l (14-1 to 14-L) receives coefficient g l (any value of g n1 , g n2 , g n3 , or 0) from VBAP coefficient calculation unit 21. Then, VBAP coefficient multiplication unit 14-l receives a signal to which an area element has been added from area element addition unit 12-l, and multiplies the signal by coefficient g l to generate a signal that reflects coefficient g l .

VBAP係数乗算部14-lは、係数glを反映した信号を角度重み付加部15-lに出力する。 The VBAP coefficient multiplier 14-l outputs a signal reflecting the coefficient g l to the angle weighting unit 15-l.

角度重み付加部15-l(15-1~15-L)は、角度算出部20から成す角θl(θ1~θL)を入力し、成す角θlに基づいて、ステップS606のとおり、前記式(14)にて角度重みwS(θl)を設定する。そして、角度重み付加部15-lは、VBAP係数乗算部14-lから係数glを反映した信号を入力し、当該信号に対し角度重みwS(θl)を乗算することで、成す角θlを反映した信号を生成する。 Angle weighting unit 15-l (15-1 to 15-L) receives angle θ l1 to θ L ) from angle calculation unit 20, and sets angle weight w Sl ) in equation (14) based on the angle θ l as in step S606. Then, angle weighting unit 15-l receives a signal reflecting coefficient g l from VBAP coefficient multiplication unit 14-l, and multiplies the signal by angle weight w Sl ) to generate a signal reflecting angle θ l .

仮想音源104を内部に含む3つスピーカ106-n1,106-n2,106-n3に対応する角度重み付加部15-n1,15-n2,15-n3において、成す角θlを反映した信号は、成す角θlが90°に近いほど、係数glを反映した信号に近くなる。一方、成す角θlを反映した音源信号Sは、成す角θlが0°に近いほど、0に近い信号となる。また、仮想音源104を内部に含む3つスピーカ106-n1,106-n2,106-n3以外のスピーカ106-lに対応する角度重み付加部15-lにおいて、成す角θlを反映した信号は0である。 In the angle weighting units 15-n1, 15-n2, and 15-n3 corresponding to the three speakers 106-n1, 106-n2, and 106-n3 including the virtual sound source 104, the signal reflecting the angle θ l becomes closer to the signal reflecting the coefficient g l as the angle θ l becomes closer to 90°. On the other hand, the sound source signal S reflecting the angle θ l becomes closer to 0 as the angle θ l becomes closer to 0°. Also, in the angle weighting units 15-l corresponding to the speakers 106-l other than the three speakers 106-n1, 106-n2, and 106-n3 including the virtual sound source 104, the signal reflecting the angle θ l is 0.

角度重み付加部15-lは、成す角θlを反映した信号を第2駆動信号として加算部16-lに出力する。 The angle weighting section 15-l outputs a signal reflecting the formed angle θ l to the adding section 16-l as a second drive signal.

加算部16-l(16-1~16-L)は、角度重み付加部13-lから成す角θlを反映した第1駆動信号を入力すると共に、角度重み付加部15-lから成す角θlを反映した第2駆動信号を入力する。そして、加算部16-lは、成す角θlを反映した第1駆動信号及び成す角θlを反映した第2駆動信号を加算し、加算結果を駆動信号d(rl)としてスピーカ106-lへ出力する。 The adder 16-l (16-1 to 16-L) receives the first drive signal reflecting the angle θ l from the angle weighting unit 13-l, and receives the second drive signal reflecting the angle θ l from the angle weighting unit 15-l. The adder 16-l then adds the first drive signal reflecting the angle θ l and the second drive signal reflecting the angle θ l , and outputs the addition result as a drive signal d( r l ) to the speaker 106-l.

以上のように、実施例2のオブジェクトベース音響レンダリング装置2によれば、実施例1のWFSの構成に対してVBAPの構成を組み込み、WFSの一部の構成とVBAPの構成とを、角度重みに応じてシームレスに切り替えることで、駆動信号d(rl)を生成するようにした。 As described above, according to the object-based acoustic rendering device 2 of the second embodiment, the VBAP configuration is incorporated into the WFS configuration of the first embodiment, and a drive signal d(r l ) is generated by seamlessly switching between a part of the WFS configuration and the VBAP configuration according to the angle weighting.

具体的には、VBAP係数算出部21は、所定の受音点から仮想音源座標rSへの仮想音源方向の単位ベクトル及びスピーカ座標r1~rLへのスピーカ方向の単位ベクトルに基づいて、仮想音源104を内部に含む3つのスピーカ106-n1,106-n2,106-n3に対応する係数gn1,gn2,gn3を算出する。 Specifically, the VBAP coefficient calculation unit 21 calculates coefficients g n1 , g n2 , and g n3 corresponding to the three speakers 106-n1, 106-n2, and 106-n3 that include the virtual sound source 104 therein, based on the unit vector of the virtual sound source direction from a specified sound receiving point to the virtual sound source coordinate r S and the unit vectors of the speaker directions to the speaker coordinates r 1 to r L.

VBAP係数乗算部14-lは、VBAP係数算出部21から係数gl(gn1,gn2,gn3,0のうちのいずれかの値)を入力する。そして、VBAP係数乗算部14-lは、信号増幅部9-l、HPF10-l、減衰付加部11-l及び面積要素付加部12-lにより得られた信号に係数glを乗算することで、係数glを反映した信号を生成する。 The VBAP coefficient multiplication unit 14-l inputs a coefficient g l (any value of g n1 , g n2 , g n3 , or 0) from the VBAP coefficient calculation unit 21. Then, the VBAP coefficient multiplication unit 14-l multiplies the signal obtained by the signal amplification unit 9-l, HPF 10-l, attenuation addition unit 11-l, and area element addition unit 12-l by the coefficient g l to generate a signal reflecting the coefficient g l .

角度重み付加部15-lは、成す角θlに基づいて、前記式(14)にて角度重みwS(θl)を設定する。そして、角度重み付加部15-lは、係数glを反映した信号に角度重みwS(θl)を乗算することで、成す角θlを反映した第2駆動信号を生成する。 The angle weighting unit 15-l sets the angle weight w Sl ) in the above formula (14) based on the formed angle θ l . Then, the angle weighting unit 15-l generates a second drive signal that reflects the formed angle θ l by multiplying the signal that reflects the coefficient g l by the angle weight w Sl ).

加算部16-lは、信号増幅部9-l、HPF10-l、減衰付加部11-l、面積要素付加部12-l及び角度重み付加部13-lからなるWFSの処理により得られた、成す角θlを反映した第1駆動信号、及び、成す角θlを反映した第2駆動信号を加算し、加算結果を駆動信号d(rl)としてスピーカ106-lへ出力する。 The adder 16-l adds together a first drive signal reflecting the angle θ l and a second drive signal reflecting the angle θ l obtained by processing the WFS consisting of the signal amplifier 9-l, the HPF 10-l, the attenuation adding unit 11-l, the surface element adding unit 12- l and the angle weighting adding unit 13-l, and outputs the addition result as a drive signal d(r l ) to the speaker 106-l.

このように、角度重みwS(θl)を用いる角度重み付加部15-lは、係数glを用いるVBAP係数乗算部14-lに対して直列に接続され、VBAPのVBAP係数乗算部14-l及び角度重み付加部15-lは、WFSの角度重み付加部13-lに並列に接続される。そして、角度重み付加部13-lに用いる角度重みwC(θl)と角度重み付加部15-lに用いる角度重みwS(θl)とは、0~1の範囲においてトレードオフの関係にある。 In this way, the angle weighting unit 15-l using the angle weight w Sl ) is connected in series to the VBAP coefficient multiplier 14-l using the coefficient g l , and the VBAP coefficient multiplier 14-l and angle weighting unit 15-l of the VBAP are connected in parallel to the angle weighting unit 13-l of the WFS. The angle weight w Cl ) used in the angle weighting unit 13-l and the angle weight w Sl ) used in the angle weighting unit 15-l are in a trade-off relationship in the range of 0 to 1.

このため、仮想音源104の位置(仮想音源座標rS)がスピーカ106-lの境界面から離れており、成す角θlが0°に近づいている場合には、角度重みwC(θl)は1に近い大きい値となるが、角度重みwS(θl)は0に近い小さい値となる。この場合、駆動信号d(rl)は、WFSによる分配側が支配的となる。 For this reason, when the position of the virtual sound source 104 (virtual sound source coordinate r S ) is away from the boundary surface of the speaker 106-l and the angle θ l formed therewith is close to 0°, the angle weight w Cl ) becomes a large value close to 1, but the angle weight w Sl ) becomes a small value close to 0. In this case, the distribution side by the WFS becomes dominant in the drive signal d(r l ).

一方、仮想音源104の位置(仮想音源座標rS)がスピーカ106-lの境界面に近接し、成す角θlが90°に近づいている場合には、角度重みwC(θl)は0に近い小さい値となるが、角度重みwS(θl)は1に近い大きい値となる。この場合、駆動信号d(rl)は、VBAPによる分配側が支配的となる。 On the other hand, when the position of the virtual sound source 104 (virtual sound source coordinate r S ) is close to the boundary surface of the speaker 106-l and the formed angle θ l is close to 90°, the angle weight w Cl ) is a small value close to 0, but the angle weight w Sl ) is a large value close to 1. In this case, the distribution side by VBAP becomes dominant in the drive signal d (r l ).

つまり、スピーカ106-lに対する仮想音源104の位置に応じて、WFSによる分配側とVBAPによる分配側とが、連続的にシームレスに切り替わるようになる。 In other words, depending on the position of the virtual sound source 104 relative to the speaker 106-l, the distribution side based on WFS and the distribution side based on VBAP are switched continuously and seamlessly.

したがって、実施例2のオブジェクトベース音響レンダリング装置2では、実施例1と同様の効果を奏することができる。また、スピーカ106-lが疎に配列された環境において、仮想音源104の位置(仮想音源座標rS)がスピーカ106-lの境界面に近接し、成す角θl が大きくなるにつれてWFSの角度重みは小さく、VBAPの角度重みが大きくなり、連続的にレンダリング則が切り替わる。このため、WFSの角度重みが小さくなることに起因し、再生信号が小さくなる場合でもVBAPの角度重みでそれを補填することで、再生信号が極端に小さくなるという問題を解決することができる。 Therefore, the object-based sound rendering device 2 of the second embodiment can achieve the same effect as that of the first embodiment. In an environment in which the speakers 106-l are sparsely arranged, as the position of the virtual sound source 104 (virtual sound source coordinate r S ) approaches the boundary surface of the speakers 106-l and the angle θ l formed increases, the angle weight of the WFS decreases and the angle weight of the VBAP increases, and the rendering rule is switched continuously. Therefore, even if the playback signal becomes small due to the decrease in the angle weight of the WFS, the problem of the playback signal becoming extremely small can be solved by compensating for it with the angle weight of the VBAP.

尚、実施例2のオブジェクトベース音響レンダリング装置2のHPF10-l(10-1~10-L)は、図1に示した実施例1と同様に、jk||rl-rS||+1を、前記式(12)のHPF係数hn(rl,rS)を用いた前記式(11)のハイパスフィルタに置き換えて使用するようにしてもよい。 The HPF 10-l (10-1 to 10-L) of the object-based acoustic rendering device 2 of the second embodiment may be used by replacing jk∥r l -r S ∥+1 with the high-pass filter of the above formula (11) using the HPF coefficient h n (r l , r S ) of the above formula (12), as in the first embodiment shown in FIG.

また、実施例2のオブジェクトベース音響レンダリング装置2の減衰付加部11-l(11-1~11-L)は、図1に示した実施例1と同様に、減衰係数1/||rl-rS||2の代わりに、前記式(13)の減衰係数g(rl,rS)を用いるようにしてもよい。つまり、減衰付加部11-lは、減衰係数g(rl,rS)を用いて、仮想音源104とスピーカ106-lとの間の距離に応じて減衰した信号を生成する。 Also, the attenuation adding unit 11-l (11-1 to 11-L) of the object-based acoustic rendering device 2 of the second embodiment may use the attenuation coefficient g(r l , r S ) of the above formula (13) instead of the attenuation coefficient 1/∥r l -r S2 , as in the first embodiment shown in Fig. 1. In other words, the attenuation adding unit 11-l uses the attenuation coefficient g(r l , r S ) to generate a signal attenuated according to the distance between the virtual sound source 104 and the speaker 106-l.

〔実施例3〕
次に、実施例3について説明する。前述のとおり、実施例3は、実施例2と同様に、実施例1の構成に対してVBAPの構成を組み込むことで、実施例1の効果に加え、スピーカ106-lが疎に配置された場合に駆動信号d(rl)が小さくなる問題を解決する。より詳細には、実施例3は、実施例1に示した単純化したWFSの全体の構成とVBAPの構成とを、角度重みに応じてシームレスに切り替えることで、駆動信号d(rl)を生成する。
Example 3
Next, a third embodiment will be described. As described above, in the third embodiment, similar to the second embodiment, the VBAP configuration is incorporated into the configuration of the first embodiment, thereby achieving the effects of the first embodiment and solving the problem that the drive signal d(r l ) becomes small when the speakers 106-l are sparsely arranged. More specifically, the third embodiment generates the drive signal d(r l ) by seamlessly switching between the entire simplified WFS configuration shown in the first embodiment and the VBAP configuration according to the angle weighting.

図8は、実施例3のオブジェクトベース音響レンダリング装置の構成例を示すブロック図であり、図9は、実施例3のオブジェクトベース音響レンダリング装置の処理例を示す疑似コードである。 Figure 8 is a block diagram showing an example of the configuration of an object-based acoustic rendering device of the third embodiment, and Figure 9 is pseudocode showing an example of the processing of the object-based acoustic rendering device of the third embodiment.

このオブジェクトベース音響レンダリング装置3は、信号増幅部9-1~9-L、HPF10-1~10-L、減衰付加部11-1~11-L、面積要素付加部12-1~12-L、角度重み付加部13-1~13-L、VBAP係数乗算部14-1~14-L、角度重み付加部15-1~15-L、加算部16-1~16-L、角度算出部20及びVBAP係数算出部21を備えている。 This object-based acoustic rendering device 3 includes signal amplifiers 9-1 to 9-L, HPFs 10-1 to 10-L, attenuation adding units 11-1 to 11-L, surface area element adding units 12-1 to 12-L, angle weighting adding units 13-1 to 13-L, VBAP coefficient multipliers 14-1 to 14-L, angle weighting adding units 15-1 to 15-L, adders 16-1 to 16-L, an angle calculation unit 20, and a VBAP coefficient calculation unit 21.

信号増幅部9-l、HPF10-l、減衰付加部11-l、面積要素付加部12-l及び角度重み付加部13-lは、WFSの構成部であり、VBAP係数乗算部14-l及び角度重み付加部15-lは、VBAPの構成部である。WFSの構成部とVBAPの構成部とは、当該オブジェクトベース音響レンダリング装置3全体として、並列に接続されている。 The signal amplifier 9-l, HPF 10-l, attenuation adding unit 11-l, surface element adding unit 12-l and angle weight adding unit 13-l are components of the WFS, and the VBAP coefficient multiplier 14-l and angle weight adding unit 15-l are components of the VBAP. The components of the WFS and the components of the VBAP are connected in parallel as the object-based acoustic rendering device 3 as a whole.

図2に示した実施例2のオブジェクトベース音響レンダリング装置2とこの実施例3のオブジェクトベース音響レンダリング装置3とを比較すると、両オブジェクトベース音響レンダリング装置2,3は、同一の構成部を備えている点で共通する。 When comparing the object-based acoustic rendering device 2 of the second embodiment shown in FIG. 2 with the object-based acoustic rendering device 3 of the third embodiment, both object-based acoustic rendering devices 2 and 3 have the same components in common.

一方、オブジェクトベース音響レンダリング装置3は、VBAPの構成部であるVBAP係数乗算部14-l及び角度重み付加部15-lが、WFSの全体の構成部と並列に接続されている点で、WFSの一部の角度重み付加部13-lのみと並列に接続されているオブジェクトベース音響レンダリング装置2と相違する。 On the other hand, the object-based acoustic rendering device 3 differs from the object-based acoustic rendering device 2 in that the VBAP coefficient multiplication unit 14-l and the angle weighting unit 15-l, which are components of the VBAP, are connected in parallel to the entire components of the WFS, whereas the object-based acoustic rendering device 3 is connected in parallel to only a part of the WFS, the angle weighting unit 13-l.

図9を参照してオブジェクトベース音響レンダリング装置3の全体処理について説明する。図9に示すステップS901~S908の処理は、図6に示した実施例2のオブジェクトベース音響レンダリング装置2によるステップS601~S608の処理と同じであるため、ここでは説明を省略する。 The overall processing of the object-based acoustic rendering device 3 will be described with reference to FIG. 9. The processing of steps S901 to S908 shown in FIG. 9 is the same as the processing of steps S601 to S608 by the object-based acoustic rendering device 2 of the second embodiment shown in FIG. 6, so a description thereof will be omitted here.

オブジェクトベース音響レンダリング装置3は、ステップS907にて取得したスピーカ座標rlのインデックスがl=n1,n2,n3の場合、スピーカ106-n1,106-n2,106-n3について、定数u(例えばu=1/2π)、ステップS901にて入力した音源信号S及び仮想音源座標rS、ステップS902にて入力したスピーカ座標rl及び面積要素ΔSl、ステップS903にて設定したHPFh(rl,rS)、ステップS904にて設定した減衰係数1/||rl-rS||2及びステップS906にて設定した角度重みwC(θl)及び角度重みwS(θl)に基づき、以下の式にて駆動信号d(rl)を算出し出力する(ステップS909)。

Figure 0007583638000021
When the index of the speaker coordinate r l obtained in step S907 is l = n1, n2, n3, the object-based acoustic rendering device 3 calculates and outputs a drive signal d(r l ) for the speakers 106-n1, 106-n2, 106-n3 using the following equation based on the constant u (e.g., u = 1/2π), the sound source signal S and virtual sound source coordinate r S input in step S901, the speaker coordinate r l and area element ΔS l input in step S902, the HPFh(r l , r S ) set in step S903, the attenuation coefficient 1/|| r l -r S || 2 set in step S904, and the angle weight w Cl ) and angle weight w Sl ) set in step S906 (step S909).
Figure 0007583638000021

この式において、係数gl=gn1,gn2,gn3である。また、*は畳み込みを表す。駆動信号d(rl)は、信号増幅部9-l、HPF10-l、減衰付加部11-l、面積要素付加部12-l、角度重み付加部13-l、VBAP係数乗算部14-l、角度重み付加部15-l及び加算部16-lにより算出される。 In this formula, the coefficients g l = g n1 , g n2 , g n3 . * indicates convolution. The drive signal d(r l ) is calculated by a signal amplifier 9-l, HPF 10-l, attenuation adding unit 11-l, surface area element adding unit 12-l, angle weighting adding unit 13-l, VBAP coefficient multiplier 14-l, angle weighting adding unit 15-l, and adder 16-l.

一方、オブジェクトベース音響レンダリング装置3は、インデックスがl=n1,n2,n3以外の場合、スピーカ106-n1,106-n2,106-n3以外のスピーカ106-lについて、定数u、音源信号S、仮想音源座標rS、スピーカ座標rl及び面積要素ΔSl、HPFh(rl,rS)、減衰係数1/||rl-rS||2及び角度重みwC(θl)に基づき、以下の式にて駆動信号d(rl)を算出し出力する(ステップS910)。

Figure 0007583638000022
この式(19)は、前記式(10)及び前記式(17)と同じである。 On the other hand, when the index is other than l=n1, n2, n3, the object-based acoustic rendering device 3 calculates and outputs a drive signal d(r l ) for each speaker 106-l other than speakers 106-n1, 106-n2, 106-n3 based on the constant u, sound source signal S, virtual sound source coordinate r S , speaker coordinate r l and area element ΔS l , HPFh(r l , r S ), attenuation coefficient 1/||r l -r S || 2 and angle weight w C ( θ l ) using the following formula (step S910).
Figure 0007583638000022
This formula (19) is the same as the above formulas (10) and (17).

この駆動信号d(rl)は、信号増幅部9-l、HPF10-l、減衰付加部11-l、面積要素付加部12-l及び角度重み付加部13-lにより算出される。 This drive signal d(r l ) is calculated by a signal amplifier 9-l, HPF 10-l, attenuation adding section 11-l, surface area element adding section 12-l and angle weighting section 13-l.

尚、前記式(18)の演算において、右辺の第1項であるWFSの構成による演算結果と、第2項であるVBAPの構成による演算結果とは、フィルタリングにより遅延が生じる。このため、角度重み付加部13-l,15-lにおいて、VBAP側にも位相を調整するための遅延を加える必要があるが、ここではその表記は省略する。 In the calculation of equation (18), a delay occurs due to filtering between the calculation result of the WFS configuration, which is the first term on the right side, and the calculation result of the VBAP configuration, which is the second term. For this reason, it is necessary to add a delay to the VBAP side in order to adjust the phase in the angle weighting units 13-l and 15-l, but this will not be shown here.

また、前記式(18)及び前記式(19)において、畳み込み*は、FFT(Fast Fourier Transform:高速フーリエ変換)を利用し、周波数領域での積を逆変換して求めるようにしてもよい。前記式(16)及び前記式(17)についても同様である。 In addition, in the formulas (18) and (19), the convolution * may be calculated by inversely transforming the product in the frequency domain using FFT (Fast Fourier Transform). The same applies to the formulas (16) and (17).

図8を参照して、オブジェクトベース音響レンダリング装置3に備えたそれぞれの構成部の処理は、図5に示した実施例2のオブジェクトベース音響レンダリング装置2に備えたそれぞれの構成部の処理と同じであるため、構成部の処理の説明については省略する。 Referring to FIG. 8, the processing of each component of the object-based acoustic rendering device 3 is the same as the processing of each component of the object-based acoustic rendering device 2 of the second embodiment shown in FIG. 5, so the description of the processing of the components is omitted.

VBAP係数乗算部14-l(14-1~14-L)の入力データは、オブジェクトベース音響レンダリング装置2,3間において異なる。図5に示したオブジェクトベース音響レンダリング装置2のVBAP係数乗算部14-lは、面積要素付加部12-lから面積要素が付加された信号を入力する。これに対し、図8に示すオブジェクトベース音響レンダリング装置3のVBAP係数乗算部14-lは、音源信号Sを入力する。 The input data of the VBAP coefficient multiplier 14-l (14-1 to 14-L) differs between the object-based acoustic rendering devices 2 and 3. The VBAP coefficient multiplier 14-l of the object-based acoustic rendering device 2 shown in FIG. 5 inputs a signal to which an area element has been added from the area element adding unit 12-l. In contrast, the VBAP coefficient multiplier 14-l of the object-based acoustic rendering device 3 shown in FIG. 8 inputs the sound source signal S.

具体的には、図8に示すオブジェクトベース音響レンダリング装置3のVBAP係数乗算部14-lは、VBAP係数算出部21から係数gl(gn1,gn2,gn3,0のうちのいずれかの値)を入力する。そして、VBAP係数乗算部14-lは、音源信号Sを入力し、当該音源信号Sに係数glを乗算することで、係数glを反映した信号を生成する。 8 receives a coefficient g l (any value of g n1 , g n2 , g n3 , or 0) from a VBAP coefficient calculation unit 21. The VBAP coefficient multiplication unit 14-l receives a sound source signal S and multiplies the sound source signal S by the coefficient g l to generate a signal reflecting the coefficient g l .

以上のように、実施例3のオブジェクトベース音響レンダリング装置3によれば、実施例1のWFSの構成に対してVBAPの構成を組み込み、WFSの全体の構成とVBAPの構成とを、角度重みに応じてシームレスに切り替えることで、駆動信号d(rl)を生成する。 As described above, according to the object-based acoustic rendering device 3 of Example 3, the VBAP configuration is incorporated into the WFS configuration of Example 1, and the drive signal d(r l ) is generated by seamlessly switching between the overall WFS configuration and the VBAP configuration according to the angle weighting.

具体的には、VBAP係数乗算部14-lは、VBAP係数算出部21から係数gl(gn1,gn2,gn3,0のうちのいずれかの値)を入力する。そして、VBAP係数乗算部14-lは、音源信号Sに係数glを乗算することで、係数glを反映した信号を生成する。 Specifically, the VBAP coefficient multiplication unit 14-l inputs a coefficient g l (any value of g n1 , g n2 , g n3 , or 0) from the VBAP coefficient calculation unit 21. Then, the VBAP coefficient multiplication unit 14-l multiplies the sound source signal S by the coefficient g l to generate a signal that reflects the coefficient g l .

角度重み付加部15-lは、成す角θlに基づいて、前記式(14)にて角度重みwS(θl)を設定する。そして、角度重み付加部15-lは、係数glを反映した信号に角度重みwS(θl)を乗算することで、成す角θlを反映した第2駆動信号を生成する。 The angle weighting unit 15-l sets the angle weight w Sl ) in the above formula (14) based on the formed angle θ l . Then, the angle weighting unit 15-l generates a second drive signal that reflects the formed angle θ l by multiplying the signal that reflects the coefficient g l by the angle weight w Sl ).

加算部16-lは、信号増幅部9-l、HPF10-l、減衰付加部11-l、面積要素付加部12-l及び角度重み付加部13-lからなるWFSの処理により得られた、成す角θlを反映した第1駆動信号、及び、成す角θlを反映した第2駆動信号を加算し、加算結果を駆動信号d(rl)としてスピーカ106-lへ出力する。 The adder 16-l adds together a first drive signal reflecting the angle θ l and a second drive signal reflecting the angle θ l obtained by processing the WFS consisting of the signal amplifier 9-l, the HPF 10-l, the attenuation adding unit 11-l, the surface element adding unit 12- l and the angle weighting adding unit 13-l, and outputs the addition result as a drive signal d(r l ) to the speaker 106-l.

このように、角度重みwS(θl)を用いる角度重み付加部15-lは、係数glを用いるVBAP係数乗算部14-lに対して直列に接続される。また、VBAPのVBAP係数乗算部14-l及び角度重み付加部15-lは、WFSの信号増幅部9-l、HPF10-l、減衰付加部11-l、面積要素付加部12-l及び角度重み付加部13-lに並列に接続される。そして、角度重み付加部13-lに用いる角度重みwC(θl)と角度重み付加部15-lに用いる角度重みwS(θl)とは、0~1の範囲においてトレードオフの関係にある。 In this way, the angle weighting unit 15-l using the angle weight w Sl ) is connected in series to the VBAP coefficient multiplier 14-l using the coefficient g l . The VBAP coefficient multiplier 14-l and angle weighting unit 15-l of the VBAP are connected in parallel to the signal amplifier 9-l, HPF 10-l, attenuation unit 11-l, surface element adding unit 12-l and angle weighting unit 13-l of the WFS. The angle weight w Cl ) used in the angle weighting unit 13-l and the angle weight w Sl ) used in the angle weighting unit 15-l are in a trade-off relationship in the range of 0 to 1.

このため、実施例2と同様に、θlが0°に近づいたときには、駆動信号d(rl)は、WFSによる分配側が支配的となり、θlが90°に近づいたときには、駆動信号d(rl)は、VBAPによる分配側が支配的となる。 For this reason, similarly to the second embodiment, when θ l approaches 0°, the distribution side by WFS becomes dominant in the drive signal d(r l ), and when θ l approaches 90°, the distribution side by VBAP becomes dominant in the drive signal d(r l ).

つまり、スピーカ106-lに対する仮想音源104の位置に応じて、連続的にWFSとVBAPとの分配側が、シームレスに切り替わるようになる。 In other words, the distribution side between WFS and VBAP is switched continuously and seamlessly depending on the position of the virtual sound source 104 relative to the speaker 106-l.

したがって、実施例3のオブジェクトベース音響レンダリング装置3では、実施例1と同様の効果を奏することができる。また、実施例2と同様に、スピーカ106-lが疎に配列された環境において、WFSによるレンダリングを行っている際に、仮想音源104が境界面に近接して配置されると、VBAPによるレンダリングに連続的にシームレスに切り替わる。このため、再生信号が小さくなるという問題を解決することができる。 Therefore, the object-based acoustic rendering device 3 of the third embodiment can achieve the same effect as that of the first embodiment. Also, as in the second embodiment, when rendering by WFS is being performed in an environment in which the speakers 106-l are sparsely arranged, if the virtual sound source 104 is placed close to a boundary surface, rendering by VBAP is continuously and seamlessly switched over. This solves the problem of the playback signal becoming smaller.

尚、実施例3のオブジェクトベース音響レンダリング装置3のHPF10-l(10-1~10-L)は、図1に示した実施例1及び図5に示した実施例2と同様に、jk||rl-rS||+1を、前記式(12)のHPF係数hn(rl,rS)を用いた前記式(11)のハイパスフィルタに置き換えて使用するようにしてもよい。 The HPF 10-l (10-1 to 10-L) of the object-based acoustic rendering device 3 of the third embodiment may be configured to use a high-pass filter of the above formula (11) using the HPF coefficient h n (r l , r S ) of the above formula (12), replacing jk∥r l -r S ∥+1, as in the first embodiment shown in FIG. 1 and the second embodiment shown in FIG.

また、実施例3のオブジェクトベース音響レンダリング装置3の減衰付加部11-l(11-1~11-L)は、図1に示した実施例1及び図5に示した実施例2と同様に、減衰係数1/||rl-rS||2の代わりに、前記式(13)の減衰係数g(rl,rS)を用いるようにしてもよい。つまり、減衰付加部11-lは、減衰係数g(rl,rS)を用いて、仮想音源104とスピーカ106-lとの間の距離に応じて減衰した信号を生成する。 Furthermore, the attenuation adding unit 11-l (11-1 to 11-L) of the object-based acoustic rendering device 3 of the third embodiment may use the attenuation coefficient g(r l , r S ) of the above formula (13) instead of the attenuation coefficient 1/∥r l -r S2 , as in the first embodiment shown in Fig. 1 and the second embodiment shown in Fig. 5. In other words, the attenuation adding unit 11-l uses the attenuation coefficient g(r l , r S ) to generate a signal attenuated according to the distance between the virtual sound source 104 and the speaker 106-l.

ただし、仮想音源104がスピーカ106-lに近接して配置された場合、単純化したWFSの構成(HPF10-l~角度重み付加部13-l)と、VBAPの構成(VBAP係数乗算部14-l及び角度重み付加部15-l)とでは、信号振幅が大きく異なる場合がある。このため、信号振幅が極端に異ならないように、前記式(13)の減衰係数g(rl,rS)を算出するために用いるパラメータβ1,β2は、適切に調整される必要がある。 However, when the virtual sound source 104 is placed close to the speaker 106-l, the signal amplitude may be significantly different between the simplified WFS configuration (HPF 10-l to angle weighting unit 13-l) and the VBAP configuration (VBAP coefficient multiplier 14-l and angle weighting unit 15-l). Therefore, the parameters β1 and β2 used to calculate the attenuation coefficient g(r l , r S ) in the above formula (13) need to be appropriately adjusted so that the signal amplitude does not differ significantly.

以上、実施例1,2,3を挙げて本発明を説明したが、本発明は前記実施例1,2,3に限定されるものではなく、その技術思想を逸脱しない範囲で種々変形可能である。 The present invention has been described above using Examples 1, 2, and 3, but the present invention is not limited to the above Examples 1, 2, and 3, and various modifications are possible without departing from the technical concept thereof.

尚、本発明の実施例1,2,3によるオブジェクトベース音響レンダリング装置1,2,3のハードウェア構成としては、通常のコンピュータを使用することができる。オブジェクトベース音響レンダリング装置1,2,3は、CPU、RAM等の揮発性の記憶媒体、ROM等の不揮発性の記憶媒体、及びインターフェース等を備えたコンピュータによって構成される。 In addition, a normal computer can be used as the hardware configuration of the object-based acoustic rendering devices 1, 2, and 3 according to the first, second, and third embodiments of the present invention. The object-based acoustic rendering devices 1, 2, and 3 are configured by a computer equipped with a CPU, a volatile storage medium such as a RAM, a non-volatile storage medium such as a ROM, and an interface, etc.

オブジェクトベース音響レンダリング装置1に備えたHPF10-1~10-L、減衰付加部11-1~11-L、面積要素付加部12-1~12-L、角度重み付加部13-1~13-L及び角度算出部20の各機能は、これらの機能を記述したプログラムをCPUに実行させることによりそれぞれ実現される。 The functions of the HPFs 10-1 to 10-L, attenuation adding units 11-1 to 11-L, surface area element adding units 12-1 to 12-L, angle weighting adding units 13-1 to 13-L, and angle calculation unit 20 provided in the object-based acoustic rendering device 1 are each realized by having the CPU execute a program that describes these functions.

また、オブジェクトベース音響レンダリング装置2,3に備えたHPF10-1~10-L、減衰付加部11-1~11-L、面積要素付加部12-1~12-L、角度重み付加部13-1~13-L、VBAP係数乗算部14-1~14-L、角度重み付加部15-1~15-L、加算部16-1~16-L、角度算出部20及びVBAP係数算出部21の各機能は、これらの機能を記述したプログラムをCPUに実行させることによりそれぞれ実現される。 Furthermore, the functions of the HPFs 10-1 to 10-L, attenuation adding units 11-1 to 11-L, surface area element adding units 12-1 to 12-L, angle weighting adding units 13-1 to 13-L, VBAP coefficient multipliers 14-1 to 14-L, angle weighting adding units 15-1 to 15-L, adders 16-1 to 16-L, angle calculation unit 20, and VBAP coefficient calculation unit 21 provided in the object-based acoustic rendering devices 2 and 3 are each realized by having the CPU execute a program that describes these functions.

これらのプログラムは、前記記憶媒体に格納されており、CPUに読み出されて実行される。また、これらのプログラムは、磁気ディスク(フロッピー(登録商標)ディスク、ハードディスク等)、光ディスク(CD-ROM、DVD等)、半導体メモリ等の記憶媒体に格納して頒布することもでき、ネットワークを介して送受信することもできる。 These programs are stored in the storage medium and are read and executed by the CPU. In addition, these programs can be distributed by storing them on storage media such as magnetic disks (floppy disks, hard disks, etc.), optical disks (CD-ROMs, DVDs, etc.), and semiconductor memories, and can also be transmitted and received via a network.

1,2,3 オブジェクトベース音響レンダリング装置
9 信号増幅部
10 HPF(ハイパスフィルタ)
11 減衰付加部
12 面積要素付加部
13,15 角度重み付加部
14 VBAP係数乗算部
16 加算部
20 角度算出部
21 VBAP係数算出部
30,32 算出部
31 スピーカ決定部
100 受音点
101,104 仮想音源
102,106 スピーカ
103 音源
105 スピーカアレイ
nS 仮想音源方向の単位ベクトル
n1,rn2,rn3 スピーカ方向の単位ベクトル
l,gn1,gn2,gn3 係数
S 仮想音源座標
l スピーカ座標
C1,C2 領域
S 音源信号
L スピーカの個数
l スピーカの番号(系統の番号)
ΔSl スピーカの面積要素
n(rl) スピーカの境界面内向き法線ベクトル
k 波数
θl 成す角(仮想音源104位置からスピーカ106-l位置を結んだベクトル(rl-rS)と境界面内向き法線ベクトルn(rl)との成す角)
h(rl,rS) HPF
C(θl),wS(θl) 角度重み
1/||rl-rS||2,g(rl,rS) 減衰係数
d(rl) 駆動信号
1, 2, 3 Object-based acoustic rendering device 9 Signal amplifier 10 HPF (high pass filter)
REFERENCE SIGNS LIST 11 attenuation adding section 12 area element adding section 13, 15 angle weight adding section 14 VBAP coefficient multiplying section 16 addition section 20 angle calculation section 21 VBAP coefficient calculation section 30, 32 calculation section 31 speaker determination section 100 sound receiving point 101, 104 virtual sound source 102, 106 speaker 103 sound source 105 speaker array r nS unit vector r n1 , r n2 , r n3 in virtual sound source direction unit vector g l , g n1 , g n2 , g n3 in speaker direction coefficient r S virtual sound source coordinate r l speaker coordinates C1, C2 area S sound source signal L number of speakers l speaker number (system number)
Angle formed by ΔS l, surface area element n (r l ) of speaker, inward normal vector k of speaker's boundary surface, and wave number θ l (angle formed by vector (r l -r S ) connecting the position of virtual sound source 104 to the position of speaker 106-l and inward normal vector n (r l ) of the boundary surface)
h(r l , r s ) HPF
w Cl ), w Sl ) Angular weight 1/||r l -r S || 2 , g(r l , r S ) Damping coefficient d(r l ) Drive signal

Claims (6)

音響メタデータに記述された位置に配置された音源オブジェクトに対しレンダリングを行うことで、試聴環境に配置された複数のスピーカのそれぞれに対する駆動信号を生成するオブジェクトベース音響レンダリング装置において、
前記複数のスピーカの個数をL、前記スピーカの番号をl(=1,・・・,L)、第l番目の前記スピーカを第l番目スピーカ、音源信号が出力される仮想音源の座標を仮想音源座標rS、前記第l番目スピーカの座標をスピーカ座標rl、前記第l番目スピーカの位置での境界面内向き法線ベクトルをn(rl)、前記第l番目スピーカの位置を中心とする面積要素をΔSl、前記第l番目スピーカに対する前記駆動信号をd(rl)として、
前記複数のスピーカのそれぞれについて、前記仮想音源座標rSの位置から前記第l番目スピーカの前記スピーカ座標rlの位置までのベクトルと前記第l番目スピーカの前記境界面内向き法線ベクトルn(rl)との成す角θlを算出する角度算出部、並びに、
前記複数のスピーカのそれぞれに対応する信号増幅部、HPF(ハイパスフィルタ)、減衰付加部、面積要素付加部及び第1角度重み付加部を備え、
前記信号増幅部は、
前記音源信号を定数にて増幅し、
前記HPFは、
前記仮想音源座標rS及び前記第l番目スピーカの前記スピーカ座標rlに基づいて、HPFh(rl,rS)を設定し、前記信号増幅部により増幅された信号に対し、前記HPFh(rl,rS)を用いてフィルタ処理を施し、
前記減衰付加部は、
前記仮想音源座標rSの位置から前記第l番目スピーカの前記スピーカ座標rlの位置までのベクトルの絶対値を求め、前記絶対値を2乗した結果の逆数を減衰係数1/||rl-rS||2として設定し、前記フィルタ処理が施された信号に対し前記減衰係数1/||rl-rS||2を乗算し、
前記面積要素付加部は、
前記減衰付加部により乗算された信号に対し前記面積要素ΔSlを乗算し、
前記第1角度重み付加部は、
前記角度算出部により算出された前記第l番目スピーカの前記成す角θlに基づき、0から1までの範囲において、前記成す角θlの絶対値が0°に近いほど1に近い値をとり、前記成す角θlの絶対値が90°に近いほど0に近い値をとり、前記成す角θlの絶対値が0°以下または90°以上のときに0の値をとる角度重みwC(θl)を設定し、前記面積要素付加部により乗算された信号に対し前記角度重みwC(θl)を乗算することで、前記第l番目スピーカに対する前記駆動信号d(rl)を生成する、ことを特徴とするオブジェクトベース音響レンダリング装置。
1. An object-based audio rendering device that generates drive signals for a plurality of speakers arranged in a listening environment by performing rendering on a sound source object arranged at a position described in audio metadata,
Let L be the number of the plurality of speakers, l (=1, ..., L) be the number of the speakers, the lth speaker be the lth speaker, the coordinates of the virtual sound source from which a sound source signal is output be virtual sound source coordinates r S , the coordinates of the lth speaker be speaker coordinates r l , the inward normal vector of the boundary surface at the position of the lth speaker be n(r l ), the area element centered on the position of the lth speaker be ΔS l , and the drive signal for the lth speaker be d(r l ),
an angle calculation unit that calculates an angle θ l between a vector from the position of the virtual sound source coordinate r S to the position of the speaker coordinate r l of the first speaker and the boundary surface inward normal vector n(r l ) of the first speaker, for each of the plurality of speakers;
a signal amplifier, a high pass filter, an attenuation adding unit, an area element adding unit, and a first angle weighting unit, each of which corresponds to one of the plurality of speakers;
The signal amplifier unit includes:
amplifying the sound source signal by a constant;
The HPF is
setting an HPFh(r l , r S ) based on the virtual sound source coordinates r S and the speaker coordinates r l of the first speaker, and performing a filtering process on the signal amplified by the signal amplifier using the HPFh(r l , r S );
The attenuation adding unit is
an absolute value of a vector from the position of the virtual sound source coordinate r S to the position of the speaker coordinate r l of the first speaker is obtained, the reciprocal of the result of squaring the absolute value is set as an attenuation coefficient 1/||r l -r S || 2 , and the signal that has been subjected to the filtering process is multiplied by the attenuation coefficient 1/||r l -r S || 2 ;
The surface area element adding unit
Multiplying the signal multiplied by the attenuation adding unit by the area element ΔS l ;
The first angle weighting unit
an angle weight wC(θl) is set based on the angle θl of the first speaker calculated by the angle calculation unit, the angle weight wC(θl) taking a value closer to 1 as the absolute value of the angle θl approaches 0°, the value closer to 0 as the absolute value of the angle θl approaches 90°, and the value 0 when the absolute value of the angle θl is less than 0° or greater than 90°, in the range from 0 to 1; and the drive signal d( rl ) for the first speaker is generated by multiplying the signal multiplied by the area element addition unit by the angle weight wC ( θl ) .
請求項1に記載のオブジェクトベース音響レンダリング装置において、
さらに、前記仮想音源座標rSへの仮想音源方向の単位ベクトル及び全てのスピーカにおける前記スピーカ座標rlへのスピーカ方向の単位ベクトルに基づいて、前記仮想音源を内部に含む3つのスピーカをVBAP(Vector Based Amplitude Panning)対象の3つのスピーカとして特定し、前記VBAP対象の3つのスピーカの単位ベクトルrn1,rn2,rn3を取得し、前記仮想音源座標rSへの仮想音源方向の単位ベクトル及び前記VBAP対象の3つのスピーカの単位ベクトルrn1,rn2,rn3に基づいて、前記VBAP対象の3つのスピーカに対応する係数gl=gn1,gn2,gn3を求め、前記全てのスピーカのうち、前記VBAP対象の3つのスピーカ以外のスピーカに対応する係数gl=0を設定し、前記係数glを出力するVBAP係数算出部、並びに、
前記複数のスピーカのそれぞれに対応するVBAP係数乗算部、第2角度重み付加部及び加算部を備え、
前記VBAP係数乗算部は、
前記面積要素付加部により乗算された信号に対し、前記VBAP係数算出部により出力された前記係数glを乗算し、
前記第2角度重み付加部は、
前記角度算出部により算出された前記第l番目スピーカの前記成す角θlに基づき、0から1までの範囲において、前記成す角θlの絶対値が0°に近いほど0に近い値をとり、前記成す角θlの絶対値が90°に近いほど1に近い値をとり、前記成す角θlの絶対値が0°以下または90°以上のときに0の値をとる角度重みwS(θl)を設定し、前記VBAP係数乗算部により乗算された信号に対し前記角度重みwS(θl)を乗算することで、第2駆動信号を生成し、
前記第1角度重み付加部は、
前記角度重みwC(θl)を設定し、前記面積要素付加部により乗算された信号に対し前記角度重みwC(θl)を乗算することで、第1駆動信号を生成し、前記加算部が、前記第1駆動信号及び前記第2駆動信号を加算することで、前記第l番目スピーカに対する前記駆動信号d(rl)を生成する、ことを特徴とするオブジェクトベース音響レンダリング装置。
2. The object-based audio rendering apparatus of claim 1,
Furthermore, a VBAP coefficient calculation unit that identifies three speakers including the virtual sound source as three speakers that are targets of VBAP (Vector Based Amplitude Panning ) based on a unit vector of a virtual sound source direction toward the virtual sound source coordinate rS and a unit vector of a speaker direction toward the speaker coordinate r1 for all speakers, obtains unit vectors rn1 , rn2 , rn3 of the three speakers that are targets of VBAP, calculates coefficients g1 = gn1 , gn2 , gn3 corresponding to the three speakers that are targets of VBAP based on the unit vector of the virtual sound source direction toward the virtual sound source coordinate rS and the unit vectors rn1, rn2 , rn3 of the three speakers that are targets of VBAP, sets coefficient g1 = 0 corresponding to speakers other than the three speakers that are targets of VBAP among all the speakers, and outputs the coefficient g1 ;
a VBAP coefficient multiplier, a second angle weighting unit, and an adder, each corresponding to one of the plurality of speakers;
The VBAP coefficient multiplication unit
multiplying the signal multiplied by the area element adding unit by the coefficient g output by the VBAP coefficient calculation unit;
The second angle weighting unit is
based on the angle θl of the first speaker calculated by the angle calculation unit, an angle weight ws(θl) is set, which takes a value closer to 0 as the absolute value of the angle θl approaches 0°, takes a value closer to 1 as the absolute value of the angle θl approaches 90°, and takes a value of 0 when the absolute value of the angle θl is less than 0° or greater than 90°, in a range from 0 to 1; and generates a second drive signal by multiplying the signal multiplied by the VBAP coefficient multiplication unit by the angle weight ws ( θl ) ;
The first angle weighting unit
an angle weight wC ( θl ) is set, and a first drive signal is generated by multiplying the signal multiplied by the area element adding unit by the angle weight wC ( θl ), and the adder unit generates the drive signal d( rl ) for the first speaker by adding the first drive signal and the second drive signal.
請求項2に記載のオブジェクトベース音響レンダリング装置において、
前記VBAP係数乗算部は、
前記面積要素付加部により乗算された信号の代わりに、前記音源信号を入力し、前記音源信号に対し前記係数glを乗算する、ことを特徴とするオブジェクトベース音響レンダリング装置。
3. The object-based audio rendering apparatus of claim 2,
The VBAP coefficient multiplication unit
2. An object-based sound rendering apparatus comprising: an input of the sound source signal instead of the signal multiplied by the area element adding unit; and a multiplication unit for multiplying the sound source signal by the coefficient g l .
請求項1から3までのいずれか一項に記載のオブジェクトベース音響レンダリング装置において、
前記HPFは、
予め設定されたパラメータをα、予め設定されたフィルタ次数をN、及びn=0,1,・・・,Nとして、以下の式:
Figure 0007583638000023
にて、HPF係数hn(rl,rS)を設定し、
x[t]及びy[t]を時刻tにおける当該HPFの入力及び出力として、入出力特性が以下の式:
Figure 0007583638000024
となるように、前記信号増幅部により増幅された信号に対し、前記HPF係数hn(rl,rS)を用いてフィルタ処理を施す、ことを特徴とするオブジェクトベース音響レンダリング装置。
An object-based acoustic rendering apparatus according to any one of claims 1 to 3,
The HPF is
With a preset parameter as α, a preset filter order as N, and n=0, 1, . . . , N, the following equation is used:
Figure 0007583638000023
Set the HPF coefficients h n (r l , r S ) in
Let x[t] and y[t] be the input and output of the HPF at time t, and the input/output characteristics are expressed by the following equation:
Figure 0007583638000024
and filtering the signal amplified by the signal amplifier using the HPF coefficients h n (r 1 , r s ) so that:
請求項1から4までのいずれか一項に記載のオブジェクトベース音響レンダリング装置において、
前記減衰付加部は、
予め設定されたパラメータをβ1,β2として、以下の式:
Figure 0007583638000025
にて減衰係数g(rl,rS)を求め、前記フィルタ処理が施された信号に対し前記減衰係数g(rl,rS)を乗算する、ことを特徴とするオブジェクトベース音響レンダリング装置。
An object-based acoustic rendering apparatus according to any one of claims 1 to 4,
The attenuation adding unit is
With preset parameters as β 1 and β 2 , the following equation is used:
Figure 0007583638000025
and multiplying the filtered signal by the attenuation coefficient g(r l , r S ) .
コンピュータを、請求項1から5までのいずれか一項に記載のオブジェクトベース音響レンダリング装置として機能させるためのプログラム。 A program for causing a computer to function as an object-based acoustic rendering device according to any one of claims 1 to 5.
JP2021023419A 2021-02-17 2021-02-17 Object-based audio rendering device and program Active JP7583638B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021023419A JP7583638B2 (en) 2021-02-17 2021-02-17 Object-based audio rendering device and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021023419A JP7583638B2 (en) 2021-02-17 2021-02-17 Object-based audio rendering device and program

Publications (2)

Publication Number Publication Date
JP2022125686A JP2022125686A (en) 2022-08-29
JP7583638B2 true JP7583638B2 (en) 2024-11-14

Family

ID=83058284

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021023419A Active JP7583638B2 (en) 2021-02-17 2021-02-17 Object-based audio rendering device and program

Country Status (1)

Country Link
JP (1) JP7583638B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2024022249A (en) 2022-08-05 2024-02-16 株式会社デンソー Power receiving device

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014090504A (en) 2009-11-04 2014-05-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandte Forschung E V Device and method of calculating drive coefficient of speaker in speaker facility based on audio signal related to virtual sound source, and device and method of supplying drive signal of speaker in speaker facility
JP2014220614A (en) 2013-05-07 2014-11-20 日本放送協会 Sound signal processing device, sound reproduction apparatus and sound signal processing program
JP2019016871A (en) 2017-07-05 2019-01-31 日本電信電話株式会社 Sound image generator

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014090504A (en) 2009-11-04 2014-05-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandte Forschung E V Device and method of calculating drive coefficient of speaker in speaker facility based on audio signal related to virtual sound source, and device and method of supplying drive signal of speaker in speaker facility
JP2014220614A (en) 2013-05-07 2014-11-20 日本放送協会 Sound signal processing device, sound reproduction apparatus and sound signal processing program
JP2019016871A (en) 2017-07-05 2019-01-31 日本電信電話株式会社 Sound image generator

Also Published As

Publication number Publication date
JP2022125686A (en) 2022-08-29

Similar Documents

Publication Publication Date Title
JP6933215B2 (en) Sound field forming device and method, and program
JP2006508404A (en) Loudspeaker system for virtual sound synthesis
CN105323684A (en) Method for approximating synthesis of sound field, monopole contribution determination device, and sound rendering system
KR20130102566A (en) Spectrally uncolored optimal crosstalk cancellation for audio through loudspeakers
GB2540175A (en) Spatial audio processing apparatus
JPH1070796A (en) Stereophonic sound processor
US20050069143A1 (en) Filtering for spatial audio rendering
Iijima et al. Binaural rendering from microphone array signals of arbitrary geometry
Gauthier et al. Source sparsity control of sound field reproduction using the elastic-net and the lasso minimizers
Fazi et al. Sound field reproduction as an equivalent acoustical scattering problem
Gao et al. Multizone sound reproduction with adaptive control of scattering effects
Ifergan et al. On the selection of the number of beamformers in beamforming-based binaural reproduction
JP7583638B2 (en) Object-based audio rendering device and program
JP5941373B2 (en) Speaker array driving apparatus and speaker array driving method
Ahrens et al. Wave field synthesis of moving virtual sound sources with complex radiation properties
CN109923877A (en) Apparatus and method for weighting stereo audio signals
Bai et al. Spatial sound field synthesis and upmixing based on the equivalent source method
Matsuda et al. Binaural-centered mode-matching method for enhanced reproduction accuracy at listener's both ears in sound field reproduction
JP6970366B2 (en) Sound image reproduction device, sound image reproduction method and sound image reproduction program
JP2016092562A (en) Audio processing apparatus and method, and program
JPWO2018066384A1 (en) Signal processing apparatus and method, and program
JP2026511007A (en) Method and system for optimizing the behavior of an audio playback system
US20200021939A1 (en) Method for acoustically rendering the size of sound a source
Jin A tutorial on immersive three-dimensional sound technologies
Tuna et al. Data-driven local average room transfer function estimation for multi-point equalization

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240104

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240927

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20241009

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20241101

R150 Certificate of patent or registration of utility model

Ref document number: 7583638

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150