JP7583638B2 - Object-based audio rendering device and program - Google Patents
Object-based audio rendering device and program Download PDFInfo
- Publication number
- JP7583638B2 JP7583638B2 JP2021023419A JP2021023419A JP7583638B2 JP 7583638 B2 JP7583638 B2 JP 7583638B2 JP 2021023419 A JP2021023419 A JP 2021023419A JP 2021023419 A JP2021023419 A JP 2021023419A JP 7583638 B2 JP7583638 B2 JP 7583638B2
- Authority
- JP
- Japan
- Prior art keywords
- angle
- speaker
- unit
- sound source
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Stereophonic System (AREA)
Description
本発明は、オブジェクトベース音響の再生装置に関し、特に、WFS(Wave Field Synthesis:波面合成方式)の考え方に基づいてスピーカの駆動信号を算出するオブジェクトベース音響レンダリング装置及びプログラムに関する。 The present invention relates to an object-based audio playback device, and in particular to an object-based audio rendering device and program that calculates speaker drive signals based on the concept of WFS (Wave Field Synthesis).
近年、映画音響を中心にオブジェクトベース音響技術が脚光を浴びつつある。従来は、複数の音声素材を規定のチャンネルフォーマットへミックスダウンして記録するチャンネルベース音響が主流であった。 In recent years, object-based audio technology has been gaining attention, particularly in the field of movie sound. Previously, channel-based audio was the mainstream, in which multiple audio materials were mixed down to a specified channel format and then recorded.
オブジェクトベース音響では、個々の音声素材を音響オブジェクトとして別々に記録しておき、音響オブジェクトのレベル及び座標等が記述された音響メタデータに基づいてレンダリングを行う。 In object-based audio, each piece of audio material is recorded separately as an audio object, and rendering is performed based on audio metadata that describes the level and coordinates of the audio object.
以下、このようなオブジェクトベース音響方式の再生装置をオブジェクトベース音響レンダリング装置という。オブジェクトベース音響レンダリング装置は、音響オブジェクトに対し、音響メタデータと配置された複数のスピーカ位置に基づいて音響オブジェクトのレンダリングを行い、それぞれのスピーカの位置に応じた駆動信号を生成することで、試聴環境に応じた音響再生を行う。したがって、コンテンツの制作時とは異なるスピーカ配置で再生する場合であっても、それに適応した再生が可能となる。 Hereinafter, such an object-based audio playback device will be referred to as an object-based audio rendering device. The object-based audio rendering device renders audio objects based on audio metadata and the positions of multiple speakers arranged for the audio objects, and generates drive signals according to the positions of each speaker, thereby playing audio according to the listening environment. Therefore, even if the content is played back with a speaker arrangement different from that used when it was created, playback that is adapted to the listening environment is possible.
〔VBAP〕
従来、オブジェクトベース音響のレンダリングには、VBAP(Vector Based Amplitude Panning)と呼ばれるアルゴリズムが多く利用される(例えば、非特許文献1を参照)。
[VBAP]
Conventionally, an algorithm called Vector Based Amplitude Panning (VBAP) is often used for rendering object-based audio (see, for example, Non-Patent Document 1).
VBAPでは、再生空間を3個のスピーカからなる三角形領域で分割し、音源座標を含む三角形の各頂点に位置するスピーカに対して重みを算出する。そして、音源信号を前記算出した重みで分配することにより、振幅パンニングを行う。 In VBAP, the playback space is divided into a triangular region consisting of three speakers, and weights are calculated for the speakers located at each vertex of the triangle that contains the sound source coordinates. Amplitude panning is then performed by distributing the sound source signal using the calculated weights.
しかしながら、VBAPでは、スピーカがある特定の半径の球面状に配置され、音源がその球面上に配置されているものとして処理が行われる。そのため、音源の距離による遠近の表現をすることができない。 However, VBAP processes the sound as if the speakers are arranged on a sphere of a specific radius, and the sound source is placed on that sphere. Therefore, it is not possible to express the sense of perspective based on the distance of the sound source.
VBAPを用いて遠近も含めた音場の表現を行う際には、距離減衰及び残響等を付加して表現することがあるが(例えば、非特許文献2を参照)、それらは心理音響に基づく手法であり、音場を物理的に再現することを目的とした方法ではない。 When using VBAP to represent a sound field that includes both near and far, distance attenuation and reverberation may be added (see, for example, Non-Patent Document 2), but these are methods based on psychoacoustics and are not intended to physically reproduce the sound field.
また、VBAPの重み算出アルゴリズムによれば、スイートスポットで聴取することを想定して重みが算出されるため、そこから離れた位置で試聴する場合において、再生品質は保証されるものではない。 In addition, VBAP's weight calculation algorithm calculates weights assuming listening in the sweet spot, so playback quality is not guaranteed when listening from a position away from that sweet spot.
〔WFS〕
一方、波動音響に基づく音場の表現方法として、WFSと呼ばれる手法が知られている。WFSは、以下の式にて表されるキルヒホッフ-ヘルムホルツ積分方程式によって波動音響的に裏付けられた音場再現手法である(例えば、非特許文献3を参照)。
On the other hand, a method called WFS is known as a method for expressing a sound field based on wave acoustics. WFS is a sound field reproduction method supported by wave acoustics using the Kirchhoff-Helmholtz integral equation expressed by the following formula (see, for example, Non-Patent Document 3):
ここで、p(r)は、境界∂Vで閉じられたある領域V内の任意の点rでの音圧を示し、G(r|ro)は、境界∂V上の点roから境界∂V内の任意の点rまでのグリーン関数を示す。n(ro)は、点roにおける境界∂Vの法線方向内向きの単位ベクトルを示す。p(ro)は、境界∂V上の点roにおける音圧を示し、∂p(ro)/∂nは、境界∂V上の点roにおける単位ベクトルn(ro)方向の音圧勾配ベクトルを示す。dSOは、境界∂V上の微小面積である。 Here, p(r) denotes the sound pressure at any point r in a region V enclosed by the boundary ∂V, and G(r|r o ) denotes the Green's function from point r o on the boundary ∂V to any point r within the boundary ∂V. n(r o ) denotes the unit vector inward in the normal direction of the boundary ∂V at point r o . p(r o ) denotes the sound pressure at point r o on the boundary ∂V, and ∂p(r o )/∂n denotes the sound pressure gradient vector in the direction of unit vector n(r o ) at point r o on the boundary ∂V. dS o is an infinitesimal area on the boundary ∂V.
またここで、境界が任意の形状をしている場合に、境界∂Vにおける境界条件として、∂G(r|ro)/∂n=0なるノイマン条件を想定したグリーン関数を設定する。そして、点roにおける平均音響インテンシティI(ro)及び単位ベクトルn(ro)によって決定される以下の窓関数a(ro)を導入する。
これにより、以下の等式が成り立つ。
Go(r|ro)は、点roから点rまでの自由音場グリーン関数を示す。キルヒホッフ-ヘルムホルツ積分方程式は、ある領域の外部に音源が存在する場合、その領域内部の音場は、境界面の境界法線方向の音圧勾配分布によって決定されるという事実を示している。 G o (r|r o ) denotes the free-field Green's function from point r o to point r. The Kirchhoff-Helmholtz integral equation expresses the fact that when a sound source exists outside a certain region, the sound field inside the region is determined by the sound pressure gradient distribution in the boundary normal direction of the boundary surface.
WFSでは、音場を再現したい領域の境界面上に密にスピーカを配置し、音源(点音源を想定)の座標を与えることで、キルヒホッフ-ヘルムホルツ積分方程式に基づいて、スピーカの駆動信号を決定する。 In WFS, speakers are densely arranged on the boundary surfaces of the area in which the sound field is to be reproduced, and the coordinates of the sound source (assumed to be a point source) are given, and the driving signals for the speakers are determined based on the Kirchhoff-Helmholtz integral equation.
このように、WFSを用いることにより、再生領域の内側で波面を再合成することができるため、VBAPとは異なり、スイートスポットから離れた点において再生品質が低下するという問題点は生じない。 In this way, by using WFS, the wavefront can be resynthesized inside the playback area, so unlike VBAP, there is no problem with the playback quality deteriorating at points away from the sweet spot.
しかしながら、WFSを用いて厳密に波面を合成するためには、境界面に密にスピーカを配置する必要があり、また、所定の周波数特性を持つフィルタ及び遅延等の要素を加える必要がある。このため、WFSを用いた場合には、VBAPに比べてシステムの規模が大きくなるという課題があった。 However, in order to precisely synthesize wavefronts using WFS, it is necessary to place speakers closely on the boundary surfaces, and it is also necessary to add elements such as filters with specific frequency characteristics and delays. For this reason, when using WFS, there is an issue that the system size is larger than that of VBAP.
そこで、本発明は前記課題を解決するためになされたものであり、その目的は、システムの規模を拡大することなく、WFSに基づき音源の距離の遠近を表現する駆動信号を生成可能なオブジェクトベース音響レンダリング装置及びプログラムを提供することにある。 The present invention has been made to solve the above problems, and its purpose is to provide an object-based audio rendering device and program that can generate drive signals that represent the distance of a sound source based on WFS without expanding the scale of the system.
前記課題を解決するために、請求項1のオブジェクトベース音響レンダリング装置は、 音響メタデータに記述された位置に配置された音源オブジェクトに対しレンダリングを行うことで、試聴環境に配置された複数のスピーカのそれぞれに対する駆動信号を生成するオブジェクトベース音響レンダリング装置において、前記複数のスピーカの個数をL、前記スピーカの番号をl(=1,・・・,L)、第l番目の前記スピーカを第l番目スピーカ、音源信号が出力される仮想音源の座標を仮想音源座標rS、前記第l番目スピーカの座標をスピーカ座標rl、前記第l番目スピーカの位置での境界面内向き法線ベクトルをn(rl)、前記第l番目スピーカの位置を中心とする面積要素をΔSl、前記第l番目スピーカに対する前記駆動信号をd(rl)として、前記複数のスピーカのそれぞれについて、前記仮想音源座標rSの位置から前記第l番目スピーカの前記スピーカ座標rlの位置までのベクトルと前記第l番目スピーカの前記境界面内向き法線ベクトルn(rl)との成す角θlを算出する角度算出部、並びに、前記複数のスピーカのそれぞれに対応する信号増幅部、HPF(ハイパスフィルタ)、減衰付加部、面積要素付加部及び第1角度重み付加部を備え、前記信号増幅部が、前記音源信号を定数にて増幅し、前記HPFが、前記仮想音源座標rS及び前記第l番目スピーカの前記スピーカ座標rlに基づいて、HPFh(rl,rS)を設定し、前記信号増幅部により増幅された信号に対し、前記HPFh(rl,rS)を用いてフィルタ処理を施し、前記減衰付加部が、前記仮想音源座標rSの位置から前記第l番目スピーカの前記スピーカ座標rlの位置までのベクトルの絶対値を求め、前記絶対値を2乗した結果の逆数を減衰係数1/||rl-rS||2として設定し、前記フィルタ処理が施された信号に対し前記減衰係数1/||rl-rS||2を乗算し、前記面積要素付加部が、前記減衰付加部により乗算された信号に対し前記面積要素ΔSlを乗算し、前記第1角度重み付加部が、前記角度算出部により算出された前記第l番目スピーカの前記成す角θlに基づき、0から1までの範囲において、前記成す角θlの絶対値が0°に近いほど1に近い値をとり、前記成す角θlの絶対値が90°に近いほど0に近い値をとり、前記成す角θlの絶対値が0°以下または90°以上のときに0の値をとる角度重みwC(θl)を設定し、前記面積要素付加部により乗算された信号に対し前記角度重みwC(θl)を乗算することで、前記第l番目スピーカに対する前記駆動信号d(rl)を生成する、ことを特徴とする。
In order to solve the above problem, an object-based audio rendering device according to
また、請求項2のオブジェクトベース音響レンダリング装置は、請求項1に記載のオブジェクトベース音響レンダリング装置において、さらに、前記仮想音源座標rSへの仮想音源方向の単位ベクトル及び全てのスピーカにおける前記スピーカ座標rlへのスピーカ方向の単位ベクトルに基づいて、前記仮想音源を内部に含む3つのスピーカをVBAP(Vector Based Amplitude Panning)対象の3つのスピーカとして特定し、前記VBAP対象の3つのスピーカの単位ベクトルrn1,rn2,rn3を取得し、前記仮想音源座標rSへの仮想音源方向の単位ベクトル及び前記VBAP対象の3つのスピーカの単位ベクトルrn1,rn2,rn3に基づいて、前記VBAP対象の3つのスピーカに対応する係数gl=gn1,gn2,gn3を求め、前記全てのスピーカのうち、前記VBAP対象の3つのスピーカ以外のスピーカに対応する係数gl=0を設定し、前記係数glを出力するVBAP係数算出部、並びに、前記複数のスピーカのそれぞれに対応するVBAP係数乗算部、第2角度重み付加部及び加算部を備え、前記VBAP係数乗算部が、前記面積要素付加部により乗算された信号に対し、前記VBAP係数算出部により出力された前記係数glを乗算し、前記第2角度重み付加部が、前記角度算出部により算出された前記第l番目スピーカの前記成す角θlに基づき、0から1までの範囲において、前記成す角θlの絶対値が0°に近いほど0に近い値をとり、前記成す角θlの絶対値が90°に近いほど1に近い値をとり、前記成す角θlの絶対値が0°以下または90°以上のときに0の値をとる角度重みwS(θl)を設定し、前記VBAP係数乗算部により乗算された信号に対し前記角度重みwS(θl)を乗算することで、第2駆動信号を生成し、前記第1角度重み付加部が、前記角度重みwC(θl)を設定し、前記面積要素付加部により乗算された信号に対し前記角度重みwC(θl)を乗算することで、第1駆動信号を生成し、前記加算部が、前記第1駆動信号及び前記第2駆動信号を加算することで、前記第l番目スピーカに対する前記駆動信号d(rl)を生成する、ことを特徴とする。
The object-based acoustic rendering device of
また、請求項3のオブジェクトベース音響レンダリング装置は、請求項2に記載のオブジェクトベース音響レンダリング装置において、前記VBAP係数乗算部が、前記面積要素付加部により乗算された信号の代わりに、前記音源信号を入力し、前記音源信号に対し前記係数glを乗算する、ことを特徴とする。
The object-based acoustic rendering apparatus of claim 3 is characterized in that, in the object-based acoustic rendering apparatus of
また、請求項4のオブジェクトベース音響レンダリング装置は、請求項1から3までのいずれか一項に記載のオブジェクトベース音響レンダリング装置において、前記HPFが、予め設定されたパラメータをα、予め設定されたフィルタ次数をN、及びn=0,1,・・・,Nとして、以下の式:
にて、HPF係数hn(rl,rS)を設定し、
x[t]及びy[t]を時刻tにおける当該HPFの入力及び出力として、入出力特性が以下の式:
となるように、前記信号増幅部により増幅された信号に対し、前記HPF係数hn(rl,rS)を用いてフィルタ処理を施す、ことを特徴とする。
The object-based acoustic rendering apparatus of claim 4 is the object-based acoustic rendering apparatus of any one of
Set the HPF coefficients h n (r l , r S ) in
Let x[t] and y[t] be the input and output of the HPF at time t, and the input/output characteristics are expressed by the following formula:
The signal amplified by the signal amplifier is filtered using the HPF coefficients h n (r 1 , r s ) so that:
また、請求項5のオブジェクトベース音響レンダリング装置は、請求項1から4までのいずれか一項に記載のオブジェクトベース音響レンダリング装置において、前記減衰付加部が、予め設定されたパラメータをβ1,β2として、以下の式:
にて減衰係数g(rl,rS)を求め、前記フィルタ処理が施された信号に対し前記減衰係数g(rl,rS)を乗算する、ことを特徴とする。
According to a fifth aspect of the present invention, there is provided an object-based sound rendering apparatus according to any one of the first to fourth aspects, wherein the attenuation adding section calculates a value of β 1 and β 2 by the following equation:
and multiplying the filtered signal by the attenuation coefficient g(r l , r S ) .
さらに、請求項6のプログラムは、コンピュータを、請求項1から5までのいずれか一項に記載のオブジェクトベース音響レンダリング装置として機能させることを特徴とする。
Furthermore, the program of claim 6 is characterized in that it causes a computer to function as an object-based audio rendering device according to any one of
以上のように、本発明によれば、システムの規模を拡大することなく、WFSに基づき音源の距離の遠近を表現する駆動信号を生成することができる。 As described above, according to the present invention, it is possible to generate a drive signal that expresses the distance of a sound source based on WFS without expanding the scale of the system.
以下、本発明を実施するための形態について図面を用いて詳細に説明する。本発明の実施例1のオブジェクトベース音響レンダリング装置は、WFSの構成を近似により単純化することで、システムの規模を拡大することなく、WFSに基づき音源の距離の遠近を表現する駆動信号を生成する。また、実施例2,3のオブジェクトベース音響レンダリング装置は、実施例1の構成に対してVBAPの構成を組み込むことで、スピーカが疎に配置された場合に駆動信号が小さくなる問題を解決する。 The following describes in detail the embodiments of the present invention with reference to the drawings. The object-based acoustic rendering device of the first embodiment of the present invention generates a drive signal that expresses the distance of a sound source based on the WFS without expanding the scale of the system by simplifying the WFS configuration through approximation. The object-based acoustic rendering device of the second and third embodiments incorporates a VBAP configuration into the configuration of the first embodiment, thereby solving the problem of the drive signal becoming small when speakers are sparsely arranged.
本発明の実施例1,2,3のオブジェクトベース音響レンダリング装置について説明する前に、VBAP及びWFSによる音場再現手法の概要について説明する。 Before explaining the object-based acoustic rendering devices of the first, second, and third embodiments of the present invention, we will provide an overview of the sound field reproduction methods using VBAP and WFS.
〔VBAPの概要〕
まず、VBAPの概要について説明する。前述のとおり、VBAPは、再生空間を3個のスピーカからなる三角形領域で分割し、音源座標を含む三角形の各頂点に位置するスピーカに対して重みを算出し、音源信号を分配することにより、振幅パンニングを行う振幅パンニング手法である。
[Outline of VBAP]
First, an overview of VBAP will be described. As described above, VBAP is an amplitude panning technique that divides a reproduction space into triangular regions each consisting of three speakers, calculates weights for the speakers located at each vertex of a triangle including the sound source coordinates, and distributes the sound source signal to perform amplitude panning.
図10は、VBAPを説明するための概念図である。xyz空間において、受音点100を原点とし、仮想音源101方向の単位ベクトルをrnS=(xnS,ynS,znS)Tとする。また、分割された三角形領域のうち、仮想音源101を内部に含む3つのスピーカ102-1,102-2,102-3方向の単位ベクトルをそれぞれ、rn1=(xn1,yn1,zn1)T,rn2=(xn2,yn2,zn2)T,rn3=(xn3,yn3,zn3)Tとする。 10 is a conceptual diagram for explaining VBAP. In the xyz space, the sound receiving point 100 is set as the origin, and the unit vector in the direction of the virtual sound source 101 is set as r nS = (x nS , ynS , z nS ) T. In addition, among the divided triangular regions, the unit vectors in the directions of the three speakers 102-1, 102-2, and 102-3 that include the virtual sound source 101 inside are set as r n1 = (x n1 , yn1 , z n1 ) T , r n2 = (x n2 , yn2 , z n2 ) T , and r n3 = (x n3 , yn3 , z n3 ) T , respectively.
このとき、仮想音源101方向の単位ベクトルrnSは、スピーカ102-1,102-2,102-3方向の単位ベクトルrn1,rn2,rn3及び係数ベクトルg=(gn1,gn2,gn3)Tを用いて以下のように表される。
係数ベクトルgは、以下の式にて算出することができる。
前記式(5)にて算出された係数ベクトルg=(gn1,gn2,gn3)Tを用いて重み付けが行われる。そして、重み付けが行われた信号を3つのスピーカ102-1,102-2,102-3から再生することにより、聴取者は、単位ベクトルrnSの方向に音像を定位することができる。尚、仮想音源101を内部に含まない三角形を成すスピーカの重みは全て0とする。 Weighting is performed using the coefficient vector g = (g n1 , g n2 , g n3 ) T calculated by the above formula (5). Then, by playing back the weighted signals from the three speakers 102-1, 102-2, and 102-3, the listener can localize the sound image in the direction of the unit vector r nS . Note that the weights of all speakers forming a triangle that does not include the virtual sound source 101 inside are set to 0.
〔WFSの概要〕
次に、WFSの概要について説明する。前述のとおり、WFSは、音場を再現したい領域の境界面上に密にスピーカを配置し、前記式(1)のキルヒホッフ-ヘルムホルツ積分方程式に基づいて、スピーカ位置において、再現したい音場である原音場での境界面の法線方向音圧勾配を再現することで、境界面内部の音場を再現する音場再現手法である。
[Outline of WFS]
Next, an overview of WFS will be described. As described above, WFS is a sound field reproduction method in which speakers are densely arranged on the boundary surface of an area in which a sound field is to be reproduced, and the sound pressure gradient in the normal direction of the boundary surface in the original sound field, which is the sound field to be reproduced, is reproduced at the speaker positions based on the Kirchhoff-Helmholtz integral equation of the above formula (1), thereby reproducing the sound field inside the boundary surface.
図11は、WFSを説明するための概念図であり、(1)は原音場を示し、(2)は再現音場を示す。 Figure 11 is a conceptual diagram to explain WFS, where (1) shows the original sound field and (2) shows the reproduced sound field.
(1)の原音場は、xyz空間において、領域C1の外側の座標rS=(xS,yS,zS)Tの点に配置されている音源103から放射される音波によって形成される。このときの領域C1の境界面上の座標rl=(xl,yl,zl)Tにおける音圧pは、以下の式にて表される。l(エル)は、座標rlの点の番号を示し、後述するスピーカ106-lの番号(系統の番号)に相当する。
さらに、領域C1の境界面上の座標rl=(xl,yl,zl)Tの点における境界法線方向内向きの単位ベクトル(境界面内向き法線ベクトル)をn(rl)とする。また、座標rSの点から座標rlの点までを結んだベクトル(rl-rS)と境界面内向き法線ベクトルn(rl)との成す角をθlとする。座標rlの点における法線方向の音圧勾配ベクトルは、以下の式で表される。
したがって、キルヒホッフ-ヘルムホルツ積分方程式によれば、(2)の再現音場において離散的に配置されたスピーカアレイ105を、各スピーカ要素の座標rlに応じて以下の式の駆動信号d(rl)にて駆動させることにより、座標rSの点に仮想音源104の点音源が配置された音場を、領域C2内部に再現することができる。
ここで、ΔSlは、領域C2の境界面を、スピーカ位置を中心とする面積要素に分割したときのl番目の要素の面積(面積要素)であり、スピーカ要素が密に配置されているほど小さい値をとり、疎に配置されているほど大きい値をとる。 Here, ΔS l is the area (area element) of the lth element when the boundary surface of area C2 is divided into area elements centered on the speaker position, and the more densely the speaker elements are arranged, the smaller the value, and the more sparsely the speaker elements are arranged, the larger the value.
尚、xyz空間において、rSは、仮想音源104の座標(仮想音源座標)であり、rlは、スピーカアレイ105を構成する第l番目のスピーカ要素の座標(スピーカ座標)である。 In the xyz space, r S is the coordinate of the virtual sound source 104 (virtual sound source coordinates), and r l is the coordinate of the l-th speaker element that constitutes the speaker array 105 (speaker coordinates).
また、wC(θl)は、以下の式にて定義される関数である。
〔オブジェクトベース音響レンダリング装置〕
次に、実施例1,2,3のオブジェクトベース音響レンダリング装置について説明する。
[Object-based audio rendering device]
Next, the object-based audio rendering apparatuses according to the first, second and third embodiments will be described.
実施例1では、WFSの音場再現手法により決定されるスピーカの駆動信号d(rl)を示す前記式(8)において、仮想音源座標rSの位置に配置された仮想音源104とスピーカ座標rlの位置に配置されたスピーカとの間の距離による時間遅延を表しているe-jk||rl-rs||の項を無視することで、厳密な波面の再現と引き換えにはなるが、システムを簡略化する。 In the first embodiment, in the above equation (8) showing the speaker drive signal d(r l ) determined by the WFS sound field reproduction method, the term e -jk||r l -rs||, which represents the time delay due to the distance between the virtual sound source 104 located at the virtual sound source coordinate r S and the speaker located at the speaker coordinate r l, is ignored, thereby simplifying the system at the expense of accurate wavefront reproduction.
また、実施例1では、前記式(8)のjk||rl-rS||+1の項は、仮想音源104とスピーカとの間の距離により変化するハイパス特性を持ち、この特性を、当該距離に依存する低次のハイパスフィルタh(rl,rS)(HPF)にて近似する。 In addition, in the first embodiment, the term jk∥r l -r S ∥+1 in the above equation (8) has a high-pass characteristic that changes depending on the distance between the virtual sound source 104 and the speaker, and this characteristic is approximated by a low-order high-pass filter h(r l , r S ) (HPF) that depends on the distance.
これにより、実施例1では、WFSの構成を近似により単純化することで、システムの規模を拡大することなく、WFSに基づき音源の距離の遠近を表現する駆動信号を生成することができる。 As a result, in Example 1, by simplifying the WFS configuration through approximation, it is possible to generate a drive signal that expresses the distance of a sound source based on the WFS without expanding the scale of the system.
また、実施例2,3では、実施例1の構成に対してVBAPの構成を組み込むことで、実施例1の効果に加え、スピーカが疎に配置された場合に駆動信号が小さくなる問題を解決する。 In addition, in Examples 2 and 3, by incorporating a VBAP configuration into the configuration of Example 1, in addition to the effects of Example 1, the problem of the drive signal becoming small when the speakers are sparsely placed is resolved.
〔実施例1〕
まず、実施例1のオブジェクトベース音響レンダリング装置について説明する。前述のとおり、実施例1は、スピーカの駆動信号d(rl)を生成する前記式(8)において、時間遅延を表すe-jk||rl-rs||の項を無視し、jk||rl-rS||+1の項をHPFとして扱い、仮想音源104とスピーカとの間の距離により変化するハイパス特性を、当該距離に依存する低次のハイパスフィルタh(rl,rS)(HPF)にて近似する。
Example 1
First, an object-based acoustic rendering device according to Example 1 will be described. As described above, in Example 1, in the above-mentioned formula (8) for generating the speaker drive signal d(r l ), the term e -jk||r l -rs|| representing a time delay is ignored, and the term jk||r l -r S ||+1 is treated as an HPF, and the high-pass characteristics that change depending on the distance between the virtual sound source 104 and the speaker are approximated by a low-order high-pass filter h(r l , r S ) (HPF) that depends on the distance.
図1は、実施例1のオブジェクトベース音響レンダリング装置の構成例を示すブロック図であり、図2は、実施例1のオブジェクトベース音響レンダリング装置の処理例を示す疑似コードである。 Figure 1 is a block diagram showing an example of the configuration of an object-based acoustic rendering device of the first embodiment, and Figure 2 is pseudocode showing an example of the processing of the object-based acoustic rendering device of the first embodiment.
このオブジェクトベース音響レンダリング装置1は、信号増幅部9-1~9-L、HPF(ハイパスフィルタ)10-1~10-L、減衰付加部11-1~11-L、面積要素付加部12-1~12-L、角度重み付加部13-1~13-L及び角度算出部20を備えている。Lはスピーカ106-1~106-Lの個数であり、系統の数でもある。
This object-based
以下、オブジェクトベース音響レンダリング装置1において、第l(エル)番目のスピーカ106-l(l番目の系統)に対応する構成部を、それぞれ信号増幅部9-l、HPF10-l、減衰付加部11-l、面積要素付加部12-l及び角度重み付加部13-lとする。つまり、オブジェクトベース音響レンダリング装置1は、L系統の信号増幅部9-l、HPF10-l、減衰付加部11-l、面積要素付加部12-l及び角度重み付加部13-lを備え、さらに角度算出部20を備えている。l=1,・・・,Lである。
Hereinafter, in the object-based
図2を参照してオブジェクトベース音響レンダリング装置1の全体処理について説明する。オブジェクトベース音響レンダリング装置1は、音源信号Sを入力すると共に、仮想音源座標rSを入力する(ステップS201)。
The overall processing of the object-based
オブジェクトベース音響レンダリング装置1は、スピーカ106-1~106-Lのそれぞれについて(スピーカ106-lの系統について)、スピーカ106-lのスピーカ座標rl、スピーカ106-lの面積要素ΔSl、及びスピーカ106-lの位置での境界面内向き法線ベクトルn(rl)を入力する(ステップS202)。
The object-based
ここで、スピーカ座標rl、面積要素ΔSl及び境界面内向き法線ベクトルn(rl)における下付けの“l”(エル)は、スピーカ106-1~106-Lの番号(系統の番号)である。 Here, the subscript "l" in the speaker coordinate r l , the surface area element ΔS l and the boundary surface inward normal vector n(r l ) is the number (system number) of the speakers 106-1 to 106-L.
また、音源信号Sは、例えば放送局から放送される信号であり、仮想音源座標rSは、例えば放送局から放送される音響メタデータに含まれるデータである。スピーカ座標rl、面積要素ΔSl及び境界面内向き法線ベクトルn(rl)は、例えば当該オブジェクトベース音響レンダリング装置1を操作するユーザにより予め設定されるスピーカレイアウト情報に含まれるデータである。
The sound source signal S is, for example, a signal broadcast from a broadcast station, and the virtual sound source coordinates r S are, for example, data included in the audio metadata broadcast from the broadcast station. The speaker coordinates r l , the area element ΔS l and the boundary surface inward normal vector n(r l ) are, for example, data included in speaker layout information preset by a user who operates the object-based
この場合、オブジェクトベース音響レンダリング装置1は、放送局から送信された音源信号S及び仮想音源座標rSを受信し、ユーザにより予め設定されたスピーカ座標rl、面積要素ΔSl及び境界面内向き法線ベクトルn(rl)を入力する。
In this case, the object-based
オブジェクトベース音響レンダリング装置1は、スピーカ106-lについて、ステップS201にて入力した仮想音源座標rS、及びステップS202にて入力したスピーカ座標rlに基づき、所定の次数の係数を有するHPF10-lのHPFh(rl,rS)を設定する(ステップS203)。
The object-based
オブジェクトベース音響レンダリング装置1は、スピーカ106-lについて、ステップS201にて入力した仮想音源座標rS、及びステップS202にて入力したスピーカ座標rlに基づき、仮想音源104とスピーカ106-lとの間の距離に応じた減衰付加部11-lの減衰係数1/||rl-rS||2を設定する(ステップS204)。
The object-based
つまり、オブジェクトベース音響レンダリング装置1は、仮想音源104位置からスピーカ106-l位置までのベクトルの絶対値||rl-rS||を求め、当該絶対値を2乗した結果||rl-rS||2の逆数を減衰係数1/||rl-rS||2として設定する。
In other words, the object-based
オブジェクトベース音響レンダリング装置1は、スピーカ106-lについて、ステップS201にて入力した仮想音源座標rS、並びにステップS202にて入力したスピーカ座標rl及び境界面内向き法線ベクトルn(rl)に基づき、仮想音源104位置からスピーカ106-l位置を結んだベクトル(rl-rS)とスピーカ106-l位置での境界面内向き法線ベクトルn(rl)との成す角θlを算出する(ステップS205)。この成す角θlは、角度算出部20により算出される。
The object-based
オブジェクトベース音響レンダリング装置1は、スピーカ106-lについて、ステップS205にて算出した成す角θlの絶対値|θl|が0°よりも大きく、かつ90°よりも小さいか否かを判定し、前記式(9)にて角度重みwC(θl)を設定する(ステップS206)。
The object-based
具体的には、オブジェクトベース音響レンダリング装置1は、成す角|θl|が0°よりも大きく、かつ90°よりも小さいと判定した場合(前記式(9)ではcosθl>0の場合)、角度重みwC(θl)=cosθlを設定する。一方、オブジェクトベース音響レンダリング装置1は、成す角|θl|が0°以下であるか、または90°以上であると判定した場合(前記式(9)ではcosθl>0以外の場合)、角度重みwC(θl)=0を設定する。この角度重みwC(θl)は、角度重み付加部13-lにて用いられる。
Specifically, if the object-based
角度重みwC(θl)は、0から1までの範囲の値をとり、成す角|θl|が0°<|θl|<90°の範囲において、成す角|θl|が0°に近いほど1に近い値をとり、90°に近いほど0に近い値をとり、成す角|θl|が|θl|≦0°または90°≦|θl|の範囲において、0の値をとる。 The angle weight wC ( θl ) takes a value in the range from 0 to 1. When the angle | θl | is in the range of 0°<| θl |<90°, the closer the angle | θl | is to 0°, the closer the value is to 1. When the angle |θl| is closer to 90°, the closer the value is to 0. When the angle | θl | is in the range of | θl |≦0° or 90°≦| θl |, the angle weight takes a value of 0.
オブジェクトベース音響レンダリング装置1は、スピーカ106-lについて、定数u(例えばu=1/2π、系統毎に異なる値となる場合もあり得る)、ステップS201にて入力した音源信号S及び仮想音源座標rS、ステップS202にて入力したスピーカ座標rl及び面積要素ΔSl、ステップS203にて設定したHPFh(rl,rS)、ステップS204にて設定した減衰係数1/||rl-rS||2及びステップS206にて設定した角度重みwC(θl)を用いて、以下の式にて駆動信号d(rl)を算出し出力する(ステップS207)。
次に、図1を参照してオブジェクトベース音響レンダリング装置1の構成部の処理について説明する。信号増幅部9-l(9-1~9-L)は、音源信号Sを入力し、音源信号Sに対し定数u(例えば1/2π)を乗算することで音源信号Sを増幅し、増幅した信号をHPF10-lに出力する。
Next, the processing of the components of the object-based
HPF10-l(10-1~10-L)は、仮想音源座標rS及びスピーカ座標rlを入力する。そして、HPF10-lは、仮想音源座標rS及びスピーカ座標rlに基づいて、ステップS203のとおり、所定の次数の係数を有するHPFh(rl,rS)を設定する。そして、HPF10-lは、信号増幅部9-lから増幅された信号を入力し、当該信号に対し、HPFh(rl,rS)を用いてフィルタ処理を施し、フィルタ処理を施した信号を減衰付加部11-lに出力する。 The HPF 10-l (10-1 to 10-L) receives the virtual sound source coordinates r S and the speaker coordinates r L. Based on the virtual sound source coordinates r S and the speaker coordinates r L , the HPF 10-l sets an HPFh (r L , r S ) having a predetermined order of coefficients as in step S203. The HPF 10-l receives the amplified signal from the signal amplifier 9-l, filters the signal using the HPFh (r L , r S ), and outputs the filtered signal to the attenuation adder 11-l.
減衰付加部11-l(11-1~11-L)は、仮想音源座標rS及びスピーカ座標rlを入力し、仮想音源座標rS及びスピーカ座標rlに基づいて、ステップS204のとおり、減衰係数1/||rl-rS||2を設定する。そして、減衰付加部11-lは、HPF10-lからフィルタ処理が施された信号を入力し、当該信号に対し減衰係数1/||rl-rS||2を乗算することで、仮想音源104とスピーカ106-lとの間の距離に応じて信号を減衰させる。減衰付加部11-lは、減衰させた信号(減衰を付加した信号)を面積要素付加部12-lに出力する。
The attenuation adding unit 11-l (11-1 to 11-L) receives the virtual sound source coordinates r S and the speaker coordinates r L , and sets the
面積要素付加部12-l(12-1~12-L)は、面積要素ΔSlを入力する。面積要素ΔSlは、スピーカ106-lが密に配置されている場合、小さい値となり、スピーカ106-lが疎に配置されている場合、大きい値となる。 The area element adding unit 12-l (12-1 to 12-L) inputs an area element ΔS l . The area element ΔS l takes a small value when the speakers 106-l are densely arranged, and takes a large value when the speakers 106-l are sparsely arranged.
そして、面積要素付加部12-lは、減衰付加部11-lから減衰が付加された信号を入力し、当該信号に対し面積要素ΔSlを乗算することで、スピーカ106-lの離散度合いに応じて面積要素を付加した信号を生成する。面積要素付加部12-lは、面積要素を付加した信号を角度重み付加部13-lに出力する。 The area element adding unit 12-l receives the signal to which attenuation has been added from the attenuation adding unit 11-l and multiplies the signal by an area element ΔS l to generate a signal to which an area element has been added according to the degree of discreteness of the speaker 106-l. The area element adding unit 12-l outputs the signal to which the area element has been added to the angle weighting unit 13-l.
角度算出部20は、仮想音源座標rS、スピーカ座標r1~rL及び境界面内向き法線ベクトルn(r1)~n(rL)を入力する。そして、角度算出部20は、ステップS205のとおり、スピーカ106-1~106-Lのそれぞれ(スピーカ106-l)について、仮想音源104位置からスピーカ106-l位置を結んだベクトル(rl-rS)を求め、当該ベクトル(rl-rS)とスピーカ106-l位置での境界面内向き法線ベクトルn(rl)との成す角θlを算出する。角度算出部20は、成す角θl(θ1~θL)を、対応する角度重み付加部13-l(13-1~13-L)に出力する。
The
図3は、角度算出部20の構成例を示すブロック図である。この角度算出部20は、算出部30-1~30-Lを備えている。算出部30-1は、スピーカ106-1についての成す角θ1を算出する構成部であり、仮想音源座標rS、並びに第l=1番目のスピーカ座標r1及び境界面内向き法線ベクトルn(r1)を入力する。そして、算出部30-1は、仮想音源104位置からスピーカ106-l位置を結んだベクトル(r1-rS)を求め、当該ベクトル(r1-rS)とスピーカ106-1位置での境界面内向き法線ベクトルn(r1)との成す角θ1を算出する。算出部30-1は、成す角θ1を角度重み付加部13-1に出力する。
3 is a block diagram showing an example of the configuration of the
同様に、算出部30-Lは、スピーカ106-Lについての成す角θLを算出する構成部であり、仮想音源座標rS、並びに第l=L番目のスピーカ座標rL及び境界面内向き法線ベクトルn(rL)を入力する。そして、算出部30-Lは、仮想音源104位置からスピーカ106-l位置を結んだベクトル(rL-rS)を求め、当該ベクトル(rL-rS)とスピーカ106-L位置での境界面内向き法線ベクトルn(rL)との成す角θLを算出する。算出部30-Lは、成す角θLを角度重み付加部13-Lに出力する。 Similarly, the calculation unit 30-L is a component that calculates the angle θ L for the speaker 106-L, and receives as input the virtual sound source coordinates r S , the l=Lth speaker coordinates r L and the boundary surface inward normal vector n(r L ). The calculation unit 30-L then obtains a vector (r L -r S ) connecting the position of the virtual sound source 104 to the position of the speaker 106-l, and calculates the angle θ L between the vector (r L -r S ) and the boundary surface inward normal vector n(r L ) at the speaker 106-L position. The calculation unit 30-L outputs the angle θ L to the angle weighting unit 13-L.
算出部30-2~30-(L-1)についても、同様の処理が行われ、仮想音源104位置からスピーカ106-2~106-(L-1)位置を結んだベクトル(r2~rL-1-rS)とスピーカ106-2~106-(L-1)位置での境界面内向き法線ベクトルn(r2)~n(rL-1)との成す角θ2~θL-1がそれぞれ算出される。
Similar processing is performed for calculation units 30-2 to 30-(L-1), and angles
図1に戻って、角度重み付加部13-l(13-1~13-L)は、角度算出部20から成す角θl(θ1~θL)を入力し、成す角θlに基づいて、ステップS206のとおり、前記式(9)にて角度重みwC(θl)を設定する。そして、角度重み付加部13-lは、面積要素付加部12-lから面積要素が付加された信号を入力し、当該信号に対し角度重みwC(θl)を乗算することで、成す角θlを反映した信号を生成する。
1, angle weighting unit 13-l (13-1 to 13-L) receives angle θ l (θ 1 to θ L ) from
成す角θlを反映した信号は、成す角θlが0°に近いほど、面積要素が付加された信号に近くなる。一方、成す角θlを反映した信号は、成す角θlが90°に近いほど、0の信号に近くなる。 The signal reflecting the angle θl approaches a signal to which an area element has been added as the angle θl approaches 0°. On the other hand, the signal reflecting the angle θl approaches a signal of 0 as the angle θl approaches 90°.
角度重み付加部13-lは、成す角θlを反映した信号を駆動信号d(rl)としてスピーカ106-lへ出力する。 The angle weighting unit 13-l outputs a signal reflecting the formed angle θ l as a drive signal d(r l ) to the speaker 106-l.
尚、図1及び図2では、1つの音響オブジェクトの音源信号Sに対するオブジェクトベース音響のレンダリングの構成及び処理を示しているが、実際は、複数の音響オブジェクトの音源信号Sに対して処理が行われる。この場合、音響オブジェクト毎に生成された駆動信号d(rl)がスピーカ106-l毎に加算され、加算結果の駆動信号がスピーカ106-lへ出力される。後述する図5,6(実施例2)及び図8,9(実施例3)についても同様である。 1 and 2 show the configuration and processing of object-based audio rendering for the sound source signal S of one audio object, but in reality, processing is performed for the sound source signals S of a plurality of audio objects. In this case, the drive signals d(r l ) generated for each audio object are added for each speaker 106-l, and the drive signal resulting from the addition is output to the speaker 106-l. The same applies to Figs. 5 and 6 (Example 2) and Figs. 8 and 9 (Example 3) described later.
以上のように、実施例1のオブジェクトベース音響レンダリング装置1によれば、スピーカ106-lの駆動信号d(rl)を生成する前記式(8)において、時間遅延を表すe-jk||rl-rs||の項を無視し、jk||rl-rS||+1の項を、仮想音源104とスピーカ106-lとの間の距離に依存する低次のハイパスフィルタh(rl,rS)(HPF)として近似するようにした。
As described above, according to the object-based
具体的には、信号増幅部9-lは、音源信号Sに対し定数u(系統毎に異なる値となる場合もあり得る)を乗算することで、音源信号Sを増幅する。HPF10-lは、仮想音源座標rS及びスピーカ座標rlに基づいて、所定の次数の係数を有するHPFh(rl,rS)を設定する。そして、HPF10-lは、信号増幅部9-lにより増幅された信号に対し、HPFh(rl,rS)を用いてフィルタ処理を施す。 Specifically, the signal amplifier 9-l amplifies the sound source signal S by multiplying the sound source signal S by a constant u (which may have a different value for each system). The HPF 10-l sets an HPFh(r l , r S ) having a coefficient of a predetermined order based on the virtual sound source coordinates r S and the speaker coordinates r l . The HPF 10-l then performs filtering on the signal amplified by the signal amplifier 9-l using the HPFh(r l , r S ).
減衰付加部11-lは、仮想音源座標rS及びスピーカ座標rlに基づいて減衰係数1/||rl-rS||2を設定する。そして、減衰付加部11-lは、フィルタ処理が施された信号に対し減衰係数1/||rl-rS||2を乗算することで、仮想音源104とスピーカ106-lとの間の距離に応じて減衰した信号を生成する。
The attenuation adding unit 11-l sets an
面積要素付加部12-lは、減衰した信号に対しスピーカ106-lの面積要素ΔSlを乗算することで、面積要素を付加した信号を生成する。 The area element adding unit 12-l multiplies the attenuated signal by an area element ΔS l of the speaker 106-l to generate a signal to which an area element has been added.
角度算出部20は、仮想音源104位置からスピーカ106-l位置を結んだベクトル(rl-rS)とスピーカ106-l位置での境界面内向き法線ベクトルn(rl)との成す角θlを算出する。
The
角度重み付加部13-lは、成す角θlに基づいて、前記式(9)にて角度重みwC(θl)を設定する。そして、角度重み付加部13-lは、面積要素が付加された信号に対し角度重みwC(θl)を乗算することで、成す角θlを反映した信号を駆動信号d(rl)としてスピーカ106-lへ出力する。 The angle weighting unit 13-l sets the angle weight w C (θ l ) in accordance with the equation (9) based on the angle θ l . Then, the angle weighting unit 13-l multiplies the signal to which the area element has been added by the angle weight w C (θ l ) to output a signal reflecting the angle θ l to the speaker 106-l as a drive signal d(r l ).
これにより、前記式(8)における時間遅延を表すe-jk||rl-rs||の項を無視するようにしたから、システムを簡略化することができる。また、jk||rl-rS||+1の項を近似したHPFh(rl,rS)のHPF10-lを用いることで、システムを簡略化することができる。 This allows the system to be simplified because the term e -jk||rl-rs|| , which indicates the time delay in equation (8), is ignored. Also, the system can be simplified by using the HPF 10-l of HPFh(r l , r S ), which approximates the term jk||r l -r S ||+1.
したがって、WFSの構成を近似により単純化することで、システムの規模を拡大することなく、WFSに基づき仮想音源104の距離の遠近を表現する駆動信号d(rl)を生成することができる。 Therefore, by simplifying the configuration of the WFS through approximation, it is possible to generate a driving signal d(r l ) that expresses the distance of the virtual sound source 104 based on the WFS without increasing the scale of the system.
(HPF10-lの他の例)
尚、図1に示したオブジェクトベース音響レンダリング装置1のHPF10-l(10-1~10-L)は、前記式(8)においてjk||rl-rS||+1の項を近似したHPFh(rl,rS)を用いて、信号増幅部9-l(9-1~9-L)により増幅された信号に対してフィルタ処理を施すようにした。
(Another example of HPF10-1)
The HPF 10-l (10-1 to 10-L) of the object-based
例えば、前記式(8)においてjk||rl-rS||+1の項は、以下の式で表すハイパスフィルタに置き換えて使用する。
x[t]及びy[t]は、時刻tにおける当該HPF10-lの入力と出力である。HPF係数hn(rl,rS)は、以下の式で表されるものとする。n=0,1,・・・,Nである。
つまり、HPF10-lは、仮想音源座標rS及びスピーカ座標rlを入力すると共に、ユーザにより予め設定されたパラメータα及びフィルタ次数Nを入力する。そして、HPF10-lは、仮想音源座標rS、スピーカ座標rl、パラメータα及びフィルタ次数Nに基づいて、前記式(12)を係数として有するHPF係数を設定する。 That is, the HPF 10-l receives the virtual sound source coordinates r S and the speaker coordinates r l , as well as the parameter α and the filter order N preset by the user. Then, the HPF 10-l sets HPF coefficients having the above-mentioned formula (12) as coefficients, based on the virtual sound source coordinates r S , the speaker coordinates r l , the parameter α, and the filter order N.
そして、HPF10-lは、信号増幅部9-l(9-1~9-L)により増幅された信号を入力し、当該信号に対し、前記式(12)のHPF係数hn(rl,rS)を用いて、当該HPF10-lの入出力特性が前記式(11)となるようにフィルタ処理を施す。つまり、HPF10-lは、前記式(11)の入出力特性となるようなHPFにより構成される。 The HPF 10-l receives the signal amplified by the signal amplifier 9-l (9-1 to 9-L) and performs filtering on the signal using the HPF coefficient h n (r l , r S ) of the above formula (12) so that the input/output characteristics of the HPF 10-l satisfy the above formula (11). In other words, the HPF 10-l is configured with an HPF that has the input/output characteristics of the above formula (11).
これにより、オブジェクトベース音響レンダリング装置1全体として、システムの規模が拡大することなく、簡略化することができる。
This allows the object-based
(減衰付加部11-lの他の例)
また、図1に示したオブジェクトベース音響レンダリング装置1の減衰付加部11-l(11-1~11-L)は、仮想音源座標rS及びスピーカ座標rlに基づいて、減衰係数1/||rl-rS||2を設定し、フィルタ処理が施された信号に対して減衰係数1/||rl-rS||2を乗算することで、仮想音源104とスピーカ106-lとの間の距離に応じて減衰した信号を生成するようにした。
(Another Example of the Attenuation Addition Unit 11-l)
In addition, the attenuation adding unit 11-l (11-1 to 11-L) of the object-based
しかしながら、減衰係数1/||rl-rS||2は、仮想音源座標rSとスピーカ座標rlとが一致する場合、無限大に発散してしまい、結果として信号を再生することができなくなってしまう。そこで、減衰付加部11-lは、減衰係数1/||rl-rS||2を近似した以下の式で表す減衰係数g(rl,rS)を用いる。
β1は、信号振幅を調整するための正の実数であり、β2は、減衰係数g(rl,rS)の発散を抑えるための正の実数である。これらのパラメータβ1,β2の値は、ユーザが任意に決定するものとする。特に、パラメータβ2の値は、減衰係数g(rl,rS)の発散を抑えるように、微小な値がユーザにより設定される。 β1 is a positive real number for adjusting the signal amplitude, and β2 is a positive real number for suppressing the divergence of the attenuation coefficient g(r l , r S ). The values of these parameters β1 and β2 are determined arbitrarily by the user. In particular, the value of the parameter β2 is set by the user to a small value so as to suppress the divergence of the attenuation coefficient g(r l , r S ).
つまり、減衰付加部11-lは、仮想音源104位置からスピーカ106-l位置までのベクトルの絶対値||rl-rS||を求め、当該絶対値を2乗した結果にパラメータβ2を加算して加算結果(||rl-rS||2+β2)を求め、パラメータβ1を加算結果(||rl-rS||2+β2)で除算することで、減衰係数g(rl,rS)を求める。 In other words, the attenuation adding unit 11-l finds the absolute value ||r l -r S || of the vector from the position of the virtual sound source 104 to the position of the speaker 106-l, squares the absolute value, adds the parameter β 2 to the result to find the addition result (||r l -r S || 2 + β 2 ), and divides the parameter β 1 by the addition result (||r l -r S || 2 + β 2 ) to find the attenuation coefficient g(r l , r S ).
そして、減衰付加部11-lは、フィルタ処理が施された信号に対してg(rl,rS)を乗算することで、仮想音源104とスピーカ106-lとの間の距離に応じて減衰した信号を生成する。 Then, the attenuation adding unit 11-l multiplies the filtered signal by g(r l , r s ) to generate a signal attenuated according to the distance between the virtual sound source 104 and the speaker 106-l.
パラメータβ2の値が小さいほど、減衰係数g(rl,rS)の振る舞いは減衰係数1/||rl-rS||2に近づく。一方で、仮想音源座標rSがスピーカ座標rlに近づくほど、信号振幅が極端に増大する。
As the value of parameter β2 becomes smaller, the behavior of the attenuation coefficient g(r l , r S ) approaches the
これにより、信号の発散を抑制することができ、ユーザは、自らが設定するパラメータβ1,β2の値に応じて、音響オブジェクトの位置が変化するときの信号振幅の変動を調整することができる。 This makes it possible to suppress signal divergence, and the user can adjust the fluctuation in signal amplitude when the position of the sound object changes according to the values of parameters β 1 and β 2 that the user sets.
また、ユーザがパラメータβ1,β2の値をβ1=β2に設定した場合、仮想音源座標rSとスピーカ座標rlとが一致するときに(rS=rl)、減衰係数g(rl,rS)=1となる。 Furthermore, if the user sets the values of the parameters β1 and β2 to β1 = β2 , when the virtual sound source coordinate rS and the speaker coordinate r1 coincide ( rS = r1 ), the attenuation coefficient g( r1 , r1 ) = 1.
このため、ユーザは、信号を不要に増大または減衰させることのないように、これらのパラメータβ1,β2の値を調整の目安とすることができる。 Therefore, the user can use the values of these parameters β 1 and β 2 as a guide for adjustment so as not to unnecessarily increase or attenuate the signal.
また、ユーザがパラメータβ1,β2の値をβ1=β2/ΔSlに設定した場合、仮想音源座標rSとスピーカ座標rlとが一致するときに(rS=rl)、減衰係数g(rl,rS)ΔSl=1、さらにはh(rl,rS)g(rl,rS)ΔSlwC(θl)=1となる。h(rl,rS)=1及びwC(θl)=1だからである。 Furthermore, if the user sets the values of parameters β1 and β2 to β1 = β2 / ΔS1 , when the virtual sound source coordinate rS and the speaker coordinate r1 coincide ( rS = r1 ), the attenuation coefficient g( r1 , rS ) ΔS1 = 1, and furthermore h( r1 , rS ) g( r1 , rS ) ΔS1 wC ( θl ) = 1. This is because h( r1 , rS ) = 1 and wC ( θl ) = 1.
このため、仮想音源座標rSとスピーカ座標rlとが一致するときには、角度重み付加部13-lからスピーカ106-lへ出力される駆動信号d(rl)は、信号増幅部9-lにより増幅された信号と同じになる。つまり、スピーカ座標rlに位置するスピーカ106-lから、当該オブジェクトベース音響レンダリング装置1が入力した音源信号Sに対して増幅された信号が再生されることとなる。
Therefore, when the virtual sound source coordinate r S and the speaker coordinate r l coincide with each other, the drive signal d(r l ) output from the angle weighting unit 13-l to the speaker 106-l becomes the same as the signal amplified by the signal amplifier 9-l. In other words, the speaker 106-l located at the speaker coordinate r l reproduces an amplified signal of the sound source signal S input to the object-based
このように、減衰付加部11-lが前記式(13)で表される減衰係数g(rl,rS)を用いることで、仮想音源座標rSとスピーカ座標rlとが一致した場合であっても、信号が無限大に発散することがない。このため、信号を再生できなくなるという不具合を解消することができる。 In this way, by using the attenuation coefficient g(r l , r S ) expressed by the above formula (13) in the attenuation adding unit 11-l, even if the virtual sound source coordinate r S and the speaker coordinate r l match, the signal does not diverge to infinity. This makes it possible to eliminate the problem of being unable to reproduce the signal.
〔実施例2〕
次に、実施例2のオブジェクトベース音響レンダリング装置について説明する。前述のとおり、実施例2は、実施例1の構成に対してVBAPの構成を組み込むことで、実施例1の効果に加え、スピーカ106-lが疎に配置された場合に駆動信号d(rl)が小さくなる問題を解決する。より詳細には、実施例2は、実施例1に示した単純化したWFSの一部の構成とVBAPの構成とを、角度重みに応じてシームレスに切り替えることで、駆動信号d(rl)を生成する。
Example 2
Next, an object-based acoustic rendering device according to a second embodiment will be described. As described above, the second embodiment incorporates the configuration of VBAP into the configuration of the first embodiment, thereby achieving the effects of the first embodiment and solving the problem that the drive signal d(r l ) becomes small when the speakers 106-l are sparsely arranged. More specifically, the second embodiment generates the drive signal d(r l ) by seamlessly switching between the configuration of a part of the simplified WFS shown in the first embodiment and the configuration of VBAP according to the angle weight.
一般に、WFSの音場再現手法を用いる場合、多数のスピーカ106-lを密に配置することを想定する。しかし、家庭用のオーディオにおいては、多くのスピーカ106-lを密に配置することは困難であり、スピーカ106-lを疎に配置するのが通常である。 In general, when using the WFS sound field reproduction method, it is assumed that many speakers 106-l are arranged closely together. However, in home audio, it is difficult to arrange many speakers 106-l closely together, and it is common to arrange the speakers 106-l sparsely.
図4は、スピーカ106-lが疎に配置されている場合を説明する図である。図4に示すように、再現音場において、スピーカ106-lが疎に配置されており、仮想音源104の位置(仮想音源座標rS)が音場を再現したい領域の境界面に近接した場合を想定する。 4 is a diagram for explaining a case where the speakers 106-l are sparsely arranged. As shown in FIG. 4, it is assumed that the speakers 106-l are sparsely arranged in a reproduced sound field, and the position of the virtual sound source 104 (virtual sound source coordinates r S ) is close to the boundary surface of the area where the sound field is to be reproduced.
この場合、全てのスピーカ106-l(106-1~106-L)において、仮想音源104位置からスピーカ106-l位置を結んだベクトル(rl-rS)とスピーカ106-l位置での境界面内向き法線ベクトルn(rl)との成す角θlは、90°に近い値または90°を超える値となってしまう。 In this case, in all speakers 106-l (106-1 to 106-L), the angle θ l between the vector (r l -r S ) connecting the position of the virtual sound source 104 to the position of the speaker 106-l and the inward normal vector n (r l ) of the boundary surface at the position of the speaker 106- l becomes a value close to or exceeding 90°.
このため、角度重み付加部13-lにて用いる角度重みwC(θl)は、前記式(9)から0に近い値または0となる。そして、全てのスピーカ106-lに対する駆動信号d(rl)の値が小さい値または0になってしまい、仮想音源104が境界面に近接しているにも関わらず、再生信号が小さくなるという問題が生じる。 For this reason, the angle weight w C (θ l ) used in the angle weighting unit 13-l becomes a value close to 0 or 0 according to the above formula (9). Then, the values of the drive signals d(r l ) for all the speakers 106-l become small or 0, which causes a problem that the reproduced signal becomes small even though the virtual sound source 104 is close to the boundary surface.
この問題を解決するため、実施例2では、図1に示した実施例1のオブジェクトベース音響レンダリング装置1において、WFSの信号分配則に対し、成す角θlに応じて連続的にVBAPの信号分配則にシームレスに切り替わるように、VBAPの構成を追加する。
In order to solve this problem, in the second embodiment, a VBAP configuration is added to the object-based
ここで、図1に示した単純化したWFSである実施例1のオブジェクトベース音響レンダリング装置1において、HPF10-lのHPFh(rl,rS)は、周波数の補正に関する項である。また、減衰付加部11-lの減衰係数1/||rl-rS||2を、仮想音源104の位置による距離減衰に関する項、面積要素付加部12-lの面積要素ΔSlを、スピーカ106-lを離散化することによる補正に関する項であると解釈する。さらに、角度重み付加部13-lの角度重みwC(θl)を、各スピーカ106-lに対する信号の分配側に関する項であると解釈する。
Here, in the object-based
実施例2では、WFSにおける角度重み付加部13-lの角度重みwC(θl)による各スピーカ106-lに対する信号の分配則に関する項に、VBAPにより決定される各スピーカ106-lに対する信号の分配則に関する項を並列に接続する。 In the second embodiment, a term relating to the distribution law of signals for each speaker 106-l determined by VBAP is connected in parallel to a term relating to the distribution law of signals for each speaker 106- l based on the angle weight w C (θ l ) of the angle weighting unit 13-l in WFS.
図5は、実施例2のオブジェクトベース音響レンダリング装置の構成例を示すブロック図であり、図6は、実施例2のオブジェクトベース音響レンダリング装置の処理例を示す疑似コードである。 Figure 5 is a block diagram showing an example of the configuration of an object-based acoustic rendering device of the second embodiment, and Figure 6 is pseudocode showing an example of the processing of the object-based acoustic rendering device of the second embodiment.
このオブジェクトベース音響レンダリング装置2は、信号増幅部9-1~9-L、HPF10-1~10-L、減衰付加部11-1~11-L、面積要素付加部12-1~12-L、角度重み付加部13-1~13-L、VBAP係数乗算部14-1~14-L、角度重み付加部15-1~15-L、加算部16-1~16-L、角度算出部20及びVBAP係数算出部21を備えている。
This object-based
以下、オブジェクトベース音響レンダリング装置2において、第l(エル)番目のスピーカ106-l(l番目の系統)に対応する構成部を、信号増幅部9-l、HPF10-l、減衰付加部11-l、面積要素付加部12-l、角度重み付加部13-l、VBAP係数乗算部14-l、角度重み付加部15-l及び加算部16-lとする。つまり、オブジェクトベース音響レンダリング装置2は、L系統分の信号増幅部9-l、HPF10-l、減衰付加部11-l、面積要素付加部12-l、角度重み付加部13-l、VBAP係数乗算部14-l、角度重み付加部15-l及び加算部16-lを備え、さらに、角度算出部20及びVBAP係数算出部21を備えている。
Hereinafter, in the object-based
信号増幅部9-l、HPF10-l、減衰付加部11-l、面積要素付加部12-l及び角度重み付加部13-lは、WFSの構成部である。VBAP係数乗算部14-l及び角度重み付加部15-lは、VBAPの構成部であり、WFSの角度重み付加部13-lに並列に接続されている。 The signal amplifier 9-l, HPF 10-l, attenuation adding unit 11-l, surface area element adding unit 12-l, and angle weight adding unit 13-l are components of the WFS. The VBAP coefficient multiplier 14-l and angle weight adding unit 15-l are components of the VBAP, and are connected in parallel to the angle weight adding unit 13-l of the WFS.
図1に示した実施例1のオブジェクトベース音響レンダリング装置1とこの実施例2のオブジェクトベース音響レンダリング装置2とを比較すると、両オブジェクトベース音響レンダリング装置1,2は、信号増幅部9-l、HPF10-l、減衰付加部11-l、面積要素付加部12-l、角度重み付加部13-l及び角度算出部20を備えている点で共通する。
Comparing the object-based
一方、オブジェクトベース音響レンダリング装置2は、VBAP係数乗算部14-l、角度重み付加部15-l及び加算部16-l、並びにVBAP係数算出部21を備えている点で、これらの構成部を備えていないオブジェクトベース音響レンダリング装置1と相違する。
On the other hand, the object-based
図6を参照してオブジェクトベース音響レンダリング装置2の全体処理について説明する。オブジェクトベース音響レンダリング装置2は、図2のステップS201と同様に、音源信号Sを入力すると共に、仮想音源104の仮想音源座標rSを入力する(ステップS601)。
The overall processing of the object-based
オブジェクトベース音響レンダリング装置2は、図2のステップS202と同様に、スピーカ106-lについて、スピーカ座標rl、面積要素ΔSl及び境界面内向き法線ベクトルn(rl)を入力する(ステップS602)。
As in step S202 in FIG. 2, the object-based
オブジェクトベース音響レンダリング装置2は、図2のステップS203と同様に、スピーカ106-lについて、仮想音源座標rS及びスピーカ座標rlに基づき、HPFh(rl,rS)を設定する(ステップS603)。
The object-based
オブジェクトベース音響レンダリング装置2は、図2のステップS204と同様に、スピーカ106-lについて、仮想音源座標rS及びスピーカ座標rlに基づき、減衰係数1/||rl-rS||2を設定する(ステップS604)。
The object-based
オブジェクトベース音響レンダリング装置2は、図2のステップS205と同様に、スピーカ106-lについて、仮想音源座標rS、スピーカ座標rl及び境界面内向き法線ベクトルn(rl)に基づき、成す角θlを算出する(ステップS605)。
Similar to step S205 in FIG. 2, the object-based
オブジェクトベース音響レンダリング装置2は、スピーカ106-lについて、成す角θlの絶対値|θl|が0°よりも大きく、かつ90°よりも小さいか否かを判定し、前記式(9)にてWFSの角度重みwC(θl)、及び以下に示す式(14)にてVBAPの角度重みwS(θl)を設定する(ステップS606)。
具体的には、オブジェクトベース音響レンダリング装置2は、成す角|θl|が0°よりも大きく、かつ90°よりも小さいと判定した場合(前記式(9)(14)ではcosθl>0の場合)、角度重みwC(θl)=cosθl及び角度重みwS(θl)=|1-cosθl|を設定する。一方、オブジェクトベース音響レンダリング装置2は、成す角|θl|が0°以下であるか、または90°以上であると判定した場合(前記式(9)(14)ではcosθl>0以外の場合)、角度重みwC(θl)=0及び角度重みwS(θl)=0を設定する。この角度重みwC(θl)は角度重み付加部13-lにより用いられ、角度重みwS(θl)は、角度重み付加部15-lにて用いられる。
Specifically, when the object-based
角度重みwC(θl)は、0から1までの範囲の値をとり、成す角|θl|が0°<|θl|<90°の範囲において、成す角|θl|が0°に近いほど1(cosθl)に近い値をとり、90°に近いほど0に近い値をとり、成す角|θl|が|θl|≦0°または90°≦|θl|の範囲において、0の値をとる。 The angle weight wC ( θl ) takes a value in the range from 0 to 1. When the angle | θl | is in the range of 0°<| θl |<90°, the closer the angle | θl | is to 0°, the closer it is to 1 (cos θl ), and the closer it is to 90°, the closer it is to 0. When the angle | θl | is in the range of | θl |≦0° or 90°≦| θl |, the angle weight wC(θl) takes a value of 0.
角度重みwS(θl)は、成す角|θl|が0°<|θl|<90°の範囲において、成す角|θl|が0°に近いほど0に近い値をとり、90°に近いほど1(|1-cosθl|)に近い値をとり、成す角|θl|が|θl|≦0°または90°≦|θl|の範囲において、0の値をとる。 The angle weight w S (θ l ) takes a value closer to 0 as the angle |θ l | is closer to 0° when the angle |θ l | is in the range of 0°<|θ l |<90°, and takes a value closer to 1 (|1-cos θ l |) as the angle |θ l | is closer to 90°, and takes a value of 0 when the angle |θ l | is in the range of |θ l |≦0° or 90°≦|θ l |.
オブジェクトベース音響レンダリング装置2は、所定の受音点(聴取者の位置)から仮想音源座標rSへの仮想音源方向の単位ベクトル及び全てのスピーカ106-lにおける所定の受音点からスピーカ座標rlへのスピーカ方向の単位ベクトルに基づいて、仮想音源104を内部に含む3つのスピーカをVBAP対象の3つのスピーカ106-n1,106-n2,106-n3として特定する。
The object-based
そして、オブジェクトベース音響レンダリング装置2は、VBAP対象の3つのスピーカ106-n1,106-n2,106-n3におけるスピーカ方向の単位ベクトルrn1,rn2,rn3を取得する(ステップS607)。単位ベクトルrn1,rn2,rn3は、所定の受音点及びスピーカ106-n1,106-n2,106-n3の座標(スピーカ座標)に基づいて、それぞれ取得することができる。n1,n2,n3は、VBAP対象の3つのスピーカ106-n1,106-n2,106-n3のインデックスである。
The object-based
オブジェクトベース音響レンダリング装置2は、仮想音源座標rSへの仮想音源方向の単位ベクトル及びスピーカ方向の単位ベクトルrn1,rn2,rn3に基づいて、以下の式にてスピーカ106-n1,106-n2,106-n3に対応する係数gl=gn1,gn2,gn3を算出する(ステップS608)。
また、オブジェクトベース音響レンダリング装置2は、スピーカ106-1~106-Lのうちスピーカ106-n1,106-n2,106-n3以外のスピーカ106-lの係数gl=0を設定する。これらの係数gl=gn1,gn2,gn3,0は、VBAP係数算出部21により算出及び設定される。
Furthermore, the object-based
オブジェクトベース音響レンダリング装置2は、インデックスがl=n1,n2,n3のスピーカ106-n1,106-n2,106-n3について、定数u(例えばu=1/2π)、ステップS601にて入力した音源信号S及び仮想音源座標rS、ステップS602にて入力したスピーカ座標rl及び面積要素ΔSl、ステップS603にて設定したHPFh(rl,rS)、ステップS604にて設定した減衰係数1/||rl-rS||2及びステップS606にて設定した角度重みwC(θl)及び角度重みwS(θl)に基づき、以下の式にて駆動信号d(rl)を算出し出力する(ステップS609)。
この式において、係数gl=gn1,gn2,gn3である。また、*は畳み込みを表す。駆動信号d(rl)は、信号増幅部9-l、HPF10-l、減衰付加部11-l、面積要素付加部12-l、角度重み付加部13-l、VBAP係数乗算部14-l、角度重み付加部15-l及び加算部16-lにより算出される。 In this formula, the coefficients g l = g n1 , g n2 , g n3 . * indicates convolution. The drive signal d(r l ) is calculated by a signal amplifier 9-l, HPF 10-l, attenuation adding unit 11-l, surface area element adding unit 12-l, angle weighting adding unit 13-l, VBAP coefficient multiplier 14-l, angle weighting adding unit 15-l, and adder 16-l.
一方、オブジェクトベース音響レンダリング装置2は、インデックスがl=n1,n2,n3以外について、すなわちスピーカ106-n1,106-n2,106-n3以外のスピーカ106-lについて、定数u、音源信号S、仮想音源座標rS、スピーカ座標rl及び面積要素ΔSl、HPFh(rl,rS)、減衰係数1/||rl-rS||2及び角度重みwC(θl)に基づき、以下の式にて駆動信号d(rl)を算出し出力する(ステップS610)。
この駆動信号d(rl)は、信号増幅部9-l、HPF10-l、減衰付加部11-l、面積要素付加部12-l及び角度重み付加部13-lにより算出される。 This drive signal d(r l ) is calculated by a signal amplifier 9-l, HPF 10-l, attenuation adding section 11-l, surface area element adding section 12-l and angle weighting section 13-l.
次に、図5を参照してオブジェクトベース音響レンダリング装置2の構成部の処理について説明する。信号増幅部9-l(9-1~9-L)、HPF10-l(10-1~10-L)、減衰付加部11-l(11-1~11-L)、面積要素付加部12-l(12-1~12-L)、角度重み付加部13-l(13-1~13-L)及び角度算出部20は、図1に示した構成部と同じであるため、説明を省略する。
Next, the processing of the components of the object-based
ここで、角度重み付加部13-lは、成す角θlを反映したWFSの駆動信号を第1駆動信号として、対応する加算部16-lに出力する。角度算出部20は、成す角θlを、対応する角度重み付加部13-l及び角度重み付加部15-lに出力する。
Here, the angle weighting unit 13-l outputs the WFS drive signal reflecting the formed angle θ l as a first drive signal to the corresponding adding unit 16-l. The
VBAP係数算出部21は、仮想音源座標rS及びスピーカ座標r1~rLを入力する。そして、VBAP係数算出部21は、ステップS607,S608のとおり、所定の受音点から仮想音源座標rSへの仮想音源方向の単位ベクトル及び全てのスピーカ106-1~106-Lにおける所定の受音点からスピーカ座標r1~rLへのスピーカ方向の単位ベクトルに基づいて、仮想音源104を内部に含むVBAP対象の3つのスピーカ106-n1,106-n2,106-n3に対応する係数gn1,gn2,gn3を算出する。
The VBAP
VBAP係数算出部21は、係数gl=gn1,gn2,gn3を、スピーカ106-n1,106-n2,106-n3に対応するVBAP係数乗算部14-n1,14-n2,14-n3にそれぞれ出力する。また、VBAP係数算出部21は、係数gl=0を、スピーカ106-n1,106-n2,106-n3以外のスピーカ106-lに対応するVBAP係数乗算部14-lにそれぞれ出力する。
The VBAP
図7は、VBAP係数算出部21の構成例を示すブロック図である。このVBAP係数算出部21は、スピーカ決定部31及び算出部32を備えている。スピーカ決定部31は、仮想音源座標rS及び全てのスピーカ106-1~106-Lのスピーカ座標r1~rLを入力する。そして、スピーカ決定部31は、仮想音源座標rS及びスピーカ座標r1~rLに基づいて、仮想音源104を内部に含むVBAP対象の3つのスピーカ106-n1,106-n2,106-n3を特定する。
7 is a block diagram showing an example of the configuration of the VBAP
スピーカ決定部31は、VBAP対象の3つのスピーカ106-n1,106-n2,106-n3におけるスピーカ方向の単位ベクトルrn1,rn2,rn3を取得し、仮想音源座標rS及びスピーカ方向の単位ベクトルrn1,rn2,rn3を算出部32に出力する。
The
算出部32は、スピーカ決定部31から仮想音源座標rS及びスピーカ方向の単位ベクトルrn1,rn2,rn3を入力する。そして、算出部32は、仮想音源座標rSへの仮想音源方向の単位ベクトル及びスピーカ方向の単位ベクトルrn1,rn2,rn3に基づいて、前記式(15)にてスピーカ106-n1,106-n2,106-n3に対応する係数gn1,gn2,gn3を算出する。そして、算出部32は、係数gn1,gn2,gn3を、対応するVBAP係数乗算部14-n1,14-n2,14-n3に出力する。
The
また、算出部32は、スピーカ106-n1,106-n2,106-n3以外のスピーカ106-lに対応する係数gl=0を設定し、対応するVBAP係数乗算部14-lに出力する。
Furthermore, the
図5に戻って、VBAP係数乗算部14-l(14-1~14-L)は、VBAP係数算出部21から係数gl(gn1,gn2,gn3,0のうちのいずれかの値)を入力する。そして、VBAP係数乗算部14-lは、面積要素付加部12-lから面積要素が付加された信号を入力し、当該信号に対し係数glを乗算することで、係数glを反映した信号を生成する。
5, VBAP coefficient multiplication unit 14-l (14-1 to 14-L) receives coefficient g l (any value of g n1 , g n2 , g n3 , or 0) from VBAP
VBAP係数乗算部14-lは、係数glを反映した信号を角度重み付加部15-lに出力する。 The VBAP coefficient multiplier 14-l outputs a signal reflecting the coefficient g l to the angle weighting unit 15-l.
角度重み付加部15-l(15-1~15-L)は、角度算出部20から成す角θl(θ1~θL)を入力し、成す角θlに基づいて、ステップS606のとおり、前記式(14)にて角度重みwS(θl)を設定する。そして、角度重み付加部15-lは、VBAP係数乗算部14-lから係数glを反映した信号を入力し、当該信号に対し角度重みwS(θl)を乗算することで、成す角θlを反映した信号を生成する。
Angle weighting unit 15-l (15-1 to 15-L) receives angle θ l (θ 1 to θ L ) from
仮想音源104を内部に含む3つスピーカ106-n1,106-n2,106-n3に対応する角度重み付加部15-n1,15-n2,15-n3において、成す角θlを反映した信号は、成す角θlが90°に近いほど、係数glを反映した信号に近くなる。一方、成す角θlを反映した音源信号Sは、成す角θlが0°に近いほど、0に近い信号となる。また、仮想音源104を内部に含む3つスピーカ106-n1,106-n2,106-n3以外のスピーカ106-lに対応する角度重み付加部15-lにおいて、成す角θlを反映した信号は0である。 In the angle weighting units 15-n1, 15-n2, and 15-n3 corresponding to the three speakers 106-n1, 106-n2, and 106-n3 including the virtual sound source 104, the signal reflecting the angle θ l becomes closer to the signal reflecting the coefficient g l as the angle θ l becomes closer to 90°. On the other hand, the sound source signal S reflecting the angle θ l becomes closer to 0 as the angle θ l becomes closer to 0°. Also, in the angle weighting units 15-l corresponding to the speakers 106-l other than the three speakers 106-n1, 106-n2, and 106-n3 including the virtual sound source 104, the signal reflecting the angle θ l is 0.
角度重み付加部15-lは、成す角θlを反映した信号を第2駆動信号として加算部16-lに出力する。 The angle weighting section 15-l outputs a signal reflecting the formed angle θ l to the adding section 16-l as a second drive signal.
加算部16-l(16-1~16-L)は、角度重み付加部13-lから成す角θlを反映した第1駆動信号を入力すると共に、角度重み付加部15-lから成す角θlを反映した第2駆動信号を入力する。そして、加算部16-lは、成す角θlを反映した第1駆動信号及び成す角θlを反映した第2駆動信号を加算し、加算結果を駆動信号d(rl)としてスピーカ106-lへ出力する。 The adder 16-l (16-1 to 16-L) receives the first drive signal reflecting the angle θ l from the angle weighting unit 13-l, and receives the second drive signal reflecting the angle θ l from the angle weighting unit 15-l. The adder 16-l then adds the first drive signal reflecting the angle θ l and the second drive signal reflecting the angle θ l , and outputs the addition result as a drive signal d( r l ) to the speaker 106-l.
以上のように、実施例2のオブジェクトベース音響レンダリング装置2によれば、実施例1のWFSの構成に対してVBAPの構成を組み込み、WFSの一部の構成とVBAPの構成とを、角度重みに応じてシームレスに切り替えることで、駆動信号d(rl)を生成するようにした。
As described above, according to the object-based
具体的には、VBAP係数算出部21は、所定の受音点から仮想音源座標rSへの仮想音源方向の単位ベクトル及びスピーカ座標r1~rLへのスピーカ方向の単位ベクトルに基づいて、仮想音源104を内部に含む3つのスピーカ106-n1,106-n2,106-n3に対応する係数gn1,gn2,gn3を算出する。
Specifically, the VBAP
VBAP係数乗算部14-lは、VBAP係数算出部21から係数gl(gn1,gn2,gn3,0のうちのいずれかの値)を入力する。そして、VBAP係数乗算部14-lは、信号増幅部9-l、HPF10-l、減衰付加部11-l及び面積要素付加部12-lにより得られた信号に係数glを乗算することで、係数glを反映した信号を生成する。
The VBAP coefficient multiplication unit 14-l inputs a coefficient g l (any value of g n1 , g n2 , g n3 , or 0) from the VBAP
角度重み付加部15-lは、成す角θlに基づいて、前記式(14)にて角度重みwS(θl)を設定する。そして、角度重み付加部15-lは、係数glを反映した信号に角度重みwS(θl)を乗算することで、成す角θlを反映した第2駆動信号を生成する。 The angle weighting unit 15-l sets the angle weight w S (θ l ) in the above formula (14) based on the formed angle θ l . Then, the angle weighting unit 15-l generates a second drive signal that reflects the formed angle θ l by multiplying the signal that reflects the coefficient g l by the angle weight w S (θ l ).
加算部16-lは、信号増幅部9-l、HPF10-l、減衰付加部11-l、面積要素付加部12-l及び角度重み付加部13-lからなるWFSの処理により得られた、成す角θlを反映した第1駆動信号、及び、成す角θlを反映した第2駆動信号を加算し、加算結果を駆動信号d(rl)としてスピーカ106-lへ出力する。 The adder 16-l adds together a first drive signal reflecting the angle θ l and a second drive signal reflecting the angle θ l obtained by processing the WFS consisting of the signal amplifier 9-l, the HPF 10-l, the attenuation adding unit 11-l, the surface element adding unit 12- l and the angle weighting adding unit 13-l, and outputs the addition result as a drive signal d(r l ) to the speaker 106-l.
このように、角度重みwS(θl)を用いる角度重み付加部15-lは、係数glを用いるVBAP係数乗算部14-lに対して直列に接続され、VBAPのVBAP係数乗算部14-l及び角度重み付加部15-lは、WFSの角度重み付加部13-lに並列に接続される。そして、角度重み付加部13-lに用いる角度重みwC(θl)と角度重み付加部15-lに用いる角度重みwS(θl)とは、0~1の範囲においてトレードオフの関係にある。 In this way, the angle weighting unit 15-l using the angle weight w S (θ l ) is connected in series to the VBAP coefficient multiplier 14-l using the coefficient g l , and the VBAP coefficient multiplier 14-l and angle weighting unit 15-l of the VBAP are connected in parallel to the angle weighting unit 13-l of the WFS. The angle weight w C (θ l ) used in the angle weighting unit 13-l and the angle weight w S (θ l ) used in the angle weighting unit 15-l are in a trade-off relationship in the range of 0 to 1.
このため、仮想音源104の位置(仮想音源座標rS)がスピーカ106-lの境界面から離れており、成す角θlが0°に近づいている場合には、角度重みwC(θl)は1に近い大きい値となるが、角度重みwS(θl)は0に近い小さい値となる。この場合、駆動信号d(rl)は、WFSによる分配側が支配的となる。 For this reason, when the position of the virtual sound source 104 (virtual sound source coordinate r S ) is away from the boundary surface of the speaker 106-l and the angle θ l formed therewith is close to 0°, the angle weight w C (θ l ) becomes a large value close to 1, but the angle weight w S (θ l ) becomes a small value close to 0. In this case, the distribution side by the WFS becomes dominant in the drive signal d(r l ).
一方、仮想音源104の位置(仮想音源座標rS)がスピーカ106-lの境界面に近接し、成す角θlが90°に近づいている場合には、角度重みwC(θl)は0に近い小さい値となるが、角度重みwS(θl)は1に近い大きい値となる。この場合、駆動信号d(rl)は、VBAPによる分配側が支配的となる。 On the other hand, when the position of the virtual sound source 104 (virtual sound source coordinate r S ) is close to the boundary surface of the speaker 106-l and the formed angle θ l is close to 90°, the angle weight w C (θ l ) is a small value close to 0, but the angle weight w S (θ l ) is a large value close to 1. In this case, the distribution side by VBAP becomes dominant in the drive signal d (r l ).
つまり、スピーカ106-lに対する仮想音源104の位置に応じて、WFSによる分配側とVBAPによる分配側とが、連続的にシームレスに切り替わるようになる。 In other words, depending on the position of the virtual sound source 104 relative to the speaker 106-l, the distribution side based on WFS and the distribution side based on VBAP are switched continuously and seamlessly.
したがって、実施例2のオブジェクトベース音響レンダリング装置2では、実施例1と同様の効果を奏することができる。また、スピーカ106-lが疎に配列された環境において、仮想音源104の位置(仮想音源座標rS)がスピーカ106-lの境界面に近接し、成す角θl が大きくなるにつれてWFSの角度重みは小さく、VBAPの角度重みが大きくなり、連続的にレンダリング則が切り替わる。このため、WFSの角度重みが小さくなることに起因し、再生信号が小さくなる場合でもVBAPの角度重みでそれを補填することで、再生信号が極端に小さくなるという問題を解決することができる。
Therefore, the object-based
尚、実施例2のオブジェクトベース音響レンダリング装置2のHPF10-l(10-1~10-L)は、図1に示した実施例1と同様に、jk||rl-rS||+1を、前記式(12)のHPF係数hn(rl,rS)を用いた前記式(11)のハイパスフィルタに置き換えて使用するようにしてもよい。
The HPF 10-l (10-1 to 10-L) of the object-based
また、実施例2のオブジェクトベース音響レンダリング装置2の減衰付加部11-l(11-1~11-L)は、図1に示した実施例1と同様に、減衰係数1/||rl-rS||2の代わりに、前記式(13)の減衰係数g(rl,rS)を用いるようにしてもよい。つまり、減衰付加部11-lは、減衰係数g(rl,rS)を用いて、仮想音源104とスピーカ106-lとの間の距離に応じて減衰した信号を生成する。
Also, the attenuation adding unit 11-l (11-1 to 11-L) of the object-based
〔実施例3〕
次に、実施例3について説明する。前述のとおり、実施例3は、実施例2と同様に、実施例1の構成に対してVBAPの構成を組み込むことで、実施例1の効果に加え、スピーカ106-lが疎に配置された場合に駆動信号d(rl)が小さくなる問題を解決する。より詳細には、実施例3は、実施例1に示した単純化したWFSの全体の構成とVBAPの構成とを、角度重みに応じてシームレスに切り替えることで、駆動信号d(rl)を生成する。
Example 3
Next, a third embodiment will be described. As described above, in the third embodiment, similar to the second embodiment, the VBAP configuration is incorporated into the configuration of the first embodiment, thereby achieving the effects of the first embodiment and solving the problem that the drive signal d(r l ) becomes small when the speakers 106-l are sparsely arranged. More specifically, the third embodiment generates the drive signal d(r l ) by seamlessly switching between the entire simplified WFS configuration shown in the first embodiment and the VBAP configuration according to the angle weighting.
図8は、実施例3のオブジェクトベース音響レンダリング装置の構成例を示すブロック図であり、図9は、実施例3のオブジェクトベース音響レンダリング装置の処理例を示す疑似コードである。 Figure 8 is a block diagram showing an example of the configuration of an object-based acoustic rendering device of the third embodiment, and Figure 9 is pseudocode showing an example of the processing of the object-based acoustic rendering device of the third embodiment.
このオブジェクトベース音響レンダリング装置3は、信号増幅部9-1~9-L、HPF10-1~10-L、減衰付加部11-1~11-L、面積要素付加部12-1~12-L、角度重み付加部13-1~13-L、VBAP係数乗算部14-1~14-L、角度重み付加部15-1~15-L、加算部16-1~16-L、角度算出部20及びVBAP係数算出部21を備えている。
This object-based acoustic rendering device 3 includes signal amplifiers 9-1 to 9-L, HPFs 10-1 to 10-L, attenuation adding units 11-1 to 11-L, surface area element adding units 12-1 to 12-L, angle weighting adding units 13-1 to 13-L, VBAP coefficient multipliers 14-1 to 14-L, angle weighting adding units 15-1 to 15-L, adders 16-1 to 16-L, an
信号増幅部9-l、HPF10-l、減衰付加部11-l、面積要素付加部12-l及び角度重み付加部13-lは、WFSの構成部であり、VBAP係数乗算部14-l及び角度重み付加部15-lは、VBAPの構成部である。WFSの構成部とVBAPの構成部とは、当該オブジェクトベース音響レンダリング装置3全体として、並列に接続されている。 The signal amplifier 9-l, HPF 10-l, attenuation adding unit 11-l, surface element adding unit 12-l and angle weight adding unit 13-l are components of the WFS, and the VBAP coefficient multiplier 14-l and angle weight adding unit 15-l are components of the VBAP. The components of the WFS and the components of the VBAP are connected in parallel as the object-based acoustic rendering device 3 as a whole.
図2に示した実施例2のオブジェクトベース音響レンダリング装置2とこの実施例3のオブジェクトベース音響レンダリング装置3とを比較すると、両オブジェクトベース音響レンダリング装置2,3は、同一の構成部を備えている点で共通する。
When comparing the object-based
一方、オブジェクトベース音響レンダリング装置3は、VBAPの構成部であるVBAP係数乗算部14-l及び角度重み付加部15-lが、WFSの全体の構成部と並列に接続されている点で、WFSの一部の角度重み付加部13-lのみと並列に接続されているオブジェクトベース音響レンダリング装置2と相違する。
On the other hand, the object-based acoustic rendering device 3 differs from the object-based
図9を参照してオブジェクトベース音響レンダリング装置3の全体処理について説明する。図9に示すステップS901~S908の処理は、図6に示した実施例2のオブジェクトベース音響レンダリング装置2によるステップS601~S608の処理と同じであるため、ここでは説明を省略する。
The overall processing of the object-based acoustic rendering device 3 will be described with reference to FIG. 9. The processing of steps S901 to S908 shown in FIG. 9 is the same as the processing of steps S601 to S608 by the object-based
オブジェクトベース音響レンダリング装置3は、ステップS907にて取得したスピーカ座標rlのインデックスがl=n1,n2,n3の場合、スピーカ106-n1,106-n2,106-n3について、定数u(例えばu=1/2π)、ステップS901にて入力した音源信号S及び仮想音源座標rS、ステップS902にて入力したスピーカ座標rl及び面積要素ΔSl、ステップS903にて設定したHPFh(rl,rS)、ステップS904にて設定した減衰係数1/||rl-rS||2及びステップS906にて設定した角度重みwC(θl)及び角度重みwS(θl)に基づき、以下の式にて駆動信号d(rl)を算出し出力する(ステップS909)。
この式において、係数gl=gn1,gn2,gn3である。また、*は畳み込みを表す。駆動信号d(rl)は、信号増幅部9-l、HPF10-l、減衰付加部11-l、面積要素付加部12-l、角度重み付加部13-l、VBAP係数乗算部14-l、角度重み付加部15-l及び加算部16-lにより算出される。 In this formula, the coefficients g l = g n1 , g n2 , g n3 . * indicates convolution. The drive signal d(r l ) is calculated by a signal amplifier 9-l, HPF 10-l, attenuation adding unit 11-l, surface area element adding unit 12-l, angle weighting adding unit 13-l, VBAP coefficient multiplier 14-l, angle weighting adding unit 15-l, and adder 16-l.
一方、オブジェクトベース音響レンダリング装置3は、インデックスがl=n1,n2,n3以外の場合、スピーカ106-n1,106-n2,106-n3以外のスピーカ106-lについて、定数u、音源信号S、仮想音源座標rS、スピーカ座標rl及び面積要素ΔSl、HPFh(rl,rS)、減衰係数1/||rl-rS||2及び角度重みwC(θl)に基づき、以下の式にて駆動信号d(rl)を算出し出力する(ステップS910)。
この駆動信号d(rl)は、信号増幅部9-l、HPF10-l、減衰付加部11-l、面積要素付加部12-l及び角度重み付加部13-lにより算出される。 This drive signal d(r l ) is calculated by a signal amplifier 9-l, HPF 10-l, attenuation adding section 11-l, surface area element adding section 12-l and angle weighting section 13-l.
尚、前記式(18)の演算において、右辺の第1項であるWFSの構成による演算結果と、第2項であるVBAPの構成による演算結果とは、フィルタリングにより遅延が生じる。このため、角度重み付加部13-l,15-lにおいて、VBAP側にも位相を調整するための遅延を加える必要があるが、ここではその表記は省略する。 In the calculation of equation (18), a delay occurs due to filtering between the calculation result of the WFS configuration, which is the first term on the right side, and the calculation result of the VBAP configuration, which is the second term. For this reason, it is necessary to add a delay to the VBAP side in order to adjust the phase in the angle weighting units 13-l and 15-l, but this will not be shown here.
また、前記式(18)及び前記式(19)において、畳み込み*は、FFT(Fast Fourier Transform:高速フーリエ変換)を利用し、周波数領域での積を逆変換して求めるようにしてもよい。前記式(16)及び前記式(17)についても同様である。 In addition, in the formulas (18) and (19), the convolution * may be calculated by inversely transforming the product in the frequency domain using FFT (Fast Fourier Transform). The same applies to the formulas (16) and (17).
図8を参照して、オブジェクトベース音響レンダリング装置3に備えたそれぞれの構成部の処理は、図5に示した実施例2のオブジェクトベース音響レンダリング装置2に備えたそれぞれの構成部の処理と同じであるため、構成部の処理の説明については省略する。
Referring to FIG. 8, the processing of each component of the object-based acoustic rendering device 3 is the same as the processing of each component of the object-based
VBAP係数乗算部14-l(14-1~14-L)の入力データは、オブジェクトベース音響レンダリング装置2,3間において異なる。図5に示したオブジェクトベース音響レンダリング装置2のVBAP係数乗算部14-lは、面積要素付加部12-lから面積要素が付加された信号を入力する。これに対し、図8に示すオブジェクトベース音響レンダリング装置3のVBAP係数乗算部14-lは、音源信号Sを入力する。
The input data of the VBAP coefficient multiplier 14-l (14-1 to 14-L) differs between the object-based
具体的には、図8に示すオブジェクトベース音響レンダリング装置3のVBAP係数乗算部14-lは、VBAP係数算出部21から係数gl(gn1,gn2,gn3,0のうちのいずれかの値)を入力する。そして、VBAP係数乗算部14-lは、音源信号Sを入力し、当該音源信号Sに係数glを乗算することで、係数glを反映した信号を生成する。
8 receives a coefficient g l (any value of g n1 , g n2 , g n3 , or 0) from a VBAP
以上のように、実施例3のオブジェクトベース音響レンダリング装置3によれば、実施例1のWFSの構成に対してVBAPの構成を組み込み、WFSの全体の構成とVBAPの構成とを、角度重みに応じてシームレスに切り替えることで、駆動信号d(rl)を生成する。 As described above, according to the object-based acoustic rendering device 3 of Example 3, the VBAP configuration is incorporated into the WFS configuration of Example 1, and the drive signal d(r l ) is generated by seamlessly switching between the overall WFS configuration and the VBAP configuration according to the angle weighting.
具体的には、VBAP係数乗算部14-lは、VBAP係数算出部21から係数gl(gn1,gn2,gn3,0のうちのいずれかの値)を入力する。そして、VBAP係数乗算部14-lは、音源信号Sに係数glを乗算することで、係数glを反映した信号を生成する。
Specifically, the VBAP coefficient multiplication unit 14-l inputs a coefficient g l (any value of g n1 , g n2 , g n3 , or 0) from the VBAP
角度重み付加部15-lは、成す角θlに基づいて、前記式(14)にて角度重みwS(θl)を設定する。そして、角度重み付加部15-lは、係数glを反映した信号に角度重みwS(θl)を乗算することで、成す角θlを反映した第2駆動信号を生成する。 The angle weighting unit 15-l sets the angle weight w S (θ l ) in the above formula (14) based on the formed angle θ l . Then, the angle weighting unit 15-l generates a second drive signal that reflects the formed angle θ l by multiplying the signal that reflects the coefficient g l by the angle weight w S (θ l ).
加算部16-lは、信号増幅部9-l、HPF10-l、減衰付加部11-l、面積要素付加部12-l及び角度重み付加部13-lからなるWFSの処理により得られた、成す角θlを反映した第1駆動信号、及び、成す角θlを反映した第2駆動信号を加算し、加算結果を駆動信号d(rl)としてスピーカ106-lへ出力する。 The adder 16-l adds together a first drive signal reflecting the angle θ l and a second drive signal reflecting the angle θ l obtained by processing the WFS consisting of the signal amplifier 9-l, the HPF 10-l, the attenuation adding unit 11-l, the surface element adding unit 12- l and the angle weighting adding unit 13-l, and outputs the addition result as a drive signal d(r l ) to the speaker 106-l.
このように、角度重みwS(θl)を用いる角度重み付加部15-lは、係数glを用いるVBAP係数乗算部14-lに対して直列に接続される。また、VBAPのVBAP係数乗算部14-l及び角度重み付加部15-lは、WFSの信号増幅部9-l、HPF10-l、減衰付加部11-l、面積要素付加部12-l及び角度重み付加部13-lに並列に接続される。そして、角度重み付加部13-lに用いる角度重みwC(θl)と角度重み付加部15-lに用いる角度重みwS(θl)とは、0~1の範囲においてトレードオフの関係にある。 In this way, the angle weighting unit 15-l using the angle weight w S (θ l ) is connected in series to the VBAP coefficient multiplier 14-l using the coefficient g l . The VBAP coefficient multiplier 14-l and angle weighting unit 15-l of the VBAP are connected in parallel to the signal amplifier 9-l, HPF 10-l, attenuation unit 11-l, surface element adding unit 12-l and angle weighting unit 13-l of the WFS. The angle weight w C (θ l ) used in the angle weighting unit 13-l and the angle weight w S (θ l ) used in the angle weighting unit 15-l are in a trade-off relationship in the range of 0 to 1.
このため、実施例2と同様に、θlが0°に近づいたときには、駆動信号d(rl)は、WFSによる分配側が支配的となり、θlが90°に近づいたときには、駆動信号d(rl)は、VBAPによる分配側が支配的となる。 For this reason, similarly to the second embodiment, when θ l approaches 0°, the distribution side by WFS becomes dominant in the drive signal d(r l ), and when θ l approaches 90°, the distribution side by VBAP becomes dominant in the drive signal d(r l ).
つまり、スピーカ106-lに対する仮想音源104の位置に応じて、連続的にWFSとVBAPとの分配側が、シームレスに切り替わるようになる。 In other words, the distribution side between WFS and VBAP is switched continuously and seamlessly depending on the position of the virtual sound source 104 relative to the speaker 106-l.
したがって、実施例3のオブジェクトベース音響レンダリング装置3では、実施例1と同様の効果を奏することができる。また、実施例2と同様に、スピーカ106-lが疎に配列された環境において、WFSによるレンダリングを行っている際に、仮想音源104が境界面に近接して配置されると、VBAPによるレンダリングに連続的にシームレスに切り替わる。このため、再生信号が小さくなるという問題を解決することができる。 Therefore, the object-based acoustic rendering device 3 of the third embodiment can achieve the same effect as that of the first embodiment. Also, as in the second embodiment, when rendering by WFS is being performed in an environment in which the speakers 106-l are sparsely arranged, if the virtual sound source 104 is placed close to a boundary surface, rendering by VBAP is continuously and seamlessly switched over. This solves the problem of the playback signal becoming smaller.
尚、実施例3のオブジェクトベース音響レンダリング装置3のHPF10-l(10-1~10-L)は、図1に示した実施例1及び図5に示した実施例2と同様に、jk||rl-rS||+1を、前記式(12)のHPF係数hn(rl,rS)を用いた前記式(11)のハイパスフィルタに置き換えて使用するようにしてもよい。 The HPF 10-l (10-1 to 10-L) of the object-based acoustic rendering device 3 of the third embodiment may be configured to use a high-pass filter of the above formula (11) using the HPF coefficient h n (r l , r S ) of the above formula (12), replacing jk∥r l -r S ∥+1, as in the first embodiment shown in FIG. 1 and the second embodiment shown in FIG.
また、実施例3のオブジェクトベース音響レンダリング装置3の減衰付加部11-l(11-1~11-L)は、図1に示した実施例1及び図5に示した実施例2と同様に、減衰係数1/||rl-rS||2の代わりに、前記式(13)の減衰係数g(rl,rS)を用いるようにしてもよい。つまり、減衰付加部11-lは、減衰係数g(rl,rS)を用いて、仮想音源104とスピーカ106-lとの間の距離に応じて減衰した信号を生成する。
Furthermore, the attenuation adding unit 11-l (11-1 to 11-L) of the object-based acoustic rendering device 3 of the third embodiment may use the attenuation coefficient g(r l , r S ) of the above formula (13) instead of the
ただし、仮想音源104がスピーカ106-lに近接して配置された場合、単純化したWFSの構成(HPF10-l~角度重み付加部13-l)と、VBAPの構成(VBAP係数乗算部14-l及び角度重み付加部15-l)とでは、信号振幅が大きく異なる場合がある。このため、信号振幅が極端に異ならないように、前記式(13)の減衰係数g(rl,rS)を算出するために用いるパラメータβ1,β2は、適切に調整される必要がある。 However, when the virtual sound source 104 is placed close to the speaker 106-l, the signal amplitude may be significantly different between the simplified WFS configuration (HPF 10-l to angle weighting unit 13-l) and the VBAP configuration (VBAP coefficient multiplier 14-l and angle weighting unit 15-l). Therefore, the parameters β1 and β2 used to calculate the attenuation coefficient g(r l , r S ) in the above formula (13) need to be appropriately adjusted so that the signal amplitude does not differ significantly.
以上、実施例1,2,3を挙げて本発明を説明したが、本発明は前記実施例1,2,3に限定されるものではなく、その技術思想を逸脱しない範囲で種々変形可能である。 The present invention has been described above using Examples 1, 2, and 3, but the present invention is not limited to the above Examples 1, 2, and 3, and various modifications are possible without departing from the technical concept thereof.
尚、本発明の実施例1,2,3によるオブジェクトベース音響レンダリング装置1,2,3のハードウェア構成としては、通常のコンピュータを使用することができる。オブジェクトベース音響レンダリング装置1,2,3は、CPU、RAM等の揮発性の記憶媒体、ROM等の不揮発性の記憶媒体、及びインターフェース等を備えたコンピュータによって構成される。
In addition, a normal computer can be used as the hardware configuration of the object-based
オブジェクトベース音響レンダリング装置1に備えたHPF10-1~10-L、減衰付加部11-1~11-L、面積要素付加部12-1~12-L、角度重み付加部13-1~13-L及び角度算出部20の各機能は、これらの機能を記述したプログラムをCPUに実行させることによりそれぞれ実現される。
The functions of the HPFs 10-1 to 10-L, attenuation adding units 11-1 to 11-L, surface area element adding units 12-1 to 12-L, angle weighting adding units 13-1 to 13-L, and
また、オブジェクトベース音響レンダリング装置2,3に備えたHPF10-1~10-L、減衰付加部11-1~11-L、面積要素付加部12-1~12-L、角度重み付加部13-1~13-L、VBAP係数乗算部14-1~14-L、角度重み付加部15-1~15-L、加算部16-1~16-L、角度算出部20及びVBAP係数算出部21の各機能は、これらの機能を記述したプログラムをCPUに実行させることによりそれぞれ実現される。
Furthermore, the functions of the HPFs 10-1 to 10-L, attenuation adding units 11-1 to 11-L, surface area element adding units 12-1 to 12-L, angle weighting adding units 13-1 to 13-L, VBAP coefficient multipliers 14-1 to 14-L, angle weighting adding units 15-1 to 15-L, adders 16-1 to 16-L,
これらのプログラムは、前記記憶媒体に格納されており、CPUに読み出されて実行される。また、これらのプログラムは、磁気ディスク(フロッピー(登録商標)ディスク、ハードディスク等)、光ディスク(CD-ROM、DVD等)、半導体メモリ等の記憶媒体に格納して頒布することもでき、ネットワークを介して送受信することもできる。 These programs are stored in the storage medium and are read and executed by the CPU. In addition, these programs can be distributed by storing them on storage media such as magnetic disks (floppy disks, hard disks, etc.), optical disks (CD-ROMs, DVDs, etc.), and semiconductor memories, and can also be transmitted and received via a network.
1,2,3 オブジェクトベース音響レンダリング装置
9 信号増幅部
10 HPF(ハイパスフィルタ)
11 減衰付加部
12 面積要素付加部
13,15 角度重み付加部
14 VBAP係数乗算部
16 加算部
20 角度算出部
21 VBAP係数算出部
30,32 算出部
31 スピーカ決定部
100 受音点
101,104 仮想音源
102,106 スピーカ
103 音源
105 スピーカアレイ
rnS 仮想音源方向の単位ベクトル
rn1,rn2,rn3 スピーカ方向の単位ベクトル
gl,gn1,gn2,gn3 係数
rS 仮想音源座標
rl スピーカ座標
C1,C2 領域
S 音源信号
L スピーカの個数
l スピーカの番号(系統の番号)
ΔSl スピーカの面積要素
n(rl) スピーカの境界面内向き法線ベクトル
k 波数
θl 成す角(仮想音源104位置からスピーカ106-l位置を結んだベクトル(rl-rS)と境界面内向き法線ベクトルn(rl)との成す角)
h(rl,rS) HPF
wC(θl),wS(θl) 角度重み
1/||rl-rS||2,g(rl,rS) 減衰係数
d(rl) 駆動信号
1, 2, 3 Object-based
REFERENCE SIGNS
Angle formed by ΔS l, surface area element n (r l ) of speaker, inward normal vector k of speaker's boundary surface, and wave number θ l (angle formed by vector (r l -r S ) connecting the position of virtual sound source 104 to the position of speaker 106-l and inward normal vector n (r l ) of the boundary surface)
h(r l , r s ) HPF
w C (θ l ), w S (θ l )
Claims (6)
前記複数のスピーカの個数をL、前記スピーカの番号をl(=1,・・・,L)、第l番目の前記スピーカを第l番目スピーカ、音源信号が出力される仮想音源の座標を仮想音源座標rS、前記第l番目スピーカの座標をスピーカ座標rl、前記第l番目スピーカの位置での境界面内向き法線ベクトルをn(rl)、前記第l番目スピーカの位置を中心とする面積要素をΔSl、前記第l番目スピーカに対する前記駆動信号をd(rl)として、
前記複数のスピーカのそれぞれについて、前記仮想音源座標rSの位置から前記第l番目スピーカの前記スピーカ座標rlの位置までのベクトルと前記第l番目スピーカの前記境界面内向き法線ベクトルn(rl)との成す角θlを算出する角度算出部、並びに、
前記複数のスピーカのそれぞれに対応する信号増幅部、HPF(ハイパスフィルタ)、減衰付加部、面積要素付加部及び第1角度重み付加部を備え、
前記信号増幅部は、
前記音源信号を定数にて増幅し、
前記HPFは、
前記仮想音源座標rS及び前記第l番目スピーカの前記スピーカ座標rlに基づいて、HPFh(rl,rS)を設定し、前記信号増幅部により増幅された信号に対し、前記HPFh(rl,rS)を用いてフィルタ処理を施し、
前記減衰付加部は、
前記仮想音源座標rSの位置から前記第l番目スピーカの前記スピーカ座標rlの位置までのベクトルの絶対値を求め、前記絶対値を2乗した結果の逆数を減衰係数1/||rl-rS||2として設定し、前記フィルタ処理が施された信号に対し前記減衰係数1/||rl-rS||2を乗算し、
前記面積要素付加部は、
前記減衰付加部により乗算された信号に対し前記面積要素ΔSlを乗算し、
前記第1角度重み付加部は、
前記角度算出部により算出された前記第l番目スピーカの前記成す角θlに基づき、0から1までの範囲において、前記成す角θlの絶対値が0°に近いほど1に近い値をとり、前記成す角θlの絶対値が90°に近いほど0に近い値をとり、前記成す角θlの絶対値が0°以下または90°以上のときに0の値をとる角度重みwC(θl)を設定し、前記面積要素付加部により乗算された信号に対し前記角度重みwC(θl)を乗算することで、前記第l番目スピーカに対する前記駆動信号d(rl)を生成する、ことを特徴とするオブジェクトベース音響レンダリング装置。 1. An object-based audio rendering device that generates drive signals for a plurality of speakers arranged in a listening environment by performing rendering on a sound source object arranged at a position described in audio metadata,
Let L be the number of the plurality of speakers, l (=1, ..., L) be the number of the speakers, the lth speaker be the lth speaker, the coordinates of the virtual sound source from which a sound source signal is output be virtual sound source coordinates r S , the coordinates of the lth speaker be speaker coordinates r l , the inward normal vector of the boundary surface at the position of the lth speaker be n(r l ), the area element centered on the position of the lth speaker be ΔS l , and the drive signal for the lth speaker be d(r l ),
an angle calculation unit that calculates an angle θ l between a vector from the position of the virtual sound source coordinate r S to the position of the speaker coordinate r l of the first speaker and the boundary surface inward normal vector n(r l ) of the first speaker, for each of the plurality of speakers;
a signal amplifier, a high pass filter, an attenuation adding unit, an area element adding unit, and a first angle weighting unit, each of which corresponds to one of the plurality of speakers;
The signal amplifier unit includes:
amplifying the sound source signal by a constant;
The HPF is
setting an HPFh(r l , r S ) based on the virtual sound source coordinates r S and the speaker coordinates r l of the first speaker, and performing a filtering process on the signal amplified by the signal amplifier using the HPFh(r l , r S );
The attenuation adding unit is
an absolute value of a vector from the position of the virtual sound source coordinate r S to the position of the speaker coordinate r l of the first speaker is obtained, the reciprocal of the result of squaring the absolute value is set as an attenuation coefficient 1/||r l -r S || 2 , and the signal that has been subjected to the filtering process is multiplied by the attenuation coefficient 1/||r l -r S || 2 ;
The surface area element adding unit
Multiplying the signal multiplied by the attenuation adding unit by the area element ΔS l ;
The first angle weighting unit
an angle weight wC(θl) is set based on the angle θl of the first speaker calculated by the angle calculation unit, the angle weight wC(θl) taking a value closer to 1 as the absolute value of the angle θl approaches 0°, the value closer to 0 as the absolute value of the angle θl approaches 90°, and the value 0 when the absolute value of the angle θl is less than 0° or greater than 90°, in the range from 0 to 1; and the drive signal d( rl ) for the first speaker is generated by multiplying the signal multiplied by the area element addition unit by the angle weight wC ( θl ) .
さらに、前記仮想音源座標rSへの仮想音源方向の単位ベクトル及び全てのスピーカにおける前記スピーカ座標rlへのスピーカ方向の単位ベクトルに基づいて、前記仮想音源を内部に含む3つのスピーカをVBAP(Vector Based Amplitude Panning)対象の3つのスピーカとして特定し、前記VBAP対象の3つのスピーカの単位ベクトルrn1,rn2,rn3を取得し、前記仮想音源座標rSへの仮想音源方向の単位ベクトル及び前記VBAP対象の3つのスピーカの単位ベクトルrn1,rn2,rn3に基づいて、前記VBAP対象の3つのスピーカに対応する係数gl=gn1,gn2,gn3を求め、前記全てのスピーカのうち、前記VBAP対象の3つのスピーカ以外のスピーカに対応する係数gl=0を設定し、前記係数glを出力するVBAP係数算出部、並びに、
前記複数のスピーカのそれぞれに対応するVBAP係数乗算部、第2角度重み付加部及び加算部を備え、
前記VBAP係数乗算部は、
前記面積要素付加部により乗算された信号に対し、前記VBAP係数算出部により出力された前記係数glを乗算し、
前記第2角度重み付加部は、
前記角度算出部により算出された前記第l番目スピーカの前記成す角θlに基づき、0から1までの範囲において、前記成す角θlの絶対値が0°に近いほど0に近い値をとり、前記成す角θlの絶対値が90°に近いほど1に近い値をとり、前記成す角θlの絶対値が0°以下または90°以上のときに0の値をとる角度重みwS(θl)を設定し、前記VBAP係数乗算部により乗算された信号に対し前記角度重みwS(θl)を乗算することで、第2駆動信号を生成し、
前記第1角度重み付加部は、
前記角度重みwC(θl)を設定し、前記面積要素付加部により乗算された信号に対し前記角度重みwC(θl)を乗算することで、第1駆動信号を生成し、前記加算部が、前記第1駆動信号及び前記第2駆動信号を加算することで、前記第l番目スピーカに対する前記駆動信号d(rl)を生成する、ことを特徴とするオブジェクトベース音響レンダリング装置。 2. The object-based audio rendering apparatus of claim 1,
Furthermore, a VBAP coefficient calculation unit that identifies three speakers including the virtual sound source as three speakers that are targets of VBAP (Vector Based Amplitude Panning ) based on a unit vector of a virtual sound source direction toward the virtual sound source coordinate rS and a unit vector of a speaker direction toward the speaker coordinate r1 for all speakers, obtains unit vectors rn1 , rn2 , rn3 of the three speakers that are targets of VBAP, calculates coefficients g1 = gn1 , gn2 , gn3 corresponding to the three speakers that are targets of VBAP based on the unit vector of the virtual sound source direction toward the virtual sound source coordinate rS and the unit vectors rn1, rn2 , rn3 of the three speakers that are targets of VBAP, sets coefficient g1 = 0 corresponding to speakers other than the three speakers that are targets of VBAP among all the speakers, and outputs the coefficient g1 ;
a VBAP coefficient multiplier, a second angle weighting unit, and an adder, each corresponding to one of the plurality of speakers;
The VBAP coefficient multiplication unit
multiplying the signal multiplied by the area element adding unit by the coefficient g output by the VBAP coefficient calculation unit;
The second angle weighting unit is
based on the angle θl of the first speaker calculated by the angle calculation unit, an angle weight ws(θl) is set, which takes a value closer to 0 as the absolute value of the angle θl approaches 0°, takes a value closer to 1 as the absolute value of the angle θl approaches 90°, and takes a value of 0 when the absolute value of the angle θl is less than 0° or greater than 90°, in a range from 0 to 1; and generates a second drive signal by multiplying the signal multiplied by the VBAP coefficient multiplication unit by the angle weight ws ( θl ) ;
The first angle weighting unit
an angle weight wC ( θl ) is set, and a first drive signal is generated by multiplying the signal multiplied by the area element adding unit by the angle weight wC ( θl ), and the adder unit generates the drive signal d( rl ) for the first speaker by adding the first drive signal and the second drive signal.
前記VBAP係数乗算部は、
前記面積要素付加部により乗算された信号の代わりに、前記音源信号を入力し、前記音源信号に対し前記係数glを乗算する、ことを特徴とするオブジェクトベース音響レンダリング装置。 3. The object-based audio rendering apparatus of claim 2,
The VBAP coefficient multiplication unit
2. An object-based sound rendering apparatus comprising: an input of the sound source signal instead of the signal multiplied by the area element adding unit; and a multiplication unit for multiplying the sound source signal by the coefficient g l .
前記HPFは、
予め設定されたパラメータをα、予め設定されたフィルタ次数をN、及びn=0,1,・・・,Nとして、以下の式:
にて、HPF係数hn(rl,rS)を設定し、
x[t]及びy[t]を時刻tにおける当該HPFの入力及び出力として、入出力特性が以下の式:
となるように、前記信号増幅部により増幅された信号に対し、前記HPF係数hn(rl,rS)を用いてフィルタ処理を施す、ことを特徴とするオブジェクトベース音響レンダリング装置。 An object-based acoustic rendering apparatus according to any one of claims 1 to 3,
The HPF is
With a preset parameter as α, a preset filter order as N, and n=0, 1, . . . , N, the following equation is used:
Set the HPF coefficients h n (r l , r S ) in
Let x[t] and y[t] be the input and output of the HPF at time t, and the input/output characteristics are expressed by the following equation:
and filtering the signal amplified by the signal amplifier using the HPF coefficients h n (r 1 , r s ) so that:
前記減衰付加部は、
予め設定されたパラメータをβ1,β2として、以下の式:
にて減衰係数g(rl,rS)を求め、前記フィルタ処理が施された信号に対し前記減衰係数g(rl,rS)を乗算する、ことを特徴とするオブジェクトベース音響レンダリング装置。 An object-based acoustic rendering apparatus according to any one of claims 1 to 4,
The attenuation adding unit is
With preset parameters as β 1 and β 2 , the following equation is used:
and multiplying the filtered signal by the attenuation coefficient g(r l , r S ) .
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021023419A JP7583638B2 (en) | 2021-02-17 | 2021-02-17 | Object-based audio rendering device and program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021023419A JP7583638B2 (en) | 2021-02-17 | 2021-02-17 | Object-based audio rendering device and program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2022125686A JP2022125686A (en) | 2022-08-29 |
| JP7583638B2 true JP7583638B2 (en) | 2024-11-14 |
Family
ID=83058284
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2021023419A Active JP7583638B2 (en) | 2021-02-17 | 2021-02-17 | Object-based audio rendering device and program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7583638B2 (en) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2024022249A (en) | 2022-08-05 | 2024-02-16 | 株式会社デンソー | Power receiving device |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2014090504A (en) | 2009-11-04 | 2014-05-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandte Forschung E V | Device and method of calculating drive coefficient of speaker in speaker facility based on audio signal related to virtual sound source, and device and method of supplying drive signal of speaker in speaker facility |
| JP2014220614A (en) | 2013-05-07 | 2014-11-20 | 日本放送協会 | Sound signal processing device, sound reproduction apparatus and sound signal processing program |
| JP2019016871A (en) | 2017-07-05 | 2019-01-31 | 日本電信電話株式会社 | Sound image generator |
-
2021
- 2021-02-17 JP JP2021023419A patent/JP7583638B2/en active Active
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2014090504A (en) | 2009-11-04 | 2014-05-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandte Forschung E V | Device and method of calculating drive coefficient of speaker in speaker facility based on audio signal related to virtual sound source, and device and method of supplying drive signal of speaker in speaker facility |
| JP2014220614A (en) | 2013-05-07 | 2014-11-20 | 日本放送協会 | Sound signal processing device, sound reproduction apparatus and sound signal processing program |
| JP2019016871A (en) | 2017-07-05 | 2019-01-31 | 日本電信電話株式会社 | Sound image generator |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2022125686A (en) | 2022-08-29 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6933215B2 (en) | Sound field forming device and method, and program | |
| JP2006508404A (en) | Loudspeaker system for virtual sound synthesis | |
| CN105323684A (en) | Method for approximating synthesis of sound field, monopole contribution determination device, and sound rendering system | |
| KR20130102566A (en) | Spectrally uncolored optimal crosstalk cancellation for audio through loudspeakers | |
| GB2540175A (en) | Spatial audio processing apparatus | |
| JPH1070796A (en) | Stereophonic sound processor | |
| US20050069143A1 (en) | Filtering for spatial audio rendering | |
| Iijima et al. | Binaural rendering from microphone array signals of arbitrary geometry | |
| Gauthier et al. | Source sparsity control of sound field reproduction using the elastic-net and the lasso minimizers | |
| Fazi et al. | Sound field reproduction as an equivalent acoustical scattering problem | |
| Gao et al. | Multizone sound reproduction with adaptive control of scattering effects | |
| Ifergan et al. | On the selection of the number of beamformers in beamforming-based binaural reproduction | |
| JP7583638B2 (en) | Object-based audio rendering device and program | |
| JP5941373B2 (en) | Speaker array driving apparatus and speaker array driving method | |
| Ahrens et al. | Wave field synthesis of moving virtual sound sources with complex radiation properties | |
| CN109923877A (en) | Apparatus and method for weighting stereo audio signals | |
| Bai et al. | Spatial sound field synthesis and upmixing based on the equivalent source method | |
| Matsuda et al. | Binaural-centered mode-matching method for enhanced reproduction accuracy at listener's both ears in sound field reproduction | |
| JP6970366B2 (en) | Sound image reproduction device, sound image reproduction method and sound image reproduction program | |
| JP2016092562A (en) | Audio processing apparatus and method, and program | |
| JPWO2018066384A1 (en) | Signal processing apparatus and method, and program | |
| JP2026511007A (en) | Method and system for optimizing the behavior of an audio playback system | |
| US20200021939A1 (en) | Method for acoustically rendering the size of sound a source | |
| Jin | A tutorial on immersive three-dimensional sound technologies | |
| Tuna et al. | Data-driven local average room transfer function estimation for multi-point equalization |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240104 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240927 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20241009 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20241101 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7583638 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |