JP6921832B2 - Efficient format conversion in audio coding - Google Patents
Efficient format conversion in audio coding Download PDFInfo
- Publication number
- JP6921832B2 JP6921832B2 JP2018540755A JP2018540755A JP6921832B2 JP 6921832 B2 JP6921832 B2 JP 6921832B2 JP 2018540755 A JP2018540755 A JP 2018540755A JP 2018540755 A JP2018540755 A JP 2018540755A JP 6921832 B2 JP6921832 B2 JP 6921832B2
- Authority
- JP
- Japan
- Prior art keywords
- array
- entry
- downmix matrix
- frequency
- frequency bin
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Stereophonic System (AREA)
Description
本書類は、オーディオ信号のフォーマット変換(ダウンミキシングを含む)の方法及び装置に関する。特に、本書類は、例えば、MPEG−H 3Dオーディオ標準規格に関する簡略化されたより効率的なフォーマット変換の方法及び装置に関する。 This document relates to methods and devices for format conversion (including downmixing) of audio signals. In particular, this document relates to, for example, simplified and more efficient format conversion methods and devices for the MPEG-H 3D audio standard.
MPEG−H 3Dオーディオ標準規格のメインプロファイルのフォーマット変換器は、Nin個のチャネルを有する送信チャネル構成からNout≦Nin個のチャネルを有する所望の再生フォーマットに、マルチチャネルオーディオ信号を変換するダウンミキサーである。このダウンミキサーは、エネルギーの保存を確保する位相整列(phase-alignment)アクティブダウンミックスアルゴリズムを特徴とし、さらに、望ましくない信号のカラーレーション及びアーティファクトをもたらす制御されない信号の相殺(cancellations)又は信号の増幅を防止又は低減するように機能する。マイナス面としては、ダウンミックスアルゴリズムの計算の複雑度は高く、高い計算負荷を復号化器に与える。例えば、22.2チャネルからステレオへのダウンミックスの場合、メインプロファイルにおける復号化器の全体の複雑度の約50パーセントがダウンミックスアルゴリズムに割り当てられる。 Format converter of the main profile of MPEG-H 3D audio standards, the desired playback format having N out ≦ N in number of channels from the transmission channel configuration having N in number of channels, converts the multi-channel audio signal It is a down mixer. This downmixer features a phase-alignment active downmix algorithm that ensures energy conservation, as well as uncontrolled signal cancellations or signal amplification that result in unwanted signal coloration and artifacts. Functions to prevent or reduce. On the downside, the computational complexity of the downmix algorithm is high, giving the decoder a high computational load. For example, in the case of a 22.2 channel to stereo downmix, about 50 percent of the overall complexity of the decoder in the main profile is allocated to the downmix algorithm.
高い計算複雑度は、入力チャネルの数Ninが大きい場合に特に生じる。計算負荷は、典型的には比較的小さい計算能力をもつが、多数のチャネルを特徴とする高品質のブロードキャストコンテンツをレンダリングするデバイスにとって、特に重大である。 High computational complexity occurs especially when the number of input channels N in is large. Computational load, which typically has relatively small computational power, is especially significant for devices that render high quality broadcast content featuring a large number of channels.
したがって、簡単で且つ効率的でありながら、更にオーディオ信号の品質及びエネルギーの保存に関して有利な特性を保持するフォーマット変換器が必要とされている。 Therefore, there is a need for a format converter that is simple and efficient, yet retains favorable properties in terms of audio signal quality and energy conservation.
本開示の一態様によれば、複数の入力オーディオチャネルをダウンミキシングする方法が説明される。本方法は、入力オーディオチャネルのそれぞれについて、複数の対応する周波数ビン(変換領域周波数ビン)における複数の周波数係数を取得することを含み得る。この取得するステップは、ビットストリームからそれらの周波数係数を受け取ること、又は時間周波数変換を入力オーディオチャネルのそれぞれに適用して、(入力オーディオチャネルのそれぞれについて)複数の対応する周波数ビンにおける複数の周波数係数を取得することに関連していてもよい。この時間周波数変換は、短時間フーリエ変換(STFT)であってもよい。特に、この時間周波数変換は、離散フーリエ変換(DFT)(例えば、高速フーリエ変換(FFT))であってもよい。本方法は、少なくとも1つの周波数ビンについて、それぞれの周波数ビンの複数の入力オーディオチャネルの周波数係数によって形成される第1のアレイにダウンミックス行列を適用して、それぞれの周波数ビンの複数の中間オーディオチャネルの周波数係数によって形成される第2のアレイを取得することを更に含んでいてもよい。これらの第1のアレイ及び第2のアレイは、線形アレイ(ベクトル)であり得る。第1のアレイのエントリー(要素)の数は、入力オーディオチャネルの数によって与えられ得る。第2のアレイのエントリーの数は、出力オーディオチャネルの数によって与えられ得る。ダウンミックス行列は、周波数ビンが異なるごとに異なっていてもよいし、オーディオ帯域(処理帯域)が異なるごとに異なっていてもよい。実施形態によっては、ダウンミックス行列は、周波数ビン又はオーディオ帯域の全体にわたって一様であってもよい。本方法は、更に、ダウンミックス行列の非ゼロのエントリー(要素)のみを含む第3のアレイを求めることを含んでいてもよい。本方法は、更に、第3のアレイの各エントリーについて、ダウンミックス行列内の第3のアレイのそれぞれのエントリーの位置を示すエントリーを含む第4のアレイを求めることを含んでいてもよい。ダウンミックス行列を第1のアレイに適用することは、少なくとも1つの周波数ビンについて、それぞれの周波数ビンの第3のアレイのエントリーと第1のアレイの対応するエントリーとを乗算することを含んでいてもよい。第1のアレイの対応するエントリーは、第4のアレイに基づいて求められ得る。ここで、第1のアレイ内の対応するエントリーは、ダウンミックス行列と第1のアレイとの通常の行列の乗算において、ダウンミックス行列のそれぞれの非ゼロのエントリーと乗算されるエントリーを示すものと理解される。ダウンミックス行列を適用することは、取得された積の総和を適切に計算することと、取得された積の(1つ以上の)総和を第2のアレイのエントリーに割り当てることとを更に含み得る。 According to one aspect of the present disclosure, a method of downmixing a plurality of input audio channels will be described. The method may include obtaining multiple frequency coefficients in a plurality of corresponding frequency bins (conversion region frequency bins) for each of the input audio channels. This acquisition step receives those frequency coefficients from the bitstream, or applies time-frequency conversion to each of the input audio channels, and multiple frequencies in multiple corresponding frequency bins (for each of the input audio channels). It may be related to obtaining the coefficient. This time frequency transform may be a short time Fourier transform (STFT). In particular, this time-frequency transform may be a discrete Fourier transform (DFT) (eg, a fast Fourier transform (FFT)). The method applies a downmix matrix to a first array formed by the frequency coefficients of multiple input audio channels in each frequency bin for at least one frequency bin, and multiple intermediate audios in each frequency bin. It may further include acquiring a second array formed by the frequency coefficients of the channel. These first and second arrays can be linear arrays (vectors). The number of entries (elements) in the first array can be given by the number of input audio channels. The number of entries in the second array can be given by the number of output audio channels. The downmix matrix may be different for each different frequency bin, or may be different for each different audio band (processing band). In some embodiments, the downmix matrix may be uniform over the frequency bin or audio band. The method may further include finding a third array containing only nonzero entries (elements) of the downmix matrix. The method may further include finding for each entry in the third array a fourth array containing an entry indicating the position of each entry in the third array in the downmix matrix. Applying the downmix matrix to the first array involves multiplying at least one frequency bin the entry of the third array of each frequency bin and the corresponding entry of the first array. May be good. The corresponding entry in the first array can be determined based on the fourth array. Here, the corresponding entry in the first array indicates the entry to be multiplied by each non-zero entry in the downmix matrix in the normal matrix multiplication of the downmix matrix with the first array. Understood. Applying a downmix matrix may further include properly calculating the sum of the obtained products and assigning the sum (one or more) of the obtained products to the entries in the second array. ..
上記のように構成されることにより、当業者に理解されるように、提案された方法は、通常の用途下、特にチャネルの数が多い(例えば、Nin、Nout≧6である)場合において、典型的には全ての出力チャネルが全ての入力チャネルに依存するわけではないので、ダウンミックス行列が典型的にはスパース行列になるという事実を利用する。換言すれば、通常のアプリケーションシナリオにおいて、ダウンミックス行列は、ゼロに等しいエントリーを有する。ダウンミックス行列のスパース性、すなわち、ゼロエントリーの割合は、フォーマット変換の使用例に依存する。ただし、典型的には、スパース性は、入力チャネル及び出力チャネルの数の増加とともに増加する。例えば、22.2チャネルのオーディオを5.1チャネルのオーディオにダウンミキシングする実際的な使用例において、ダウンミキシング行列が6×24のダウンミックス行列における144個のエントリーの中で34個の非ゼロのエントリーを有する場合、スパース度Sは、S=(144−34)/144≒76%によって与えられる。スパース性を利用することにより、1つのオーディオ帯域を変換するフォーマットの計算の複雑度を、およそO(NoutNin 2)からO((1−S)NoutNin 2)に低減することができる。なお、例えばスパースダウンミックス行列に用いられるハードウェアプラットフォーム及び厳密な表現に依存して、何らかの付加的なオーバーヘッドを伴うことがある。 As will be appreciated by those skilled in the art by being configured as described above, the proposed method is under normal use, especially when the number of channels is large (eg, N in , N out ≥ 6). Take advantage of the fact that a downmix matrix is typically a sparse matrix, since typically not all output channels depend on all input channels. In other words, in a normal application scenario, the downmix matrix has entries equal to zero. The sparsity of the downmix matrix, i.e. the percentage of zero entries, depends on the format conversion use case. However, typically, sparsity increases with increasing number of input and output channels. For example, in a practical use case of downmixing 22.2 channel audio to 5.1 channel audio, 34 non-zeros out of 144 entries in a downmix matrix with a downmixing matrix of 6x24. With the entry of, the degree of sparseness S is given by S = (144-34) / 144≈76%. By utilizing sparsity, the complexity of calculation of a format that converts one audio band can be reduced from approximately O (N out N in 2 ) to O ((1-S) N out N in 2). Can be done. Note that some additional overhead may be involved, depending on, for example, the hardware platform used for the sparse downmix matrix and the exact representation.
特に、本提案による方法は、ダウンミックス行列へのアクセスを最小限にする。そして、全体的な計算コストを増大させるが所望の計算結果に影響を及ぼさない計算ステップを回避する。したがって、ダウンミキシングされたオーディオチャネルの全体的な計算は、例えば計算の精度を劣化させることなく、計算結果に影響を及ぼすことなく、計算コスト及びメモリアクセスレートの双方に関してより効率的に行うことができる。したがって、本提案による方法を用いるオーディオ復号化器のフォーマット変換器は、フォーマット変換器のスリムな設計を可能にする削減された計算能力を有し得る。 In particular, the proposed method minimizes access to the downmix matrix. It avoids computational steps that increase the overall computational cost but do not affect the desired computational results. Therefore, the overall calculation of the downmixed audio channel can be done more efficiently in terms of both calculation cost and memory access rate, for example, without degrading the accuracy of the calculation and without affecting the calculation result. can. Therefore, the format converter of an audio decoder using the method according to the present proposal may have reduced computing power that allows for a slim design of the format converter.
本提案による方法は、スパースダウンミックス行列のいずれの例においても有益であるが、特に、システムによってサポートされる入力チャネル及び出力チャネルが最大数の場合に発生する最悪の場合の複雑度を低減するのに有益である。一般的に言えば、本提案による方法は、多数の入力チャネル及び出力チャネルを伴う複雑な使用例に対して特に有益である。 The proposed method is useful in all examples of sparse downmix matrices, but in particular reduces the worst-case complexity that occurs with the maximum number of input and output channels supported by the system. It is beneficial to. Generally speaking, the method according to the present proposal is particularly useful for complex use cases involving a large number of input and output channels.
上記及びこのセクションの残りの部分では、本提案による方法は、少なくとも1つの周波数ビンについて実行されるものとしている。しかしながら、本方法は、時間周波数変換の、単一の周波数ビン、周波数ビンの或るグループ内(例えば、所与のオーディオ帯域(処理帯域)内)の全ての周波数ビン、又は全ての周波数ビン(例えば、各周波数ビン)について、実行され得ることが理解される。 In the above and for the rest of this section, the method according to the present proposal shall be performed for at least one frequency bin. However, the method uses a single frequency bin for time-frequency conversion, all frequency bins within a group of frequency bins (eg, within a given audio band (processing band)), or all frequency bins (eg, within a given audio band (processing band)). For example, for each frequency bin) it is understood that it can be done.
幾つかの例示の実施形態では、本方法は、少なくとも1つの周波数ビンについて、中間(intermediate)オーディオチャネルごとに、それぞれの中間オーディオチャネルのエネルギー指標値を求める(計算する)ステップを更に含んでいてもよい。本方法は、少なくとも1つの周波数ビンについて、中間オーディオチャネルごとに、それぞれのエネルギー指標値に基づいてそれぞれの周波数ビンにおけるそれぞれの中間オーディオチャネルの周波数係数の大きさを調整するステップを更に含んでいてもよい。 In some exemplary embodiments, the method further comprises the step of finding (calculating) the energy index value of each intermediate audio channel for at least one frequency bin, for each intermediate audio channel. May be good. The method further comprises adjusting the magnitude of the frequency coefficient of each intermediate audio channel in each frequency bin based on the respective energy index value for each intermediate audio channel for at least one frequency bin. May be good.
幾つかの例示の実施形態では、本方法は、ダウンミックス行列がスパース行列であるか否かの判断を更に含んでいてもよい。その後、ダウンミックス行列がスパース行列であると判明した場合にのみ、第3のアレイ及び第4のアレイ(及び以下で定義する第5のアレイ)を伴う処理を実行してもよい。 In some exemplary embodiments, the method may further include determining whether the downmix matrix is a sparse matrix. After that, processing involving a third array and a fourth array (and a fifth array as defined below) may be performed only if the downmix matrix is found to be a sparse matrix.
幾つかの例示の実施形態では、上記エネルギー指標値を求めることは、少なくとも1つの周波数ビンについて、第3のアレイのエントリーの累乗と、第1のアレイの対応するエントリーの絶対値の累乗とを乗算することを含んでいてもよく、第1のアレイの対応するエントリーは、第4のアレイに基づいて求められ得る。例えば、エネルギー指標値は、第3のアレイのエントリーの2乗と第1のアレイの対応するエントリーの絶対値の2乗(絶対平方)とを乗算することを伴っていてもよい。エネルギー指標値を求めることは、取得された積を適切に合計することを更に含んでいてもよい。上記エネルギー指標値は、所与のオーディオ帯域内の全ての周波数ビンについて同一であってもよい。そのような場合、周波数ビンの上記エネルギー指標値を求めることは、所与のオーディオ帯域内の周波数ビンのそれぞれについて取得されたそれぞれの結果(例えば、取得された積の適切な和)を合計することを更に含んでいてもよい。 In some exemplary embodiments, determining the energy index value is a power of the entries in the third array and a power of the absolute values of the corresponding entries in the first array for at least one frequency bin. Multiplying may be included and the corresponding entry in the first array can be determined based on the fourth array. For example, the energy index value may involve multiplying the square of the entry in the third array by the square of the absolute value (absolute square) of the corresponding entry in the first array. Finding the energy index value may further include summing the obtained products appropriately. The energy index value may be the same for all frequency bins in a given audio band. In such cases, finding the above energy index values for frequency bins sums the respective results obtained for each of the frequency bins within a given audio band (eg, the appropriate sum of the acquired products). It may further include that.
これによって、計算コスト及びメモリアクセスレートに関して特に単純な方法でエネルギー指標値を効率的に計算することが可能になる。その上、このようにエネルギー指標値の算出を実施すると、中間オーディオチャネルの計算及びエネルギー指標値の計算の双方を一括して行うことができる。この一括した計算によって、双方の計算に同じ計算ツールを用いることが可能になるとともに、第1のアレイ及び第3のアレイのインデックスにわたって繰り返されるループを回避することが可能になる。その結果、計算の複雑度及びメモリアクセスレートを更に低減することができる。 This makes it possible to efficiently calculate the energy index value in a particularly simple way with respect to calculation cost and memory access rate. Moreover, when the calculation of the energy index value is performed in this way, both the calculation of the intermediate audio channel and the calculation of the energy index value can be performed collectively. This batch calculation makes it possible to use the same calculation tool for both calculations and avoid repeated loops across the indexes of the first and third arrays. As a result, the complexity of calculation and the memory access rate can be further reduced.
幾つかの例示の実施形態では、第3のアレイは、ダウンミックス行列の非ゼロのエントリーを、ダウンミックス行列のエントリー全体にわたる所定の走査順序におけるそれらの出現順序で含む線形アレイ(ベクトル)であり得る。この走査順序は、例えば、行方向走査順序又は列方向走査順序であり得る。 In some exemplary embodiments, the third array is a linear array (vector) containing non-zero entries in the downmix matrix in their order of appearance in a given scan order across the entries in the downmix matrix. obtain. This scanning order may be, for example, a row-direction scanning order or a column-direction scanning order.
幾つかの例示の実施形態では、第4のアレイの各エントリーは、第3のアレイにおけるそれぞれのエントリーの、ダウンミックス行列内での上記走査順序における位置を示していてもよい。この位置は、線形位置であってもよい。さらに、この位置は、走査順序における絶対位置、例えば、行方向走査順序の場合には行の長さを法とする(mod)絶対位置とすることもできるし、列方向走査順序の場合には列の長さ(列の高さ)を法とする絶対位置とすることもできる。 In some exemplary embodiments, each entry in the fourth array may indicate the position of each entry in the third array in the scan order in the downmix matrix. This position may be a linear position. Further, this position can be an absolute position in the scan order, for example, in the case of a row direction scan order, the row length is modal (mod), or in the case of a column direction scan order. It can also be an absolute position relative to the length of the row (height of the row).
幾つかの例示の実施形態では、第4のアレイの各エントリーは、行方向走査順序の場合には、第3のアレイのそれぞれのエントリーがダウンミックス行列において位置するダウンミックス行列の列を示していてもよい。列方向走査順序の場合、第4のアレイの各エントリーは、第3のアレイのそれぞれのエントリーがダウンミックス行列において位置するダウンミックス行列の行を示していてもよい。 In some exemplary embodiments, each entry in the fourth array, in the case of row-wise scan order, indicates a column of downmix matrices in which each entry in the third array is located in the downmix matrix. You may. For columnar scan order, each entry in the fourth array may represent a row in the downmix matrix in which each entry in the third array is located in the downmix matrix.
別の実施形態では、第4のアレイの各エントリーは、ダウンミックス行列における第3のアレイのそれぞれのエントリーの走査順序上での位置の、当該走査順序上での第1の位置からのオフセットを示していてもよい。更に別の実施形態では、第4のアレイの各エントリーは、ダウンミックス行列における第3のアレイのそれぞれのエントリーの走査順序上での位置の、ダウンミックス行列における第3のアレイのそれぞれのエントリーの直前のエントリーの走査順序上での位置からのオフセットを示していてもよい。 In another embodiment, each entry in the fourth array is offset by the scan order position of each entry in the third array in the downmix matrix from the first position in the scan order. It may be shown. In yet another embodiment, each entry in the fourth array is a position on the scan order of each entry in the third array in the downmix matrix, and each entry in the third array in the downmix matrix. It may indicate the offset from the position in the scanning order of the immediately preceding entry.
第4のアレイにおいて、位置のそのような表現を行うことにより、僅かな計算量及び低減されたメモリアクセスレートで、第3のアレイの所与のエントリーに対応する第1のアレイ内のエントリーを容易に推定することが可能になる。 By making such a representation of position in the fourth array, the entries in the first array corresponding to a given entry in the third array with a small amount of computation and reduced memory access rate. It can be easily estimated.
幾つかの例示の実施形態では、本方法は、第5のアレイを求めるステップ(複数の場合もある)を更に含んでいてもよい。第5のアレイのエントリーは、行方向走査順序の場合には、ダウンミックス行列のそれぞれの行ごとの非ゼロのエントリーの数を示していてもよく、列方向走査順序の場合には、ダウンミックス行列のそれぞれの列ごとの非ゼロのエントリーの数を示していてもよい。ここで、第5のアレイのエントリーは、いずれにおいても、ダウンミックス行列の行又は列がダウンミックス行列において有する次数と同じ次数を有していてもよい。 In some exemplary embodiments, the method may further include the step (s) of finding a fifth array. The entries in the fifth array may indicate the number of non-zero entries for each row of the downmix matrix in the case of row scan order and downmix in the case of column scan order. It may indicate the number of non-zero entries for each column of the matrix. Here, the entries in the fifth array may in any case have the same degree as the rows or columns of the downmix matrix have in the downmix matrix.
幾つかの例示の実施形態では、ダウンミックス行列を第1のアレイに適用することは、少なくとも1つの周波数ビンについて、それぞれの周波数ビンの第3のアレイのエントリーと第1のアレイの対応するエントリーとの1つ以上の積の和を、第5のアレイのエントリーに基づいて第2のアレイのエントリーに割り当てることを更に含んでいてもよい。 In some exemplary embodiments, applying the downmix matrix to the first array is an entry in the third array of each frequency bin and a corresponding entry in the first array for at least one frequency bin. It may further include assigning the sum of one or more products of and to the entries of the second array based on the entries of the fifth array.
幾つかの例示の実施形態では、ダウンミックス行列を第1のアレイに適用することは、少なくとも1つの周波数ビンについて、第3のアレイに対するエントリーインデックスを一時に1つずつ連続的にインクリメントし、そのようなエントリーインデックスごとに、それぞれの周波数ビンの、それぞれのエントリーインデックスによって示される第3のアレイのエントリーと、第1のアレイの対応するエントリーとの積を求める(計算する)ことを更に含んでいてもよい。ダウンミックス行列を第1のアレイに適用することは、少なくとも1つの周波数ビンについて、これらの積のうちの1つ以上の和を第2のアレイのエントリーに順次割り当てることを更に伴うことができ、この割り当ては、第5のアレイのエントリーに基づいている。ここで、上記インクリメントすることは、エントリーインデックスの可能な最小の値(例えば、1)から開始してもよい。 In some exemplary embodiments, applying the downmix matrix to the first array continuously increments the entry index for the third array, one at a time, for at least one frequency bin. For each such entry index, further including finding (calculating) the product of the entry of the third array represented by each entry index of each frequency bin and the corresponding entry of the first array. You may. Applying the downmix matrix to the first array can further entail assigning the sum of one or more of these products sequentially to the entries of the second array for at least one frequency bin. This allocation is based on the entry in the fifth array. Here, the increment may start from the smallest possible value of the entry index (eg, 1).
幾つかの例示の実施形態では、ダウンミックス行列を第1のアレイに適用することは、少なくとも1つの周波数ビン及び第3のアレイに対する各エントリーインデックスについて、それぞれの周波数ビンの、それぞれのエントリーインデックスによって示される第3のアレイのエントリーの2乗と、第1のアレイの対応するエントリーの絶対平方との積を第2の積として求めることを更に伴うことができる。ダウンミックス行列を第1のアレイに適用することは、少なくとも1つの周波数ビン及び第3のアレイに対する各エントリーインデックスについて、これらの第2の積のうちの1つ以上の和をそれぞれの周波数ビンの第6のアレイのエントリーに順次割り当てることをまた更に伴うことができる。この割り当ては、第5のアレイのエントリーに基づいてもよい。所与の処理帯域内の周波数ビンにわたる第6のアレイの和は、当該所与の処理帯域内の周波数ビンの第1のエネルギー指標値を与え得る。 In some exemplary embodiments, applying the downmix matrix to the first array means that for each entry index for at least one frequency bin and the third array, by each entry index for each frequency bin. It can further be accompanied by finding the product of the square of the entries in the third array shown and the absolute squares of the corresponding entries in the first array as the second product. Applying the downmix matrix to the first array is the sum of one or more of these second products for each entry index for at least one frequency bin and the third array for each frequency bin. It can also be accompanied by sequential allocation to the entries in the sixth array. This allocation may be based on the entry of the fifth array. The sum of the sixth array over the frequency bins in a given processing band can give the first energy index value of the frequency bins in the given processing band.
幾つかの例示の実施形態では、所与の処理帯域内の周波数ビンを求めるステップは、ルックアップテーブルを参照することを伴うことができる。このルックアップテーブルは、処理帯域ごとに、このそれぞれの処理帯域内の周波数ビンの数を示すエントリーを含み得る。 In some exemplary embodiments, the step of finding a frequency bin within a given processing band can involve referring to a look-up table. This lookup table may contain, for each processing band, an entry indicating the number of frequency bins within each processing band.
幾つかの例示の実施形態では、本方法は、第2のアレイの第1のエントリーについて、第5のアレイの第1のエントリーから、ダウンミックス行列の第1の行における非ゼロのエントリーの数を求めることを更に伴うことができる。第2のアレイ及び第5のアレイに対するエントリーインデックスは、1に初期化され得る。本方法は、第3のアレイの第1のエントリーと第4のアレイの第1のエントリーによって示される第1のアレイのエントリーとの積を第1の積として求める(計算する)ことを更に含み得る。本方法は、第3のアレイの第1のエントリーの2乗と第4のアレイの第1のエントリーによって示される第1のアレイのエントリーの絶対平方との積を第2の積として求める(計算する)ことを更に含み得る。本方法は、求められた第1の積の数がダウンミックス行列の第1の行における非ゼロのエントリーの数よりも少ない場合に、第3のアレイに対するエントリーインデックス及び第4のアレイに対するエントリーインデックスを1つだけインクリメントすることと、インクリメントされたそれぞれのエントリーインデックスによって示される第3のアレイのエントリーと第4のアレイのエントリーとの積を第1の積として求める(計算する)こととを更に含み得る。本方法は、求められた第1の積を合計することと、求められた第1の積の和を第2のアレイの第1のエントリーに割り当てることとをまた更に含み得る。本方法は、求められた第2の積を合計することと、求められた第2の積の和を第6のアレイの第1のエントリーに割り当てることとをまた更に含み得る。その後、第3のアレイ、第4のアレイ及び第5のアレイに対するエントリーインデックスをそれぞれ1つずつインクリメントしてもよく、第2のアレイの第2のエントリー及び第6のアレイの第2のエントリーについて前述のステップを繰り返してもよく、第2のアレイ(及び第6のアレイ)の最後のエントリーに達するまで、同様に行ってもよい。 In some exemplary embodiments, the method is the number of non-zero entries in the first row of the downmix matrix from the first entry in the fifth array for the first entry in the second array. Can be further accompanied by seeking. The entry index for the second and fifth arrays can be initialized to 1. The method further comprises finding (calculating) the product of the first entry of the third array and the entry of the first array represented by the first entry of the fourth array as the first product. obtain. The method finds the product of the square of the first entry in the third array and the absolute square of the entry in the first array indicated by the first entry in the fourth array as the second product (calculation). ) Can be further included. The method finds an entry index for the third array and an entry index for the fourth array when the number of first products obtained is less than the number of non-zero entries in the first row of the downmix matrix. Is further incremented by one, and the product of the entries in the third array and the entries in the fourth array indicated by each incremented entry index is further calculated (calculated) as the first product. Can include. The method may further include summing the obtained first products and assigning the sum of the obtained first products to the first entry in the second array. The method may further include summing the obtained second products and assigning the sum of the obtained second products to the first entry in the sixth array. The entry index for each of the third, fourth, and fifth arrays may then be incremented by one for each of the second entry in the second array and the second entry in the sixth array. The steps described above may be repeated, and may be repeated until the final entry of the second array (and the sixth array) is reached.
本書類において説明される方法は、対応する装置、例えば、フォーマット変換器又はオーディオ復号化器に適用することができることに留意されたい。方法に関して上記で述べたことはいずれも、複数の入力オーディオチャネルをダウンミキシングする装置にも同様に当てはまることが理解される。 It should be noted that the methods described in this document can be applied to corresponding devices such as format converters or audio decoders. It is understood that all of the above statements regarding the method apply equally to devices that downmix multiple input audio channels.
その結果、別の態様によれば、複数の入力オーディオチャネルをダウンミキシングする装置が説明される。本装置(例えば、フォーマット変換器又はオーディオ復号化器)は、入力オーディオチャネルのそれぞれについて、複数の対応する周波数ビン(変換領域周波数ビン)における複数の周波数係数を取得するように適合(構成)された周波数係数取得ユニットを備えることができる。この周波数係数取得ユニットは、ビットストリームから上記周波数係数を受信するように構成された受信ユニットであってもよいし、入力オーディオチャネルのそれぞれに時間周波数変換を適用して、入力オーディオチャネルのそれぞれについて、複数の対応する周波数ビンにおける複数の周波数係数を取得するように構成された時間周波数変換ユニットであってもよい。時間周波数変換は、例えば、短時間フーリエ変換(STFT)であってもよい。特に、時間周波数変換は、離散フーリエ変換(DFT)、例えば、高速フーリエ変換(FFT)であってもよい。本装置は、ダウンミックス行列を取得するように構成されたダウンミックス行列取得ユニットを更に備えることができる。本装置は、少なくとも1つの周波数ビンについて、それぞれの周波数ビンの複数の入力オーディオチャネルの周波数係数によって形成された第1のアレイにダウンミックス行列を適用して、それぞれの周波数ビンの複数の中間オーディオチャネルの周波数係数によって形成された第2のアレイを取得するように構成されたダウンミキシングユニットを更に備えることができる。第1のアレイ及び第2のアレイは、線形アレイ(ベクトル)とすることができる。第1のアレイのエントリー(要素)の数は、入力オーディオチャネルの数によって与えることができ、第2のアレイのエントリーの数は、出力オーディオチャネルの数によって与えることができる。ダウンミックス行列は、周波数ビンが異なるごとに異なる場合もあるし、オーディオ帯域(処理帯域)が異なるごとに異なる場合もある。 As a result, according to another aspect, a device that downmixes a plurality of input audio channels is described. The device (eg, a format converter or audio decoder) is adapted (configured) to acquire multiple frequency coefficients in a plurality of corresponding frequency bins (conversion region frequency bins) for each of the input audio channels. A frequency coefficient acquisition unit can be provided. The frequency coefficient acquisition unit may be a receiving unit configured to receive the above frequency coefficient from the bitstream, or apply time-frequency conversion to each of the input audio channels for each of the input audio channels. , It may be a time-frequency conversion unit configured to acquire a plurality of frequency coefficients in a plurality of corresponding frequency bins. The time frequency transform may be, for example, a short time Fourier transform (STFT). In particular, the time-frequency transform may be a discrete Fourier transform (DFT), such as a fast Fourier transform (FFT). The apparatus may further include a downmix matrix acquisition unit configured to acquire the downmix matrix. The device applies a downmix matrix to a first array formed by the frequency coefficients of multiple input audio channels in each frequency bin for at least one frequency bin, and multiple intermediate audios in each frequency bin. Further downmixing units configured to acquire a second array formed by the frequency coefficients of the channels can be provided. The first array and the second array can be linear arrays (vectors). The number of entries (elements) in the first array can be given by the number of input audio channels and the number of entries in the second array can be given by the number of output audio channels. The downmix matrix may be different for each different frequency bin, or may be different for each different audio band (processing band).
幾つかの例示の実施形態では、ダウンミックス行列は、周波数ビン又はオーディオ帯域の全体にわたって一様であり得る。ダウンミキシングユニットは、ダウンミックス行列の非ゼロのエントリーのみを含む第3のアレイを求めるように構成され得る。ダウンミキシングユニットは、第3のアレイの各エントリーについて、ダウンミックス行列内の第3のアレイのそれぞれのエントリーの位置を示すエントリーを含む第4のアレイを求めるように更に構成することができる。ダウンミキシングユニットは、少なくとも1つの周波数ビンについて、それぞれの周波数ビンの第3のアレイのエントリーと第1のアレイの対応するエントリーとを乗算するようにまた更に構成することができ、第1のアレイの対応するエントリーは、第4のアレイに基づいて求められる。ここで、第1のアレイ内の対応するエントリーは、ダウンミックス行列と第1のアレイとの通常の行列乗算において、ダウンミックス行列のそれぞれの非ゼロのエントリーと乗算されるエントリーを示すものと解釈される。ダウンミックスユニットは、取得された積を適切に合計し、取得された積の(1つ以上)の和を第2のアレイのエントリーに割り当てるように更に構成することができる。 In some exemplary embodiments, the downmix matrix can be uniform throughout the frequency bin or audio band. The downmixing unit may be configured to find a third array containing only nonzero entries in the downmix matrix. The downmixing unit can be further configured to find for each entry in the third array a fourth array containing an entry indicating the position of each entry in the third array in the downmix matrix. The downmixing unit can be further configured to multiply at least one frequency bin by the entry of the third array of each frequency bin and the corresponding entry of the first array, the first array. The corresponding entry for is found based on the fourth array. Here, the corresponding entry in the first array is interpreted to indicate the entry to be multiplied by each non-zero entry in the downmix matrix in a normal matrix multiplication of the downmix matrix and the first array. Will be done. The downmix unit can be further configured to appropriately sum the acquired products and assign the sum of the acquired products (one or more) to the entries in the second array.
幾つかの例示の実施形態では、本装置は、少なくとも1つの周波数ビンについて、中間オーディオチャネルごとに、それぞれの中間オーディオチャネルのエネルギー指標値を求めるように構成されたエネルギー算出ユニットを更に備えることができる。本装置は、少なくとも1つの周波数ビンについて、中間オーディオチャネルごとに、それぞれのエネルギー指標値に基づいてそれぞれの周波数ビンにおけるそれぞれの中間オーディオチャネルの周波数係数の大きさを調整するように構成された調整ユニットをまた更に備えることができる。 In some exemplary embodiments, the device may further include, for each intermediate audio channel, an energy calculation unit configured to determine the energy index value of each intermediate audio channel for at least one frequency bin. can. The apparatus is configured to adjust the magnitude of the frequency coefficient of each intermediate audio channel in each frequency bin based on the respective energy index value for each intermediate audio channel for at least one frequency bin. Further units can be provided.
幾つかの例示の実施形態では、ダウンミキシングユニットは、ダウンミックス行列がスパース行列であるか否かを判断するように更に構成され得る。その後、ダウンミックス行列がスパース行列であると判明した場合にのみ、第3のアレイ及び第4のアレイ(及び以下で定義する第5のアレイも)を伴う処理を実行してもよい。 In some exemplary embodiments, the downmixing unit may be further configured to determine if the downmix matrix is a sparse matrix. After that, processing involving a third array and a fourth array (and also a fifth array as defined below) may be performed only if the downmix matrix is found to be a sparse matrix.
幾つかの例示の実施形態では、第3のアレイは、ダウンミックス行列の非ゼロのエントリーを、ダウンミックス行列のエントリー全体にわたる所定の走査順序におけるそれらの出現順序で含む線形アレイであり得る。 In some exemplary embodiments, the third array can be a linear array that includes non-zero entries in the downmix matrix in their order of appearance in a given scan order across the entries in the downmix matrix.
幾つかの例示の実施形態では、ダウンミキシングユニットは、第5のアレイを求めるように更に構成されていてもよい。第5のアレイのエントリーは、行方向走査順序の場合には、ダウンミックス行列のそれぞれの行ごとの非ゼロのエントリーの数を示していてもよく、列方向走査順序の場合には、それぞれの列ごとのダウンミックス行列の非ゼロのエントリーの数を示していてもよい。 In some exemplary embodiments, the downmixing unit may be further configured to require a fifth array. The entries in the fifth array may indicate the number of non-zero entries for each row of the downmix matrix in the case of row scan order, and in the case of column scan order, respectively. It may indicate the number of non-zero entries in the downmix matrix per column.
実施形態によっては、ダウンミキシングユニットは、少なくとも1つの周波数ビンについて、それぞれの周波数ビンの第3のアレイのエントリーと第1のアレイの対応するエントリーとの1つ以上の積の和を、第5のアレイのエントリーに基づいて第2のアレイのエントリーに割り当てるように更に構成されていてもよい。 In some embodiments, the downmixing unit is the sum of one or more products of the entries of the third array of each frequency bin and the corresponding entries of the first array for at least one frequency bin. It may be further configured to be assigned to a second array entry based on the array entry of.
別の態様によれば、ソフトウェアプログラムが説明される。このソフトウェアプログラムは、プロセッサ上で実行されるように構成され得るとともに、コンピューティングデバイス上で実施されると、本書類において略述した方法のステップを実行するように構成され得る。 According to another aspect, the software program is described. The software program may be configured to run on a processor and, when run on a computing device, to perform the steps of the method outlined in this document.
別の態様によれば、記憶媒体が説明される。この記憶媒体は、プロセッサ上で実行されるように構成されるとともに、コンピューティングデバイス上で実施されると、本書類において略述した方法のステップを実行するように構成されたソフトウェアプログラムを含み得る。例えば、1つ以上のプロセッサによって実行することができる命令が記憶された非一時的コンピューター可読媒体。 According to another aspect, the storage medium is described. This storage medium may include a software program configured to run on a processor and, when implemented on a computing device, to perform the steps of the method outlined in this document. .. For example, a non-transitory computer-readable medium that stores instructions that can be executed by one or more processors.
更なる態様によれば、コンピュータープログラム製品が説明される。このコンピュータープログラムは、コンピューター上で実行されると、本書類において略述した方法のステップを実行する実行可能命令を含み得る。 According to a further aspect, a computer program product is described. This computer program may include executable instructions that, when run on a computer, perform the steps of the methods outlined in this document.
本書類において略述する好ましい実施形態を含む上記方法及び上記装置は、スタンドアローンで用いることもできるし、本書類において開示した他の方法及びシステムと組み合わせて用いることもできることに留意されたい。さらに、本書類において略述する方法及び装置の全ての態様は、任意に組み合わせることができる。特に、請求項の特徴は、任意の方法で互いに組み合わせることができる。 It should be noted that the methods and devices, including the preferred embodiments outlined herein, can be used standalone or in combination with other methods and systems disclosed in this document. Moreover, all aspects of the methods and devices outlined in this document can be arbitrarily combined. In particular, the features of the claims can be combined with each other in any way.
添付図面に関する以下の詳細な説明を通して、上記例示の実施形態の上記目的、特徴及び利点並びに他の目的、特徴及び利点は、より理解できるものとなる。図面において、幾つかの実施形態が、一例及び非限定的なものとして示される。 Through the following detailed description of the accompanying drawings, the above-mentioned objectives, features and advantages as well as other objectives, features and advantages of the above-exemplified embodiments will be better understood. In the drawings, some embodiments are shown as examples and non-limiting.
まず、MPEG−H 3Dオーディオ標準規格のメインプロファイルのフォーマット変換器の関連性のある側面を簡潔に説明する。MPEG−H 3Dオーディオ標準規格のより広範な解説については、文献ISO/IEC DIS 23008−3 "Information technology - High efficiency coding and media delivery in heterogeneous environments - Part 3: 3D audio"を参照されたい。この文献の全体を本願において援用する。この文献のセクション10が、フォーマット変換器に関連する。
First, the relevant aspects of the main profile format converter of the MPEG-H 3D audio standard will be briefly described. For a broader description of the MPEG-H 3D audio standard, see Reference ISO / IEC DIS 23008-3 "Information technology --High efficiency coding and media delivery in heterogeneous environments --Part 3: 3D audio". The entire document is incorporated herein by reference.
要約すれば、MPEG−H 3Dオーディオ標準規格のメインプロファイルフォーマット変換器は、位相整列直交ミラーフィルター(QMF)領域ダウンミックスを提供する。このダウンミックスは、QMFフィルターバンク(ハイブリッドQMF)及び位相整列処理を伴う。後者は、入力信号(入力チャネル)の共分散分析を含む。特に、メインプロファイルフォーマット変換器は、信号キャンセル又は信号ブーストに、より効果的に対処しこれらを防止することができるようにするために、最低処理帯域において周波数分解能を高めるナイキストフィルターバンクとともに、入力オーディオチャネルのQMF表現(ハイブリッドQMF)を用いる。 In summary, the MPEG-H 3D audio standard main profile format transducer provides a phase-aligned quadrature mirror filter (QMF) region downmix. This downmix involves a QMF filter bank (hybrid QMF) and phase alignment processing. The latter includes analysis of covariance of the input signal (input channel). In particular, the main profile format converter, along with the Nyquist filter bank, which increases frequency resolution in the lowest processing band, allows input audio to be able to more effectively address and prevent signal cancellation or signal boost. The QMF representation of the channel (hybrid QMF) is used.
メインプロファイルフォーマット変換器のQMFフィルターバンクは、比較的高い時間分解能を発揮するように設計され、640サンプルの分析ウィンドウ長について64サンプルのホップサイズを有する。したがって、後続のフィルターバンク分析結果の間には90%の重複が存在し、その結果、計算コスト及びメモリアクセスレートが比較的高くなる。結果として得られる高い時間分解能は、位相整列に関する変調アーティファクトを防止するには有効であるが、実際のダウンミックス動作には必要とされない。 The QMF filter bank of the main profile format converter is designed to provide relatively high time resolution and has a hop size of 64 samples for an analysis window length of 640 samples. Therefore, there is a 90% overlap between subsequent filter bank analysis results, resulting in relatively high computational costs and memory access rates. The resulting high time resolution is effective in preventing modulation artifacts related to phase alignment, but is not required for actual downmix operation.
高い計算複雑度を回避するという観点では、フォーマット変換機能を組み込んだMPEG−H 3Dオーディオ標準規格の低複雑(LC)プロファイルが想定される。概略的に言えば、LCプロファイルのフォーマット変換器は、利用可能なラウドスピーカーチャネルの数が入力チャネルの数よりも少ない場合に、ダウンミキシングすることによってオーディオチャネルの数を削減する。フォーマット変換器は、チャネルの数が削減されているにもかかわらず、元のオーディオイメージに類似した忠実なオーディオイメージの維持を試みる。この目的のために、ダウンミキサーは、個々のオーディオ帯域(処理帯域)にわたって入力チャネルのエネルギーを基準として出力チャネルのエネルギーを制御する適応等化を伴う。 From the viewpoint of avoiding high computational complexity, a low complexity (LC) profile of the MPEG-H 3D audio standard incorporating a format conversion function is assumed. Generally speaking, LC profile format converters reduce the number of audio channels by downmixing when the number of loudspeaker channels available is less than the number of input channels. Format converters attempt to maintain a faithful audio image that resembles the original audio image, despite the reduced number of channels. To this end, the down mixer involves adaptive equalization that controls the energy of the output channel relative to the energy of the input channel across the individual audio bands (processing bands).
LCフォーマット変換器は、ダウンミキシングにとって適切な時間周波数分解能を有する入力信号の周波数表現に対して作用する。メインプロファイルフォーマット変換器とは反対に、LCプロファイルに組み込まれたフォーマット変換機能は、QMFフィルターバンクを伴わないようにすることができ、それにより、フォーマット変換の計算の複雑度が低減される。その代わりに、LCプロファイルフォーマット変換器は、離散フーリエ変換(DFT)領域等の短時間フーリエ変換(STFT)において動作し得る。この時間周波数表現は、複素高速フーリエ変換(FFT)をウィンドウ化された入力オーディオチャネルに対して適用することによって取得され得る。STFTは、512サンプルの長さ(分析ウィンドウ長)を有し得る。ホップサイズは、256サンプルであり得る。すなわち、連続する分析ウィンドウの間の重複は、50%であり得る。STFTは、sqrt(Hann)(Hanning)分析及び合成ウィンドウを更に行い得る。 The LC format converter acts on the frequency representation of the input signal with the appropriate time-frequency resolution for downmixing. Contrary to the main profile format converter, the format conversion function built into the LC profile can be without the QMF filter bank, thereby reducing the computational complexity of the format conversion. Instead, the LC profile format transducer may operate in a short-time Fourier transform (STFT) such as the Discrete Fourier Transform (DFT) region. This time-frequency representation can be obtained by applying a complex Fast Fourier Transform (FFT) to a windowed input audio channel. The FTFT can have a length of 512 samples (analysis window length). The hop size can be 256 samples. That is, the overlap between consecutive analysis windows can be 50%. The FTFT can further perform sqrt (Hann) analysis and synthesis windows.
時間周波数変換の周波数ビン(変換領域周波数ビン)は、等化のためにオーディオ帯域(処理帯域)にグループ化され得る。例えば、STFTは、58個の処理帯域を有していてもよい。これらの処理帯域は、心理音響モデルに従って規定することができる。例えば、計算複雑度を低減するためには、高い周波数における周波数分解能を低減することができる。 Frequency bins for time-frequency conversion (conversion region frequency bins) can be grouped into audio bands (processing bands) for equalization. For example, the FTFT may have 58 processing bands. These processing bands can be defined according to the psychoacoustic model. For example, in order to reduce the computational complexity, the frequency resolution at high frequencies can be reduced.
次に、入力オーディオチャネルの実際のダウンミキシングが、時間周波数変換によって取得された周波数係数に対して行われ得る。このダウンミキシングにおいて用いられるダウンミキシング行列は、処理帯域が異なるごとに互いに異なる場合がある。次に、それぞれのダウンミックス行列の適用によって取得された中間オーディオチャネル(例えば、それらの周波数係数)は、エネルギーの保存を確保するためにエネルギー等化を受けてもよい。 The actual down-mixing of the input audio channel can then be performed on the frequency coefficients obtained by the time-frequency conversion. The downmixing matrices used in this downmixing may differ from each other for different processing bands. The intermediate audio channels (eg, their frequency coefficients) obtained by applying each downmix matrix may then undergo energy equalization to ensure energy conservation.
他方、LCフォーマット変換器は、位相整列を伴わず、したがって、共分散分析を伴わない。位相整列の省略を補償するために、中間周波数レンジにおける周波数分解能を(メインプロファイルフォーマット変換器のハイブリッドQMFダウンミックス処理と比較して)高めるようにSTFTの処理帯域を更に規定することができる(例えば、約100Hz前後〜3.5kHz前後のレンジ、すなわち、100Hz〜3.5kHzのレンジ)。 LC format transducers, on the other hand, do not involve phase alignment and therefore analysis of covariance. To compensate for the omission of phase alignment, the processing band of the STFT can be further defined (eg, compared to the hybrid QMF downmix processing of the main profile format converter) in the intermediate frequency range. , A range of about 100 Hz to about 3.5 kHz, that is, a range of about 100 Hz to 3.5 kHz).
特に、MPEG−H 3Dオーディオ標準規格のLCフォーマット変換器は、メインプロファイルフォーマット変換器の設計と互換性を有し、良好なオーディオ信号品質を提供し、エネルギー保存を満たし、何よりもまず計算複雑度を低減するように考案されている。 In particular, the MPEG-H 3D audio standard LC format transducer is compatible with the design of the main profile format converter, provides good audio signal quality, meets energy conservation, and above all, computational complexity. Is designed to reduce.
本開示は、実際のダウンミキシング及び等化に関するものであり、これらのステップを効率的に実行し、それによって、フォーマット変換器の計算複雑度を更に低減する有利なストラテジーを教示する。 The present disclosure relates to actual down-mixing and equalization, and teaches advantageous strategies for efficiently performing these steps, thereby further reducing the computational complexity of the format transducer.
しかしながら、本開示の多くの態様は、LCフォーマット変換器によって用いられる特定の時間周波数変換に対して独立しており、例えば、オーディオチャネルのQMF表現を用いるフォーマット変換器にも直接適用することができることが理解される。 However, many aspects of the disclosure are independent of the particular time-frequency conversion used by LC format converters and can also be applied directly to format converters that use the QMF representation of audio channels, for example. Is understood.
図1に示すように、オーディオ復号化器のフォーマット変換器100(例えば、フォーマット変換器のオーディオ処理ブロック)は、例えば、Nin個のオーディオチャネル(入力オーディオチャネル)10の(復号化された)時間領域オーディオサンプルをオーディオ復号化器のコア復号化器から受信し、Nout個の出力オーディオチャネル20からなるダウンミキシングされた時間領域オーディオ出力信号を生成する。オーディオ出力チャネルの数は、入力オーディオチャネルの数以下である(例えば、Nout≦Nin)。実際のダウンミキシングプロセスは、周波数領域において実行され得る。Nin個の入力オーディオチャネルをダウンミキシングするダウンミックス行列MDMXを、(例えば、コア復号化器によって)フォーマット変換器100に提供することができる。したがって、フォーマット変換器100の処理は、コア復号化器によって復号化されたオーディオデータと、(静的な)ダウンミックス行列MDMXとを入力とする。ダウンミックス行列MDMXは、フォーマット変換器の初期処理(起動)の際に、任意選択で出力オーディオチャネルの所望の出力チャネル構成とともに、フォーマット変換器に提供され得る(例えば、信号として与えられ得る)。ダウンミックス行列MDMX又はその指標値は、オーディオ復号化器に提供されるオーディオビットストリームにおいて送信され得る。特に、MPEG−H 3Dオーディオ標準規格では、特定のターゲットチャネル構成のダウンミックスの詳細項目(ダウンミックス行列の指標値を含む)の送信が可能である。ダウンミックス行列MDMXは、実数値の非負のダウンミックス係数を含む得る。また、次元Nout×Ninを有し得る。すなわち、ダウンミックス行列の行の数は、Noutによって与えられ得る。ダウンミックス行列の列の数は、Ninによって与えられ得る。この書類の残りの部分における特定の例は、ダウンミックス行列が次元Nout×Ninを有することを前提とする。しかし、これらの特定の例は、次元Nin×Noutのダウンミックス行列の場合にも同様に当てはまる。その場合、当該特定の例における列及び行の概念を互いに交換しなければならない。
As shown in FIG. 1, the
図2は、(例えば、フォーマット変換器100が)実行することができるフォーマット変換(ダウンミキシング)のプロセス(方法)を概略的に示すフローチャートである。この方法は、時間領域サンプルの1つのブロック(例えば、フレーム)の処理に関するものであり、時間領域サンプルの後続のブロックについて繰り返すことができる。 FIG. 2 is a flowchart schematically showing a format conversion (downmixing) process (method) that can be performed (for example, by the format converter 100). This method relates to the processing of one block (eg, a frame) of the time domain sample and can be repeated for subsequent blocks of the time domain sample.
ステップS2010において、例えば、フォーマット変換器の外部のソースからの信号通信によって、(静的な)ダウンミックス行列MDMXを取得することができる。換言すれば、本方法(あるいはフォーマット変換器)は、ダウンミックス行列MDMXを入力として受けとることができる。単一のダウンミックス行列MDMXではなく、ステップS2020において取得される周波数係数の各周波数ビンにつき1つの複数のダウンミックス行列
ダウンミックス行列が時間的に一定であるという概念は、2≦lとして、(2つ以上の)ダウンミックス行列
本方法は、複数の入力オーディオチャネル(入力オーディオ信号)を入力として受信することを更に含み得る。特に、本方法は、複数の入力オーディオチャネルの時間領域サンプル(のシーケンス)を受信することを含み得る。 The method may further include receiving a plurality of input audio channels (input audio signals) as inputs. In particular, the method may include receiving time domain samples (sequences) of multiple input audio channels.
ステップS2020において、入力オーディオチャネルのそれぞれについて、複数の周波数ビンにおける複数の周波数係数(周波数ビンごとに1つの周波数係数)が取得され得る。例えば、入力オーディオチャネルのそれぞれについての複数の周波数ビンにおける上記複数の周波数係数は、ビットストリームから受信され得る。あるいは、時間周波数変換を複数の入力オーディオチャネルのそれぞれ(例えば、複数の入力オーディオチャネルのそれぞれの時間領域サンプル)に適用してもよい。この時間周波数変換は、入力オーディオチャネルのそれぞれについて、複数の周波数ビンにおける複数の周波数係数を与えることができる。 In step S2020, a plurality of frequency coefficients (one frequency coefficient for each frequency bin) in a plurality of frequency bins can be acquired for each of the input audio channels. For example, the plurality of frequency coefficients in the plurality of frequency bins for each of the input audio channels may be received from the bitstream. Alternatively, time-frequency conversion may be applied to each of the plurality of input audio channels (eg, each time domain sample of the plurality of input audio channels). This time-frequency conversion can provide multiple frequency coefficients in multiple frequency bins for each of the input audio channels.
フォーマット変換は、連続する重複しないフレームに対して作用することができる。当該フレームは、入力オーディオ信号の時間領域サンプルを単位とする長さL(例えば、L=256個の時間領域サンプル)を有し得る。フォーマット変換により、長さLの処理された入力フレーム当たり、L個のサンプルをもつ1つのフレームが出力され得る。この出力フレームは、入力フレームよりも少ないオーディオ信号チャネル(又は多くとも同じの数のオーディオ信号チャネル)を有する。 Format conversion can work on consecutive non-overlapping frames. The frame may have a length L (eg, L = 256 time domain samples) in units of time domain samples of the input audio signal. The format conversion may output one frame with L samples per processed input frame of length L. This output frame has fewer audio signal channels (or at most the same number of audio signal channels) than input frames.
時間周波数変換は、DFT等のSTFTであり得る。STFTの長さNは、N=512サンプルであり得る。STFTのホップサイズは、256サンプルであり得る。この場合、後続のSTFTの間の重複は、256サンプル、すなわち50%となる。STFT領域処理は、例えば、K=256個の周波数ビンに対して行われ得る。これらの周波数ビンは、処理される複数のオーディオ帯域(処理帯域)、例えば、B=58個の処理帯域に分割され得る。 The time-frequency conversion can be an STFT such as DFT. The length N of the FTFT can be N = 512 samples. The hop size of the FTFT can be 256 samples. In this case, the overlap between subsequent STFTs is 256 samples, or 50%. The FTFT region processing can be performed on, for example, K = 256 frequency bins. These frequency bins can be divided into a plurality of audio bands (processing bands) to be processed, for example, B = 58 processing bands.
幾つかの例示の実施形態では、時間周波数変換を適用することは、Nin個の時間領域の入力オーディオチャネルの1つのフレーム(L個の時間領域サンプル、例えば、256個の時間領域サンプル)によって、長さN(例えば、512個の時間領域サンプル)の入力バッファー(例えば、先入れ先出し(FIFO)バッファー)を更新することを伴っていてもよい。ここで、所与の入力オーディオチャネル1≦i≦Ninの入力バッファーを、
ステップS2030において、ダウンミックス行列は、(例えば、周波数ビンごとに)それぞれの周波数ビンにおける、複数の入力オーディオチャネルの周波数係数によって形成された第1のアレイ(例えば、ベクトル)に適用される。換言すれば、実際のダウンミックスが、(例えば、各周波数ビンにおいて、すなわち、周波数ビンごとに)実行され得る。ここで採用した表記では、第kの周波数ビンの第1のアレイは、
上記及びこのセクションの残りの部分において、本提案による方法は、周波数ビンごとに実行されるものとして記載されている。しかしながら、本方法は、一般に、時間周波数変換における、少なくとも1つの周波数ビン(例えば、単一の周波数ビン)、周波数ビンのグループ内(例えば、所与のオーディオ帯域内)の全ての周波数ビン、又は全ての周波数ビンについて、実行できることが理解される。 In the above and in the rest of this section, the proposed method is described as being performed on a frequency bin basis. However, the method generally involves at least one frequency bin (eg, a single frequency bin), all frequency bins within a group of frequency bins (eg, within a given audio band), or, in time-frequency conversion. It is understood that this can be done for all frequency bins.
中間オーディオチャネルの数は、出力オーディオチャネルの数Noutと等しくすることができる。中間オーディオチャネル及び出力オーディオチャネルは、1対1の関係とすることができる。出力オーディオチャネルは、それらの周波数係数の大きさを調整することによって中間オーディオチャネルから取得することができる。 The number of intermediate audio channels can be equal to the number of output audio channels N out. The intermediate audio channel and the output audio channel can have a one-to-one relationship. The output audio channels can be obtained from the intermediate audio channels by adjusting the magnitude of their frequency coefficients.
ここで、第kの周波数ビンにおける第o(1≦o≦Nout)の中間オーディオチャネルの周波数係数を
中間オーディオチャネル(中間オーディオ信号)において発生し得る可聴アーティファクトを低減するために、中間オーディオチャネルを適応等化によって更に処理して、ダウンミキシングされたオーディオ帯域のエネルギーを制御してもよい。この目的のために、フォーマット変換器は、以下で説明する第1のエネルギー指標値及び第2のエネルギー指標値を計算する。 In order to reduce the audible artifacts that may occur in the intermediate audio channel (intermediate audio signal), the intermediate audio channel may be further processed by adaptive equalization to control the energy of the downmixed audio band. For this purpose, the format converter calculates a first energy index value and a second energy index value as described below.
ステップS2040において、それぞれの中間オーディオチャネルの第1のエネルギー指標値(例えば、特許請求の範囲において言及されるエネルギー指標値)が周波数ビンごとに求められ得る。ここで、同じエネルギー指標値を複数の周波数ビンに割り当ててもよい。例えば、同じ処理帯域によって構成される周波数ビンは、同じエネルギー指標値を有していてもよい。例えば、各処理帯域0≦b≦B−1(B≦N)について、第bの処理帯域内の全ての周波数ビンkの第oの中間オーディオチャネルのエネルギー指標値
この例によれば、所与の周波数ビンの所与の中間オーディオチャネルの第1のエネルギー指標値は、全ての入力オーディオチャネルと、所与の周波数ビンと同じ処理帯域内の全ての周波数ビンとにわたる、入力オーディオチャネルの周波数係数とダウンミックス行列の対応するエントリーとの積の絶対平方の和に依存し得る。一般に、所与の周波数ビンの所与の中間オーディオチャネルの第1のエネルギー指標値は、全ての入力オーディオチャネルと、任意選択で所与の周波数ビンと同じ処理帯域内の全ての周波数ビンとにわたる、入力オーディオチャネルの周波数係数の絶対値の累乗(例えば、1乗、2乗、3乗等)と、ダウンミックス行列の対応するエントリーの累乗(例えば、1乗、2乗、3乗等)との積の和に依存し得る。特に、ダウンミックス行列のエントリーは、実数であり得るのに対して、第1のアレイのエントリーは、複素数であり得る。ここで、アレイ(ベクトル、行列)の「対応するエントリー」は、これらのアレイの通常の行列乗算において互いに乗算されるエントリーを意味する。 According to this example, the first energy index value of a given intermediate audio channel in a given frequency bin is for all input audio channels and all frequency bins in the same processing band as the given frequency bin. It can depend on the sum of the absolute squares of the product of the frequency coefficients of the input audio channel and the corresponding entries of the downmix matrix over. In general, the first energy index value for a given intermediate audio channel in a given frequency bin spans all input audio channels and optionally all frequency bins in the same processing band as the given frequency bin. , The power of the absolute value of the frequency coefficient of the input audio channel (eg, 1st, 2nd, 3rd, etc.) and the power of the corresponding entry in the downmix matrix (eg, 1st, 2nd, 3rd, etc.) Can depend on the sum of the products of. In particular, the entries in the downmix matrix can be real, while the entries in the first array can be complex. Here, the "corresponding entry" of arrays (vectors, matrices) means entries that are multiplied by each other in normal matrix multiplication of these arrays.
さらに、周波数ビンごとに第2のエネルギー指標値を求めることができる。ここでも、同じ第2のエネルギー指標値を複数の周波数ビンに割り当てることができる。例えば、同じ処理帯域によって構成される周波数ビンは、同じ第2のエネルギー指標値を有し得る。例えば、各処理帯域0≦b≦B−1について、第bの処理帯域内の全ての周波数ビンkの第oの中間オーディオチャネルの第2のエネルギー指標値
したがって、所与の中間オーディオチャネル及び所与の周波数ビンの第2のエネルギー指標値は、所与の周波数ビンと同じ処理帯域内の全ての周波数ビンにわたる、所与の中間オーディオチャネルの周波数係数とそれぞれの周波数ビンとの絶対平方の和に依存し得る。例えば、全ての入力オーディオチャネルにわたる、入力オーディオチャネルの周波数係数とダウンミックス行列の対応するエントリーとの積の和の絶対平方の、所与の周波数ビンと同じ処理帯域内の全ての周波数ビンにわたる和に依存し得る。 Therefore, the second energy index value of a given intermediate audio channel and a given frequency bin is the frequency coefficient of a given intermediate audio channel over all frequency bins in the same processing band as the given frequency bin. It may depend on the sum of the absolute squares with each frequency bin. For example, the sum of the absolute squares of the sum of the products of the frequency coefficients of the input audio channels and the corresponding entries in the downmix matrix over all input audio channels, over all frequency bins in the same processing band as a given frequency bin. Can depend on.
第1のエネルギー指標値及び第2のエネルギー指標値の上記計算(決定)は、同じオーディオ帯域に割り当てられる周波数ビンを求めて、それらの周波数ビンにアクセスすることを要する。これは、周波数ビンごとに、それぞれの周波数ビンが属するオーディオ帯域を列挙したルックアップテーブルを参照することによって行うことができる。しかしながら、第1のエネルギー指標値及び第2のエネルギー指標値を求めることに関してそのようなテーブルを参照することは、複数回に亘って間接的なアドレス指定を行う必要があるので、計算コストが高くなり得る。この問題を解消するために、オーディオ帯域bごとに、それぞれのオーディオ帯域bに属する周波数ビンの数Nb(b)を列挙した別のルックアップテーブルを設けてもよい。各オーディオ帯域は、隣接するオーディオ帯域間に重複もギャップもない隣り合う複数の周波数ビンを含むので、この別のルックアップテーブルに含まれる情報は、第1のエネルギー指標値及び第2のエネルギー指標値を求めるのに十分である。第1のオーディオ帯域から開始して、第1のエネルギー指標値及び第2のエネルギー指標値を求めるとき、k個にわたる和における最初のNb(0)個の項を合計して、第1のオーディオ帯域(それぞれの中間オーディオチャネル)の第1のエネルギー指標値又は第2のエネルギー指標値に割り当てることができ、第2のオーディオ帯域以降についても同様である。一般的には、帯域インデックスb=0から開始し、帯域インデックスbを一時に1つずつ反復的にインクリメントして、式[4]及び/又は[5]におけるk個にわたる和におけるNb(b)個の連続する項を合計し、第bのオーディオ帯域(それぞれの中間オーディオチャネル)のそれぞれのエネルギー指標値に割り当てることができる。すなわち、オーディオ帯域について求められた(例えば、別のルックアップテーブルから推定された)数Nbに従って、k個にわたる和における連続する項を合計し、それぞれのオーディオ帯域のそれぞれのエネルギー指標値に割り当てることができる。 The above calculation (determination) of the first energy index value and the second energy index value requires to obtain the frequency bins assigned to the same audio band and access those frequency bins. This can be done by referring to a lookup table that lists the audio bands to which each frequency bin belongs for each frequency bin. However, referencing such a table for obtaining the first energy index value and the second energy index value is expensive because it requires indirect addressing multiple times. Can be. In order to solve this problem, another lookup table may be provided for each audio band b, which lists the number Nb (b) of frequency bins belonging to each audio band b. Since each audio band contains multiple adjacent frequency bins with no overlap or gap between adjacent audio bands, the information contained in this separate lookup table is a first energy index value and a second energy index. Enough to find the value. When calculating the first energy index value and the second energy index value starting from the first audio band, the first Nb (0) terms in the sum of k items are summed to obtain the first audio. It can be assigned to the first energy index value or the second energy index value of the band (each intermediate audio channel), and the same applies to the second audio band and thereafter. In general, starting from band index b = 0, band index b is iteratively incremented one at a time, and Nb (b) in the sum of k pieces in equations [4] and / or [5]. The consecutive terms can be summed and assigned to each energy index value in the bth audio band (each intermediate audio channel). That is, according to the number Nb obtained for the audio band (for example, estimated from another look-up table), the consecutive terms in the sum over k are summed and assigned to each energy index value of each audio band. Can be done.
複数の周波数ビン又はオーディオ帯域にわたって一定であるダウンミックス行列MDMXの場合、上記式[4]及び[5]におけるダウンミックス行列は、問題とする周波数ビン又はオーディオ帯域について計算から除外することができる。それにより、計算コストを更に低減することができる。例えば、式[4]の計算は、以下の式に簡略化することができる。
ステップS2050において、中間ダウンミックス信号のエネルギーが調整され得る。すなわち、中間オーディオチャネルごと及び周波数ビンごとにそれぞれの周波数係数の大きさが調整され得る。この調整は、それぞれの中間オーディオチャネル及びそれぞれの周波数ビンの第1のエネルギー指標値及び第2のエネルギー指標値の一方又は双方に基づいて行われ得る。一般に、この調整は、それぞれの中間オーディオチャネル及びそれぞれの周波数ビンのエネルギー指標値に基づいて行われると言える。それぞれの中間オーディオチャネル及びそれぞれの周波数ビンの第1のエネルギー指標値及び第2のエネルギー指標値の一方又は双方に基づいて調整ファクター
第oの中間オーディオチャネル及び第kの周波数ビンの調整ファクター
ステップS2060において、周波数時間変換(逆時間周波数変換、例えば、ステップS2020における時間周波数変換の逆変換)が、ステップS2050において生成されるエネルギー調整された周波数係数に適用され得る。この逆時間周波数変換は、処理されたフレーム(例えば、256個のサンプル)ごとに実行され得る。エネルギー調整されたダウンミックス信号は、逆DFT、例えば逆FFTの適用によって時間領域に変換することができる。これは、ウィンドウ化及び重複更新を更に伴っていてもよい。その結果、ステップS2060は、出力信号チャネル当たりL個の時間領域出力サンプルを生成することができる。 In step S2060, frequency time conversion (reverse time frequency conversion, eg, inverse conversion of time frequency conversion in step S2020) can be applied to the energy adjusted frequency coefficient generated in step S2050. This reverse time frequency conversion can be performed for each processed frame (eg, 256 samples). The energy-tuned downmix signal can be transformed into the time domain by applying an inverse DFT, eg, an inverse FFT. This may further involve windowing and duplicate updates. As a result, step S2060 can generate L time domain output samples per output signal channel.
現在のフレームFについて、ステップS2060の処理は、0≦ν<Nについて、以下の式によって与えられ得る。
上記の方法は、時間領域サンプルの後続のフレームについて繰り返すことができることが理解される。この場合、フレームごとにダウンミックス行列を取得する必要はなく、ステップS2010を(例えば、後続のフレームについて)省略することができる。 It is understood that the above method can be repeated for subsequent frames of the time domain sample. In this case, it is not necessary to acquire the downmix matrix for each frame, and step S2010 can be omitted (for example, for subsequent frames).
次に図3を参照する。図2のプロセスにおけるステップの詳細の例を概略的に示すフローチャートが提供されている。すなわち、ステップS2030の詳細を、図3に示すフローチャートを参照して説明する。より具体的には、ダウンミックス行列を第1のアレイに適用するステップS2030は、ステップS3010〜S3030のうちの幾つか又は全てを含み得る。 Next, refer to FIG. A flowchart illustrating an exemplary example of the details of the steps in the process of FIG. 2 is provided. That is, the details of step S2030 will be described with reference to the flowchart shown in FIG. More specifically, step S2030, which applies the downmix matrix to the first array, may include some or all of steps S301-10.3030.
ステップS3010において、ダウンミックス行列MDMXの非ゼロのエントリー(要素)のみを含む第3のアレイ(例えば、ベクトル、すなわち、線形アレイ)Mが求められ得る。ダウンミックス行列の非ゼロのエントリーは、所定の走査順序で抽出することができ、ダウンミックス行列における走査順序において出現した順序で第3のアレイに配列することができる。換言すれば、第3のアレイMにおける第nのエントリーは、ダウンミックス行列MDMXにおける走査順序での第nの非ゼロのエントリーを表す。この走査順序は、例えば、行方向であってもよいし、列方向であってもよい。ダウンミックス行列が次元Nout×Ninを有する場合、走査順序は行方向とすることができる。本書類の残りの部分において提供される本開示の実施形態は、行方向走査順序を前提としている。ただし、これらの実施形態は、行方向走査順序に限定されると解釈されるべきではない。列と行とを交換して逆にすることによって、これらの実施形態は、列方向走査順序の場合に容易に適合させることもできることが理解される。 In step S3010, a third array (eg, a vector, i.e., a linear array) M containing only non-zero entries (elements) of the downmix matrix M DMX can be determined. Non-zero entries in the downmix matrix can be extracted in a predetermined scan order and arranged in a third array in the order in which they appear in the scan order in the downmix matrix. In other words, the nth entry in the third array M represents the nth nonzero entry in the scan order in the downmix matrix M DMX. The scanning order may be, for example, the row direction or the column direction. If the downmix matrix has dimensions N out x N in , the scan order can be in the row direction. The embodiments of the present disclosure provided in the rest of this document presuppose a row-wise scan order. However, these embodiments should not be construed as being limited to row-wise scanning order. It is understood that by swapping and reversing the columns and rows, these embodiments can also be easily adapted in the case of columnwise scanning order.
次に図4を参照する。本開示の実施形態によるダウンミックス行列及び当該ダウンミックス行列から導出されるアレイの一例が概略的に示されている。すなわち、ダウンミックス行列MDMX及び対応する第3のアレイMの一例が図4に示されている。図4には、第4のアレイs及び第5のアレイrの一例も示されている。この例では、ダウンミックス行列MDMXは、6つの非ゼロのエントリー、すなわち、行方向走査順序による1、4、2、6、3、5を有する。したがって、行方向走査順序の場合、第3のアレイMは、6つのエントリーを有し、(M)T=[1,4,2,6,3,5]によって与えられる。 Next, refer to FIG. An example of a downmix matrix according to an embodiment of the present disclosure and an array derived from the downmix matrix is schematically shown. That is, an example of the downmix matrix M DMX and the corresponding third array M is shown in FIG. FIG. 4 also shows an example of the fourth array s and the fifth array r. In this example, the downmix matrix M DMX has 6 non-zero entries, i.e. 1, 4, 2, 6, 3, 5 according to the row scanning order. Thus, for row scan order, the third array M has 6 entries and is given by (M) T = [1,4,2,6,3,5].
ステップS3020において、第4のアレイ(例えば、ベクトル、すなわち、線形アレイ)sが求められ得る。ここで、第4のアレイsのエントリーは、第3のアレイMのエントリーと対応関係にあり得る。第4のアレイsの各エントリーは、第3のアレイMにおけるそれぞれの対応するエントリーがダウンミックス行列MDMXおいて走査順序によって有する位置(例えば、線形位置)を示し得る。換言すれば、第4のアレイsにおける第nのエントリーは、第3のアレイMの第nのエントリー(例えば、ダウンミックス行列MDMXにおける走査順序による第nの非ゼロのエントリー)がダウンミックス行列MDMXにおいて走査順序によって有する位置を表す。幾つかの例示の実施形態では、行方向走査順序の場合、走査順序による(線形)位置は、行の長さを法として与えることができる(例えば、行の長さによる除算の剰余に依拠し得る)。例えば、第3のアレイのそれぞれのエントリーが位置するダウンミックス行列の列を示し得る。あるいは、列方向走査順序の場合、走査順序による(線形)位置は、列の高さを法として与えることができる(すなわち、列の高さによる除算の剰余に依拠し得る)。例えば、第3のアレイのそれぞれのエントリーが位置するダウンミックス行列の行を示し得る。次元Nout×Ninのダウンミックス行列の場合、行の長さはNinによって与えられ、列の高さはNoutによって与えられる。 In step S3020, a fourth array (eg, a vector, i.e., a linear array) s can be determined. Here, the entry of the fourth array s may correspond to the entry of the third array M. Each entry in the fourth array s may indicate a position (eg, a linear position) that each corresponding entry in the third array M has in the downmix matrix M DMX by scan order. In other words, the nth entry in the 4th array s is the nth entry in the 3rd array M (eg, the nth non-zero entry in the downmix matrix M DMX by scan order) is the downmix matrix. Represents the position held by the scanning order in M DMX. In some exemplary embodiments, in the case of row-wise scan order, the (linear) position by scan order can be given by method of row length (eg, depending on the remainder of the division by row length). obtain). For example, it may indicate a sequence of downmix matrices in which each entry in the third array is located. Alternatively, in the case of a column-wise scan order, the (linear) position by the scan order can be given the column height modulo (ie, can rely on the remainder of the column height division). For example, it may indicate the row of the downmix matrix in which each entry in the third array is located. For a downmix matrix of dimensions N out x N in , the row length is given by N in and the column height is given by N out.
別の実施形態では、第4のアレイsのエントリーは、ダウンミックス行列における走査順序による第1の位置からのオフセットを示し得る。更に別の実施形態では、第4のアレイsのエントリーは、ダウンミックス行列MDMXの或る非ゼロのエントリーの位置と走査順序による次の非ゼロのエントリーの位置との間の相対オフセット(すなわち、走査順序によるダウンミックス行列内の第3のアレイのそれぞれのエントリーの直前のエントリーの位置からのオフセット)を示し得る。また更に別の実施形態では、第4のアレイsのエントリーは、第3のアレイMの各対応する非ゼロのエントリーについて、それぞれの行におけるそのそれぞれの直前のエントリーの位置からの、又は、対応する非ゼロのエントリーがその行における第1のエントリーである場合には、それぞれの行における第1の位置からのその行における対応する非ゼロのエントリーの位置の相対オフセットを示し得る。第4のアレイsの前述の実施態様は、行方向走査順序の場合に適用されるが、行と列を交換することによって列方向走査順序にも容易に適合させることができる。 In another embodiment, the entry of the fourth array s may indicate an offset from the first position due to the scan order in the downmix matrix. In yet another embodiment, the entry of the fourth array s is a relative offset (ie,) between the position of one non-zero entry in the downmix matrix M DMX and the position of the next non-zero entry due to the scan order. , Offset from the position of the entry immediately preceding each entry in the third array in the downmix matrix by scan order). In yet another embodiment, the entries in the fourth array s, for each corresponding non-zero entry in the third array M, from or correspond to the position of their respective immediately preceding entry in their respective rows. If the non-zero entry is the first entry in that row, it may indicate the relative offset of the position of the corresponding non-zero entry in that row from the first position in each row. The above-described embodiment of the fourth array s is applied in the case of a row-direction scan order, but can be easily adapted to a column-direction scan order by exchanging rows and columns.
図4の例では、第4のアレイsは、(s)T=[1,4,2,6,3,5]によって与えることができ、そのエントリーは、第3のアレイのそれぞれのエントリーが位置する(すなわち、第3のアレイMへの抽出前に位置していた)ダウンミックス行列における列を示すことができる。あるいは、第4のアレイsのエントリーが、ダウンミックス行列MDMXにおける(行方向)走査順序による第1の位置からのそれぞれのオフセットを示すものである場合、第4のアレイsは、(s)T=[0,3,7,11,14,16]によって与えられることになり、第4のアレイsのエントリーが、ダウンミックス行列MDMXの或る非ゼロのエントリーの位置と(行方向)走査順序による次の非ゼロのエントリーの位置との間の相対オフセットを示すものである場合、第4のアレイsは、(s)T=[0,3,4,4,3,2]によって与えられることになる。第4のアレイsのエントリーが、それぞれの行における直前のエントリー又は第1のエントリーの位置からの相対オフセットを示すものである場合、第4のアレイsは、(s)T=[0,3,1,4,2,2]によって与えられることになる。 In the example of FIG. 4, the fourth array s can be given by (s) T = [1,4,2,6,3,5], the entry of which is each entry of the third array. It is possible to show the columns in the downmix matrix that are located (ie, were located prior to extraction into the third array M). Alternatively, if the entry of the fourth array s indicates the respective offset from the first position by the (row direction) scan order in the downmix matrix M DMX, the fourth array s is (s). Given by T = [0,3,7,11,14,16], the entry of the fourth array s is the position and (row direction) of some non-zero entry in the downmix matrix M DMX. If the fourth array s indicates a relative offset from the position of the next non-zero entry in the scan order, then the fourth array s is by (s) T = [0,3,4,4,3,2]. Will be given. If the entries in the fourth array s indicate a relative offset from the position of the previous entry or the first entry in each row, then the fourth array s is (s) T = [0,3. , 1, 4, 2, 2].
図3には示されていないが、ステップS2030は、第5のアレイrを求めるステップを更に含んでいてもよい。この第5のアレイrのエントリーは、ダウンミックス行列MDMXの行又は列ごとの非ゼロのエントリーの数を示す。ここで、第5のアレイrのエントリーが行ごとの非ゼロのエントリーの数を示すか列ごとの非ゼロのエントリーの数を示すかは、走査順序に依存する。すなわち、行方向走査順序の場合、第5のアレイrのエントリーは、行ごとのダウンミックス行列MDMXの非ゼロのエントリーの数を示し、列方向走査順序の場合、第5のアレイrのエントリーは、列ごとのダウンミックス行列MDMXの非ゼロのエントリーの数を示す。図4の例では、第5のアレイは、(r)T=[2,2,2]によって与えられる。列方向走査順序の場合、第5のアレイは、(r)T=[1,1,1,1,1,1]によって与えられる。いうまでもなく、第5のアレイrのエントリーは、いずれにおいても、ダウンミックス行列の行又は列がダウンミックス行列において有する次数と同じ次数を有する。すなわち、第5のアレイrの第mのエントリーは、ダウンミックス行列MDMXの第m行(又は列)における非ゼロの係数の数を示す。ここで、mは、1からダウンミックス行列MDMXにおける行(又は列)の数に及ぶ。例えば、第5のアレイrの第1のエントリーは、ダウンミックス行列MDMXの第1の行(又は列)における非ゼロの係数の数を示し、他のエントリーについても同様である。 Although not shown in FIG. 3, step S2030 may further include a step of finding a fifth array r. The entries in this fifth array r indicate the number of nonzero entries per row or column in the downmix matrix M DMX. Here, whether the entries of the fifth array r indicate the number of non-zero entries per row or the number of non-zero entries per column depends on the scanning order. That is, in the row scan order, the entries in the fifth array r indicate the number of non-zero entries in the downmix matrix M DMX per row, and in the column scan order, the entries in the fifth array r. Indicates the number of non-zero entries in the downmix matrix M DMX per column. In the example of FIG. 4, the fifth array is given by (r) T = [2,2,2]. For columnar scan order, the fifth array is given by (r) T = [1,1,1,1,1,1]. Needless to say, the entries in the fifth array r all have the same degree as the rows or columns of the downmix matrix have in the downmix matrix. That is, the mth entry of the fifth array r indicates the number of nonzero coefficients in the mth row (or column) of the downmix matrix M DMX. Here, m ranges from 1 to the number of rows (or columns) in the downmix matrix M DMX. For example, the first entry in the fifth array r indicates the number of non-zero coefficients in the first row (or column) of the downmix matrix M DMX, and so on for the other entries.
さらに、所与の周波数ビンkの第1のエネルギー指標値
第3のアレイ、第4のアレイ及び第5のアレイの決定は、任意の順序で行われ得ることが理解される。ダウンミックス行列MDMXが周波数ビンに依存する場合、前述のステップは、周波数ビンごとに実行され得るし、ダウンミックス行列MDMXが周波数ビンのそれぞれのグループ内の周波数ビンについて同一である場合には、周波数ビンのグループ(処理帯域)ごとに実行され得ることが更に理解される。ダウンミックス行列
図3を再び参照する。ステップS3030において、第3のアレイMのエントリーは、(例えば、周波数ビンごとに)第1のアレイの対応するエントリーと乗算され得る。これらの乗算によって、中間オーディオチャネルの周波数係数を実際に決定すること(例えば、実際のダウンミキシング)あるいは、この決定の少なくとも一部を行うことができる。すなわち、この決定は、周波数ビンごとに、(例えば、それぞれの周波数ビンの)第3のアレイMのエントリーを(例えば、それぞれの周波数ビンの)第1のアレイの対応するエントリーと乗算することを含み得る。ここで、第1のアレイとダウンミックス行列との通常の行列乗算にによってダウンミックス行列MDMXの対応する非ゼロのエントリーと乗算される場合、第1のアレイのエントリーは、第3のアレイのエントリーに対応すると言える。第1のアレイの当該対応するエントリーは、第4のアレイに基づいて(例えば、第4のアレイのエントリーに基づいて)決定することができる。第4のアレイのエントリーは、第3のアレイMのそれぞれのエントリーがダウンミックス行列MDMXにおいて有していた位置を示し得る。これによって、その後、第3のアレイMのエントリーごとに、第1のアレイとダウンミックス行列MDMXとの通常の行列乗算において、第3のアレイMのエントリーと乗算される第1のアレイのエントリーを決定することが可能になる。 See FIG. 3 again. In step S3030, the entry of the third array M can be multiplied by the corresponding entry of the first array (eg, for each frequency bin). These multiplications can actually determine the frequency factor of the intermediate audio channel (eg, actual downmixing), or at least part of this determination. That is, for each frequency bin, this determination multiplies the entry of the third array M (eg, of each frequency bin) with the corresponding entry of the first array (eg, of each frequency bin). Can include. Here, if the normal matrix multiplication of the first array and the downmix matrix is multiplied by the corresponding non-zero entries of the downmix matrix M DMX , then the entries of the first array are of the third array. It can be said that it corresponds to the entry. The corresponding entry in the first array can be determined based on the fourth array (eg, based on the entry in the fourth array). The entries in the fourth array may indicate the positions that each entry in the third array M had in the downmix matrix M DMX. Thereby, for each entry of the third array M, the entry of the first array to be multiplied by the entry of the third array M in the normal matrix multiplication of the first array and the downmix matrix M DMX. Can be determined.
エントリーの適切な積は、(それぞれの周波数ビンの)第2のアレイのエントリーごとに合計され得る。第2のエントリーのエントリーへの(1つ以上の)積の和の割り当ては、第5のアレイrに基づいて行われ得る。第5のアレイrの各エントリーは、第2のアレイのそれぞれのエントリーについて、幾つの積を合計して第2のアレイのそれぞれのエントリーに割り当てる必要があるのかを示し得る。第2のアレイの第1のエントリーから開始した場合、求められた積の和を、これらの積が求められた順序で第2のアレイのエントリーに連続して割り当てることにより、第2のアレイの全てのエントリーが得られる。ここで、各和における項の数は、第5のアレイrのそれぞれのエントリーによって決まる。したがって、一般的に表現すると、ダウンミックス行列を第1のアレイに適用することは、周波数ビンごとに、それぞれの周波数ビンの第3のアレイのエントリーと第1のアレイの対応するエントリーとの1つ以上の積の和を、第5のアレイのエントリーに基づいて第2のアレイのエントリーに割り当てることを更に含むと言うことができる。ここで、第5のアレイr及び第2のアレイ
幾つかの例示の実施形態では、ダウンミックス行列を第1のアレイに適用することは、第3のアレイへのエントリーインデックスを一時に1つずつ連続的にインクリメントすることと、そのようなエントリーインデックスごとに、それぞれの周波数ビンのそれぞれのエントリーインデックスによって示される第3のアレイのエントリーと、第1のアレイの対応するエントリーとの積を求めることとを更に含み得る。第1のアレイの対応するエントリーは、第4のアレイを参照することによって求めることができる。第3のアレイMの任意の所与のエントリーについて、ダウンミックス行列内のエントリーの位置は、第4のアレイの対応するエントリーから決定することができる(第4のアレイの第jのエントリーは、第3のアレイの第jのエントリーに対応する。ここで、jは、1とMDMXにおける非ゼロのエントリーの数との間の整数である)。例えば、問題とするエントリーの列番号を第4のアレイsのそれぞれのエントリーから決定することができる。次に、第3のアレイMの問題とするエントリーに対応する第1のアレイのエントリーは、決定された列番号を第1のアレイ内のエントリーインデックスとして有する第1のアレイのエントリーとして決定され得る。ダウンミックス行列を第1のアレイに適用することは、これらの積のうちの1つ以上の和を第2のアレイのエントリーに順次割り当てることを更に含み得る。この割り当ては、第5のアレイのエントリーに基づいていてもよい。すなわち、第2のアレイのエントリーに割り当てられる和における積の数は、第2のアレイの問題とするエントリーと同じエントリーインデックスを有する第5のアレイのエントリーによって求めることができる。第3のアレイのエントリーと第1のアレイの対応するエントリーとの積が連続的に求められる場合、これらの求められた積を第2のアレイのエントリーに、第2のアレイにおけるそれらの順序で連続的に加算することができる(第2のアレイのエントリーは、事前に0に初期化されることを前提とする)。ここで、第2のアレイの各エントリーに加算される連続的に求められる積の数は、第5のアレイの対応するエントリーから決定され得る。特に、これらのステップは、周波数ビンごとに実行され得る。 In some exemplary embodiments, applying the downmix matrix to the first array continuously increments the entry index to the third array one at a time, and such an entry index. Each may further include finding the product of the entries in the third array, indicated by the respective entry indexes in each frequency bin, and the corresponding entries in the first array. The corresponding entry in the first array can be found by reference to the fourth array. For any given entry in the third array M, the position of the entry in the downmix matrix can be determined from the corresponding entry in the fourth array (the jth entry in the fourth array is Corresponds to the jth entry in the third array, where j is an integer between 1 and the number of non-zero entries in M DMX). For example, the column number of the entry in question can be determined from each entry in the fourth array s. The entry in the first array corresponding to the entry in question in the third array M can then be determined as the entry in the first array having the determined column number as the entry index in the first array. .. Applying the downmix matrix to the first array may further include assigning the sum of one or more of these products sequentially to the entries of the second array. This allocation may be based on the entry of the fifth array. That is, the number of products in the sum assigned to the entries in the second array can be determined by the entries in the fifth array that have the same entry index as the entry in question in the second array. If the product of the entries in the third array and the corresponding entries in the first array is continuously determined, then these calculated products are placed in the entries in the second array and in their order in the second array. It can be added continuously (assuming that the entries in the second array are pre-initialized to 0). Here, the number of continuously obtained products to be added to each entry in the second array can be determined from the corresponding entry in the fifth array. In particular, these steps can be performed on a frequency bin basis.
図5は、上記に即して図3におけるステップS3030において中間オーディオチャネルの周波数係数を実際に求める(例えば、実際にダウンミキシングする)本開示の実施形態による一例を示している。すなわち、上記ダウンミキシングは、ステップS5010〜S5090のうちの幾つかの又は全てを含み得る。特に、図5の例は、行方向走査順序の場合に関するが、列方向走査順序の場合に関するように容易に適合させることができる。また、第1のアレイ及び第2のアレイのエントリーは、典型的には複素数であり、以下で説明する動作は、実部及び虚部の双方を考慮に入れる必要がある。 FIG. 5 shows an example according to the embodiment of the present disclosure in which the frequency coefficient of the intermediate audio channel is actually obtained (for example, actually down-mixed) in step S3030 in FIG. 3 in accordance with the above. That is, the downmixing may include some or all of steps S501-1090. In particular, the example of FIG. 5 relates to the case of row-direction scanning order, but can be easily adapted as in the case of column-direction scanning order. Also, the entries in the first and second arrays are typically complex numbers, and the operations described below need to take into account both the real and imaginary parts.
本方法は、ステップS5000から開始する。ステップS5010において、行インデックスがrow=1に初期化され得る。すなわち、第2のアレイの第1のエントリーが最初に求められる(計算される)。ステップS5020において、(第3のアレイ及び第4のアレイに対する)エントリーインデックスがj=1に初期化され得る。 The method starts from step S5000. In step S5010, the row index can be initialized to row = 1. That is, the first entry of the second array is first found (calculated). In step S5020, the entry index (for the third and fourth arrays) can be initialized to j = 1.
ステップS5030において、行インデックスrowによって示されるダウンミックス行列MDMXの行における非ゼロのエントリーの数が決定され得る。この決定は、行インデックスrowによって示される第5のアレイrのエントリーを参照することによって(例えば、rrowを参照することによって)行われ得る。行インデックスrowによって示される第5のアレイrのエントリーは、行インデックスrowによって示されるダウンミックス行列MDMXの行における非ゼロの係数の数を直接示す。 In step S5030, the number of nonzero entries in the row of the downmix matrix M DMX indicated by the row index row can be determined. This determination can be made by reference to the entry of the fifth array r indicated by the row index row (eg, by reference to r row ). The entry in the fifth array r represented by the row index row directly indicates the number of non-zero coefficients in the row of the downmix matrix M DMX represented by the row index row.
行インデックスrowによって示されるダウンミックス行列MDMXの行が非ゼロのエントリーを含まない場合、本方法は、行インデックスrowによって示される第2のアレイのエントリーに(複素数)値0を割り当て、ステップS5040〜S5070をスキップすることができる。 If the rows of the downmix matrix M DMX indicated by the row index row do not contain non-zero entries, the method assigns a (complex) value of 0 to the entries in the second array indicated by the row index row, step S5040. ~ S5070 can be skipped.
ステップS5040において、第3のアレイMの第jのエントリーと第1のアレイの対応するエントリーとが、それらの積を求めるために互いに乗算され得る。第3のアレイMの第jのエントリーに対応する第1のアレイのエントリーは、第4のアレイsの第jのエントリーを参照することによって求めることができる。第4のアレイsの第jのエントリーは、第3のアレイMの第jのエントリーがダウンミックス行列MDMXにおいて有していた列番号を示すことができる。この列番号(すなわち、第4のアレイsの第jのエントリー)は、第1のアレイ内の問題とする対応するエントリーの位置を直接示す(すなわち、列番号mの場合、第1のアレイの第mのエントリーは、第3のアレイMの問題とするエントリーに対応する)。特に、ダウンミックス行列MDMXにおける列の数は、第1のアレイのエントリーの数に等しい。 In step S5040, the jth entry of the third array M and the corresponding entry of the first array can be multiplied together to determine their product. The entry of the first array corresponding to the jth entry of the third array M can be obtained by referring to the jth entry of the fourth array s. The jth entry of the fourth array s can indicate the column number that the jth entry of the third array M had in the downmix matrix M DMX. This column number (ie, the jth entry of the fourth array s) directly indicates the location of the corresponding entry in question in the first array (ie, in the case of column number m, of the first array). The third entry corresponds to the problematic entry of the third array M). In particular, the number of columns in the downmix matrix M DMX is equal to the number of entries in the first array.
ステップS5050において、求められた積の数が、行インデックスrowによって示されるダウンミックス行列MDMXの行における非ゼロのエントリーの数よりも少ないか否かが判定され得る。すなわち、その行インデックスrowの現在の値について既に求められている積の数が、ダウンミックス行列MDMXの現在の行(例えば、行インデックスrowによって示されるダウンミックス行列MDMXの行)における非ゼロのエントリーの数と比較され得る。その積の数が、ステップS5030において求められた非ゼロのエントリーの上記数よりも少ない場合、ステップS5060において、エントリーインデックスjが1つだけインクリメントされ得る。そして、本方法は、ステップS5040に戻され得る。 In step S5050, it can be determined whether the number of products obtained is less than the number of non-zero entries in the rows of the downmix matrix M DMX indicated by the row index row. That is, the number of products already calculated for the current value of the row index row is non-zero in the current row of the downmix matrix M DMX (eg, the row of the downmix matrix M DMX indicated by the row index row). Can be compared to the number of entries in. If the number of products is less than the above number of non-zero entries found in step S5030, then in step S5060 the entry index j may be incremented by one. The method can then be returned to step S5040.
他方、その積の数が、ステップS5030において求められた非ゼロのエントリーの上記数よりも少なくない場合、本方法は、ステップS5070に進み得る。ステップS5070において、行インデックスrowの現在の値について求められた積が合計され得る。その結果得られた和が、行インデックスrowによって示される第2のアレイのエントリーに割り当てられ得る。あるいは、第2のアレイの問題とするエントリーが事前に0に初期化されていることを前提として、行インデックスrowの現在の値について求められた積が、第2のアレイの問題とするエントリーに連続的に加算され得る。図4の例では、row=1について、r1=2の積(M1・xS1及びM2・xS2)
が求められ得る。それらの和が第2のアレイの第1のエントリー
Can be sought. The sum of them is the first entry in the second array
ステップS5080において、全ての行が処理されたか否か、すなわち、行インデックスrowが値Noutに達したか否かが判定され得る。全ての行が処理された場合、本方法はステップS5100において終了する。他方、全ての行が処理されていない場合、ステップS5090において、行インデックスrowが1つだけインクリメントされ得る。そして、本方法はステップS5030に戻る。 In step S5080, it can be determined whether all the rows have been processed, that is, whether the row index row has reached the value N out. If all rows have been processed, the method ends in step S5100. On the other hand, if all rows have not been processed, the row index row may be incremented by one in step S5090. Then, this method returns to step S5030.
特に、図5の例におけるステップS5010〜S5090は、周波数ビンごとに実行することができる。 In particular, steps S501 to S5090 in the example of FIG. 5 can be performed for each frequency bin.
次に、上記ステップを実施する例示の擬似コード(Cプログラミング言語で記述されたもの)を以下に提供する。
// z、M、x、及びs、zの
// 適切なタイプ定義、メモリ配分、及び初期化を前提とする。
// スパース行列の表現
sp = &s[0]; // ポインターインクリメント(第4のアレイ)
Mp = &M[0]; // スパース行列の非ゼロ(第3のアレイ)
rp = &r[0]; // 各行における非ゼロの数(第5のアレイ)
// 入力及び出力
xp = &x[0]; // 入力(第1のアレイ)
zp = &z[0]; // 出力(第2のアレイ)
// ベクトルによるスパース行列の乗算:z = Mdmx x
for (row = 0; row < Nout; row++) [ // Mの行にわたるループ
xp = &x[0]; // xのアドレス
*zp = 0;
for (j = 0; j < *rp++; j++) [ // 行の非ゼロにわたるループ
xp = *sp++; // x内にジャンプ
*zp += (*Mp++) * (*xp);
]
*zp++;
]
Next, exemplary pseudo-code (written in the C programming language) that implements the above steps is provided below.
// of z, M, x, and s, z
// Assuming proper type definition, memory allocation, and initialization.
// Representation of sparse matrix
sp = & s [0]; // Pointer increment (4th array)
Mp = & M [0]; // Nonzero sparse matrix (third array)
rp = & r [0]; // Number of nonzeros in each row (fifth array)
// Input and output
xp = & x [0]; // Input (first array)
zp = & z [0]; // Output (second array)
// Vector multiplication of sparse matrix: z = Mdmx x
for (row = 0; row <Nout; row ++) [// Loop over M rows
xp = & x [0]; // address of x
* zp = 0;
for (j = 0; j <* rp ++; j ++) [// Loop across non-zero lines
xp = * sp ++; // Jump into x
* zp + = (* Mp ++) * (* xp);
]
* zp ++;
]
上記例示的なコードにおいて、第4のアレイsのエントリーが位置間の相対オフセットを示す場合、上記ライン
xp = *sp++; // x内にジャンプ
は、例えば、以下のラインによって置き換える必要がある。
xp += *sp++; // x内にジャンプ
In the above exemplary code, if the entry of the fourth array s indicates a relative offset between positions, then the line
xp = * sp ++; // Jumps within x should be replaced by, for example, the following line.
xp + = * sp ++; // Jump into x
特に、この擬似コードは、x及びzが実数であることを前提としているが、これは単なる例示にすぎない。x及びzは、典型的には複素数のエントリーを有し得ることが理解される。この例示的なコードは、x及びzの複素エントリーも考慮するように容易に適合させることができることが更に理解される。 In particular, this pseudocode assumes that x and z are real numbers, but this is just an example. It is understood that x and z can typically have complex entries. It is further understood that this exemplary code can be easily adapted to take into account the complex entries of x and z.
別の実施形態では、実際のダウンミックスを実行することは、ダウンミックス行列MDMXのエントリーごとに、それぞれのエントリーが0であるか否かについて判断することを含んでいてもよい。エントリーの実際の乗算及び第2のアレイのそれぞれのエントリーへの割り当ては、ダウンミックス行列の問題とするエントリーが非ゼロであることが判明した場合にのみ行われる。上記のアプローチを実行するCプログラミング言語で記述された例示的なコードを以下に記載する。
// タイプ定義。
float Mdmx[][], x[], z[];
int S[][]; // Mdmxにおける非ゼロのエントリーを
// マーキングするバイナリー行列
int I, j;
// ここでは、Nout×Nin行列MDMX及びS、並びにNinベクトルxの
// 適切なメモリ配分及び初期化を前提とする。行列Sは、
// Mdmx[i][j]がゼロである場合には、S[i][j]がゼロであり、
// それ以外の場合には、非ゼロであるように初期化される。
// z = Mdmx xを実行する
for (i = 0; i < Nout; i++) [
z[i] = 0.0;
for (j = 0; j < Nin; j++) [
if (S[i][j] == 0) [
z[i] += Mdmx[i][j]*x[j];
]
]
]
In another embodiment, performing the actual downmix may include determining for each entry in the downmix matrix M DMX whether or not each entry is zero. The actual multiplication of the entries and the allocation of the second array to each entry are made only if the entry in question in the downmix matrix turns out to be non-zero. An exemplary code written in a C programming language that implements the above approach is given below.
// Type definition.
float Mdmx [] [], x [], z [];
int S [] []; // Non-zero entry in M dmx
// Binary matrix to mark
int I, j;
// Here, N out x N in matrix M DMX and S, and N in vector x
// Assuming proper memory allocation and initialization. The matrix S is
// If Mdmx [i] [j] is zero, then S [i] [j] is zero and
// Otherwise, it will be initialized to be non-zero.
// run z = Mdmx x
for (i = 0; i <Nout; i ++) [
z [i] = 0.0;
for (j = 0; j <Nin; j ++) [
if (S [i] [j] == 0) [
z [i] + = Mdmx [i] [j] * x [j];
]
]
]
次に、図2におけるステップS2040の詳細を、図6に示す例示的なフローチャートを参照して説明する。すなわち、それぞれの中間オーディオチャネルの第1のエネルギー指標値を求めることは、ステップS6010〜S6030のうちの幾つかの又は全てを含み得る。 Next, the details of step S2040 in FIG. 2 will be described with reference to the exemplary flowchart shown in FIG. That is, finding the first energy index value for each intermediate audio channel may include some or all of steps S601-10.6030.
ステップS6010において、第3のアレイMが、以前に既に決定されているわけでもなく、それ以外の方法で既に取得しているわけでもない場合、第3のアレイMが決定され得る。この決定は、上述したステップS3010と同様の方法で実行することができ、ステップS3010に関して説明した事項は、本ステップでも同様に当てはまる。ステップS6020において、第4のアレイsが、以前に既に決定されているわけでもなく、それ以外の方法で既に所得しているわけでもない場合、第4のアレイsが決定され得る。この決定は、上述したステップS3020と同様の方法で実行することができ、ステップS3020に関して説明した事項はも、本ステップでも同様に当てはまる。図6には示されていないが、ステップS2040は、第5のアレイrが、以前に既に決定されているわけでもなく、それ以外の方法で既に所得されているわけでもない場合、第5のアレイrを決定することを更に含み得る。この決定は、図3に関して上述したステップS2030と同様の方法で実行することができ、ステップS2030に関して説明した事項は、本ステップでも同様に当てはまる。 In step S6010, if the third array M has not been previously determined and has not already been acquired in any other way, the third array M may be determined. This determination can be performed in the same manner as in step S3010 described above, and the matters described with respect to step S3010 also apply in this step. In step S6020, if the fourth array s has not been previously determined and is not otherwise already earned, the fourth array s may be determined. This determination can be performed in the same manner as in step S3020 described above, and the matters described with respect to step S3020 also apply in this step. Although not shown in FIG. 6, step S2040 is a fifth array r if the fifth array r has not been previously determined and is not otherwise already earned. It may further include determining the array r. This determination can be performed in the same manner as in step S2030 described above with respect to FIG. 3, and the matters described with respect to step S2030 apply similarly to this step.
ステップS6030において、第3のアレイMのエントリーの累乗(例えば、2乗)が、(例えば、周波数ビンごとに)第1のアレイの対応するエントリーの絶対値の累乗(例えば、絶対平方)と乗算され得る。これらの乗算により、中間オーディオチャネルの第1のエネルギー指標値を実際に決定すること又はこの決定の少なくとも一部を行うことができる。すなわち、この決定は、周波数ビンごとに、(例えば、それぞれの周波数ビンの)第3のアレイMのエントリーの累乗(例えば、2乗)と、(例えば、それぞれの周波数ビンの)第1のアレイの対応するエントリーの絶対値の累乗(例えば、絶対平方)とを乗算して、これらのエントリーのそれぞれの積を取得することを含み得る。第1のアレイ及び第3のアレイにおける対応するエントリーの概念については、上述したそれらの詳細な説明を参照されたい。 In step S6030, the power of the entries in the third array M (eg, squared) is multiplied (eg, for each frequency bin) by the power of the absolute values of the corresponding entries in the first array (eg, absolute squares). Can be done. These multiplications can actually determine the first energy index value of the intermediate audio channel, or at least part of this determination. That is, for each frequency bin, this determination is a power (eg, square) of the entries of the third array M (eg, for each frequency bin) and a first array (eg, for each frequency bin). Can include multiplying the power of the absolute value of the corresponding entry of (eg, absolute square) to obtain the product of each of these entries. See their detailed description above for the concepts of the corresponding entries in the first array and the third array.
エントリーの適切な積(第3のアレイMのエントリーの2乗と第1のアレイのエントリーの絶対平方とを乗算したもの)は、(それぞれの周波数ビンの)第6のアレイのエントリーごとに合計され得る。第6のアレイのエントリーへの(1つ以上の)積の和の割り当ては、第5のアレイrに基づいて行われ得る。第5のアレイrの各エントリーは、第6のアレイのそれぞれのエントリーについて、幾つの積を合計して、第6のアレイのそれぞれのエントリーに割り当てる必要があるのかを示し得る。第6のアレイの第1のエントリーから開始した場合、求められた積の和を、これらの積が求められた順序で第6のアレイのエントリーに連続して割り当てることにより、第6のアレイの全てのエントリーが得られる。これにより、全ての中間オーディオチャネルの第1のエネルギー指標値が得られる。ここで、各和における項の数は、第5のアレイrのそれぞれのエントリーによって決まる。一般的に表現すると、第1のエネルギー指標値を求めることは、周波数ビンごとに、それぞれの周波数ビンの第3のアレイのエントリーの2乗と第1のアレイの対応するエントリーの絶対平方との1つ以上の積の和を、第5のアレイのエントリーに基づいて第6のアレイのエントリーに割り当てることを更に含み得る。ここで、第5のアレイr及び第6のアレイ
幾つかの例示の実施形態では、第1のエネルギー指標値を求めるステップは、第6のアレイに対するエントリーインデックスを一時に1つずつ連続的にインクリメントすることと、そのようなエントリーインデックスごとに、それぞれの周波数ビンの、それぞれのエントリーインデックスによって示される第3のアレイのエントリーの2乗と、第1のアレイの対応するエントリーの絶対平方との積を求めることとを更に含み得る。第1のアレイの対応するエントリーは、上述したように、第4のアレイを参照することによって求めることができる。例えば、問題とするエントリーの列番号を第4のアレイsを参照することによって求めることができる。第3のアレイの問題とするエントリーに対応する第1のアレイのエントリーは、求められた列番号をエントリーインデックスとして有する第1のアレイのエントリーとして求めることができる。第1のエネルギー指標値を求めることは、これらの積のうちの1つ以上の和を第6のアレイのエントリーに順次割り当てることを更に含んでいてもよい。この割り当ては、第5のアレイのエントリーに基づいていてもよい。すなわち、第6のアレイのエントリーに割り当てられる和における積の数は、第6のアレイの問題とするエントリーと同じエントリーインデックスを有する第5のアレイのエントリーによって求めることができる。第3のアレイのエントリーの2乗と第1のアレイの対応するエントリーの絶対平方との積が連続的に求められる場合、これらの求められた積が、第6のアレイのエントリーに、第6のアレイ内のそれらの順序で連続的に加算され得る(第6のアレイのエントリーは、事前に0に初期化されることを前提とする)。第6のアレイの各エントリーに加算される連続的に求められる積の数は、第5のアレイの対応するエントリーから求めることができる。特に、これらのステップは、周波数ビンごとに実行され得る。所与の処理帯域の第1のエネルギー指標値を取得するために、この所与の処理帯域内の周波数ビンの第6のアレイを(ベクトル加算のルールに従って)合計してもよい。所与の周波数帯域に関連した第1のエネルギー指標値は、この処理帯域内の周波数ビンのそれぞれの第1のエネルギー指標値であると言える。 In some exemplary embodiments, the step of finding the first energy index value is to continuously increment the entry index for the sixth array one at a time, and for each such entry index, respectively. It may further include finding the product of the square of the entries of the third array indicated by each entry index of the frequency bin of the first array with the absolute squares of the corresponding entries of the first array. The corresponding entry in the first array can be determined by reference to the fourth array, as described above. For example, the column number of the entry in question can be determined by referring to the fourth array s. The entry in the first array corresponding to the entry in question in the third array can be sought as an entry in the first array having the sought column number as the entry index. Finding the first energy index value may further include assigning the sum of one or more of these products sequentially to the entries in the sixth array. This allocation may be based on the entry of the fifth array. That is, the number of products in the sum assigned to the entries in the sixth array can be determined by the entries in the fifth array that have the same entry index as the entry in question in the sixth array. If the product of the squares of the entries in the third array and the absolute squares of the corresponding entries in the first array is continuously determined, then these calculated products are in the entry of the sixth array, the sixth. Can be added sequentially in those order within the array of (assuming that the entries in the sixth array are pre-initialized to 0). The number of continuously determined products added to each entry in the sixth array can be determined from the corresponding entry in the fifth array. In particular, these steps can be performed on a frequency bin basis. A sixth array of frequency bins within this given processing band may be summed (according to the rules of vector addition) to obtain the first energy index value for a given processing band. It can be said that the first energy index value associated with a given frequency band is the first energy index value of each of the frequency bins in this processing band.
図7は、図6におけるステップS6030において第1のエネルギー指標値を求める本開示の実施形態による一例を示している。すなわち、第1のエネルギー指標値を求めることは、ステップS7010〜S7090のうちの幾つかの又は全てを含み得る。特に、図7の例は、行方向走査順序の場合に関するが、列方向走査順序の場合に関するように容易に適合させることができる。 FIG. 7 shows an example according to the embodiment of the present disclosure for obtaining the first energy index value in step S6030 in FIG. That is, obtaining the first energy index value may include some or all of steps S701 to S7900. In particular, the example of FIG. 7 relates to the case of row-direction scanning order, but can be easily adapted as in the case of column-direction scanning order.
本方法は、ステップS7000から開始する。ステップS7010、ステップS7020、及びステップS7030は、それぞれ図5におけるステップS5010、ステップS5020及びステップS5030と同一であり得る。それらの繰り返しとなる説明は省略する。 This method starts from step S7000. Step S7010, step S7020, and step S7030 can be the same as step S5010, step S5020, and step S5030 in FIG. 5, respectively. The repetitive explanations thereof will be omitted.
行インデックスrowによって示されるダウンミックス行列MDMXの行が非ゼロのエントリーを含まない場合、本方法は、行インデックスrowによって示される第6のアレイのエントリーに(複素数)値0を割り当て、ステップS7040〜S7070をスキップすることができる。 If the rows of the downmix matrix M DMX indicated by the row index row do not contain non-zero entries, the method assigns a (complex) value of 0 to the entries in the sixth array indicated by the row index row, step S7040. ~ S7070 can be skipped.
ステップS7040は、以下の点を除いて、図5におけるステップS5040と同一であり得る。第3のアレイMの第jのエントリー及び第1のアレイの対応するエントリーの代わりに、ここでは、第3のアレイMの第jのエントリーの累乗(例えば、2乗)及び第1のアレイの対応するエントリーの絶対値の累乗(例えば、絶対平方)が、それらの積を求めるために互いに乗算され得る。 Step S7040 can be the same as step S5040 in FIG. 5, except for the following points. Instead of the jth entry of the third array M and the corresponding entry of the first array, here the power of the jth entry of the third array M (eg, squared) and of the first array The powers of the absolute values of the corresponding entries (eg, absolute squares) can be multiplied by each other to find their product.
ステップS7050及びステップS7060は、それぞれ図5におけるステップS5050及びステップS5060と同一であり得る。それらの繰り返しとなる説明は省略する。 Step S7050 and step S7060 can be the same as step S5050 and step S5060 in FIG. 5, respectively. The repetitive explanations thereof will be omitted.
ステップS7070において、行インデックスrowの現在の値について求められた積を合計することから得られた和が、行インデックスrowによって示される第6のアレイのエントリーに割り当てられ得る。あるいは、第6のアレイの問題とするエントリーが事前に0に初期化されていることを前提として、行インデックスrowの現在の値について求められた積が、第6のアレイの問題とするエントリーに連続的に加算され得る。図4の例では、row=1について、r1=2の積((M1)2・|xS1|2及び(M2)2・|xS2|2)
が求められ得る。それらの和が、第6のアレイの第1のエントリー
Can be sought. The sum of them is the first entry in the sixth array.
ここでもまた、ステップS7080及びステップS7090は、それぞれ図5におけるステップS5080及びステップS5090と同一であり得る。それらの繰り返しとなる説明は省略する。 Again, step S7080 and step S7090 can be identical to step S5080 and step S5090 in FIG. 5, respectively. The repetitive explanations thereof will be omitted.
特に、図5及び図7のプロセスは、第1のアレイ及び第3のアレイのエントリーをループする計算コスト及びアドレス指定の計算コストを削減するために、単一のプロセスに統合することができる。実際のダウンミックスを実行し、第1のエネルギー指標値を求める新たな統合されたプロセス(方法)は、ステップS5040及びステップS5070を除いて、図5における方法と同じステップを含み得る。これらのステップは、それぞれ新たなステップS8040及びS8070に置き換えられる。特に、この統合は、ステップS2030及びステップS2040をまとめて実行できることを意味する。 In particular, the processes of FIGS. 5 and 7 can be integrated into a single process to reduce the computational cost of looping the entries of the first and third arrays and the computational cost of addressing. The new integrated process (method) of performing the actual downmix and determining the first energy index value may include the same steps as the method in FIG. 5, except for step S5040 and step S5070. These steps are replaced by new steps S8040 and S8070, respectively. In particular, this integration means that steps S2030 and S2040 can be performed together.
ステップS8040において、ステップS5040及びステップS7040の統合された処理が実行され得る。すなわち、第3のアレイの第jのエントリーと第1のアレイの対応するエントリーとの第1の積が(上記ステップS5040に関して説明した方法で)取得され、同時に、第3のアレイの第jのエントリーの累乗(例えば、2乗)と第1のアレイの対応するエントリーの絶対値の累乗(例えば、絶対平方)との第2の積が(上記ステップS7040に関して説明した方法で)取得され得る。これは、式[4]における2つの加算プロセスの順序の交換を要することに留意されたい。 In step S8040, the integrated processing of steps S5040 and S7040 can be performed. That is, the first product of the jth entry of the third array and the corresponding entry of the first array is obtained (as described with respect to step S5040 above), and at the same time the jth of the third array. A second product of the power of the entry (eg, square) and the power of the absolute value of the corresponding entry in the first array (eg, absolute square) can be obtained (as described with respect to step S7040 above). Note that this requires an exchange of the order of the two addition processes in equation [4].
次に、ステップS8070において、ステップS5070及びステップS7070の統合された処理が実行され得る。すなわち、行インデックスrowの現在の値について求められた第1の積が合計され、その結果得られた和が、行インデックスrowによって示される第2のアレイのインデックスに割り当てられ得る。あるいは、第2のアレイの問題とするエントリーが事前に0に初期化されていることを前提として、行インデックスrowの現在の値について求められた第1の積が、第2のアレイの問題とするエントリーに連続的に加算され得る。さらに、行インデックスrowの現在の値について求められた第2の積が合計され、その結果得られた和が、行インデックスrowによって示される第6のアレイのインデックスに割り当てられ得る。あるいは、第6のアレイの問題とするエントリーが事前に0に初期化されていることを前提として、行インデックスrowの現在の値について求められた第2の積が、第6のアレイの問題とするエントリーに連続的に加算され得る。 Next, in step S8070, the integrated processing of step S5070 and step S7070 may be executed. That is, the first product obtained for the current value of the row index row is summed and the resulting sum can be assigned to the index of the second array indicated by the row index row. Alternatively, assuming that the entry in question in the second array has been pre-initialized to 0, the first product found for the current value of the row index row is the problem in the second array. Can be continuously added to the entries to be made. In addition, the second product calculated for the current value of the row index row is summed and the resulting sum can be assigned to the index of the sixth array indicated by the row index row. Alternatively, assuming that the entry in question in the sixth array has been pre-initialized to 0, the second product found for the current value of the row index row is the problem in the sixth array. Can be continuously added to the entries to be made.
上記処理は、周波数ビンごとに実行することができる。周波数ビンごとではなく処理帯域ごとの第1のエネルギー指標値を取得するために、所与の処理帯域内の周波数ビンのそれぞれの第6のアレイを(ベクトル加算のルールに従って)合計してもよい。 The above processing can be executed for each frequency bin. Each sixth array of frequency bins within a given processing band may be summed (according to the rules of vector addition) to obtain a first energy index value per processing band rather than per frequency bin. ..
本提案による、複数の入力オーディオチャネルのダウンミキシングの方法は、装置、例えば、オーディオ復号化器のフォーマット変換器(フォーマット変換器ブロック)又は一般的にはオーディオ復号化器によって実施できることが理解される。そのような装置(例えば、フォーマット変換器又はオーディオ復号化器)は、上術したそれぞれのステップを実行するように構成されたそれぞれのユニットを備え得る。そのような装置8000の一例を図8に概略的に示す。例えば、そのような装置8000は、前述のステップS2020を実行するように構成された周波数係数取得ユニット8010(例えば、受信ユニット又は時間周波数変換ユニット)、前述のステップS2010を実行するように構成されたダウンミックス行列取得ユニット8020、前述のステップS2030を実行するように構成されたダウンミキシングユニット8030、前述のステップS2040を実行するように構成されたエネルギー算出ユニット8040、前述のステップS2050を実行するように構成された調整ユニット8050、及び/又は前述のステップS2060を実行するように構成された逆時間周波数変換ユニット8060を備え得る。そのような装置の各ユニットは、当該各ユニットによって実行される処理を行うように構成された、すなわち、前述のステップのそれぞれを実行するように構成されたコンピューティングデバイスのプロセッサ8100によって具現化され得ることが更に理解される。
It is understood that the method of downmixing a plurality of input audio channels according to the present proposal can be carried out by a device, for example, a format converter (format converter block) of an audio decoder or generally an audio decoder. .. Such a device (eg, a format converter or audio decoder) may include a respective unit configured to perform each of the above-mentioned steps. An example of such a
本開示の実施形態の上記説明では、行インデックスrow及びエントリーインデックスjは1に初期化され、任意の所与のアレイにおける最初のインデックスは値1を有する、すなわち、インデックス値1は問題とするアレイの第1のエントリーを示すものとした。しかしながら、本開示は、このような選択に限定されるものと解釈されるべきではない。上記の代わりに、これらのインデックスは、0のインデックス値を有していてもよい。したがって、上記で選択された1という値は、可能な最小のインデックス値を例示的に表していると言える。
In the above description of the embodiments of the present disclosure, the row index row and the entry index j are initialized to 1, and the first index in any given array has a value of 1, i.e., an index value of 1 is the array in question. The first entry of. However, this disclosure should not be construed as being limited to such choices. Instead of the above, these indexes may have an index value of 0. Therefore, it can be said that the
本出願において用いられる用語「回路機構(circuitry)」は、次のもの、すなわち、(a)ハードウェアのみの回路で実施されたもの(アナログ回路機構及び/又はデジタル回路機構のみで実施されたもの等)と、(b)(適用可能な場合には)(i)プロセッサ(複数の場合もある)の組み合わせ又は(ii)モバイルフォン又はサーバー等の装置に様々な機能を実行させるように共に動作するプロセッサ(複数の場合もある)/ソフトウェア(デジタル信号プロセッサ(複数の場合もある)を含む)の一部分、ソフトウェア、及びメモリ(複数の場合もある)等の回路とソフトウェア(及び/又はファームウェア)とを組み合わせたものと、(c)ソフトウェア又はファームウェアが物理的に存在しない場合であっても、動作のためにソフトウェア又はファームウェアを必要とするマイクロプロセッサ(複数の場合もある)又はマイクロプロセッサ(複数の場合もある)の一部分等の回路の全てを指す。「回路機構」のこの定義は、あらゆる請求項を含む本出願におけるこの用語の全ての使用に当てはまる。更なる例として、本出願において用いられる「回路機構」の用語は、プロセッサ(又は複数のプロセッサ)又はプロセッサの一部分と、その(又はそれらの)添付ソフトウェア及び/又はファームウェアとだけで実施されたものも包含する。「回路機構」の用語は、例えば、特定の請求項の要素に適用可能な場合には、モバイルフォン用のベースバンド集積回路若しくはアプリケーションプロセッサ集積回路、又はサーバー、セルラーネットワークデバイス、若しくは他のネットワークデバイス(例えば、FirstNet、E−UTRAN、UTRAN又はGERANの対応デバイスと通信することが可能なスマートフォン、セルラーフォン、パーソナルデジタルアシスタント(PDA)、ワイヤレスモデム、ワイヤレス通信デバイス、ラップトップ、ネットブック、タブレット又は他の任意のデバイス等のユーザー機器(UE))における同様の集積回路も包含する。 The term "circuitry" as used in this application is as follows: (a) implemented in a hardware-only circuit (analog circuit mechanism and / or implemented in a digital circuit mechanism only). Etc.) and (b) (if applicable) (i) a combination of processors (s) or (ii) working together to cause a device such as a mobile phone or server to perform various functions. Circuits and software (and / or firmware) such as part of a microprocessor (s) / software (including a digital signal processor (s)), software, and memory (s). And (c) microprocessors (s) or microprocessors (s) that require software or firmware to operate even if the software or hardware does not physically exist. Refers to all of the circuit such as a part of). This definition of "circuit mechanism" applies to all uses of this term in this application, including all claims. As a further example, the term "circuit mechanism" used in this application is implemented solely with a processor (or a plurality of processors) or a portion of a processor and its (or their) attached software and / or firmware. Also includes. The term "circuit mechanism" is used, for example, as a baseband integrated circuit or application processor integrated circuit for a mobile phone, or a server, cellular network device, or other network device, where applicable to a particular claim element. (For example, smartphones, cellular phones, personal digital assistants (PDAs), wireless modems, wireless communication devices, laptops, netbooks, tablets or others capable of communicating with FirstNet, E-UTRAN, UTRAN or GERAN compatible devices. Also includes similar integrated circuits in user devices (UEs) such as any device in the world.
本明細書及び図面は、本提案による方法及び装置の原理を単に示しているにすぎないことに留意されたい。したがって、当業者であれば、本明細書に明示的に説明も図示もされていないが、本発明の原理を具現化するとともにその趣旨及び範囲内に含まれる様々な構成を考案することができることが理解されるであろう。さらに、本明細書に詳述した全ての例は、主として、読み手が、本提案による方法及び装置の原理、並びにこの技術を進めることに本発明者らが貢献する概念を理解することを助けるという専ら教育上の目的を特に意図したものであり、そのような特に詳述した例及び状況に限定されるものと解釈されるべきではない。その上、本発明の原理、態様、及び実施形態、並びにそれらの特定の例を詳述した本明細書における全ての記述は、それらと均等なものを包含するように意図されている。 It should be noted that the specification and drawings merely illustrate the principles of the methods and devices according to the present proposal. Therefore, a person skilled in the art can embody the principle of the present invention and devise various configurations included in the purpose and scope thereof, although not explicitly explained or illustrated in the present specification. Will be understood. Moreover, all the examples detailed herein are primarily intended to help the reader understand the principles of the methods and devices proposed herein, as well as the concepts by which the inventors contribute to advancing this technique. It is solely intended for educational purposes and should not be construed as being limited to such particularly detailed examples and situations. Moreover, all descriptions herein detailing the principles, aspects, and embodiments of the invention, as well as specific examples thereof, are intended to include those equivalent.
本書類において説明した方法及び装置は、ソフトウェア、ファームウェア及び/又はハードウェアとして実施することができる。或る特定の構成要素は、例えば、デジタル信号プロセッサ又はマイクロプロセッサ上で動作するソフトウェアとして実施することができる。他の構成要素は、例えば、ハードウェア及び/又は特定用途向け集積回路として実施することができる。説明した方法及び装置において生じる信号は、ランダムアクセスメモリ又は光記憶媒体等の媒体に記憶することができる。それらの信号は、無線ネットワーク、衛星ネットワーク、ワイヤレスネットワーク又はワイヤラインネットワーク(例えば、インターネット及び/又はIPマルチメディアコアネットワークサブシステム(IMS))等のネットワークを介して転送することができる。 The methods and devices described in this document can be implemented as software, firmware and / or hardware. Certain components can be implemented, for example, as software running on a digital signal processor or microprocessor. Other components can be implemented, for example, as hardware and / or application-specific integrated circuits. The signals generated by the methods and devices described can be stored in media such as random access memory or optical storage media. These signals can be transferred over networks such as wireless networks, satellite networks, wireless networks or wireline networks (eg, the Internet and / or IP Multimedia Core Network Subsystem (IMS)).
上記例示の実施形態に対する様々な変更及び改変は、上記説明が添付図面とともに読まれた場合に、上記説明を考慮することで当業者に明らかになることができる。あらゆる全ての変更は、非限定的な例示の実施形態の範囲内に含まれる。さらに、上記本明細書において述べたカテゴリーの他の例示の実施形態は、前述の説明及び図面に提示された教示からの利益を得る、これらの実施形態が関係する技術分野の当業者に思い浮かぶであろう。 Various changes and modifications to the above-exemplified embodiments can be made apparent to those skilled in the art by considering the above description when the above description is read with the accompanying drawings. All changes are included within the scope of the non-limiting exemplary embodiments. Moreover, other exemplary embodiments of the categories mentioned herein will come to mind to those skilled in the art in which these embodiments relate, benefiting from the teachings presented in the above description and drawings. Will.
したがって、本発明は、本明細書において説明した形態のうちの任意のもので具現化することができる。例えば、以下に列挙した例示の実施形態(A−EEE)は、本発明の幾つかの態様の幾つかの構造、特徴、及び機能を記述する。 Therefore, the present invention can be embodied in any of the forms described herein. For example, the exemplary embodiments (A-EEE) listed below describe some structures, features, and functions of some aspects of the invention.
A−EEE1.複数の入力オーディオチャネルをダウンミキシングする方法であって、
前記入力オーディオチャネルのそれぞれについて、複数の対応する周波数ビンにおける複数の周波数係数を取得することと、
少なくとも1つの周波数ビンについて、それぞれの周波数ビンについての前記複数の入力オーディオチャネルの前記周波数係数によって形成された第1のアレイにダウンミックス行列を適用して、それぞれの周波数ビンの複数の中間オーディオチャネルの前記周波数係数によって形成された第2のアレイを取得することと、
を含み、
前記方法は、
前記ダウンミックス行列の非ゼロのエントリーのみを含む第3のアレイを求めることと、
前記第3のアレイの各エントリーについて、前記ダウンミックス行列内での前記第3のアレイのそれぞれのエントリーの位置を示すエントリーを含む第4のアレイを求めることと、
を更に含み、
前記ダウンミックス行列を前記第1のアレイに適用することは、
前記少なくとも1つの周波数ビンについて、それぞれの周波数ビンについての前記第3のアレイの前記エントリーと前記第1のアレイの対応するエントリーとを乗算すること、
を含み、
前記第1のアレイの前記対応するエントリーは、前記第4のアレイに基づいて求められる、方法。
A-EEE1. A method of downmixing multiple input audio channels,
Acquiring a plurality of frequency coefficients in a plurality of corresponding frequency bins for each of the input audio channels,
For at least one frequency bin, a downmix matrix is applied to the first array formed by the frequency coefficients of the plurality of input audio channels for each frequency bin, and multiple intermediate audio channels for each frequency bin are applied. To obtain a second array formed by the frequency coefficients of
Including
The method is
Finding a third array containing only non-zero entries in the downmix matrix,
For each entry in the third array, a fourth array containing an entry indicating the position of each entry in the third array in the downmix matrix is determined.
Including
Applying the downmix matrix to the first array
Multiplying the at least one frequency bin by the entry of the third array for each frequency bin and the corresponding entry of the first array.
Including
The method in which the corresponding entry of the first array is determined based on the fourth array.
A−EEE2.前記少なくとも1つの周波数ビンについて、中間オーディオチャネルごとに、それぞれの中間オーディオチャネルのエネルギー指標値を求めること、
を更に含み、
前記エネルギー指標値を求めることは、前記少なくとも1つの周波数ビンについて、
前記第3のアレイの前記エントリーの累乗と、前記第1のアレイの前記対応するエントリーの絶対値の累乗とを乗算すること、
を含み、
前記第1のアレイの前記対応するエントリーは、前記第4のアレイに基づいて求められる、A−EEE1による方法。
A-EEE2. Obtaining the energy index value of each intermediate audio channel for each intermediate audio channel for at least one frequency bin.
Including
Obtaining the energy index value is to obtain the energy index value for the at least one frequency bin.
Multiplying the power of the entry in the third array by the power of the absolute value of the corresponding entry in the first array.
Including
The corresponding entry in the first array is determined based on the fourth array, the method according to A-EEE1.
A−EEE3.前記第3のアレイは、前記ダウンミックス行列の前記非ゼロのエントリーを、前記ダウンミックス行列のエントリー全体にわたる所定の走査順序におけるそれらの出現順序で含む線形アレイである、先行するA−EEEのいずれか1つによる方法。 A-EEE3. The third array is any of the preceding A-EEEs, which is a linear array containing the non-zero entries of the downmix matrix in their order of appearance in a predetermined scan order across the entries of the downmix matrix. One way.
A−EEE4.前記第4のアレイの各エントリーは、前記ダウンミックス行列内の前記第3のアレイのそれぞれのエントリーの前記走査順序における前記位置を示す、先行するA−EEEのいずれか1つによる方法。 A-EEE4. A method according to any one of the preceding A-EEEs, wherein each entry in the fourth array indicates the position of each entry in the third array in the downmix matrix in said scan order.
A−EEE5.前記第4のアレイの各エントリーは、行方向走査順序の場合には、前記第3のアレイのそれぞれのエントリーが前記ダウンミックス行列において位置する前記ダウンミックス行列の列を示し、列方向走査順序の場合には、前記第3のアレイのそれぞれのエントリーが前記ダウンミックス行列において位置する前記ダウンミックス行列の行を示す、先行するA−EEEのいずれか1つによる方法。 A-EEE5. Each entry in the fourth array, in the case of row-wise scan order, indicates the column of the downmix matrix in which each entry in the third array is located in the downmix matrix and is in column-wise scan order. In the case of a method according to any one of the preceding A-EEEs, where each entry in the third array indicates a row of the downmix matrix located in the downmix matrix.
A−EEE6.第5のアレイを求めることを更に含み、
前記第5のアレイのエントリーは、行方向走査順序の場合には、前記ダウンミックス行列のそれぞれの行ごとの非ゼロのエントリーの数を示し、列方向走査順序の場合には、前記ダウンミックス行列のそれぞれの列ごとの非ゼロのエントリーの数を示す、A−EEE3、又は、A−EEE3に従属する、先行するA−EEEのいずれか1つによる方法。
A-EEE6. Further including finding a fifth array,
The entries in the fifth array indicate the number of non-zero entries for each row of the downmix matrix in the case of row scan order and the downmix matrix in the case of column scan order. A method according to either A-EEE3 or one of the preceding A-EEEs subordinate to A-EEE3, which indicates the number of non-zero entries for each column of.
A−EEE7.前記ダウンミックス行列を前記第1のアレイに適用することは、前記少なくとも1つの周波数ビンについて、
それぞれの周波数ビンについての前記第3のアレイの前記エントリーと前記第1のアレイの前記対応するエントリーとの1つ以上の積の和を、前記第5のアレイの前記エントリーに基づいて前記第2のアレイの前記エントリーに割り当てること、
を更に伴う、A−EEE6による方法。
A-EEE7. Applying the downmix matrix to the first array can be applied to the at least one frequency bin.
The sum of one or more products of the entry of the third array and the corresponding entry of the first array for each frequency bin is based on the entry of the fifth array. Assigned to the entry in the array of
The method according to A-EEE6, which is further accompanied by.
A−EEE8.前記ダウンミックス行列を前記第1のアレイに適用することは、前記少なくとも1つの周波数ビンについて、
前記第3のアレイに対する前記エントリーインデックスを一時に1つずつ連続的にインクリメントし、エントリーインデックスごとに、それぞれの周波数ビンの、それぞれのエントリーインデックスによって示される前記第3のアレイの前記エントリーと、前記第1のアレイの前記対応するエントリーとの積を求めることと、
前記積のうちの1つ以上の和を前記第2のアレイの前記エントリーに順次割り当てることと、
を更に含み、前記割り当ては、前記第5のアレイの前記エントリーに基づく、A−EEE5又は6による方法。
A-EEE8. Applying the downmix matrix to the first array can be applied to the at least one frequency bin.
The entry index for the third array is continuously incremented one at a time, and for each entry index, the entry of the third array indicated by the entry index of each frequency bin and the entry of the third array. Finding the product of the corresponding entry of the first array and
Sequentially assigning the sum of one or more of the products to the entry in the second array,
The allocation is based on the entry of the fifth array, according to A-EEE5 or 6.
A−EEE9.前記ダウンミックス行列を前記第1のアレイに適用することは、前記少なくとも1つの周波数ビンについて、
前記第3のアレイに対するエントリーインデックスごとに、それぞれの周波数ビンの、それぞれのエントリーインデックスによって示される前記第3のアレイの前記エントリーの2乗と、前記第1のアレイの前記対応するエントリーの絶対平方との積を第2の積として求めることと、
これらの第2の積のうちの1つ以上の和をそれぞれの周波数ビンの第6のアレイの前記エントリーに順次割り当てることと、
を更に含み、
前記割り当ては、前記第5のアレイの前記エントリーに基づき、
所与の処理帯域内の周波数ビンにわたる前記第6のアレイの和は、前記所与の処理帯域内の前記周波数ビンの前記エネルギー指標値を与える、A−EEE8による方法。
A-EEE9. Applying the downmix matrix to the first array can be applied to the at least one frequency bin.
For each entry index for the third array, the square of the entry of the third array indicated by the entry index of each frequency bin and the absolute square of the corresponding entry of the first array. To find the product of and as the second product,
The sum of one or more of these second products is sequentially assigned to the entry in the sixth array of each frequency bin, and
Including
The allocation is based on the entry in the fifth array.
The method according to A-EEE8, wherein the sum of the sixth array over the frequency bins in a given processing band gives the energy index value of the frequency bins in the given processing band.
A−EEE10.前記所与の処理帯域内の前記周波数ビンを求めることは、ルックアップテーブルを参照することを含み、前記ルックアップテーブルは、処理帯域ごとに、それぞれの処理帯域内の周波数ビンの数を示すエントリーを含む、A−EEE9による方法。 A-EEE10. Finding the frequency bins in the given processing band involves referencing a look-up table, which is an entry indicating the number of frequency bins in each processing band for each processing band. The method according to A-EEE9, which comprises.
A−EEE11.複数の入力オーディオチャネルをダウンミキシングする装置であって、 前記入力オーディオチャネルのそれぞれについて、複数の対応する周波数ビンにおける複数の周波数係数を取得するように構成された周波数係数取得ユニットと、
ダウンミックス行列を取得するように構成されたダウンミックス行列取得ユニットと、
少なくとも1つの周波数ビンについて、それぞれの周波数ビンについての前記複数の入力オーディオチャネルの前記周波数係数によって形成された第1のアレイに前記ダウンミックス行列を適用して、それぞれの周波数ビンの複数の中間オーディオチャネルの前記周波数係数によって形成された第2のアレイを取得するように構成されたダウンミキシングユニットと、
を備え、
前記ダウンミキシングユニットは、
前記ダウンミックス行列の非ゼロのエントリーのみを含む第3のアレイを求めることと、
前記第3のアレイの各エントリーについて、前記ダウンミックス行列における前記第3のアレイのそれぞれのエントリーの位置を示すエントリーを含む第4のアレイを求めることと、
前記少なくとも1つの周波数ビンについて、それぞれの周波数ビンについての前記第3のアレイの前記エントリーと前記第1のアレイの対応するエントリーとを乗算することと、
を行うように構成され、
前記第1のアレイの前記対応するエントリーは、前記第4のアレイに基づいて求められる、装置。
A-EEE11. A device that downmixes a plurality of input audio channels, a frequency coefficient acquisition unit configured to acquire a plurality of frequency coefficients in a plurality of corresponding frequency bins for each of the input audio channels, and a frequency coefficient acquisition unit.
With a downmix matrix acquisition unit configured to acquire a downmix matrix,
For at least one frequency bin, the downmix matrix is applied to a first array formed by the frequency coefficients of the plurality of input audio channels for each frequency bin to provide multiple intermediate audio in each frequency bin. A downmixing unit configured to acquire a second array formed by said frequency coefficients of the channel, and
With
The down mixing unit is
Finding a third array containing only non-zero entries in the downmix matrix,
For each entry in the third array, a fourth array containing an entry indicating the position of each entry in the third array in the downmix matrix is determined.
Multiplying the at least one frequency bin by the entry of the third array for each frequency bin and the corresponding entry of the first array.
Is configured to do
The corresponding entry of the first array is determined based on the fourth array.
A−EEE12.前記第3のアレイは、前記ダウンミックス行列の前記非ゼロのエントリーを、前記ダウンミックス行列のエントリー全体にわたる所定の走査順序におけるそれらの出現順序で含む線形アレイである、A−EEE11による装置。 A-EEE12. The device according to A-EEE11, said third array is a linear array containing the non-zero entries of the downmix matrix in their appearance order in a predetermined scan order across the entries of the downmix matrix.
A−EEE13.前記ダウンミキシングユニットは、第5のアレイを求めるように更に構成され、
前記第5のアレイのエントリーは、行方向走査順序の場合には、前記ダウンミックス行列のそれぞれの行ごとの非ゼロのエントリーの数を示し、列方向走査順序の場合には、それぞれの列ごとの前記ダウンミックス行列の非ゼロのエントリーの数を示す、A−EEE12による装置。
A-EEE 13. The downmixing unit is further configured to obtain a fifth array.
The entries in the fifth array indicate the number of non-zero entries per row of the downmix matrix in the case of row scan order, and per column in the case of column scan order. A device according to A-EEE12 showing the number of non-zero entries in the downmix matrix of.
A−EEE14.前記ダウンミキシングユニットは、前記少なくとも1つの周波数ビンについて、
それぞれの周波数ビンについての前記第3のアレイの前記エントリーと前記第1のアレイの前記対応するエントリーとの1つ以上の積の和を、前記第5のアレイの前記エントリーに基づいて前記第2のアレイの前記エントリーに割り当てる、
ように更に構成される、A−EEE13による装置。
A-EEE14. The downmixing unit is for the at least one frequency bin.
The sum of one or more products of the entry of the third array and the corresponding entry of the first array for each frequency bin is based on the entry of the fifth array. Assign to said entry in the array of
A device according to A-EEE13, which is further configured as described above.
A−EEE15.プロセッサ上で実行されるように構成されるとともに、コンピューティングデバイス上で実施されるとA−EEE1〜10のいずれか1つによる方法の方法ステップを実行するように構成されたソフトウェアプログラム。 A-EEE15. A software program configured to run on a processor and, when run on a computing device, to perform a method step of the method according to any one of A-EEE1-10.
更なる例示として、以下に列挙した例示の実施形態(B−EEE)は、本発明の幾つかの態様の幾つかの構造、特徴、及び機能を記載している。 As a further example, the exemplary embodiments (B-EEE) listed below describe some structures, features, and functions of some aspects of the invention.
B−EEE1.複数の入力オーディオチャネルをダウンミキシングする方法であって、 前記入力オーディオチャネルのそれぞれについて、複数の対応する周波数ビンにおける複数の周波数係数を取得することと、
少なくとも1つの周波数ビンについて、それぞれの周波数ビンについての前記複数の入力オーディオチャネルの前記周波数係数によって形成された第1のアレイにダウンミックス行列を適用して、それぞれの周波数ビンの複数の中間オーディオチャネルの前記周波数係数によって形成された第2のアレイを取得することと、
を含み、
前記方法は、
前記ダウンミックス行列の非ゼロのエントリーのみを含む第3のアレイを求めることと、
前記第3のアレイの各エントリーについて、前記ダウンミックス行列内での前記第3のアレイのそれぞれのエントリーの位置を示すエントリーを含む第4のアレイを求めることと、
を更に含み、
前記ダウンミックス行列を前記第1のアレイに適用することは、
前記少なくとも1つの周波数ビンについて、それぞれの周波数ビンについての前記第3のアレイの前記エントリーと前記第1のアレイの対応するエントリーとを乗算すること、
を含み、前記第1のアレイの前記対応するエントリーは、前記第4のアレイに基づいて求められる、方法。
B-EEE1. A method of downmixing multiple input audio channels, for each of the input audio channels, to obtain multiple frequency coefficients in multiple corresponding frequency bins.
For at least one frequency bin, a downmix matrix is applied to the first array formed by the frequency coefficients of the plurality of input audio channels for each frequency bin, and multiple intermediate audio channels for each frequency bin are applied. To obtain a second array formed by the frequency coefficients of
Including
The method is
Finding a third array containing only non-zero entries in the downmix matrix,
For each entry in the third array, a fourth array containing an entry indicating the position of each entry in the third array in the downmix matrix is determined.
Including
Applying the downmix matrix to the first array
Multiplying the at least one frequency bin by the entry of the third array for each frequency bin and the corresponding entry of the first array.
The method, wherein the corresponding entry of the first array is determined based on the fourth array.
B−EEE2.前記少なくとも1つの周波数ビンについて、中間オーディオチャネルごとに、それぞれの中間オーディオチャネルのエネルギー指標値を求めること、
を更に含み、
前記エネルギー指標値を求めることは、前記少なくとも1つの周波数ビンについて、
前記第3のアレイの前記エントリーの累乗と、前記第1のアレイの前記対応するエントリーの絶対値の累乗とを乗算すること、
を含み、前記第1のアレイの前記対応するエントリーは、前記第4のアレイに基づいて求められる、B−EEE1による方法。
B-EEE2. Obtaining the energy index value of each intermediate audio channel for each intermediate audio channel for at least one frequency bin.
Including
Obtaining the energy index value is to obtain the energy index value for the at least one frequency bin.
Multiplying the power of the entry in the third array by the power of the absolute value of the corresponding entry in the first array.
The method according to B-EEE1, wherein the corresponding entry of the first array is determined based on the fourth array.
B−EEE3.前記第3のアレイは、前記ダウンミックス行列の前記非ゼロのエントリーを、前記ダウンミックス行列のエントリー全体にわたる所定の走査順序におけるそれらの出現順序で含む線形アレイである、先行するB−EEEのいずれか1つによる方法。 B-EEE3. The third array is any of the preceding B-EEEs, which is a linear array containing the non-zero entries of the downmix matrix in their order of appearance in a predetermined scan order across the entries of the downmix matrix. One way.
B−EEE4.前記第4のアレイの各エントリーは、前記ダウンミックス行列内の前記第3のアレイのそれぞれのエントリーの前記走査順序における前記位置を示す、先行するB−EEEのいずれか1つによる方法。 B-EEE4. A method according to any one of the preceding B-EEEs, wherein each entry in the fourth array indicates the position of each entry in the third array in the downmix matrix in said scan order.
B−EEE5.前記第4のアレイの各エントリーは、行方向走査順序の場合には、前記第3のアレイのそれぞれのエントリーが前記ダウンミックス行列において位置する前記ダウンミックス行列の列を示し、列方向走査順序の場合には、前記第3のアレイのそれぞれのエントリーが前記ダウンミックス行列において位置する前記ダウンミックス行列の行を示す、先行するB−EEEのいずれか1つによる方法。 B-EEE5. Each entry in the fourth array, in the case of row-wise scan order, indicates the column of the downmix matrix in which each entry in the third array is located in the downmix matrix and is in column-wise scan order. In the case of a method according to any one of the preceding B-EEEs, where each entry in the third array indicates a row of the downmix matrix located in the downmix matrix.
B−EEE6.第5のアレイを求めることを更に含み、
前記第5のアレイのエントリーは、行方向走査順序の場合には、前記ダウンミックス行列のそれぞれの行ごとの非ゼロのエントリーの数を示し、列方向走査順序の場合には、前記ダウンミックス行列のそれぞれの列ごとの非ゼロのエントリーの数を示す、B−EEE3、又は、B−EEE3に従属する、先行するB−EEEのいずれか1つによる方法。
B-EEE6. Further including finding a fifth array,
The entries in the fifth array indicate the number of non-zero entries for each row of the downmix matrix in the case of row scan order, and the downmix matrix in the case of column scan order. A method according to either B-EEE3 or a preceding B-EEE subordinate to B-EEE3, which indicates the number of non-zero entries for each column of.
B−EEE7.前記ダウンミックス行列を前記第1のアレイに適用することは、前記少なくとも1つの周波数ビンについて、
それぞれの周波数ビンについての前記第3のアレイの前記エントリーと前記第1のアレイの前記対応するエントリーとの1つ以上の積の和を、前記第5のアレイの前記エントリーに基づいて前記第2のアレイの前記エントリーに割り当てること、
を更に伴う、B−EEE6による方法。
B-EEE 7. Applying the downmix matrix to the first array can be applied to the at least one frequency bin.
The sum of one or more products of the entry of the third array and the corresponding entry of the first array for each frequency bin is based on the entry of the fifth array. Assigned to the entry in the array of
The method according to B-EEE6, which is further accompanied by.
B−EEE8.前記ダウンミックス行列を前記第1のアレイに適用することは、前記少なくとも1つの周波数ビンについて、
前記第3のアレイに対する前記エントリーインデックスを一時に1つずつ連続的にインクリメントし、エントリーインデックスごとに、それぞれの周波数ビンの、それぞれのエントリーインデックスによって示される前記第3のアレイの前記エントリーと、前記第1のアレイの前記対応するエントリーとの積を求めることと、
前記積のうちの1つ以上の和を前記第2のアレイの前記エントリーに順次割り当てることと、
を更に含み、
前記割り当ては、前記第5のアレイの前記エントリーに基づく、B−EEE5又は6による方法。
B-EEE8. Applying the downmix matrix to the first array can be applied to the at least one frequency bin.
The entry index for the third array is continuously incremented one at a time, and for each entry index, the entry of the third array indicated by the entry index of each frequency bin and the entry of the third array. Finding the product of the corresponding entry of the first array and
Sequentially assigning the sum of one or more of the products to the entry in the second array,
Including
The allocation is based on the entry of the fifth array, according to B-EEE5 or 6.
B−EEE9.前記ダウンミックス行列を前記第1のアレイに適用することは、前記少なくとも1つの周波数ビンについて、
前記第3のアレイに対するエントリーインデックスごとに、それぞれの周波数ビンの、それぞれのエントリーインデックスによって示される前記第3のアレイの前記エントリーの2乗と、前記第1のアレイの前記対応するエントリーの絶対平方との積を第2の積として求めることと、
前記第2の積のうちの1つ以上の和をそれぞれの周波数ビンの第6のアレイの前記エントリーに順次割り当てることと、
を更に含み、
前記割り当ては、前記第5のアレイの前記エントリーに基づき、
所与の処理帯域内の周波数ビンにわたる前記第6のアレイの和は、前記所与の処理帯域内の前記周波数ビンの前記エネルギー指標値を与える、B−EEE8による方法。
B-EEE 9. Applying the downmix matrix to the first array can be applied to the at least one frequency bin.
For each entry index for the third array, the square of the entry of the third array indicated by the entry index of each frequency bin and the absolute square of the corresponding entry of the first array. To find the product of and as the second product,
The sum of one or more of the second products is sequentially assigned to the entry in the sixth array of each frequency bin.
Including
The allocation is based on the entry in the fifth array.
The method according to B-EEE8, wherein the sum of the sixth array over the frequency bins in a given processing band gives the energy index value of the frequency bins in the given processing band.
B−EEE10.前記所与の処理帯域内の前記周波数ビンを求めることは、ルックアップテーブルを参照することを含み、前記ルックアップテーブルは、処理帯域ごとに、それぞれの処理帯域内の周波数ビンの数を示すエントリーを含む、B−EEE9による方法。 B-EEE10. Finding the frequency bins in the given processing band involves referencing a look-up table, which is an entry indicating the number of frequency bins in each processing band for each processing band. The method according to B-EEE9, which comprises.
B−EEE11.複数の入力オーディオチャネルをダウンミキシングする装置であって、 前記入力オーディオチャネルのそれぞれについて、複数の対応する周波数ビンにおける複数の周波数係数を取得するように構成された周波数係数取得ユニットと、
ダウンミックス行列を取得するように構成されたダウンミックス行列取得ユニットと、
少なくとも1つの周波数ビンについて、それぞれの周波数ビンについての前記複数の入力オーディオチャネルの前記周波数係数によって形成された第1のアレイに前記ダウンミックス行列を適用して、それぞれの周波数ビンの複数の中間オーディオチャネルの前記周波数係数によって形成された第2のアレイを取得するように構成されたダウンミキシングユニットと、
を備え、
前記ダウンミキシングユニットは、
前記ダウンミックス行列の非ゼロのエントリーのみを含む第3のアレイを求めることと、
前記第3のアレイの各エントリーについて、前記ダウンミックス行列における前記第3のアレイのそれぞれのエントリーの位置を示すエントリーを含む第4のアレイを求めることと、
前記少なくとも1つの周波数ビンについて、それぞれの周波数ビンについての前記第3のアレイの前記エントリーと前記第1のアレイの対応するエントリーとを乗算することと、
を行うように構成され、
前記第1のアレイの前記対応するエントリーは、前記第4のアレイに基づいて求められる、装置。
B-EEE11. A device that downmixes a plurality of input audio channels, a frequency coefficient acquisition unit configured to acquire a plurality of frequency coefficients in a plurality of corresponding frequency bins for each of the input audio channels, and a frequency coefficient acquisition unit.
With a downmix matrix acquisition unit configured to acquire a downmix matrix,
For at least one frequency bin, the downmix matrix is applied to a first array formed by the frequency coefficients of the plurality of input audio channels for each frequency bin to provide multiple intermediate audio in each frequency bin. A downmixing unit configured to acquire a second array formed by said frequency coefficients of the channel, and
With
The down mixing unit is
Finding a third array containing only non-zero entries in the downmix matrix,
For each entry in the third array, a fourth array containing an entry indicating the position of each entry in the third array in the downmix matrix is determined.
Multiplying the at least one frequency bin by the entry of the third array for each frequency bin and the corresponding entry of the first array.
Is configured to do
The corresponding entry of the first array is determined based on the fourth array.
B−EEE12.前記第3のアレイは、前記ダウンミックス行列の前記非ゼロのエントリーを、前記ダウンミックス行列のエントリー全体にわたる所定の走査順序におけるそれらの出現順序で含む線形アレイである、B−EEE11による装置。 B-EEE12. The device by B-EEE11, wherein the third array is a linear array that includes the non-zero entries of the downmix matrix in their appearance order in a predetermined scanning order across the entries of the downmix matrix.
B−EEE13.前記ダウンミキシングユニットは、第5のアレイを求めるように更に構成され、
前記第5のアレイのエントリーは、行方向走査順序の場合には、前記ダウンミックス行列のそれぞれの行ごとの非ゼロのエントリーの数を示し、列方向走査順序の場合には、それぞれの列ごとの前記ダウンミックス行列の非ゼロのエントリーの数を示す、B−EEE12による装置。
B-EEE 13. The downmixing unit is further configured to obtain a fifth array.
The entries in the fifth array indicate the number of non-zero entries per row of the downmix matrix in the case of row scan order, and per column in the case of column scan order. A device according to B-EEE12 showing the number of non-zero entries in the downmix matrix of.
B−EEE14.前記ダウンミキシングユニットは、前記少なくとも1つの周波数ビンについて、
それぞれの周波数ビンについての前記第3のアレイの前記エントリーと前記第1のアレイの前記対応するエントリーとの1つ以上の積の和を、前記第5のアレイの前記エントリーに基づいて前記第2のアレイの前記エントリーに割り当てる、
ように更に構成される、B−EEE13による装置。
B-EEE14. The downmixing unit is for the at least one frequency bin.
The sum of one or more products of the entry of the third array and the corresponding entry of the first array for each frequency bin is based on the entry of the fifth array. Assign to said entry in the array of
A device according to B-EEE13, which is further configured as described above.
B−EEE15.プロセッサ上で実行されるように構成されるとともに、コンピューティングデバイス上で実施されるとB−EEE1〜10のいずれか1つによる方法の方法ステップを実行するように構成されたソフトウェアプログラム。 B-EEE15. A software program configured to run on a processor and, when run on a computing device, to perform a method step of the method according to any one of B-EEE1-10.
更なる例示として、以下に列挙した例示の実施形態(C−EEE)は、本発明の幾つかの態様の幾つかの構造、特徴、及び機能を記載している。 As a further example, the exemplary embodiments (C-EEE) listed below describe some structures, features, and functions of some aspects of the invention.
C−EEE1.複数の入力オーディオチャネルをダウンミキシングする方法であって、
前記入力オーディオチャネルのそれぞれについて、複数の対応する周波数ビンにおける複数の周波数係数を取得することと、
少なくとも1つの周波数ビンについて、それぞれの周波数ビンについての前記複数の入力オーディオチャネルの前記周波数係数によって形成された第1のアレイにダウンミックス行列を適用して、それぞれの周波数ビンの複数の中間オーディオチャネルの前記周波数係数によって形成された第2のアレイを取得することと、
を含み、
前記方法は、
前記ダウンミックス行列の非ゼロのエントリーのみを含む第3のアレイを求めることと、
前記第3のアレイの各エントリーについて、前記ダウンミックス行列内での前記第3のアレイのそれぞれのエントリーの位置を示すエントリーを含む第4のアレイを求めることと、
を更に含み、
前記ダウンミックス行列を前記第1のアレイに適用することは、
前記少なくとも1つの周波数ビンについて、それぞれの周波数ビンについての前記第3のアレイの前記エントリーと前記第1のアレイの対応するエントリーとを乗算すること、
を含み、
前記第1のアレイの前記対応するエントリーは、前記第4のアレイに基づいて求められる、方法。
C-EEE1. A method of downmixing multiple input audio channels,
Acquiring a plurality of frequency coefficients in a plurality of corresponding frequency bins for each of the input audio channels,
For at least one frequency bin, a downmix matrix is applied to the first array formed by the frequency coefficients of the plurality of input audio channels for each frequency bin, and multiple intermediate audio channels for each frequency bin are applied. To obtain a second array formed by the frequency coefficients of
Including
The method is
Finding a third array containing only non-zero entries in the downmix matrix,
For each entry in the third array, a fourth array containing an entry indicating the position of each entry in the third array in the downmix matrix is determined.
Including
Applying the downmix matrix to the first array
Multiplying the at least one frequency bin by the entry of the third array for each frequency bin and the corresponding entry of the first array.
Including
The method in which the corresponding entry of the first array is determined based on the fourth array.
C−EEE2.前記少なくとも1つの周波数ビンについて、中間オーディオチャネルごとに、それぞれの中間オーディオチャネルのエネルギー指標値を求めること、
を更に含み、
前記エネルギー指標値を求めることは、前記少なくとも1つの周波数ビンについて、
前記第3のアレイの前記エントリーの累乗と、前記第1のアレイの前記対応するエントリーの絶対値の累乗とを乗算すること、
を含み、前記第1のアレイの前記対応するエントリーは、前記第4のアレイに基づいて求められる、C−EEE1による方法。
C-EEE2. Obtaining the energy index value of each intermediate audio channel for each intermediate audio channel for at least one frequency bin.
Including
Obtaining the energy index value is to obtain the energy index value for the at least one frequency bin.
Multiplying the power of the entry in the third array by the power of the absolute value of the corresponding entry in the first array.
The method according to C-EEE1, wherein the corresponding entry of the first array is determined based on the fourth array.
C−EEE3.前記第3のアレイは、前記ダウンミックス行列の前記非ゼロのエントリーを、前記ダウンミックス行列のエントリー全体にわたる所定の走査順序におけるそれらの出現順序で含む線形アレイである、先行するC−EEEのいずれか1つによる方法。 C-EEE3. The third array is any of the preceding C-EEEs, which is a linear array containing the non-zero entries of the downmix matrix in their order of appearance in a predetermined scan order across the entries of the downmix matrix. One way.
C−EEE4.前記第4のアレイの各エントリーは、前記ダウンミックス行列内の前記第3のアレイのそれぞれのエントリーの前記走査順序における前記位置を示す、先行するC−EEEのいずれか1つによる方法。 C-EEE4. A method according to any one of the preceding C-EEEs, wherein each entry in the fourth array indicates the position of each entry in the third array in the downmix matrix in said scan order.
C−EEE5.前記第4のアレイの各エントリーは、行方向走査順序の場合には、前記第3のアレイのそれぞれのエントリーが前記ダウンミックス行列において位置する前記ダウンミックス行列の列を示し、列方向走査順序の場合には、前記第3のアレイのそれぞれのエントリーが前記ダウンミックス行列において位置する前記ダウンミックス行列の行を示す、先行するC−EEEのいずれか1つによる方法。 C-EEE5. Each entry in the fourth array, in the case of row-wise scan order, indicates the column of the downmix matrix in which each entry in the third array is located in the downmix matrix and is in column-wise scan order. In the case of a method according to any one of the preceding C-EEEs, where each entry in the third array indicates a row of the downmix matrix located in the downmix matrix.
C−EEE6.第5のアレイを求めることを更に含み、
前記第5のアレイのエントリーは、行方向走査順序の場合には、前記ダウンミックス行列のそれぞれの行ごとの非ゼロのエントリーの数を示し、列方向走査順序の場合には、前記ダウンミックス行列のそれぞれの列ごとの非ゼロのエントリーの数を示す、C−EEE3、又は、C−EEE3に従属する、先行するC−EEEのいずれか1つによる方法。
C-EEE6. Further including finding a fifth array,
The entries in the fifth array indicate the number of non-zero entries for each row of the downmix matrix in the case of row scan order, and the downmix matrix in the case of column scan order. A method according to either C-EEE3 or a preceding C-EEE subordinate to C-EEE3, which indicates the number of non-zero entries for each column of.
C−EEE7.前記ダウンミックス行列を前記第1のアレイに適用することは、前記少なくとも1つの周波数ビンについて、
それぞれの周波数ビンについての前記第3のアレイの前記エントリーと前記第1のアレイの前記対応するエントリーとの1つ以上の積の和を、前記第5のアレイの前記エントリーに基づいて前記第2のアレイの前記エントリーに割り当てること、
を更に伴う、C−EEE6による方法。
C-EEE7. Applying the downmix matrix to the first array can be applied to the at least one frequency bin.
The sum of one or more products of the entry of the third array and the corresponding entry of the first array for each frequency bin is based on the entry of the fifth array. Assigned to the entry in the array of
The method according to C-EEE6, which is further accompanied by.
C−EEE8.前記ダウンミックス行列を前記第1のアレイに適用することは、前記少なくとも1つの周波数ビンについて、
前記第3のアレイに対する前記エントリーインデックスを一時に1つずつ連続的にインクリメントし、エントリーインデックスごとに、それぞれの周波数ビンの、それぞれのエントリーインデックスによって示される前記第3のアレイの前記エントリーと、前記第1のアレイの前記対応するエントリーとの積を求めることと、
前記積のうちの1つ以上の和を前記第2のアレイの前記エントリーに順次割り当てることと、
を更に含み、前記割り当ては、前記第5のアレイの前記エントリーに基づく、C−EEE5又は6による方法。
C-EEE8. Applying the downmix matrix to the first array can be applied to the at least one frequency bin.
The entry index for the third array is continuously incremented one at a time, and for each entry index, the entry of the third array indicated by the entry index of each frequency bin and the entry of the third array. Finding the product of the corresponding entry of the first array and
Sequentially assigning the sum of one or more of the products to the entry in the second array,
The allocation is based on the entry of the fifth array, according to the C-
C−EEE9.前記ダウンミックス行列を前記第1のアレイに適用することは、前記少なくとも1つの周波数ビンについて、
前記第3のアレイに対するエントリーインデックスごとに、それぞれの周波数ビンの、それぞれのエントリーインデックスによって示される前記第3のアレイの前記エントリーの2乗と、前記第1のアレイの前記対応するエントリーの絶対平方との積を第2の積として求めることと、
前記第2の積のうちの1つ以上の和をそれぞれの周波数ビンの第6のアレイの前記エントリーに順次割り当てることと、
を更に含み、
前記割り当ては、前記第5のアレイの前記エントリーに基づき、
所与の処理帯域内の周波数ビンにわたる前記第6のアレイの和は、前記所与の処理帯域内の前記周波数ビンの前記エネルギー指標値を与える、C−EEE8による方法。
C-EEE 9. Applying the downmix matrix to the first array can be applied to the at least one frequency bin.
For each entry index for the third array, the square of the entry of the third array indicated by the entry index of each frequency bin and the absolute square of the corresponding entry of the first array. To find the product of and as the second product,
The sum of one or more of the second products is sequentially assigned to the entry in the sixth array of each frequency bin.
Including
The allocation is based on the entry in the fifth array.
The method according to C-EEE8, wherein the sum of the sixth array over the frequency bins in a given processing band gives the energy index value of the frequency bins in the given processing band.
C−EEE10.前記所与の処理帯域内の前記周波数ビンを求めることは、ルックアップテーブルを参照することを含み、前記ルックアップテーブルは、処理帯域ごとに、それぞれの処理帯域内の周波数ビンの数を示すエントリーを含む、C−EEE9による方法。 C-EEE10. Finding the frequency bins in the given processing band involves referencing a look-up table, which is an entry indicating the number of frequency bins in each processing band for each processing band. The method according to C-EEE9, which comprises.
C−EEE11.複数の入力オーディオチャネルをダウンミキシングする装置であって、 前記入力オーディオチャネルのそれぞれについて、複数の対応する周波数ビンにおける複数の周波数係数を取得するように構成された周波数係数取得ユニットと、
ダウンミックス行列を取得するように構成されたダウンミックス行列取得ユニットと、
少なくとも1つの周波数ビンについて、それぞれの周波数ビンについての前記複数の入力オーディオチャネルの前記周波数係数によって形成された第1のアレイに前記ダウンミックス行列を適用して、それぞれの周波数ビンの複数の中間オーディオチャネルの前記周波数係数によって形成された第2のアレイを取得するように構成されたダウンミキシングユニットと、
を備え、
前記ダウンミキシングユニットは、
前記ダウンミックス行列の非ゼロのエントリーのみを含む第3のアレイを求めることと、
前記第3のアレイの各エントリーについて、前記ダウンミックス行列における前記第3のアレイのそれぞれのエントリーの位置を示すエントリーを含む第4のアレイを求めることと、
前記少なくとも1つの周波数ビンについて、それぞれの周波数ビンについての前記第3のアレイの前記エントリーと前記第1のアレイの対応するエントリーとを乗算することと、
を行うように構成され、
前記第1のアレイの前記対応するエントリーは、前記第4のアレイに基づいて求められる、装置。
C-EEE11. A device that downmixes a plurality of input audio channels, a frequency coefficient acquisition unit configured to acquire a plurality of frequency coefficients in a plurality of corresponding frequency bins for each of the input audio channels, and a frequency coefficient acquisition unit.
With a downmix matrix acquisition unit configured to acquire a downmix matrix,
For at least one frequency bin, the downmix matrix is applied to a first array formed by the frequency coefficients of the plurality of input audio channels for each frequency bin to provide multiple intermediate audio in each frequency bin. A downmixing unit configured to acquire a second array formed by said frequency coefficients of the channel, and
With
The down mixing unit is
Finding a third array containing only non-zero entries in the downmix matrix,
For each entry in the third array, a fourth array containing an entry indicating the position of each entry in the third array in the downmix matrix is determined.
Multiplying the at least one frequency bin by the entry of the third array for each frequency bin and the corresponding entry of the first array.
Is configured to do
The corresponding entry of the first array is determined based on the fourth array.
C−EEE12.前記第3のアレイは、前記ダウンミックス行列の前記非ゼロのエントリーを、前記ダウンミックス行列のエントリー全体にわたる所定の走査順序におけるそれらの出現順序で含む線形アレイである、C−EEE11による装置。 C-EEE12. The third array is a device according to C-EEE11, which is a linear array containing the non-zero entries of the downmix matrix in their appearance order in a predetermined scan order across the entries of the downmix matrix.
C−EEE13.前記ダウンミキシングユニットは、第5のアレイを求めるように更に構成され、
前記第5のアレイのエントリーは、行方向走査順序の場合には、前記ダウンミックス行列のそれぞれの行ごとの非ゼロのエントリーの数を示し、列方向走査順序の場合には、それぞれの列ごとの前記ダウンミックス行列の非ゼロのエントリーの数を示す、C−EEE12による装置。
C-EEE 13. The downmixing unit is further configured to obtain a fifth array.
The entries in the fifth array indicate the number of non-zero entries per row of the downmix matrix in the case of row scan order, and per column in the case of column scan order. A device according to C-EEE12 showing the number of non-zero entries in the downmix matrix of.
C−EEE14.前記ダウンミキシングユニットは、前記少なくとも1つの周波数ビンについて、
それぞれの周波数ビンについての前記第3のアレイの前記エントリーと前記第1のアレイの前記対応するエントリーとの1つ以上の積の和を、前記第5のアレイの前記エントリーに基づいて前記第2のアレイの前記エントリーに割り当てる、
ように更に構成される、C−EEE13による装置。
C-EEE14. The downmixing unit is for the at least one frequency bin.
The sum of one or more products of the entry of the third array and the corresponding entry of the first array for each frequency bin is based on the entry of the fifth array. Assign to said entry in the array of
A device according to C-EEE13, which is further configured as described above.
C−EEE15.プロセッサ上で実行されるように構成されるとともに、コンピューティングデバイス上で実施されるとC−EEE1〜10のいずれか1つによる方法の方法ステップを実行するように構成されたソフトウェアプログラム。 C-EEE15. A software program configured to run on a processor and, when run on a computing device, to perform a method step of the method according to any one of C-EEE1-10.
更なる例示として、以下に列挙した例示の実施形態(D−EEE)は、本発明の幾つかの態様の幾つかの構造、特徴、及び機能を記載している。 As a further example, the exemplary embodiments (D-EEE) listed below describe some structures, features, and functions of some aspects of the invention.
D−EEE1.複数の入力オーディオチャネルをダウンミキシングする方法であって、
前記入力オーディオチャネルのそれぞれについて、複数の対応する周波数ビンにおける複数の周波数係数を取得することと、
少なくとも1つの周波数ビンについて、それぞれの周波数ビンについての前記複数の入力オーディオチャネルの前記周波数係数によって形成された第1のアレイにダウンミックス行列を適用して、それぞれの周波数ビンの複数の中間オーディオチャネルの前記周波数係数によって形成された第2のアレイを取得することと、
を含み、
前記方法は、
前記ダウンミックス行列の非ゼロのエントリーのみを含む第3のアレイを求めることと、
前記第3のアレイの各エントリーについて、前記ダウンミックス行列内での前記第3のアレイのそれぞれのエントリーの位置を示すエントリーを含む第4のアレイを求めることと、
を更に含み、
前記ダウンミックス行列を前記第1のアレイに適用することは、
前記少なくとも1つの周波数ビンについて、それぞれの周波数ビンについての前記第3のアレイの前記エントリーと前記第1のアレイの対応するエントリーとを乗算すること、
を含み、
前記第1のアレイの前記対応するエントリーは、前記第4のアレイに基づいて求められる、方法。
D-EEE1. A method of downmixing multiple input audio channels,
Acquiring a plurality of frequency coefficients in a plurality of corresponding frequency bins for each of the input audio channels,
For at least one frequency bin, a downmix matrix is applied to the first array formed by the frequency coefficients of the plurality of input audio channels for each frequency bin, and multiple intermediate audio channels for each frequency bin are applied. To obtain a second array formed by the frequency coefficients of
Including
The method is
Finding a third array containing only non-zero entries in the downmix matrix,
For each entry in the third array, a fourth array containing an entry indicating the position of each entry in the third array in the downmix matrix is determined.
Including
Applying the downmix matrix to the first array
Multiplying the at least one frequency bin by the entry of the third array for each frequency bin and the corresponding entry of the first array.
Including
The method in which the corresponding entry of the first array is determined based on the fourth array.
D−EEE2.前記少なくとも1つの周波数ビンについて、中間オーディオチャネルごとに、それぞれの中間オーディオチャネルのエネルギー指標値を求めること、
を更に含み、
前記エネルギー指標値を求めることは、前記少なくとも1つの周波数ビンについて、
前記第3のアレイの前記エントリーの累乗と、前記第1のアレイの前記対応するエントリーの絶対値の累乗とを乗算すること、
を含み、
前記第1のアレイの前記対応するエントリーは、前記第4のアレイに基づいて求められる、D−EEE1による方法。
D-EEE2. Obtaining the energy index value of each intermediate audio channel for each intermediate audio channel for at least one frequency bin.
Including
Obtaining the energy index value is to obtain the energy index value for the at least one frequency bin.
Multiplying the power of the entry in the third array by the power of the absolute value of the corresponding entry in the first array.
Including
The corresponding entry in the first array is determined based on the fourth array, the method according to D-EEE1.
D−EEE3.前記第3のアレイは、前記ダウンミックス行列の前記非ゼロのエントリーを、前記ダウンミックス行列のエントリー全体にわたる所定の走査順序におけるそれらの出現順序で含む線形アレイである、先行するD−EEEのいずれか1つによる方法。 D-EEE3. The third array is any of the preceding D-EEEs, which is a linear array containing the non-zero entries of the downmix matrix in their order of appearance in a predetermined scan order across the entries of the downmix matrix. One way.
D−EEE4.前記第4のアレイの各エントリーは、前記ダウンミックス行列内の前記第3のアレイのそれぞれのエントリーの前記走査順序における前記位置を示す、先行するD−EEEのいずれか1つによる方法。 D-EEE4. A method according to any one of the preceding D-EEEs, wherein each entry in the fourth array indicates the position of each entry in the third array in the downmix matrix in said scan order.
D−EEE5.前記第4のアレイの各エントリーは、行方向走査順序の場合には、前記第3のアレイのそれぞれのエントリーが前記ダウンミックス行列において位置する前記ダウンミックス行列の列を示し、列方向走査順序の場合には、前記第3のアレイのそれぞれのエントリーが前記ダウンミックス行列において位置する前記ダウンミックス行列の行を示す、先行するD−EEEのいずれか1つによる方法。 D-EEE5. Each entry in the fourth array, in the case of row-wise scan order, indicates the column of the downmix matrix in which each entry in the third array is located in the downmix matrix and is in column-wise scan order. In the case of a method according to any one of the preceding D-EEEs, where each entry in the third array indicates a row of the downmix matrix located in the downmix matrix.
D−EEE6.第5のアレイを求めることを更に含み、
前記第5のアレイのエントリーは、行方向走査順序の場合には、前記ダウンミックス行列のそれぞれの行ごとの非ゼロのエントリーの数を示し、列方向走査順序の場合には、前記ダウンミックス行列のそれぞれの列ごとの非ゼロのエントリーの数を示す、D−EEE3、又は、D−EEE3に従属する、先行するD−EEEのいずれか1つによる方法。
D-EEE6. Further including finding a fifth array,
The entries in the fifth array indicate the number of non-zero entries for each row of the downmix matrix in the case of row scan order, and the downmix matrix in the case of column scan order. A method according to either D-EEE3 or a preceding D-EEE subordinate to D-EEE3, which indicates the number of non-zero entries for each column of.
D−EEE7.前記ダウンミックス行列を前記第1のアレイに適用することは、前記少なくとも1つの周波数ビンについて、
それぞれの周波数ビンについての前記第3のアレイの前記エントリーと前記第1のアレイの前記対応するエントリーとの1つ以上の積の和を、前記第5のアレイの前記エントリーに基づいて前記第2のアレイの前記エントリーに割り当てること、
を更に伴う、D−EEE6による方法。
D-EEE 7. Applying the downmix matrix to the first array can be applied to the at least one frequency bin.
The sum of one or more products of the entry of the third array and the corresponding entry of the first array for each frequency bin is based on the entry of the fifth array. Assigned to the entry in the array of
The method according to D-EEE6, which is further accompanied by.
D−EEE8.前記ダウンミックス行列を前記第1のアレイに適用することは、前記少なくとも1つの周波数ビンについて、
前記第3のアレイに対する前記エントリーインデックスを一時に1つずつ連続的にインクリメントし、エントリーインデックスごとに、それぞれの周波数ビンの、それぞれのエントリーインデックスによって示される前記第3のアレイの前記エントリーと、前記第1のアレイの前記対応するエントリーとの積を求めることと、
前記積のうちの1つ以上の和を前記第2のアレイの前記エントリーに順次割り当てることと、
を更に含み、前記割り当ては、前記第5のアレイの前記エントリーに基づく、D−EEE5又は6による方法。
D-EEE8. Applying the downmix matrix to the first array can be applied to the at least one frequency bin.
The entry index for the third array is continuously incremented one at a time, and for each entry index, the entry of the third array indicated by the entry index of each frequency bin and the entry of the third array. Finding the product of the corresponding entry of the first array and
Sequentially assigning the sum of one or more of the products to the entry in the second array,
The allocation is based on the entry of the fifth array, according to D-EEE5 or 6.
D−EEE9.前記ダウンミックス行列を前記第1のアレイに適用することは、前記少なくとも1つの周波数ビンについて、
前記第3のアレイに対するエントリーインデックスごとに、それぞれの周波数ビンの、それぞれのエントリーインデックスによって示される前記第3のアレイの前記エントリーの2乗と、前記第1のアレイの前記対応するエントリーの絶対平方との積を第2の積として求めることと、
前記第2の積のうちの1つ以上の和をそれぞれの周波数ビンの第6のアレイの前記エントリーに順次割り当てることと、
を更に含み、
前記割り当ては、前記第5のアレイの前記エントリーに基づき、
所与の処理帯域内の周波数ビンにわたる前記第6のアレイの和は、前記所与の処理帯域内の前記周波数ビンの前記エネルギー指標値を与える、D−EEE8による方法。
D-EEE 9. Applying the downmix matrix to the first array can be applied to the at least one frequency bin.
For each entry index for the third array, the square of the entry of the third array indicated by the entry index of each frequency bin and the absolute square of the corresponding entry of the first array. To find the product of and as the second product,
The sum of one or more of the second products is sequentially assigned to the entry in the sixth array of each frequency bin.
Including
The allocation is based on the entry in the fifth array.
The method according to D-EEE8, wherein the sum of the sixth array over the frequency bins in a given processing band gives the energy index value of the frequency bins in the given processing band.
D−EEE10.前記所与の処理帯域内の前記周波数ビンを求めることは、ルックアップテーブルを参照することを含み、前記ルックアップテーブルは、処理帯域ごとに、それぞれの処理帯域内の周波数ビンの数を示すエントリーを含む、D−EEE9による方法。 D-EEE10. Finding the frequency bins in the given processing band involves referencing a look-up table, which is an entry indicating the number of frequency bins in each processing band for each processing band. The method according to D-EEE9, which comprises.
D−EEE11.複数の入力オーディオチャネルをダウンミキシングする装置であって、 前記入力オーディオチャネルのそれぞれについて、複数の対応する周波数ビンにおける複数の周波数係数を取得するように構成された周波数係数取得ユニットと、
ダウンミックス行列を取得するように構成されたダウンミックス行列取得ユニットと、
少なくとも1つの周波数ビンについて、それぞれの周波数ビンについての前記複数の入力オーディオチャネルの前記周波数係数によって形成された第1のアレイに前記ダウンミックス行列を適用して、それぞれの周波数ビンの複数の中間オーディオチャネルの前記周波数係数によって形成された第2のアレイを取得するように構成されたダウンミキシングユニットと、
を備え、
前記ダウンミキシングユニットは、
前記ダウンミックス行列の非ゼロのエントリーのみを含む第3のアレイを求めることと、
前記第3のアレイの各エントリーについて、前記ダウンミックス行列における前記第3のアレイのそれぞれのエントリーの位置を示すエントリーを含む第4のアレイを求めることと、
前記少なくとも1つの周波数ビンについて、それぞれの周波数ビンについての前記第3のアレイの前記エントリーと前記第1のアレイの対応するエントリーとを乗算することと、
を行うように構成され、
前記第1のアレイの前記対応するエントリーは、前記第4のアレイに基づいて求められる、装置。
D-EEE11. A device that downmixes a plurality of input audio channels, a frequency coefficient acquisition unit configured to acquire a plurality of frequency coefficients in a plurality of corresponding frequency bins for each of the input audio channels, and a frequency coefficient acquisition unit.
With a downmix matrix acquisition unit configured to acquire a downmix matrix,
For at least one frequency bin, the downmix matrix is applied to a first array formed by the frequency coefficients of the plurality of input audio channels for each frequency bin to provide multiple intermediate audio in each frequency bin. A downmixing unit configured to acquire a second array formed by said frequency coefficients of the channel, and
With
The down mixing unit is
Finding a third array containing only non-zero entries in the downmix matrix,
For each entry in the third array, a fourth array containing an entry indicating the position of each entry in the third array in the downmix matrix is determined.
Multiplying the at least one frequency bin by the entry of the third array for each frequency bin and the corresponding entry of the first array.
Is configured to do
The corresponding entry of the first array is determined based on the fourth array.
D−EEE12.前記第3のアレイは、前記ダウンミックス行列の前記非ゼロのエントリーを、前記ダウンミックス行列のエントリー全体にわたる所定の走査順序におけるそれらの出現順序で含む線形アレイである、D−EEE11による装置。 D-EEE12. The third array is a device according to D-EEE11, which is a linear array containing the non-zero entries of the downmix matrix in their appearance order in a predetermined scan order across the entries of the downmix matrix.
D−EEE13.前記ダウンミキシングユニットは、第5のアレイを求めるように更に構成され、
前記第5のアレイのエントリーは、行方向走査順序の場合には、前記ダウンミックス行列のそれぞれの行ごとの非ゼロのエントリーの数を示し、列方向走査順序の場合には、それぞれの列ごとの前記ダウンミックス行列の非ゼロのエントリーの数を示す、D−EEE12による装置。
D-EEE 13. The downmixing unit is further configured to obtain a fifth array.
The entries in the fifth array indicate the number of non-zero entries per row of the downmix matrix in the case of row scan order, and per column in the case of column scan order. A device according to D-EEE12 showing the number of non-zero entries in the downmix matrix of.
D−EEE14.前記ダウンミキシングユニットは、前記少なくとも1つの周波数ビンについて、
それぞれの周波数ビンについての前記第3のアレイの前記エントリーと前記第1のアレイの前記対応するエントリーとの1つ以上の積の和を、前記第5のアレイの前記エントリーに基づいて前記第2のアレイの前記エントリーに割り当てる、
ように更に構成される、D−EEE13による装置。
D-EEE14. The downmixing unit is for the at least one frequency bin.
The sum of one or more products of the entry of the third array and the corresponding entry of the first array for each frequency bin is based on the entry of the fifth array. Assign to said entry in the array of
A device according to D-EEE13, which is further configured as described above.
D−EEE15.プロセッサ上で実行されるように構成されるとともに、コンピューティングデバイス上で実施されるとD−EEE1〜10のいずれか1つによる方法の方法ステップを実行するように構成されたソフトウェアプログラム。 D-EEE15. A software program configured to run on a processor and, when run on a computing device, to perform a method step of the method according to any one of D-EEE1-10.
更なる例示として、以下に列挙した例示の実施形態(E−EEE)は、本発明の幾つかの態様の幾つかの構造、特徴、及び機能を記載している。 As a further example, the exemplary embodiments (E-EEE) listed below describe some structures, features, and functions of some aspects of the invention.
E−EEE1.複数の入力オーディオチャネルをダウンミキシングする方法であって、
前記入力オーディオチャネルのそれぞれについて、複数の対応する周波数ビンにおける複数の周波数係数を取得することと、
少なくとも1つの周波数ビンについて、それぞれの周波数ビンについての前記複数の入力オーディオチャネルの前記周波数係数によって形成された第1のアレイにダウンミックス行列を適用して、それぞれの周波数ビンの複数の中間オーディオチャネルの前記周波数係数によって形成された第2のアレイを取得することと、
を含み、
前記方法は、
前記ダウンミックス行列の非ゼロのエントリーのみを含む第3のアレイを求めることと、
前記第3のアレイの各エントリーについて、前記ダウンミックス行列内での前記第3のアレイのそれぞれのエントリーの位置を示すエントリーを含む第4のアレイを求めることと、
を更に含み、
前記ダウンミックス行列を前記第1のアレイに適用することは、
前記少なくとも1つの周波数ビンについて、それぞれの周波数ビンについての前記第3のアレイの前記エントリーと前記第1のアレイの対応するエントリーとを乗算すること、
を含み、前記第1のアレイの前記対応するエントリーは、前記第4のアレイに基づいて求められる、方法。
E-EEE1. A method of downmixing multiple input audio channels,
Acquiring a plurality of frequency coefficients in a plurality of corresponding frequency bins for each of the input audio channels,
For at least one frequency bin, a downmix matrix is applied to the first array formed by the frequency coefficients of the plurality of input audio channels for each frequency bin, and multiple intermediate audio channels for each frequency bin are applied. To obtain a second array formed by the frequency coefficients of
Including
The method is
Finding a third array containing only non-zero entries in the downmix matrix,
For each entry in the third array, a fourth array containing an entry indicating the position of each entry in the third array in the downmix matrix is determined.
Including
Applying the downmix matrix to the first array
Multiplying the at least one frequency bin by the entry of the third array for each frequency bin and the corresponding entry of the first array.
The method, wherein the corresponding entry of the first array is determined based on the fourth array.
E−EEE2.前記少なくとも1つの周波数ビンについて、中間オーディオチャネルごとに、それぞれの中間オーディオチャネルのエネルギー指標値を求めること、
を更に含み、
前記エネルギー指標値を求めることは、前記少なくとも1つの周波数ビンについて、
前記第3のアレイの前記エントリーの累乗と、前記第1のアレイの前記対応するエントリーの絶対値の累乗とを乗算すること、
を含み、前記第1のアレイの前記対応するエントリーは、前記第4のアレイに基づいて求められる、E−EEE1による方法。
E-EEE2. Obtaining the energy index value of each intermediate audio channel for each intermediate audio channel for at least one frequency bin.
Including
Obtaining the energy index value is to obtain the energy index value for the at least one frequency bin.
Multiplying the power of the entry in the third array by the power of the absolute value of the corresponding entry in the first array.
The method according to E-EEE1, wherein the corresponding entry of the first array is determined based on the fourth array.
E−EEE3.前記第3のアレイは、前記ダウンミックス行列の前記非ゼロのエントリーを、前記ダウンミックス行列のエントリー全体にわたる所定の走査順序におけるそれらの出現順序で含む線形アレイである、先行するE−EEEのいずれか1つによる方法。 E-EEE3. The third array is any of the preceding E-EEEs, which is a linear array containing the non-zero entries of the downmix matrix in their order of appearance in a predetermined scan order across the entries of the downmix matrix. One way.
E−EEE4.前記第4のアレイの各エントリーは、前記ダウンミックス行列内の前記第3のアレイのそれぞれのエントリーの前記走査順序における前記位置を示す、先行するE−EEEのいずれか1つによる方法。 E-EEE4. A method according to any one of the preceding E-EEEs, wherein each entry in the fourth array indicates the position of each entry in the third array in the downmix matrix in said scan order.
E−EEE5.前記第4のアレイの各エントリーは、行方向走査順序の場合には、前記第3のアレイのそれぞれのエントリーが前記ダウンミックス行列において位置する前記ダウンミックス行列の列を示し、列方向走査順序の場合には、前記第3のアレイのそれぞれのエントリーが前記ダウンミックス行列において位置する前記ダウンミックス行列の行を示す、先行するE−EEEのいずれか1つによる方法。
E−EEE6.第5のアレイを求めることを更に含み、
前記第5のアレイのエントリーは、行方向走査順序の場合には、前記ダウンミックス行列のそれぞれの行ごとの非ゼロのエントリーの数を示し、列方向走査順序の場合には、前記ダウンミックス行列のそれぞれの列ごとの非ゼロのエントリーの数を示す、E−EEE3、又は、E−EEE3に従属する、先行するEEEのいずれか1つによる方法。
E-EEE6. Further including finding a fifth array,
The entries in the fifth array indicate the number of non-zero entries for each row of the downmix matrix in the case of row scan order, and the downmix matrix in the case of column scan order. A method according to either E-EEE3 or one of the preceding EEEs subordinate to E-EEE3, which indicates the number of non-zero entries for each column of.
E−EEE7.前記ダウンミックス行列を前記第1のアレイに適用することは、前記少なくとも1つの周波数ビンについて、
それぞれの周波数ビンについての前記第3のアレイの前記エントリーと前記第1のアレイの前記対応するエントリーとの1つ以上の積の和を、前記第5のアレイの前記エントリーに基づいて前記第2のアレイの前記エントリーに割り当てること、
を更に伴う、E−EEE6による方法。
E-EEE 7. Applying the downmix matrix to the first array can be applied to the at least one frequency bin.
The sum of one or more products of the entry of the third array and the corresponding entry of the first array for each frequency bin is based on the entry of the fifth array. Assigned to the entry in the array of
The method according to E-EEE6, which is further accompanied by.
E−EEE8.前記ダウンミックス行列を前記第1のアレイに適用することは、前記少なくとも1つの周波数ビンについて、
前記第3のアレイに対する前記エントリーインデックスを一時に1つずつ連続的にインクリメントし、エントリーインデックスごとに、それぞれの周波数ビンの、それぞれのエントリーインデックスによって示される前記第3のアレイの前記エントリーと、前記第1のアレイの前記対応するエントリーとの積を求めることと、
前記積のうちの1つ以上の和を前記第2のアレイの前記エントリーに順次割り当てることと、
を更に含み、前記割り当ては、前記第5のアレイの前記エントリーに基づく、E−EEE5又は6による方法。
E-EEE 8. Applying the downmix matrix to the first array can be applied to the at least one frequency bin.
The entry index for the third array is continuously incremented one at a time, and for each entry index, the entry of the third array indicated by the entry index of each frequency bin and the entry of the third array. Finding the product of the corresponding entry of the first array and
Sequentially assigning the sum of one or more of the products to the entry in the second array,
The allocation is based on the entry of the fifth array, according to E-EEE5 or 6.
E−EEE9.前記ダウンミックス行列を前記第1のアレイに適用することは、前記少なくとも1つの周波数ビンについて、
前記第3のアレイに対するエントリーインデックスごとに、それぞれの周波数ビンの、それぞれのエントリーインデックスによって示される前記第3のアレイの前記エントリーの2乗と、前記第1のアレイの前記対応するエントリーの絶対平方との積を第2の積として求めることと、
前記第2の積のうちの1つ以上の和をそれぞれの周波数ビンの第6のアレイの前記エントリーに順次割り当てることと、
を更に含み、
前記割り当ては、前記第5のアレイの前記エントリーに基づき、
所与の処理帯域内の周波数ビンにわたる前記第6のアレイの和は、前記所与の処理帯域内の前記周波数ビンの前記エネルギー指標値を与える、E−EEE8による方法。
E-EEE 9. Applying the downmix matrix to the first array can be applied to the at least one frequency bin.
For each entry index for the third array, the square of the entry of the third array indicated by the entry index of each frequency bin and the absolute square of the corresponding entry of the first array. To find the product of and as the second product,
The sum of one or more of the second products is sequentially assigned to the entry in the sixth array of each frequency bin.
Including
The allocation is based on the entry in the fifth array.
The method according to E-EEE8, wherein the sum of the sixth array over the frequency bins in a given processing band gives the energy index value of the frequency bins in the given processing band.
E−EEE10.前記所与の処理帯域内の前記周波数ビンを求めることは、ルックアップテーブルを参照することを含み、前記ルックアップテーブルは、処理帯域ごとに、それぞれの処理帯域内の周波数ビンの数を示すエントリーを含む、E−EEE9による方法。 E-EEE10. Finding the frequency bins in the given processing band involves referencing a look-up table, which is an entry indicating the number of frequency bins in each processing band for each processing band. The method according to E-EEE9, which comprises.
E−EEE11.複数の入力オーディオチャネルをダウンミキシングする装置であって、 前記入力オーディオチャネルのそれぞれについて、複数の対応する周波数ビンにおける複数の周波数係数を取得するように構成された周波数係数取得ユニットと、
ダウンミックス行列を取得するように構成されたダウンミックス行列取得ユニットと、
少なくとも1つの周波数ビンについて、それぞれの周波数ビンについての前記複数の入力オーディオチャネルの前記周波数係数によって形成された第1のアレイに前記ダウンミックス行列を適用して、それぞれの周波数ビンの複数の中間オーディオチャネルの前記周波数係数によって形成された第2のアレイを取得するように構成されたダウンミキシングユニットと、
を備え、
前記ダウンミキシングユニットは、
前記ダウンミックス行列の非ゼロのエントリーのみを含む第3のアレイを求めることと、
前記第3のアレイの各エントリーについて、前記ダウンミックス行列における前記第3のアレイのそれぞれのエントリーの位置を示すエントリーを含む第4のアレイを求めることと、
前記少なくとも1つの周波数ビンについて、それぞれの周波数ビンについての前記第3のアレイの前記エントリーと前記第1のアレイの対応するエントリーとを乗算することと、
を行うように構成され、前記第1のアレイの前記対応するエントリーは、前記第4のアレイに基づいて求められる、装置。
E-EEE11. A device that downmixes a plurality of input audio channels, a frequency coefficient acquisition unit configured to acquire a plurality of frequency coefficients in a plurality of corresponding frequency bins for each of the input audio channels, and a frequency coefficient acquisition unit.
With a downmix matrix acquisition unit configured to acquire a downmix matrix,
For at least one frequency bin, the downmix matrix is applied to a first array formed by the frequency coefficients of the plurality of input audio channels for each frequency bin to provide multiple intermediate audio in each frequency bin. A downmixing unit configured to acquire a second array formed by said frequency coefficients of the channel, and
With
The down mixing unit is
Finding a third array containing only non-zero entries in the downmix matrix,
For each entry in the third array, a fourth array containing an entry indicating the position of each entry in the third array in the downmix matrix is determined.
Multiplying the at least one frequency bin by the entry of the third array for each frequency bin and the corresponding entry of the first array.
The corresponding entry of the first array is obtained based on the fourth array.
E−EEE12.前記第3のアレイは、前記ダウンミックス行列の前記非ゼロのエントリーを、前記ダウンミックス行列のエントリー全体にわたる所定の走査順序におけるそれらの出現順序で含む線形アレイである、E−EEE11による装置。 E-EEE12. The device according to E-EEE11, said third array is a linear array containing the non-zero entries of the downmix matrix in their appearance order in a predetermined scan order across the entries of the downmix matrix.
E−EEE13.前記ダウンミキシングユニットは、第5のアレイを求めるように更に構成され、
前記第5のアレイのエントリーは、行方向走査順序の場合には、前記ダウンミックス行列のそれぞれの行ごとの非ゼロのエントリーの数を示し、列方向走査順序の場合には、それぞれの列ごとの前記ダウンミックス行列の非ゼロのエントリーの数を示す、E−EEE12による装置。
E-EEE 13. The downmixing unit is further configured to obtain a fifth array.
The entries in the fifth array indicate the number of non-zero entries per row of the downmix matrix in the case of row scan order, and per column in the case of column scan order. E-EEE12 apparatus showing the number of non-zero entries in the downmix matrix of.
E−EEE14.前記ダウンミキシングユニットは、前記少なくとも1つの周波数ビンについて、
それぞれの周波数ビンについての前記第3のアレイの前記エントリーと前記第1のアレイの前記対応するエントリーとの1つ以上の積の和を、前記第5のアレイの前記エントリーに基づいて前記第2のアレイの前記エントリーに割り当てる、
ように更に構成される、E−EEE13による装置。
E-EEE14. The downmixing unit is for the at least one frequency bin.
The sum of one or more products of the entry of the third array and the corresponding entry of the first array for each frequency bin is based on the entry of the fifth array. Assign to said entry in the array of
A device according to E-EEE13, which is further configured as described above.
E−EEE15.プロセッサ上で実行されるように構成されるとともに、コンピューティングデバイス上で実施されるとE−EEE1〜10のいずれか1つによる方法の方法ステップを実行するように構成されたソフトウェアプログラム。 E-EEE15. A software program configured to run on a processor and, when run on a computing device, to perform a method step of the method according to any one of E-EEE1-10.
Claims (15)
前記入力オーディオチャネルのそれぞれについて、複数の周波数ビンにそれぞれ対応する複数の周波数係数を取得することと、
少なくとも1つの周波数ビンのそれぞれについての前記複数の入力オーディオチャネルの前記周波数係数によって形成された第1のアレイにダウンミックス行列を適用して、それぞれの周波数ビンについての複数の中間オーディオチャネルの前記周波数係数によって形成された第2のアレイを取得することと、
を含み、
前記方法は、
前記ダウンミックス行列の非ゼロのエントリーのみを含む第3のアレイを求めることと、
前記第3のアレイの各エントリーについて、前記ダウンミックス行列内での前記第3のアレイのそれぞれのエントリーの位置を示すエントリーを含む第4のアレイを求めることと、
を更に含み、
前記ダウンミックス行列を前記第1のアレイに適用することは、
前記少なくとも1つの周波数ビンについて、それぞれの周波数ビンについての前記第3のアレイの前記エントリーと前記第1のアレイの対応するエントリーとを乗算すること、を含み、
前記第1のアレイの前記対応するエントリーは、前記第4のアレイに基づいて求められ、
前記方法は、
前記少なくとも1つの周波数ビンについて、中間オーディオチャネルごとに、それぞれの中間オーディオチャネルのエネルギー指標値を求めることと、
前記少なくとも1つの周波数ビンについて、中間オーディオチャネルごとに、前記エネルギー指標値に基づいて調整ファクターを求めることと、
前記少なくとも1つの周波数ビンについて、中間オーディオチャネルごとに、前記周波数係数にそれぞれの調整ファクターを乗算することにより、それぞれの周波数ビンにおけるそれぞれの前記中間オーディオチャネルの前記周波数係数の大きさを調整することと、
を更に含み、
前記エネルギー指標値を求めることは、前記少なくとも1つの周波数ビンについて、前記第3のアレイの前記エントリーの累乗と、前記第1のアレイの対応するエントリーの絶対値の累乗とを乗算することを含み、前記第1のアレイの前記対応するエントリーは、前記第4のアレイに基づいて求められる、
方法。 A method of downmixing multiple input audio channels,
For each of the input audio channels, the method comprising: acquiring a plurality of frequency coefficients corresponding to a plurality of frequency bins,
A downmix matrix is applied to the first array formed by the frequency coefficients of the plurality of input audio channels for each of the at least one frequency bin, and the frequencies of the plurality of intermediate audio channels for each frequency bin. To get a second array formed by the coefficients,
Including
The method is
Finding a third array containing only non-zero entries in the downmix matrix,
For each entry in the third array, a fourth array containing an entry indicating the position of each entry in the third array in the downmix matrix is determined.
Including
Applying the downmix matrix to the first array
For at least one frequency bin, including multiplying the entry of the third array for each frequency bin by the corresponding entry of the first array.
The corresponding entry of the first array is determined based on the fourth array .
The method is
For each of the intermediate audio channels, the energy index value of each intermediate audio channel is obtained for at least one frequency bin, and
For each of the at least one frequency bin, the adjustment factor is determined based on the energy index value for each intermediate audio channel.
Adjusting the magnitude of the frequency coefficient of each intermediate audio channel in each frequency bin by multiplying the frequency coefficient by each adjustment factor for each intermediate audio channel for the at least one frequency bin. When,
Including
Obtaining the energy index value includes multiplying the power of the entry in the third array by the power of the absolute value of the corresponding entry in the first array for at least one frequency bin. , The corresponding entry of the first array is sought based on the fourth array.
Method.
前記第5のアレイのエントリーは、行方向走査順序の場合には、前記ダウンミックス行列のそれぞれの行ごとの非ゼロのエントリーの数を示し、列方向走査順序の場合には、前記ダウンミックス行列のそれぞれの列ごとの非ゼロのエントリーの数を示す、請求項2若しくは3又は請求項2に従属する請求項4に記載の方法。 Further including finding a fifth array,
The entries in the fifth array indicate the number of non-zero entries for each row of the downmix matrix in the case of row scan order, and the downmix matrix in the case of columnar scan order. The method of claim 2 or 3 or claim 4 , which is subordinate to claim 2 , indicating the number of non-zero entries for each column of.
それぞれの周波数ビンについての前記第3のアレイの前記エントリーと前記第1のアレイの前記対応するエントリーとの1つ以上の積の和を、前記第5のアレイの前記エントリーに基づいて前記第2のアレイの前記エントリーに割り当てること、
を更に含む、請求項5に記載の方法。 Applying the downmix matrix to the first array can be applied to the at least one frequency bin.
The sum of one or more products of the entry of the third array and the corresponding entry of the first array for each frequency bin is based on the entry of the fifth array. Assigned to the entry in the array of
5. The method of claim 5, further comprising.
前記第3のアレイに対するエントリーインデックスを一時に1つずつ連続的にインクリメントし、エントリーインデックスごとに、それぞれの周波数ビンの、それぞれのエントリーインデックスによって示される前記第3のアレイの前記エントリーと、前記第1のアレイの前記対応するエントリーとの積を求めることと、
前記積のうちの1つ以上の和を前記第2のアレイの前記エントリーに順次割り当てることと、
を更に含み、
前記割り当ては、前記第5のアレイの前記エントリーに基づく、請求項5に記載の方法。 Applying the downmix matrix to the first array can be applied to the at least one frequency bin.
The third incremented by one continuously in temporary et down tree index for the array, each entry index of each frequency bin, and the entry of the third array shown by the respective entry index, the Finding the product of the corresponding entry of the first array and
Sequentially assigning the sum of one or more of the products to the entry in the second array,
Including
The allocation is based on the entry of the fifth array, The method according to claim 5.
前記第3のアレイに対するエントリーインデックスごとに、それぞれの周波数ビンの、それぞれのエントリーインデックスによって示される前記第3のアレイの前記エントリーの2乗と、前記第1のアレイの前記対応するエントリーの絶対平方との積を第2の積として求めることと、
前記第2の積のうちの1つ以上の和をそれぞれの周波数ビンの第6のアレイの前記エントリーに順次割り当てることと、
を更に含み、
前記割り当ては、前記第5のアレイの前記エントリーに基づき、
所与の処理帯域内の周波数ビンにわたる前記第6のアレイの和は、前記所与の処理帯域内の前記周波数ビンの前記エネルギー指標値を与える、請求項7に記載の方法。 Applying the downmix matrix to the first array can be applied to the at least one frequency bin.
For each entry index for the third array, the square of the entry of the third array indicated by the entry index of each frequency bin and the absolute square of the corresponding entry of the first array. To find the product of and as the second product,
The sum of one or more of the second products is sequentially assigned to the entry in the sixth array of each frequency bin.
Including
The allocation is based on the entry in the fifth array.
The method of claim 7 , wherein the sum of the sixth array over a frequency bin in a given processing band gives the energy index value of the frequency bin in the given processing band.
前記入力オーディオチャネルのそれぞれについて、複数の周波数ビンにそれぞれ対応する複数の周波数係数を取得するように構成された周波数係数取得ユニットと、
ダウンミックス行列を取得するように構成されたダウンミックス行列取得ユニットと、
少なくとも1つの周波数ビンのそれぞれについての前記複数の入力オーディオチャネルの前記周波数係数によって形成された第1のアレイに前記ダウンミックス行列を適用して、それぞれの周波数ビンについての複数の中間オーディオチャネルの前記周波数係数によって形成された第2のアレイを取得するように構成されたダウンミキシングユニットと、
を備え、
前記ダウンミキシングユニットは、
前記ダウンミックス行列の非ゼロのエントリーのみを含む第3のアレイを求めることと、
前記第3のアレイの各エントリーについて、前記ダウンミックス行列における前記第3のアレイのそれぞれのエントリーの位置を示すエントリーを含む第4のアレイを求めることと、
前記少なくとも1つの周波数ビンについて、それぞれの周波数ビンについての前記第3のアレイの前記エントリーと前記第1のアレイの対応するエントリーとを乗算することと、
を行うように構成され、
前記第1のアレイの前記対応するエントリーは、前記第4のアレイに基づいて求められ、
前記装置は、
前記少なくとも1つの周波数ビンについて、中間オーディオチャネルごとに、それぞれの中間オーディオチャネルのエネルギー指標値を決定するように構成されたエネルギー決定ユニットと、
調整ユニットであって、
前記少なくとも1つの周波数ビンについて、中間オーディオチャネルごとに、それぞれのエネルギー指標値に基づいて調整ファクターを決定し、
前記少なくとも1つの周波数ビンについて、中間オーディオチャネルごとに、前記周波数係数にそれぞれの調整ファクターを乗算することにより、それぞれの周波数ビンにおけるそれぞれの前記中間オーディオチャネルの前記周波数係数の大きさを調整する
ように構成された調整ユニットと、
を更に備え、
前記エネルギー指標値を求めることは、前記少なくとも1つの周波数ビンについて、前記第3のアレイの前記エントリーの累乗と、前記第1のアレイの対応するエントリーの絶対値の累乗とを乗算することを含み、前記第1のアレイの前記対応するエントリーは、前記第4のアレイに基づいて求められる、
装置。 A device that downmixes multiple input audio channels.
For each of the input audio channel, and the frequency coefficient acquiring unit configured to acquire a plurality of frequency coefficients corresponding to a plurality of frequency bins,
With a downmix matrix acquisition unit configured to acquire a downmix matrix,
The downmix matrix is applied to the first array formed by the frequency coefficients of the plurality of input audio channels for each of the at least one frequency bin, and the plurality of intermediate audio channels for each frequency bin are described. With a downmixing unit configured to acquire a second array formed by frequency coefficients,
With
The down mixing unit is
Finding a third array containing only non-zero entries in the downmix matrix,
For each entry in the third array, a fourth array containing an entry indicating the position of each entry in the third array in the downmix matrix is determined.
Multiplying the at least one frequency bin by the entry of the third array for each frequency bin and the corresponding entry of the first array.
Is configured to do
The corresponding entry of the first array is determined based on the fourth array .
The device is
An energy determination unit configured to determine the energy index value of each intermediate audio channel for each intermediate audio channel for at least one frequency bin.
It ’s an adjustment unit,
For each of the at least one frequency bin, the adjustment factor is determined for each intermediate audio channel based on the respective energy index value.
For at least one frequency bin, the magnitude of the frequency coefficient of each intermediate audio channel in each frequency bin is adjusted by multiplying the frequency coefficient by each adjustment factor for each intermediate audio channel.
With the adjustment unit configured as
Further prepare
Obtaining the energy index value includes multiplying the power of the entry in the third array by the power of the absolute value of the corresponding entry in the first array for at least one frequency bin. , The corresponding entry of the first array is sought based on the fourth array.
Device.
前記第5のアレイのエントリーは、行方向走査順序の場合には、前記ダウンミックス行列のそれぞれの行ごとの非ゼロのエントリーの数を示し、列方向走査順序の場合には、それぞれの列ごとの前記ダウンミックス行列の非ゼロのエントリーの数を示す、請求項11に記載の装置。 The downmixing unit is further configured to obtain a fifth array.
The entries in the fifth array indicate the number of non-zero entries per row of the downmix matrix in the case of row scan order, and per column in the case of column scan order. 11. The apparatus of claim 11 , indicating the number of non-zero entries in the downmix matrix of.
それぞれの周波数ビンについての前記第3のアレイの前記エントリーと前記第1のアレイの前記対応するエントリーとの1つ以上の積の和を、前記第5のアレイの前記エントリーに基づいて前記第2のアレイの前記エントリーに割り当てるように更に構成される、請求項12に記載の装置。 The downmixing unit is for the at least one frequency bin.
The sum of one or more products of the entry of the third array and the corresponding entry of the first array for each frequency bin is based on the entry of the fifth array. 12. The device of claim 12 , further configured to be assigned to said entry in the array of.
コンピュータープログラムを記憶する少なくとも1つのメモリと、
を備える装置であって、
前記コンピュータープログラムは、前記少なくとも1つのプロセッサに、少なくとも請求項1から9のいずれかに記載の方法をを実行させる、
装置。 With at least one processor
At least one memory for storing computer programs,
It is a device equipped with
The computer program, the at least one processor to perform the method of any one of at least claims 1-9,
Device.
Applications Claiming Priority (21)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201662290913P | 2016-02-03 | 2016-02-03 | |
| US201662290934P | 2016-02-03 | 2016-02-03 | |
| US201662290924P | 2016-02-03 | 2016-02-03 | |
| US201662290930P | 2016-02-03 | 2016-02-03 | |
| US201662290915P | 2016-02-03 | 2016-02-03 | |
| US62/290,924 | 2016-02-03 | ||
| US62/290,913 | 2016-02-03 | ||
| US62/290,934 | 2016-02-03 | ||
| US62/290,930 | 2016-02-03 | ||
| US62/290,915 | 2016-02-03 | ||
| EP16166651 | 2016-04-22 | ||
| EP16166649 | 2016-04-22 | ||
| EP16166650.8 | 2016-04-22 | ||
| EP16166650 | 2016-04-22 | ||
| EP16166651.6 | 2016-04-22 | ||
| EP16166652 | 2016-04-22 | ||
| EP16166653 | 2016-04-22 | ||
| EP16166653.2 | 2016-04-22 | ||
| EP16166652.4 | 2016-04-22 | ||
| EP16166649.0 | 2016-04-22 | ||
| PCT/EP2017/052364 WO2017134214A1 (en) | 2016-02-03 | 2017-02-03 | Efficient format conversion in audio coding |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2019508735A JP2019508735A (en) | 2019-03-28 |
| JP6921832B2 true JP6921832B2 (en) | 2021-08-18 |
Family
ID=65905942
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2018540755A Active JP6921832B2 (en) | 2016-02-03 | 2017-02-03 | Efficient format conversion in audio coding |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP6921832B2 (en) |
Family Cites Families (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| PL2880654T3 (en) * | 2012-08-03 | 2018-03-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder and method for a generalized spatial-audio-object-coding parametric concept for multichannel downmix/upmix cases |
| EP2804176A1 (en) * | 2013-05-13 | 2014-11-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio object separation from mixture signal using object-specific time/frequency resolutions |
| EP2838086A1 (en) * | 2013-07-22 | 2015-02-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | In an reduction of comb filter artifacts in multi-channel downmix with adaptive phase alignment |
| EP2866227A1 (en) * | 2013-10-22 | 2015-04-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder |
-
2017
- 2017-02-03 JP JP2018540755A patent/JP6921832B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| JP2019508735A (en) | 2019-03-28 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US11184730B2 (en) | Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field | |
| JP2025122080A (en) | Method for parametric multi-channel encoding - Patent Application 20070122967 | |
| KR102882646B1 (en) | Method and apparatus for compressing and decompressing a higher order ambisonics representation | |
| US10923131B2 (en) | MDCT-domain error concealment | |
| CN1166019A (en) | Vector quantizer method | |
| US20190392848A1 (en) | Audio source separation | |
| CN1216366C (en) | Audio Signal Coding Based on Sine Model | |
| CN108701463B (en) | Efficient Format Conversion in Audio Coding | |
| CN102812642B (en) | Coding method, coding/decoding method, device, program and recording medium | |
| JP6921832B2 (en) | Efficient format conversion in audio coding | |
| US9257129B2 (en) | Orthogonal transform apparatus, orthogonal transform method, orthogonal transform computer program, and audio decoding apparatus | |
| EP2784776B1 (en) | Orthogonal transform apparatus, orthogonal transform method, orthogonal transform computer program, and audio decoding apparatus | |
| JP2011170190A (en) | Device, method and program for signal separation | |
| CN116364103B (en) | A speech signal processing method, apparatus, and electronic device | |
| KR102847181B1 (en) | Downmixers and downmixing methods | |
| CN109074811A (en) | audio source separation | |
| KR20240128016A (en) | IVAS SPAR filter bank in QMF domain | |
| Galabov | Implementation of IMDCT Block of an MP3 Decoder through Optimization on the DCT Matrix | |
| HK1259875B (en) | Audio source separation | |
| JPH0219478B2 (en) | ||
| HK1213360B (en) | Encoder, decoder and methods for backward compatible multi-resolution spatial-audio-object-coding | |
| HK1213360A1 (en) | Encoder, decoder and methods for backward compatible multi-resolution spatial-audio-object-coding |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200129 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210127 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210216 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210514 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210629 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210728 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6921832 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |