JP4746532B2 - Linear prediction coefficient calculation method, apparatus thereof, program thereof, and storage medium thereof - Google Patents
Linear prediction coefficient calculation method, apparatus thereof, program thereof, and storage medium thereof Download PDFInfo
- Publication number
- JP4746532B2 JP4746532B2 JP2006343319A JP2006343319A JP4746532B2 JP 4746532 B2 JP4746532 B2 JP 4746532B2 JP 2006343319 A JP2006343319 A JP 2006343319A JP 2006343319 A JP2006343319 A JP 2006343319A JP 4746532 B2 JP4746532 B2 JP 4746532B2
- Authority
- JP
- Japan
- Prior art keywords
- prediction coefficient
- linear prediction
- coefficient calculation
- unit
- provisional
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
この発明は、例えば音声音響信号などの分析や符号化のための線形予測分析技術を利用する音声予測符号化装置等に用いて好適な、線形予測係数算出方法及び、その装置、そのプログラムとそのプログラムを記憶する記憶媒体に関する。 The present invention relates to a linear prediction coefficient calculation method suitable for use in, for example, a speech prediction encoding apparatus that uses a linear prediction analysis technique for analysis and encoding of a speech sound signal and the like, an apparatus thereof, a program thereof, and a The present invention relates to a storage medium for storing a program.
従来から線形予測分析手法のひとつとして自己相関法や共分散法がよく知られている。いずれも予測誤差のエネルギーを最小にすることを目的としている。この線形予測分析手法を音声音響信号に利用した一例として、音声予測符号化装置130を図14に示し、その動作を説明する。
音声予測符号化装置130は、入力端子132から入力される離散的時系列ディジタル信号xi,(i:整数、以降、ディジタル信号xiと称す)を、所定サンプル数Nごとのフレームに分割するフレーム分割部134と、各フレーム毎にディジタル信号xiの線形予測分析を行いp個の線形予測係数αj,(j=0,‥‥,p)を計算して線形予測誤差信号diを出力する線形予測分析部136と、線形予測分析部136が出力する線形予測誤差信号diを符号化する誤差符号化部138と、線形予測分析部136が出力する線形予測係数αjを符号化する係数符号化部140とから構成される。
Conventionally, autocorrelation method and covariance method are well known as one of linear prediction analysis methods. Both aim to minimize the energy of prediction errors. As an example of using this linear predictive analysis method for a speech acoustic signal, a speech
Speech
線形予測分析部136は、全極型(自己回帰型前方予測)であり、線形予測誤差信号diを最小にするp個の線形予測係数αjを計算する線形予測係数算出部136aと、線形予測係数算出部136aで計算された線形予測係数αjと、ディジタル信号xiとから予測値を計算する線形予測部136bと、ディジタル信号xiから予測値を減算して線形予測誤差信号diを生成する減算部136cとで構成される。
線形予測分析部136は、ディジタル信号xiに対し、p個の線形予測係数αjにより式(1)に示すようにして線形予測誤差信号diを求める。
D=X−YA 式(2)
The linear prediction analysis unit 136 is an all-pole type (autoregressive type forward prediction), linear prediction
The linear prediction analysis unit 136 obtains a linear prediction error signal d i for the digital signal x i by using p linear prediction coefficients α j as shown in Expression (1).
D = X-YA Formula (2)
ただし、Dは線形予測誤差信号系列のN行1列のベクトル(式(3))、Aは線形予測係数列のN行1列のベクトル(式(4))、Xはディジタル信号列のN行1列のベクトル(式(5))である。それぞれを転置行列で示す。YはN行P列の行列である(式(6))。
DT=(d0,‥‥,dN−1) 式(3)
AT=(α1,‥‥,αp) 式(4)
XT=(x0,‥‥,xN−1) 式(5)
Here, D is a vector of N rows and 1 column of the linear prediction error signal sequence (Equation (3)), A is a vector of N rows and 1 column of the linear prediction coefficient sequence (Equation (4)), and X is N of the digital signal sequence. It is a vector of
D T = (d 0 ,..., D N−1 ) Formula (3)
A T = (α 1 ,..., Α p ) Equation (4)
X T = (x 0 ,..., X N−1 ) Expression (5)
YTX=YTYA 式(9)
正規方程式(式(9))より得られる最小二乗解である線形予測係数列A(αj:j=1,‥‥,p)は式(10)で求めることができる。
A=(YTY)−1YTX 式(10)
線形予測部136bは、このようにして求められた線形予測係数αjと、ディジタル信号xiとで式(11)に示す畳み込み演算で予測値^xiを計算する。
Y T X = Y T YA Formula (9)
A linear prediction coefficient sequence A (α j : j = 1,..., P), which is a least square solution obtained from the normal equation (equation (9)), can be obtained by equation (10).
A = (Y T Y) −1 Y T X Formula (10)
減算部136cで生成された線形予測誤差信号diは、誤差符号化部138において、例えばライス符号化やハフマン符号化などでエントロピー符号化され、線形予測誤差符号として出力される。
線形予測係数算出部136aで計算された線形予測係数αjも、係数符号化部140で符号化されて出力される。
符号化された線形予測誤差符号と線形予測係数符号は、図示しない復号器に伝送され、復号器において式(12)に示す計算((11)式と同じ整数への四捨五入を含む。今後、特に整数化についてはことわらない)が行われディジタル信号xiが再生される。
The linear prediction error signal d i generated by the
The linear prediction coefficient α j calculated by the linear prediction
The encoded linear prediction error code and the linear prediction coefficient code are transmitted to a decoder (not shown), and include the calculation shown in Expression (12) in the decoder (including rounding to the same integer as Expression (11). The digital signal x i is regenerated by changing the integer number).
線形予測誤差信号diと線形予測係数αjは、それぞれ符号化されて復号器に伝送される。復号器では、p個の線形予測係数αjと順次入力される線形予測誤差信号diとから、ディジタル信号出力xsiを再生する。この動作は、フレーム単位でp個の線形予測係数αjが計算されて繰り返される。
しかしながら従来の方法では、エントロピー符号化された線形予測誤差信号diの符号量が最小にならない。良く知られているようにエントロピー符号化は、発生頻度の対数に符号長を比例させるものである。つまり、発生頻度の大きな入力に、ビット数の少ない符号を割り当てることで、全体の符号量を減らす方法である。通常の音声の圧縮では、符号長が振幅に比例するライス符号が使われ、符号量を最小にするためには振幅の絶対値の和を最小化する必要があり、二乗誤差を最小とする関係から得られた線形予測誤差信号diを、エントロピー符号化しても符号量は最小にならない。
この発明は、このような問題点に鑑みてなされたものであり、二乗誤差最小化ではなく線形予測誤差信号diの振幅の絶対値の最小化の近似をおこなうことで、線形予測誤差信号diをエントロピー符号化する際の符号量を小さくすることが出来る線形予測係数算出方法、及びその装置とそのプログラムと、その記憶媒体を提供することを目的とする。
However, in the conventional method, the code amount of the entropy-coded linear prediction error signal d i is not minimized. As is well known, entropy coding is such that the code length is proportional to the logarithm of occurrence frequency. That is, this is a method of reducing the overall code amount by assigning a code with a small number of bits to an input with a high occurrence frequency. In normal speech compression, a Rice code whose code length is proportional to the amplitude is used, and in order to minimize the amount of code, it is necessary to minimize the sum of the absolute values of the amplitudes, and to minimize the square error Even if the linear prediction error signal d i obtained from the above is entropy-encoded, the code amount is not minimized.
The present invention has been made in view of such a problem. The linear prediction error signal d is approximated by minimizing the absolute value of the amplitude of the linear prediction error signal d i instead of minimizing the square error. It is an object of the present invention to provide a linear prediction coefficient calculation method capable of reducing the code amount when entropy encoding i , an apparatus thereof, a program thereof, and a storage medium thereof.
この発明による線形予測係数算出装置は、離散的時系列ディジタル信号を所定サンプル数毎のフレームに分割するフレーム分割部の出力信号を入力とし、そのフレーム毎の時系列信号から全極型の線形予測係数を生成するものであり、暫定予測誤差生成部と予測係数算出部とを備える。
暫定予測誤差生成部は、フレーム毎に線形予測係数を求めて暫定予測係数を生成し、上記暫定予測係数に基づく予測誤差信号を求めて暫定予測誤差信号として出力する。
予測係数算出部は、フレーム毎の離散的時系列ディジタル信号と暫定予測誤差信号とを入力とし、暫定予測誤差信号の振幅の絶対値を近似する微分可能な連続関数の各次の線形予測係数の偏微分が、全て0となる線形予測係数を生成するものである。
An apparatus for calculating a linear prediction coefficient according to the present invention receives an output signal of a frame division unit that divides a discrete time-series digital signal into frames for each predetermined number of samples, and performs all-pole linear prediction from the time-series signal for each frame. A coefficient is generated, and includes a provisional prediction error generation unit and a prediction coefficient calculation unit.
The provisional prediction error generation unit obtains a linear prediction coefficient for each frame, generates a provisional prediction coefficient, obtains a prediction error signal based on the provisional prediction coefficient, and outputs it as a provisional prediction error signal.
The prediction coefficient calculation unit receives the discrete time-series digital signal for each frame and the provisional prediction error signal as input, and calculates the linear prediction coefficient of each order of a differentiable continuous function that approximates the absolute value of the amplitude of the provisional prediction error signal. A linear prediction coefficient in which the partial differentiation is all 0 is generated.
この発明によれば、線形予測係数を求めるにあたって、従来の二乗誤差を最小にする基準で求めた予測誤差を暫定予測誤差信号として求め、暫定予測誤差信号の振幅の絶対値を微分可能な連続関数に近似し、その連続関数の各次の線形予測係数の偏微分が、全て0となる線形予測係数を生成するので、従来の二乗誤差を基準にした予測誤差の符号量よりも符号量を減らすことが出来る。 According to the present invention, when obtaining a linear prediction coefficient, a continuous function that obtains a prediction error obtained by a conventional criterion for minimizing a square error as a provisional prediction error signal and that can differentiate the absolute value of the amplitude of the provisional prediction error signal. , And the linear derivative of each successive linear prediction coefficient of the continuous function generates a linear prediction coefficient that is all zero, so that the code amount is reduced from the code amount of the prediction error based on the conventional square error. I can do it.
以下、この発明の実施の形態を図面を参照して説明する。複数の図面中同一のものには同じ参照符号を付し、説明は繰り返さない。 Embodiments of the present invention will be described below with reference to the drawings. The same reference numerals are given to the same components in a plurality of drawings, and the description will not be repeated.
この発明の線形予測係数算出装置10の実施例1の機能構成例を図1に示す。この発明の線形予測係数算出装置10は、従来技術の一例として図14に示した音声予測符号化装置130内の線形予測分析部136を構成する線形予測係数算出部136aに相当するものである。
線形予測係数算出装置10は、フレーム分割部134と線形予測係数算出手段50とからなる。線形予測係数算出手段50は、暫定予測誤差生成部20と予測係数算出部30とから構成される。
入力端子132から入力されるディジタル信号xi,(i:整数)は、暫定予測誤差生成部20に入力される。暫定予測誤差生成部20は、図14に示した線形予測分析部136そのものである。図14の線形予測係数算出部136aは、暫定予測係数算出部22である。線形予測部136bは暫定線形予測部24である。減算部136cは暫定減算部26である。つまり、実施例1では、暫定的に二乗誤差を最小化する方法でフレーム毎の線形予測誤差信号diを求める。
暫定予測誤差生成部20で求められた線形予測誤差信号diは、従来技術で求めた線形予測誤差信号diと同じものである。
FIG. 1 shows a functional configuration example of the first embodiment of the linear prediction
The linear prediction
The digital signal x i , (i: integer) input from the
Linear prediction error signal d i obtained by the provisional prediction
暫定的に求められた暫定予測誤差信号diの各サンプル(d0,d2,‥‥,dN−1)の振幅の頻度分布は指数分布で近似できる。暫定予測誤差信号diの振幅の頻度分布を模式的に図2(a)に示す(以降、振幅値も同じ参照符号diで表記する)。図2(a)の横軸は、暫定予測誤差信号diの振幅、縦軸はその頻度である。暫定予測誤差信号diの振幅の頻度分布は、振幅が小さいと頻度Fが高く、振幅が大きいと頻度Fが低くなる。すなわち頻度の対数は振幅に比例する例えば、e−axのような指数関数で近似できる。
これを横軸を時間、縦軸を暫定予測誤差信号diの±振幅で時系列に模式的に表わすと、図2(b)のように表わせる。つまり、振幅の小さな暫定予測誤差信号が多く、振幅の大きな暫定予測誤差信号が少ない。
The frequency distribution of the amplitude of each sample (d 0 , d 2 ,..., D N−1 ) of the provisional prediction error signal d i tentatively obtained can be approximated by an exponential distribution. The frequency distribution of the amplitude of the provisional prediction error signal d i is schematically shown in FIG. 2A (hereinafter, the amplitude value is also expressed by the same reference sign d i ). The horizontal axis in FIG. 2 (a), the amplitude of the provisional prediction error signal d i, the vertical axis represents its frequency. Frequency distribution of the amplitude of the provisional prediction error signal d i is the frequency F is higher amplitude is small, the frequency F is decreased the amplitude is large. That is, the logarithm of the frequency can be approximated by an exponential function such as e- ax , which is proportional to the amplitude.
The horizontal axis represents time this and schematically represented in a time series on the vertical axis ± amplitude interim prediction error signal d i, expressed as in FIG. 2 (b). That is, there are many provisional prediction error signals with small amplitude and few provisional prediction error signals with large amplitude.
したがって、符号量を最小化する目的で、振幅が小さい暫定予測誤差信号の符号長を小さく、振幅が大きい暫定予測誤差信号の符号長を大きくする近似を行う。その関係を図2(c)に模式的に示す。図2(c)の横軸は中央を0として一方は+振幅、他方は−振幅であり、縦軸は符号長を表わす。符号長は暫定予測誤差信号の振幅が0でも0にはならずに所定の値を持つ。
振幅の絶対値が大きくなればそれに比例して符号長も大きくなる。このように近似した符号長からフレーム全体の符号量を求め、この符号量を最小化するように線形予測係数を求める。こうして求めた線形予測係数から予測誤差を求めると、フレーム全体の符号量を最小化することが出来る。
Therefore, for the purpose of minimizing the code amount, approximation is performed to reduce the code length of the provisional prediction error signal having a small amplitude and to increase the code length of the provisional prediction error signal having a large amplitude. The relationship is schematically shown in FIG. In FIG. 2C, the horizontal axis indicates 0 as the center, one is + amplitude, the other is -amplitude, and the vertical axis indicates the code length. The code length does not become 0 even when the amplitude of the provisional prediction error signal is 0 and has a predetermined value.
If the absolute value of the amplitude increases, the code length increases in proportion to it. The code amount of the entire frame is obtained from the code length approximated in this way, and the linear prediction coefficient is obtained so as to minimize the code amount. When the prediction error is obtained from the linear prediction coefficient thus obtained, the code amount of the entire frame can be minimized.
例えばライス符号でエントロピー符号化した場合、暫定予測誤差信号の1サンプル当たりの符号長は、暫定予測誤差信号の振幅diの2倍で近似出来る。これは、ライス符号の符号長E(di)が、振幅diに対して式(13)に示す関係であることによる。
E(di)=2|di+0.25|+0.5 式(13)
したがって、フレーム全体の符号量Jは式(14)で計算出来る。ところが、絶対値は微分値が常に一定で、原点で微分出来ないので、微分に基づく最小化基準として使えない。
E(di)=2(δ+di q)(1/q) 式(15)
ここでδは定数である。特にq=2の場合が計算上簡便である(式(16))。
For example, when entropy coding is performed using a Rice code, the code length per sample of the provisional prediction error signal can be approximated by twice the amplitude d i of the provisional prediction error signal. This is because the code length E (d i ) of the Rice code has the relationship shown in the equation (13) with respect to the amplitude d i .
E (d i ) = 2 | d i +0.25 | +0.5 Formula (13)
Therefore, the code amount J of the entire frame can be calculated by Expression (14). However, the absolute value of the absolute value is always constant and cannot be differentiated at the origin, so it cannot be used as a minimization standard based on differentiation.
E (d i ) = 2 (δ + d i q ) (1 / q) Equation (15)
Here, δ is a constant. In particular, the case of q = 2 is simple in calculation (formula (16)).
式(16)のδをδ=0.5とした符号長の特性を図3に示す。横軸は暫定予測誤差信号diの振幅、縦軸は符号長E(di)である。振幅=0の時の符号長は1.414、振幅=±1の符号長は2.44、振幅=±2の符号長は4.24、振幅±7以上の振幅は、2×diの一次関数である。つまり、暫定予測誤差信号diの振幅の絶対値に比例した符号長を得ることが出来る。
FIG. 3 shows the characteristics of the code length when δ in Expression (16) is δ = 0.5. The horizontal axis represents the amplitude of the provisional prediction error signal d i , and the vertical axis represents the code length E (d i ). The code length when amplitude = 0 is 1.414, the code length when amplitude = ± 1 is 2.44, the code length when amplitude = ± 2 is 4.24, and the amplitude greater than ± 7 is 2 × d i It is a linear function. That is, a code length proportional to the absolute value of the amplitude of the provisional prediction error signal d i can be obtained.
このように近似した絶対値近似誤差によるフレーム全体の符号量Jは、式(19)で計算出来る。
つまり、dJ/dαj=0となるJ=1からj=pまでのαjについてp個の連立方程式を解けばよい。この考え方は、従来技術で説明済みの二乗誤差を最小にする場合と同じであり、式(9)に示した正規方程式を解くことでp個の線形予測係数を求めることが出来る。
このようにして求めた線形予測係数は、絶対値近似誤差の振幅を最小にするものであるので、その線形予測係数に基づいて求めた予測誤差信号のエントロピー符号化した際の符号量を最小にすることが出来る。
この発明の線形予測係数算出装置は、実施例1に示したように二乗誤差を最小にする考えで得た暫定予測誤差信号diを、暫定予測誤差信号diの振幅の絶対値の和で近似し、振幅の絶対値の和を、最小化する線形予測係数を求めるものである。なお、振幅の絶対値の和をサンプル数Nで除算した絶対値平均値を最小化する線形予測係数を求めてもよい。つまり、平均値を求める1/Nは定数であり、1/Nを掛けても符号長が振幅の絶対値に比例する関係が変わらないからである。
That is, p simultaneous equations may be solved for α j from J = 1 to j = p where dJ / dα j = 0. This concept is the same as that in the case of minimizing the square error described in the prior art, and p linear prediction coefficients can be obtained by solving the normal equation shown in Equation (9).
Since the linear prediction coefficient obtained in this way minimizes the amplitude of the absolute value approximation error, the code amount when the entropy coding of the prediction error signal obtained based on the linear prediction coefficient is minimized. I can do it.
The linear prediction coefficient calculation apparatus according to the present invention calculates the provisional prediction error signal d i obtained with the idea of minimizing the square error as shown in the first embodiment as the sum of absolute values of the amplitudes of the provisional prediction error signal d i. A linear prediction coefficient that approximates and minimizes the sum of absolute values of amplitudes is obtained. A linear prediction coefficient that minimizes the absolute value average value obtained by dividing the sum of the absolute values of the amplitudes by the number of samples N may be obtained. That is, 1 / N for obtaining the average value is a constant, and even if 1 / N is multiplied, the relationship in which the code length is proportional to the absolute value of the amplitude does not change.
暫定予測誤差信号の振幅の絶対値近似誤差によるフレーム全体の符号量Jを、線形予測係数αjで偏微分した式(19)の係数2di/√(δ+d2 i)の分母は、αjの関数であるので、式(9)の正規方程式が手間のかかる数値解析を用いないと解けない。
そこで正規方程式を、暫定予測誤差信号diの振幅が大きなサンプル(d1,d2,‥‥,di)を軽視する対角成分のみの重み係数行列W(式(21))を掛ける形に拡張した形式に近似する(式(20))。重みは、各サンプルが線形予測係数の推定にどのくらい影響を与えるのかを決める値である。
The denominator of the coefficient 2d i / √ (δ + d 2 i ) of the equation (19) obtained by partial differentiation of the code amount J of the entire frame due to the absolute value approximation error of the amplitude of the provisional prediction error signal by the linear prediction coefficient α j is α j Therefore, the normal equation of Equation (9) cannot be solved without using time-consuming numerical analysis.
Therefore, the normal equation is multiplied by the weight coefficient matrix W (equation (21)) of only the diagonal component that neglects the samples (d 1 , d 2 ,..., D i ) whose amplitude of the provisional prediction error signal d i is large. (Formula (20)). The weight is a value that determines how much each sample affects the estimation of the linear prediction coefficient.
A=(YTWY)−1YTWX 式(22)
式(22)の形は、従来からの重み付き線形予測の式と同じである。
この重み係数行列Wは、図1の予測係数算出部30の中に破線で示す重み係数行列生成部32で生成される。重み係数行列Wは、式(21)に示す様に対角成分のみの対角行列である。各対角要素は、振幅大のサンプルの影響度を小さくする目的から、例えば、暫定予測誤差信号diの振幅の逆数(1/di)又は、振幅の平方根の逆数(1/√di)が使用できる。
重み係数行列生成部32は、予測係数算出部30内の図示しないレジスタに記憶された暫定予測誤差信号diを、読み出して暫定予測誤差信号diの逆数若しくは、平方根の逆数を、重み係数行列Wの対角要素に割り付ける動作を行う。
A = (Y T WY) -1 Y T WX formula (22)
The form of equation (22) is the same as the conventional weighted linear prediction equation.
This weighting coefficient matrix W is generated by a weighting coefficient
Weighting coefficient
しかし、暫定予測誤差信号diの振幅が大きなサンプルを軽視する重み係数行列Wを用いても、適切な線形予測係数が求まらない場合がある。
そこで、実施例2として図4に示す線形予測係数算出手段50を構成する予測係数算出部30は、フレーム毎に線形予測係数を求める動作を繰り返して行う繰り返し部34を備える。予測係数算出部30は、繰り返し部34内の終了判定部36が繰り返し動作を終了させる終了信号を出力するまでの間、線形予測係数を求める動作を繰り返して行う。また、予測係数算出部30が繰り返して線形予測係数を計算するので、フレーム分割部134が出力する少なくとも1フレームのディジタル信号を記憶するバッファ部28を、暫定予測誤差生成部20内に設ける構成とした。バッファ部28は、繰り返し部34が指定するフレームのディジタル信号を順次、暫定予測係数算出部22と暫定線形予測部24と暫定減算部26とに出力する。
However, even if a weighting coefficient matrix W that neglects a sample with a large amplitude of the provisional prediction error signal d i is used, an appropriate linear prediction coefficient may not be obtained.
Therefore, the prediction
実施例2の主要な処理の流れを図5に示す。フレーム分割部134で所定サンプル数毎のフレームに分割されたディジタル信号は、フレーム単位でバッファ部28に記憶される(図5のステップS10)。バッファ部28は少なくとも1フレームのディジタル信号を記憶して出力するものである。
新しいフレームLが得られる(ステップS12)と、回数カウント値Kが0に初期化(ステップS14)され、回数カウント値Kが+1計数される(ステップS16)。そして、通常は、バッファ部28の最新のフレームLのディジタル信号xLiが順次読み出され、暫定予測誤差生成部20を構成する暫定予測係数算出部22と暫定線形予測部24と暫定減算部26に入力される(ステップS18)。
暫定予測誤差生成部20は上記した式(8)〜式(10)に示す計算を行って、暫定予測誤差信号diを生成する(ステップS20)。暫定予測誤差信号diが入力される予測係数算出部30は、上記した式(19)〜式(22)に示す計算を行って、予測誤差信号の符号量を最小化する線形予測係数を算出する(ステップS22)。
The main processing flow of the second embodiment is shown in FIG. The digital signal divided into frames for each predetermined number of samples by the
When a new frame L is obtained (step S12), the count value K is initialized to 0 (step S14), and the count value K is incremented by 1 (step S16). Normally, the digital signal x Li of the latest frame L in the
Preliminary prediction
以上述べたステップS16〜ステップS22までの処理を、終了判定部36が終了と判断するまで、ステップ22で求めた予測係数に基づいて暫定予測誤差生成部20が暫定予測誤差を求め直す動作を繰り返すことで(ステップS24)、適切な線形予測係数を求めることが出来る。終了判定部36の終了の判断は、回数カウント値Kが所定回数Nに等しくなったか否かを終了判定部36内の回数判定部36aで行なってもよい。又は、ステップS22で求めた予測係数の絶対値和をステップS26で計算し、前回と今回の予測係数の総和の差がレジスタ38に記憶された所定値Thよりも小、若しくは変化しなくなったかを収束判定部36bで判断した結果で行なってもよい。又は、ステップS22で求めた線形予測係数とディジタル信号とからフレーム内の予測誤差信号の符号量をステップS28で計算し、終了判定部36内の符号量判定部36cで前回と今回の予測誤差信号を演算してその符号量を比較して符号量が最小になった時点としてもよい。
Until the end determination unit 36 determines that the processing from step S16 to step S22 described above is complete, the provisional prediction
以上述べたように予測係数算出部30内に繰り返し部34を設け、繰り返して予測係数を求めることで適切な線形予測係数を得ることが可能になる。但し、この発明において、この繰り返し部34は必須の構成要素ではない。実施例1で説明したように、予測誤差信号の符号量が最小になる予測係数を手間のかかる数値解析を用いて1度だけ算出し、その線形予測係数を用いてもよい。その場合は、フレーム毎に暫定予測係数を生成して、その暫定予測係数に基づく予測誤差信号を求めて暫定予測誤差信号を出力するステップS20に示す過程と、暫定予測誤差信号を入力として、予測誤差の振幅の絶対値を近似する微分可能な連続関数の各次の線形予測係数の偏微分が、全て0となる線形予測係数を生成するステップS22に示す過程、の2つが行なわれるだけである。
As described above, it is possible to obtain an appropriate linear prediction coefficient by providing the
実施例2で、線形予測係数を求める正規方程式(式(9))を容易に解くことを目的に、対角成分のみの重み係数行列W(式(22))を掛ける考えを導入した。その重み係数の各要素は、暫定予測誤差信号の振幅の大きなサンプルについて軽視する目的で、例えば暫定予測誤差信号の振幅の逆数などの比較的簡単な例を示した。
この重み係数の各要素を重み係数算出部31で計算して求める他の例を実施例3として説明する。重み係数算出部31を、図4の予測係数算出部30内に破線で示す。
実施例3は、実施例2に対してこの重み係数算出部31が設けられている点のみが異なる。他の構成は同じである。重み係数算出部31内には、図示しない定数を記憶するレジスタが設けられており、実施例2よりも複雑な重み係数を計算出来る点に特徴がある。
In Example 2, the idea of multiplying the weighting coefficient matrix W (equation (22)) of only the diagonal component was introduced for the purpose of easily solving the normal equation (equation (9)) for obtaining the linear prediction coefficient. For the purpose of neglecting a sample having a large amplitude of the provisional prediction error signal, each element of the weighting coefficient has shown a relatively simple example such as the reciprocal of the amplitude of the provisional prediction error signal.
Another example in which each element of the weighting factor is calculated by the weighting
The third embodiment is different from the second embodiment only in that the weight
従来の予測誤差が最小になる線形予測係数を求める式(8)と、この発明の暫定予測誤差信号の振幅の絶対値を最小にする線形予測係数を求める式(20)とを比較すると、1/√(δ+d2 i)が乗算されている点のみが異なる。したがって、この係数1/√(δ+d2 i)を重み係数として考慮することで、従来の予測誤差が最小になる最小二乗法で求めた線形予測係数と同じように、振幅の絶対値を最小にする線形予測係数が求められると考えられる。
Comparing the conventional equation (8) for obtaining the linear prediction coefficient that minimizes the prediction error with the equation (20) for obtaining the linear prediction coefficient that minimizes the absolute value of the amplitude of the provisional prediction error signal according to the present invention, 1 The only difference is that / √ (δ + d 2 i ) is multiplied. Therefore, by considering this
そこで、重み係数算出部31で式(23)に示す計算で各重み係数を求め、計算された各重み係数を、重み係数行列生成部32で対角要素に割り付ける。
予測誤差信号をエントロピー符号化するのにライス符号を使うと、その符号長は、上記した式(13)で求められ、暫定予測誤差信号の振幅diに対して例えば図6に示すようになる。振幅1に対して符号長3、振幅−1に対して符号長2、振幅2に対して符号長5、振幅−2に対して符号長4となる。−振幅の符号長は、+振幅の符号長より符号長が1つ少ない。
暫定予測誤差信号の振幅は例えば1万(1×10,000)と言った数が想定されるので、その1万の振幅を全てライス符号化すると、符号量が2万ビットと極めて大きな値になってしまう。そこで、振幅が大きい場合には、下位のビットを固定長符号化し、所定のビット以上をエントロピー符号化(可変長符号化)する方法が考えられる。その固定長符号化と可変長符号化を組み合わせた実施例4の機能構成例を図7に示す。
When the prediction error signal using Rice codes to entropy coding, the code length is given by Equation (13) mentioned above, as shown in FIG. 6, for example the amplitude d i provisional prediction error signal . The code length is 3 for
As the amplitude of the provisional prediction error signal, for example, a number such as 10,000 (1 × 10,000) is assumed. Therefore, when all the 10,000 amplitudes are subjected to the rice encoding, the code amount becomes an extremely large value of 20,000 bits. turn into. Therefore, when the amplitude is large, a method in which the lower bits are fixed-length encoded and a predetermined bit or more is entropy encoded (variable length encoding) can be considered. FIG. 7 shows a functional configuration example of the fourth embodiment in which the fixed length coding and the variable length coding are combined.
実施例4は実施例3に対して予測係数算出部30内に可変長符号化開始ビット設定部70を備えたことを特徴とする。他の構成は実施例2と同じである。
可変長符号化開始ビット設定部70は、絶対値平均部72と可変長符号化開始ビット計算部74とで構成される。絶対値平均部72は、暫定予測誤差信号diから暫定予測誤差系列の絶対値平均値τを計算する(式(24))。絶対値平均値τは、可変長符号ビット計算部74に入力され、例えば式(25)に基づいて可変長符号化開始ビットであるβが計算される。
この可変長符号化開始ビットβを求める方法は、ISO規格(ISO/IEC14496-5 2001/AMD 10 Reference Software
)に例示されている。
The fourth embodiment is different from the third embodiment in that a variable length coding start bit setting unit 70 is provided in the prediction
The variable length coding start bit setting unit 70 includes an absolute value averaging unit 72 and a variable length coding start bit calculation unit 74. The absolute value average unit 72 calculates the absolute value average value τ of the provisional prediction error sequence from the provisional prediction error signal d i (formula (24)). The absolute value average value τ is input to the variable-length code bit calculation unit 74, and β, which is a variable-length encoding start bit, is calculated based on, for example, Expression (25).
The method for obtaining the variable length coding start bit β is defined by the ISO standard (ISO / IEC14496-5 2001 /
).
こうして求めた可変長符号化開始ビットβを用いて、βビット以上のビットを例えばライス符号化した暫定予測誤差信号の符号長は、式(26)で計算出来る。
E(di)=2|(di/2β)+0.25|+β+0.5 式(26)
符号長E(di)は式(27)で近似出来る。
E (d i ) = 2 | (d i / 2 β ) +0.25 | + β + 0.5 Equation (26)
The code length E (d i ) can be approximated by equation (27).
このように近似したE(di)を振幅diで微分する(式(28))。
重み係数行列Wは、重み係数算出部31でフレームの各サンプル毎に式(33)で重みを計算し、その重みを重み係数行列生成部32で対角要素に割り付けることで得られる。
The weighting coefficient matrix W is obtained by calculating weights for each sample of the frame by the weighting
ただし暫定的な振幅が2βに近い暫定予測誤差信号は予測係数が更新される時に、振幅が2βより大きくなる場合も考えられるので、図9に示すような重み係数γを使えばよい。図9の横軸は、暫定予測誤差信号の振幅であり、縦軸は重みγである。可変長符号化開始ビットβ以上の暫定予測誤差信号には、式(33)で計算される重み係数を掛ける。つまり、振幅の大きな暫定予測誤差信号は軽視するように小さな重み係数を掛ける。可変長符号化開始ビットβ未満の暫定予測誤差サンプルは、つまり重さ1を乗算する。又は、可変長符号化開始ビットβ未満の暫定予測誤差には、図10中に破線で示すように符号長2βに対する重み係数よりも小さな重み係数を掛けてもよい。
また、式(33)のように各サンプル毎に重みを計算するのではなく、図10に示すような符号長の範囲毎に所定の重みを決めておく離散的な重み係数を用いてもよい。符号長の所定の範囲毎に重みを決めておくことで、重み係数算出部31で重みを計算する手間が省ける。
実施例4の主要な処理の流れを図11に示す。実施例4では、実施例2の主要な処理の流れを示した図5の、暫定予測誤差信号を生成するステップS20と予測係数を算出するステップS22との間に、暫定予測誤差信号の絶対値平均値τを算出するステップS80と、絶対値平均値τから可変長符号化開始ビットβを算出するステップS82とが設けられている点のみが異なる。ステップS80の処理は、上記した式(24)を計算するものであり、ステップS82は、上記した式(25)を計算するものである。したがって説明は省略する。
However provisional prediction error signal close tentative amplitude to 2 beta when the prediction coefficients are updated, since it is conceivable if the amplitude is greater than 2 beta, may use the weighting factor γ as shown in Fig. The horizontal axis in FIG. 9 is the amplitude of the provisional prediction error signal, and the vertical axis is the weight γ. The provisional prediction error signal equal to or greater than the variable length coding start bit β is multiplied by the weighting coefficient calculated by Expression (33). That is, the provisional prediction error signal having a large amplitude is multiplied by a small weighting factor so as to be neglected. A provisional prediction error sample less than the variable length coding start bit β is multiplied by a weight of 1. Alternatively, the provisional prediction error less than the variable length coding start bit β may be multiplied by a weighting factor smaller than the weighting factor for the
Further, instead of calculating the weight for each sample as shown in Expression (33), a discrete weight coefficient for determining a predetermined weight for each code length range as shown in FIG. 10 may be used. . By determining the weight for each predetermined range of the code length, the weight
The main processing flow of the fourth embodiment is shown in FIG. In the fourth embodiment, the absolute value of the temporary prediction error signal between step S20 for generating the temporary prediction error signal and step S22 for calculating the prediction coefficient in FIG. 5 showing the main processing flow of the second embodiment. The only difference is that step S80 for calculating the average value τ and step S82 for calculating the variable length coding start bit β from the absolute value average value τ are provided. The process of step S80 is to calculate the above equation (24), and step S82 is to calculate the above equation (25). Therefore, explanation is omitted.
〔シミュレーション結果〕
例えば、MPEG標準ではライス符号を使用することが決められている。そこで、ライス符号を使用する前提でシミュレーションを行う。ライス符号を使うと、フレーム内の予測誤差信号毎の符号長の総和の符号量は、各予測誤差信号の振幅の絶対値の大きさに比例する。フレーム内の符号量の総和を最小にすることは、各予測誤差信号の振幅の絶対値の総和を最小化することで近似出来る。
従来の線形予測では二乗誤差を最小化する基準で予測係数を求め、その予測係数から予測誤差信号を求めていたので、予測誤差信号の符号量の総和は必ずしも最小化されない。
〔simulation result〕
For example, in the MPEG standard, it is decided to use a rice code. Therefore, the simulation is performed on the assumption that the Rice code is used. When the Rice code is used, the code amount of the total code length for each prediction error signal in the frame is proportional to the absolute value of the amplitude of each prediction error signal. Minimizing the sum of the code amounts in the frame can be approximated by minimizing the sum of the absolute values of the amplitudes of the prediction error signals.
In conventional linear prediction, a prediction coefficient is obtained on the basis of minimizing the square error, and a prediction error signal is obtained from the prediction coefficient. Therefore, the sum of the code amounts of the prediction error signal is not necessarily minimized.
そこで、極端な入力系列の一例を示し、この発明の効果を確認する。例えば、入力系列としてフレーム内のサンプル数を1024個とし、図12に示すように先頭のサンプルx0=10、2個目のサンプルx1=−1000、以降のサンプルは10又は−10の振幅が交互に並ぶ系列を考える。
di=xi−αxi−1を使って具体例を示す。通常の一次の線形予測係数αは、一次の相関係数/エネルギー(二乗和)であるからα=(−10000−10000+(−100)×1021)/(1000×1000+10×10×1023)=−122100/1102300=−0.1108となる。
この予測係数αを用いて予測誤差を求めると、つまり上記した式(1)を計算し、整数化すると、d0=10、d1=−1000+10×0.1108=−999、d2=10−(−1000)×(−0.1108)=−101、d3=−9、d4=9、‥‥、d1023=−9、diを四捨五入して整数化した二乗和は1091003となる。
Therefore, an example of an extreme input sequence is shown to confirm the effect of the present invention. For example, the number of samples in a frame is 1024 as an input sequence, and the first sample x 0 = 10, the second sample x 1 = −1000, and the subsequent samples have an amplitude of 10 or −10 as shown in FIG. Consider a series of alternating lines.
A specific example is shown using d i = x i −αx i−1 . Since the normal first-order linear prediction coefficient α is a first-order correlation coefficient / energy (sum of squares), α = (− 10000−10000 + (− 100) × 1021) / (1000 × 1000 + 10 × 10 × 1023) = − 122100/1102300 = −0.1108
When the prediction error is obtained using the prediction coefficient α, that is, when the above-described equation (1) is calculated and converted into an integer, d 0 = 10, d 1 = −1000 + 10 × 0.1108 = −999, d 2 = 10− ( -1000) × (-0.1108) = - 101,
この発明の振幅の絶対値の総和を最小化する近似を用いて予測誤差を求める。重み係数Wを例えば0.1として線形予測係数αを求めると、α=(−10000×W−10000×W+(−100)×1021)/(1000×1000×W+10×10×1023)=−0.51458となる。α=−0.5として予測誤差を求める。d0=10、d1=−1000+10×0.5=−995、d2=10−(−1000)×(−0.5)=490、d3=−5、d4=5、‥‥、d1023=−5、diの二乗和は1255750となる。
二乗誤差の総和を最小にする方法で求めた予測誤差の二乗和と、絶対値の総和を最小にする方法で求めた予測誤差の二乗和とを比較すると、1091003に対して1255750であり、この発明の絶対値の総和を最小にする方法の方が大きい。
しかし、予測誤差diの絶対値の和を四捨五入した値で比較すると、二乗誤差の総和を最小にする方法では10299であり、絶対値の総和を最小にする方法では6600である。このようにこの発明の暫定予測誤差(予測誤差)の振幅の絶対値の総和を最小にする方法で求めた符号量の方が少ない。したがって、ライス符号化した符号量もこの発明の方が少なくなる。
The prediction error is obtained using the approximation that minimizes the sum of the absolute values of the amplitudes of the present invention. When the linear prediction coefficient α is obtained by setting the weighting coefficient W to 0.1, for example, α = (− 10000 × W−10000 × W + (− 100) × 1021) / (1000 × 1000 × W + 10 × 10 × 1023) = − 0.51458 It becomes. The prediction error is obtained with α = −0.5. d 0 = 10, d 1 = −1000 + 10 × 0.5 = −995, d 2 = 10 − (− 1000) × (−0.5) = 490, d 3 = −5, d 4 = 5,..., d 1023 = -5, square sum of the d i becomes 1,255,750.
Comparing the sum of squares of prediction errors obtained by the method of minimizing the sum of square errors with the sum of squares of prediction errors obtained by the method of minimizing the sum of absolute values, it is 1255750 to 1091003. The method of minimizing the sum of the absolute values of the invention is larger.
However, when the sum of the absolute values of the prediction errors d i is compared to a rounded value, the method that minimizes the sum of the square errors is 10299, and the method that minimizes the sum of the absolute values is 6600. Thus, the code amount obtained by the method of minimizing the sum of the absolute values of the provisional prediction errors (prediction errors) of the present invention is smaller. Therefore, the amount of code encoded by Rice is also smaller in the present invention.
次に、二乗誤差の総和を最小にする従来法と、絶対値の総和を最小にするこの発明による符号量の比較を、予測次数を変えて行なった結果を図13に示す。図13の横軸は予測次数を示し、縦軸は圧縮率を%で示す。圧縮率は、分母を通常のPCM符号の場合の符号量とした値である。
シミュレーション条件:予測次数を8次、16次、32次、64次として、サンプリングレートを48kHz,16bitと、48kHz,24bitと、96kHz,24bitと、192kHz,24bitとした各30秒のファイルの51個分の符号量の比較を行なった。
図13は、51個分のファイルの符号量の平均値を比較したものである。予測次数8次では、従来法の圧縮率≒49.32%に対してこの発明の圧縮率≒49.29%であり、約0.03%符号量が削減されている。予測次数16次では、従来法の圧縮率≒47.68%に対してこの発明の圧縮率≒47.64%であり、約0.04%符号量が削減されている。予測次数32次では、従来法の圧縮率≒47.5%に対してこの発明の圧縮率≒47.45%であり、約0.05%符号量が削減されている。予測次数64次では、従来法の圧縮率≒47.5%に対してこの発明の圧縮率≒47.41%であり、約0.09%符号量が削減されている。
Next, FIG. 13 shows the result of comparison between the conventional method for minimizing the sum of squared errors and the code amount according to the present invention for minimizing the sum of absolute values while changing the prediction order. The horizontal axis in FIG. 13 indicates the predicted order, and the vertical axis indicates the compression rate in%. The compression rate is a value in which the denominator is a code amount in the case of a normal PCM code.
Simulation conditions: 51 files of 30 seconds each with predicted orders of 8th, 16th, 32nd, 64th and sampling rates of 48kHz, 16bit, 48kHz, 24bit, 96kHz, 24bit, 192kHz, 24bit The code amount of the minute was compared.
FIG. 13 shows a comparison of average values of code amounts of 51 files. In the predicted
このようにどの次数でも符号量が削減できていることが分かる。なお、従来法に対する符号量の削減率が少ないような印象を受けるが、一般的に音声予測符号化装置等において符号量を1%減らすことは難しいことである。したがって、この発明による0.03〜0.09%の符号量の削減は、実用上大きな効果である。また、一次の具体例で示したように少数のサンプルが非常に大きな値をとるような場合の効果は非常に大きい。
以上の各実施例の他、この発明である各装置及び方法は上述の実施形態に限定されるものではなく、この発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記装置及び方法において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。
Thus, it can be seen that the code amount can be reduced at any order. In addition, although the impression that the reduction rate of the code amount with respect to the conventional method is small is received, it is generally difficult to reduce the code amount by 1% in a speech predictive encoding device or the like. Therefore, the reduction of the code amount of 0.03 to 0.09% according to the present invention is a great effect in practical use. Further, as shown in the first specific example, the effect is very large when a small number of samples have a very large value.
In addition to the above embodiments, each apparatus and method according to the present invention is not limited to the above-described embodiment, and can be appropriately changed without departing from the spirit of the present invention. Further, the processes described in the above apparatus and method are not only executed in time series according to the order of description, but also may be executed in parallel or individually as required by the processing capability of the apparatus that executes the process. Good.
また、上記各装置における処理機能をコンピュータによって実現する場合、線形予測係数算出装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記線形予測係数算出装置における処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記憶媒体に記憶しておくことができる。コンピュータで読み取り可能な記憶媒体としては、例えば、磁気記憶装置、光ディスク、光磁気記憶媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記憶装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記憶媒体として、MO(Magneto Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
In addition, when the processing functions in the above devices are realized by a computer, the processing contents of the functions that the linear prediction coefficient calculation device should have are described by a program. Then, by executing this program on a computer, the processing function in the linear prediction coefficient calculation device is realized on the computer.
The program describing the processing contents can be stored in a computer-readable storage medium. The computer-readable storage medium may be any medium such as a magnetic storage device, an optical disk, a magneto-optical storage medium, and a semiconductor memory. Specifically, for example, as a magnetic storage device, a hard disk device, a flexible disk, a magnetic tape, etc., and as an optical disk, a DVD (Digital Versatile Disc), a DVD-RAM (Random Access Memory), a CD-ROM (Compact Disc Read Only) Memory), CD-R (Recordable) / RW (ReWritable), etc., magneto-optical storage media, MO (Magneto Optical disc), etc., semiconductor memory, EEP-ROM (Electronically Erasable and Programmable-Read Only Memory), etc. Can be used.
また、このプログラムの流通は、例えば、そのプログラムを記憶したDVD、CD−ROM等の可搬型記憶媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記憶媒体に記憶されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記憶媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記憶媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、この形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
The program is distributed by selling, transferring, or lending a portable storage medium such as a DVD or CD-ROM storing the program, for example. Furthermore, the program may be distributed by storing the program in a storage device of the server computer and transferring the program from the server computer to another computer via a network.
For example, a computer that executes such a program first stores a program stored in a portable storage medium or a program transferred from a server computer in its own storage device. When executing the process, this computer reads a program stored in its own storage medium and executes a process according to the read program. As another execution form of the program, the computer may read the program directly from the portable storage medium and execute processing according to the program, and the program is transferred from the server computer to the computer. Each time, the processing according to the received program may be executed sequentially. Also, the program is not transferred from the server computer to the computer, and the above-described processing is executed by a so-called ASP (Application Service Provider) type service that realizes the processing function only by the execution instruction and result acquisition. It is good. Note that the program in this embodiment includes information that is used for processing by an electronic computer and that conforms to the program (data that is not a direct command to a computer but has a property that defines the processing of the computer).
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、各装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。 In this embodiment, each apparatus is configured by executing a predetermined program on a computer. However, at least a part of these processing contents may be realized by hardware.
Claims (20)
上記フレーム毎に線形予測係数を求めて暫定予測係数を生成し、上記暫定予測係数に基づく予測誤差信号を求めて暫定予測誤差信号として出力する暫定予測係数生成部と、
上記フレーム毎の離散的時系列ディジタル信号と上記暫定予測誤差信号とを入力とし、上記暫定予測誤差信号の振幅の絶対値を近似する微分可能な連続関数の各次の線形予測係数の偏微分が、全て0となる線形予測係数を生成する予測係数算出部とを、
具備する線形予測係数算出手段を備えることを特徴とする線形予測係数算出装置。 In a linear prediction coefficient calculation apparatus that receives an output signal of a frame division unit that divides a discrete time series digital signal into frames for each predetermined number of samples and generates an all-polar linear prediction coefficient from the time series signal for each frame. ,
A provisional prediction coefficient generating unit that obtains a linear prediction coefficient for each frame to generate a provisional prediction coefficient, obtains a prediction error signal based on the provisional prediction coefficient, and outputs the prediction error signal;
The partial differential of each linear predictive coefficient of a differentiable continuous function that takes the discrete time series digital signal for each frame and the provisional prediction error signal as inputs and approximates the absolute value of the amplitude of the provisional prediction error signal is A prediction coefficient calculation unit that generates linear prediction coefficients that are all 0,
A linear prediction coefficient calculation device comprising linear prediction coefficient calculation means.
上記予測係数算出部は、重み係数行列を生成する重み係数行列生成部を具備し、
上記予測係数算出部は、各次の線形予測係数を求める正規方程式に対角成分のみの上記重み係数行列を掛けて上記線形予測係数を生成するものであることを特徴とする線形予測係数算出装置。 The linear prediction coefficient calculation apparatus according to claim 1,
The prediction coefficient calculation unit includes a weight coefficient matrix generation unit that generates a weight coefficient matrix,
The prediction coefficient calculation unit generates the linear prediction coefficient by multiplying a normal equation for obtaining each linear prediction coefficient by the weighting coefficient matrix of only a diagonal component. .
上記予測係数算出部は、上記暫定予測誤差信号から重み係数を算出する重み係数算出部を具備し、上記重み係数行列生成部は、上記重み係数算出部が算出した重み係数を上記重み係数行列の対角成分に割り付けるものであることを特徴とする線形予測係数算出装置。 In the linear prediction coefficient calculation apparatus according to claim 2,
The prediction coefficient calculation unit includes a weight coefficient calculation unit that calculates a weight coefficient from the provisional prediction error signal, and the weight coefficient matrix generation unit uses the weight coefficient calculated by the weight coefficient calculation unit as the weight coefficient matrix. A linear prediction coefficient calculation apparatus characterized by being assigned to a diagonal component.
上記予測係数算出部は、上記暫定予測誤差信号の絶対値平均値を計算する絶対値平均部と、可変長符号化開始ビット数を決定する可変長符号化開始ビット計算部とからなる可変長符号化開始ビット設定部を具備し、
上記予測係数算出部は、上記可変長符号化開始ビット設定部が設定した可変長符号化開始ビット数以上の、上記暫定予測誤差信号の振幅の絶対値を近似する微分可能な連続関数の各次の線形予測係数の偏微分が、全て0となる線形予測係数を生成するものであることを特徴とする線形予測係数算出装置。 In the linear prediction coefficient calculation apparatus in any one of Claims 1 thru | or 3,
The prediction coefficient calculation unit includes a variable length code including an absolute value average unit that calculates an absolute value average value of the provisional prediction error signal and a variable length encoding start bit calculation unit that determines the number of variable length encoding start bits. A start bit setting unit,
The prediction coefficient calculation unit is configured to calculate each order of a differentiable continuous function that approximates the absolute value of the amplitude of the provisional prediction error signal that is equal to or greater than the number of variable length coding start bits set by the variable length coding start bit setting unit. A linear prediction coefficient calculation apparatus that generates a linear prediction coefficient in which partial differentiation of the linear prediction coefficient is all zero.
上記可変長符号化開始ビット数未満の上記暫定予測誤差信号に掛けられる重みは、上記可変長符号化開始ビットに掛けられる重み以下であることを特徴とする線形予測係数算出装置。 In the linear prediction coefficient calculation apparatus according to claim 4,
The linear prediction coefficient calculation apparatus according to claim 1, wherein a weight applied to the provisional prediction error signal less than the number of variable length coding start bits is equal to or less than a weight applied to the variable length coding start bit.
上記暫定予測誤差生成部は、上記フレーム分割部が出力する少なくとも1フレーム分の上記離散的時系列ディジタル信号を記憶し、上記複数フレーム中の指定されたフレームの上記離散的時系列ディジタル信号を順次出力するバッファ部を具備し、
上記予測係数算出部は、更に上記フレーム毎に線形予測係数を求める動作を繰り返す繰り返し部と、上記繰り返し部の繰り返し動作を終了させるか否かを判定し、終了時に上記繰り返し部へ終了信号を出力する終了判定部とを、具備するものであることを特徴とする線形予測係数算出装置。 The linear prediction coefficient calculation apparatus according to any one of claims 1 to 5,
The provisional prediction error generation unit stores at least one frame of the discrete time-series digital signal output from the frame division unit, and sequentially stores the discrete time-series digital signals of designated frames in the plurality of frames. A buffer unit for output;
The prediction coefficient calculation unit further determines a repetition unit that repeats an operation for obtaining a linear prediction coefficient for each frame, and determines whether or not to end the repetition operation of the repetition unit, and outputs an end signal to the repetition unit when the operation ends. A linear prediction coefficient calculation apparatus comprising: an end determination unit that performs the determination.
上記終了判定部は、上記繰り返し部の繰り返し回数が所定回数に達すると、終了信号を出力する回数判定部を具備するものであることを特徴とする線形予測係数算出装置。 The linear prediction coefficient calculation apparatus according to claim 6,
The linear prediction coefficient calculation apparatus according to claim 1, wherein the end determination unit includes a number determination unit that outputs an end signal when the number of repetitions of the repetition unit reaches a predetermined number.
上記終了判定部は、上記繰り返し求められた前回の線形予測係数の絶対値和と今回の線形予測係数の絶対値和の差が所定値以下になると、終了信号を出力する収束判定部を具備するものであることを特徴とする線形予測係数算出装置。 The linear prediction coefficient calculation apparatus according to claim 6,
The end determination unit includes a convergence determination unit that outputs an end signal when the difference between the absolute value sum of the previous linear prediction coefficient obtained repeatedly and the absolute value sum of the current linear prediction coefficient is equal to or less than a predetermined value. An apparatus for calculating a linear prediction coefficient, wherein
上記終了判定部は、上記繰り返し部が線形予測係数を求める動作を繰り返すたびにフレ
ーム内の符号量を算出する符号量算出部と、上記算出された符号量をそれまで算出された
符号量と比較し、符号量が最小になった時に終了信号を出力する符号量判定部を具備する
ものであることを特徴とする線形予測係数算出装置。 The linear prediction coefficient calculation apparatus according to claim 6,
The termination determination unit compares a code amount calculation unit that calculates a code amount in a frame each time the repetition unit repeats an operation for obtaining a linear prediction coefficient, and compares the calculated code amount with a code amount calculated so far. And a linear prediction coefficient calculation apparatus comprising a code amount determination unit that outputs an end signal when the code amount becomes minimum.
暫定予測計数生成部が、上記フレーム毎に線形予測係数を求めて暫定予測係数を生成して上記暫定予測係数に基づく予測誤差信号を求めて暫定予測誤差信号として出力する過程を備え、
予測係数算出部が、上記フレーム毎の離散的時系列ディジタル信号と上記暫定予測誤差信号を入力とし、上記予測誤差信号の振幅の絶対値を近似する微分可能な連続関数の各次の線形予測係数の偏微分が、全て0となる線形予測係数を生成する過程を備えたことを特徴とする線形予測係数算出方法。 In the linear prediction coefficient calculation method for generating an all-pole prediction coefficient from the time series signal for each frame, using the output signal of the frame division unit that divides the discrete time series digital signal into frames for each predetermined number of samples.
The provisional prediction count generation unit includes a process of obtaining a linear prediction coefficient for each frame, generating a provisional prediction coefficient, obtaining a prediction error signal based on the provisional prediction coefficient, and outputting the prediction error signal as a provisional prediction error signal,
The prediction coefficient calculation unit receives the discrete time series digital signal for each frame and the provisional prediction error signal, and each linear prediction coefficient of a differentiable continuous function that approximates the absolute value of the amplitude of the prediction error signal. A method for calculating a linear prediction coefficient, comprising a step of generating a linear prediction coefficient in which partial differentiation of all becomes zero.
上記線形予測係数を生成する過程は、上記各次の線形予測係数を求める正規方程式に対角成分のみの重み係数行列を掛ける過程を含むことを特徴とする線形予測係数算出方法。 The linear prediction coefficient calculation method according to claim 10,
The method of generating a linear prediction coefficient includes a step of multiplying a normal equation for obtaining each linear prediction coefficient by a weight coefficient matrix of only diagonal components.
上記線形予測係数を生成する過程は、上記暫定予測誤差信号から重み係数を算出する重み係数算出過程を含むことを特徴とする線形予測係数算出方法。 The linear prediction coefficient calculation method according to claim 10,
The method of generating a linear prediction coefficient includes a weighting coefficient calculation process of calculating a weighting coefficient from the provisional prediction error signal.
上記暫定予測誤差生成部が、上記フレーム分割部が出力する複数フレームに渡って上記離散的時系列ディジタル信号を記憶し、上記複数のフレーム中の指定されたフレームの上記離散的時系列ディジタル信号を順次出力する過程を有し、
上記線形予測係数を生成する過程は、上記フレーム毎に線形予測係数を求める動作を終了判定部が終了信号を出力するまで、繰り返す過程を含むことを特徴とする線形予測係数算出方法。 The linear prediction coefficient calculation method according to any one of claims 10 to 12,
The provisional prediction error generation unit stores the discrete time series digital signal over a plurality of frames output from the frame division unit, and the discrete time series digital signal of a specified frame in the plurality of frames. Have the process of outputting sequentially,
The process of generating the linear prediction coefficient includes a process of repeating the operation of obtaining the linear prediction coefficient for each frame until the end determination unit outputs an end signal.
上記終了信号を出力する過程は、上記繰り返す過程の繰り返し回数が、所定回数に達すると終了信号を出力する過程であることを特徴とする線形予測係数算出方法。 The linear prediction coefficient calculation method according to claim 13,
The method of calculating a linear prediction coefficient, wherein the process of outputting the end signal is a process of outputting an end signal when the number of repetitions of the repeating process reaches a predetermined number.
上記終了信号を出力する過程は、上記繰り返し求められた前回と今回の線形予測係数の絶対値和を計算する過程を含み、前回と今回の上記絶対値和の差が所定値以下になると終了信号を出力する過程であることを特徴とする線形予測係数算出方法。 The linear prediction coefficient calculation method according to claim 13,
The process of outputting the end signal includes a process of calculating the sum of absolute values of the previous and current linear prediction coefficients obtained repeatedly. When the difference between the sum of absolute values of the previous time and the current time is less than a predetermined value, the end signal is output. A linear prediction coefficient calculation method characterized by being a process of outputting.
上記終了信号を出力する過程は、上記フレーム内の予測誤差信号の符号量を計算する過程を含み、上記繰り返し求められた前回と今回の線形予測係数に基づく上記符号量が最小になった時に終了信号を出力する過程であることを特徴とする線形予測係数算出方法。 The linear prediction coefficient calculation method according to claim 13,
The process of outputting the end signal includes a process of calculating the code amount of the prediction error signal in the frame, and ends when the code amount based on the previous and current linear prediction coefficients obtained repeatedly is minimized. A method for calculating a linear prediction coefficient, which is a process of outputting a signal.
上記線形予測係数を生成する過程は、上記暫定予測誤差信号から可変長符号化開始ビット数を決定する過程を含み、
上記可変長符号化開始ビット数を決定する過程で決められた可変長符号化開始ビットと、上記暫定予測誤差信号とから符号長を算出する過程を含むことを特徴とする線形予測係数算出方法。 The linear prediction coefficient calculation method according to any one of claims 13 to 16,
The step of generating the linear prediction coefficient includes a step of determining a variable length coding start bit number from the provisional prediction error signal,
A linear prediction coefficient calculation method comprising a step of calculating a code length from the variable length coding start bit determined in the step of determining the variable length coding start bit number and the provisional prediction error signal.
上記符号長を算出する過程は、上記可変長符号化開始ビット数以下の符号に重みを掛ける過程を含み、上記重みは、可変長符号化開始ビットに掛けられる重み以下であることを特徴とする線形予測係数算出方法。 The linear prediction coefficient calculation method according to claim 17,
The process of calculating the code length includes a process of applying a weight to a code having the number of variable length coding start bits or less, wherein the weight is less than or equal to a weight to be applied to the variable length coding start bit. Linear prediction coefficient calculation method.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2006343319A JP4746532B2 (en) | 2006-12-20 | 2006-12-20 | Linear prediction coefficient calculation method, apparatus thereof, program thereof, and storage medium thereof |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2006343319A JP4746532B2 (en) | 2006-12-20 | 2006-12-20 | Linear prediction coefficient calculation method, apparatus thereof, program thereof, and storage medium thereof |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2008157998A JP2008157998A (en) | 2008-07-10 |
| JP4746532B2 true JP4746532B2 (en) | 2011-08-10 |
Family
ID=39659006
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2006343319A Active JP4746532B2 (en) | 2006-12-20 | 2006-12-20 | Linear prediction coefficient calculation method, apparatus thereof, program thereof, and storage medium thereof |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4746532B2 (en) |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP4870635B2 (en) * | 2007-09-05 | 2012-02-08 | 日本電信電話株式会社 | Linear prediction coefficient calculation method, apparatus, program, and recording medium |
| JP4918103B2 (en) * | 2009-01-09 | 2012-04-18 | 日本電信電話株式会社 | Encoding method, decoding method, apparatus thereof, program, and recording medium |
| US8576910B2 (en) | 2009-01-23 | 2013-11-05 | Nippon Telegraph And Telephone Corporation | Parameter selection method, parameter selection apparatus, program, and recording medium |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS4918007B1 (en) * | 1969-05-27 | 1974-05-07 | ||
| JPS597400B2 (en) * | 1981-03-27 | 1984-02-17 | 株式会社東芝 | speech analysis device |
| JP2734995B2 (en) * | 1994-08-22 | 1998-04-02 | 日本電気株式会社 | Spectrum parameter extraction device |
-
2006
- 2006-12-20 JP JP2006343319A patent/JP4746532B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| JP2008157998A (en) | 2008-07-10 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5603484B2 (en) | Encoding method, decoding method, encoding device, decoding device, program, recording medium | |
| JP4691082B2 (en) | Linear prediction model order determination apparatus, linear prediction model order determination method, program thereof, and recording medium | |
| JP6422813B2 (en) | Encoding device, decoding device, method and program thereof | |
| US20070118370A1 (en) | Methods and apparatuses for variable dimension vector quantization | |
| KR101661917B1 (en) | Encoding method, encoder, program and recording medium | |
| JP4634969B2 (en) | Linear prediction model order determination apparatus, linear prediction model order determination method, program thereof, and recording medium | |
| JP4691050B2 (en) | PARCOR coefficient calculation method, apparatus thereof, program thereof, and storage medium thereof | |
| US20130101028A1 (en) | Encoding method, decoding method, device, program, and recording medium | |
| CN120898241A (en) | Audio is generated using non-autoregressive decoding. | |
| JP4746532B2 (en) | Linear prediction coefficient calculation method, apparatus thereof, program thereof, and storage medium thereof | |
| JP2013120225A (en) | Encoding method, encoding device, program, and recording medium | |
| JP4658852B2 (en) | Adaptive block length encoding apparatus, method thereof, program and recording medium | |
| JP6216809B2 (en) | Parameter adjustment system, parameter adjustment method, program | |
| EP3786949B1 (en) | Coding of a sound signal | |
| JP4989095B2 (en) | Multi-channel encoding method, apparatus thereof, program thereof and recording medium | |
| JP2800599B2 (en) | Basic period encoder | |
| JP5361565B2 (en) | Encoding method, decoding method, encoder, decoder and program | |
| JP2009210644A (en) | Linear prediction coefficient calculator, linear prediction coefficient calculation method, linear prediction coefficient calculation program, and storage medium | |
| JP5789816B2 (en) | Encoding apparatus, method, program, and recording medium | |
| JPWO2019107041A1 (en) | Pitch enhancer, its method, and program | |
| JP5786044B2 (en) | Encoding method, encoding apparatus, decoding method, decoding apparatus, program, and recording medium | |
| JP2019197150A (en) | Pitch emphasis device, method thereof, and program | |
| JP2001228900A (en) | Computer-readable recording medium describing a speech parameter coding device, a coding method used in the device, and a coding algorithm thereof, a voice parameter quantization device, a quantization method used in the device, and a quantization algorithm thereof Computer-readable recording medium describing | |
| JPH11119799A (en) | Audio encoding method and audio encoding device | |
| JP3092344B2 (en) | Audio coding device |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090105 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110307 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110506 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110513 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140520 Year of fee payment: 3 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 4746532 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
| R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
| R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |