Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP4746532B2 - Linear prediction coefficient calculation method, apparatus thereof, program thereof, and storage medium thereof - Google Patents
[go: Go Back, main page]

JP4746532B2 - Linear prediction coefficient calculation method, apparatus thereof, program thereof, and storage medium thereof - Google Patents

Linear prediction coefficient calculation method, apparatus thereof, program thereof, and storage medium thereof Download PDF

Info

Publication number
JP4746532B2
JP4746532B2 JP2006343319A JP2006343319A JP4746532B2 JP 4746532 B2 JP4746532 B2 JP 4746532B2 JP 2006343319 A JP2006343319 A JP 2006343319A JP 2006343319 A JP2006343319 A JP 2006343319A JP 4746532 B2 JP4746532 B2 JP 4746532B2
Authority
JP
Japan
Prior art keywords
prediction coefficient
linear prediction
coefficient calculation
unit
provisional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2006343319A
Other languages
Japanese (ja)
Other versions
JP2008157998A (en
Inventor
健弘 守谷
登 原田
優 鎌本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
NTT Inc USA
Original Assignee
Nippon Telegraph and Telephone Corp
NTT Inc USA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp, NTT Inc USA filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2006343319A priority Critical patent/JP4746532B2/en
Publication of JP2008157998A publication Critical patent/JP2008157998A/en
Application granted granted Critical
Publication of JP4746532B2 publication Critical patent/JP4746532B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

この発明は、例えば音声音響信号などの分析や符号化のための線形予測分析技術を利用する音声予測符号化装置等に用いて好適な、線形予測係数算出方法及び、その装置、そのプログラムとそのプログラムを記憶する記憶媒体に関する。   The present invention relates to a linear prediction coefficient calculation method suitable for use in, for example, a speech prediction encoding apparatus that uses a linear prediction analysis technique for analysis and encoding of a speech sound signal and the like, an apparatus thereof, a program thereof, and a The present invention relates to a storage medium for storing a program.

従来から線形予測分析手法のひとつとして自己相関法や共分散法がよく知られている。いずれも予測誤差のエネルギーを最小にすることを目的としている。この線形予測分析手法を音声音響信号に利用した一例として、音声予測符号化装置130を図14に示し、その動作を説明する。
音声予測符号化装置130は、入力端子132から入力される離散的時系列ディジタル信号x,(i:整数、以降、ディジタル信号xと称す)を、所定サンプル数Nごとのフレームに分割するフレーム分割部134と、各フレーム毎にディジタル信号xの線形予測分析を行いp個の線形予測係数α,(j=0,‥‥,p)を計算して線形予測誤差信号dを出力する線形予測分析部136と、線形予測分析部136が出力する線形予測誤差信号dを符号化する誤差符号化部138と、線形予測分析部136が出力する線形予測係数αを符号化する係数符号化部140とから構成される。
Conventionally, autocorrelation method and covariance method are well known as one of linear prediction analysis methods. Both aim to minimize the energy of prediction errors. As an example of using this linear predictive analysis method for a speech acoustic signal, a speech predictive coding device 130 is shown in FIG. 14 and its operation will be described.
Speech predictive coding apparatus 130 divides discrete time-series digital signal x i (i: integer, hereinafter referred to as digital signal x i ) input from input terminal 132 into frames for each predetermined number of samples N. The frame division unit 134 performs linear prediction analysis of the digital signal x i for each frame and calculates p linear prediction coefficients α j , (j = 0,..., P) to obtain the linear prediction error signal d i . The linear prediction analysis unit 136 to output, the error encoding unit 138 to encode the linear prediction error signal d i output from the linear prediction analysis unit 136, and the linear prediction coefficient α j output from the linear prediction analysis unit 136 are encoded. And a coefficient encoding unit 140.

線形予測分析部136は、全極型(自己回帰型前方予測)であり、線形予測誤差信号dを最小にするp個の線形予測係数αを計算する線形予測係数算出部136aと、線形予測係数算出部136aで計算された線形予測係数αと、ディジタル信号xとから予測値を計算する線形予測部136bと、ディジタル信号xから予測値を減算して線形予測誤差信号dを生成する減算部136cとで構成される。
線形予測分析部136は、ディジタル信号xに対し、p個の線形予測係数αにより式(1)に示すようにして線形予測誤差信号dを求める。

Figure 0004746532
線形予測誤差信号系列dを行列で書くと式(2)のようになる。
D=X−YA 式(2) The linear prediction analysis unit 136 is an all-pole type (autoregressive type forward prediction), linear prediction coefficient calculation unit 136a that calculates p linear prediction coefficients α j that minimize the linear prediction error signal d i , and linear a linear prediction coefficients alpha j calculated by the prediction coefficient calculation unit 136a, a digital signal x and the linear prediction unit 136b that calculates a prediction value from the i, digital signal by subtracting the predicted values from x i the linear prediction error signal d i It is comprised with the subtraction part 136c which produces | generates.
The linear prediction analysis unit 136 obtains a linear prediction error signal d i for the digital signal x i by using p linear prediction coefficients α j as shown in Expression (1).
Figure 0004746532
When the linear prediction error signal sequence d i is written in a matrix, it becomes as shown in Equation (2).
D = X-YA Formula (2)

ただし、Dは線形予測誤差信号系列のN行1列のベクトル(式(3))、Aは線形予測係数列のN行1列のベクトル(式(4))、Xはディジタル信号列のN行1列のベクトル(式(5))である。それぞれを転置行列で示す。YはN行P列の行列である(式(6))。
=(d,‥‥,dN−1) 式(3)
=(α,‥‥,α) 式(4)
=(x,‥‥,xN−1) 式(5)
Here, D is a vector of N rows and 1 column of the linear prediction error signal sequence (Equation (3)), A is a vector of N rows and 1 column of the linear prediction coefficient sequence (Equation (4)), and X is N of the digital signal sequence. It is a vector of row 1 column (formula (5)). Each is shown as a transposed matrix. Y is a matrix of N rows and P columns (formula (6)).
D T = (d 0 ,..., D N−1 ) Formula (3)
A T = (α 1 ,..., Α p ) Equation (4)
X T = (x 0 ,..., X N−1 ) Expression (5)

Figure 0004746532
線形予測係数算出部136aは、式(7)に示す線形予測誤差信号dの二乗和Jを最小にする線形予測係数αを計算する。
Figure 0004746532
線形予測誤差信号dを最小にするためには、Jについてα(j=1,2,‥‥,p)に関する偏微分を0とおいて解けばよい(式(8))。つまりp個の連立方程式を解く。
Figure 0004746532
そのp個の連立方程式の解は、式(6)に示すN行P列の行列Yの転置行列Yを使った線形予測係数列Aの未知ベクトルを推定する正規方程式(式(9))で与えられる。
Figure 0004746532
The linear prediction coefficient calculation unit 136a calculates a linear prediction coefficient α j that minimizes the sum of squares J of the linear prediction error signal d i shown in Expression (7).
Figure 0004746532
In order to minimize the linear prediction error signal d i , the partial differentiation with respect to α j (j = 1, 2,..., P) with respect to J may be set to 0 (formula (8)). That is, p simultaneous equations are solved.
Figure 0004746532
Solution of the p number of simultaneous equations, normal equations for estimating the unknown vector of linear prediction coefficient string A using a transposed matrix Y T of the matrix Y of N rows P columns shown in Equation (6) (Equation (9)) Given in.

X=YYA 式(9)
正規方程式(式(9))より得られる最小二乗解である線形予測係数列A(α:j=1,‥‥,p)は式(10)で求めることができる。
A=(YY)−1X 式(10)
線形予測部136bは、このようにして求められた線形予測係数αと、ディジタル信号xとで式(11)に示す畳み込み演算で予測値^xを計算する。
Y T X = Y T YA Formula (9)
A linear prediction coefficient sequence A (α j : j = 1,..., P), which is a least square solution obtained from the normal equation (equation (9)), can be obtained by equation (10).
A = (Y T Y) −1 Y T X Formula (10)
Linear prediction unit 136b calculates the predictive value ^ x i In this way, the linear prediction coefficient alpha j obtained by the convolution shown in equation (11) in a digital signal x i calculation.

Figure 0004746532
減算部136cは、ディジタル信号xから整数に四捨五入された予測値^xを引き算して線形予測誤差信号dを生成する。
Figure 0004746532
Subtraction unit 136c generates a linear prediction error signal d i by subtracting the prediction value ^ x i from digital signal x i is rounded to an integer.

減算部136cで生成された線形予測誤差信号dは、誤差符号化部138において、例えばライス符号化やハフマン符号化などでエントロピー符号化され、線形予測誤差符号として出力される。
線形予測係数算出部136aで計算された線形予測係数αも、係数符号化部140で符号化されて出力される。
符号化された線形予測誤差符号と線形予測係数符号は、図示しない復号器に伝送され、復号器において式(12)に示す計算((11)式と同じ整数への四捨五入を含む。今後、特に整数化についてはことわらない)が行われディジタル信号xが再生される。
The linear prediction error signal d i generated by the subtraction unit 136c is entropy-coded by, for example, Rice coding or Huffman coding in the error coding unit 138, and is output as a linear prediction error code.
The linear prediction coefficient α j calculated by the linear prediction coefficient calculation unit 136a is also encoded by the coefficient encoding unit 140 and output.
The encoded linear prediction error code and the linear prediction coefficient code are transmitted to a decoder (not shown), and include the calculation shown in Expression (12) in the decoder (including rounding to the same integer as Expression (11). The digital signal x i is regenerated by changing the integer number).

Figure 0004746532
以上説明した音声予測符号化装置130と復号器の動作を模式的に図15に示す。ディジタル信号xは、音声アナログ信号をディジタル信号xに変換する際のサンプリング周期の時間間隔を空けた離散的時系列情報として音声予測符号化装置130に入力される。線形予測係数算出部136aは、過去のフレーム内のN個(作図の都合により図15ではp個のみ表記)のディジタル信号xから、次のフレームのディジタル信号xを予測するp個の線形予測係数αを計算する。線形予測部136bは、そのp個の線形予測係数αと順次入力されるディジタル信号xとを畳み込み演算して予測値^xを生成する。減算部136cは、ディジタル信号xから予測値^xを引き算して線形予測誤差信号dを出力する。
Figure 0004746532
The operations of the speech predictive coding apparatus 130 and the decoder described above are schematically shown in FIG. Digital signal x i is input to the audio prediction encoding apparatus 130 as a discrete time series information at time intervals of a sampling period when converting an audio analog signal into a digital signal x i. Linear prediction coefficient calculation unit 136a from the digital signal x i of N in a past frame (only p pieces in FIG. 15 for convenience of drawing notation), p number of linear predicting a digital signal x i of the next frame A prediction coefficient α j is calculated. Linear prediction unit 136b generates the p number of the predicted value and the digital signal x i convolution operation to sequentially input the LPC coefficients alpha j ^ x i. Subtraction unit 136c outputs the linear prediction error signal d i by subtracting the prediction value ^ x i from the digital signal x i.

線形予測誤差信号dと線形予測係数αは、それぞれ符号化されて復号器に伝送される。復号器では、p個の線形予測係数αと順次入力される線形予測誤差信号dとから、ディジタル信号出力xsiを再生する。この動作は、フレーム単位でp個の線形予測係数αが計算されて繰り返される。
中田和男、改定音声、1994年、コロナ社、53頁付録4.2 守谷健弘、音声符号化、1998年、電子情報通信学会、12〜13頁
The linear prediction error signal d i and the linear prediction coefficient α j are encoded and transmitted to the decoder. In the decoder, the digital signal output x si is reproduced from the p linear prediction coefficients α j and the linear prediction error signal d i sequentially input. This operation is repeated after p linear prediction coefficients α j are calculated for each frame.
Kazuo Nakata, revised voice, 1994, Corona, page 53, appendix 4.2 Takehiro Moriya, Speech Coding, 1998, IEICE, 12-13

しかしながら従来の方法では、エントロピー符号化された線形予測誤差信号dの符号量が最小にならない。良く知られているようにエントロピー符号化は、発生頻度の対数に符号長を比例させるものである。つまり、発生頻度の大きな入力に、ビット数の少ない符号を割り当てることで、全体の符号量を減らす方法である。通常の音声の圧縮では、符号長が振幅に比例するライス符号が使われ、符号量を最小にするためには振幅の絶対値の和を最小化する必要があり、二乗誤差を最小とする関係から得られた線形予測誤差信号dを、エントロピー符号化しても符号量は最小にならない。
この発明は、このような問題点に鑑みてなされたものであり、二乗誤差最小化ではなく線形予測誤差信号dの振幅の絶対値の最小化の近似をおこなうことで、線形予測誤差信号dをエントロピー符号化する際の符号量を小さくすることが出来る線形予測係数算出方法、及びその装置とそのプログラムと、その記憶媒体を提供することを目的とする。
However, in the conventional method, the code amount of the entropy-coded linear prediction error signal d i is not minimized. As is well known, entropy coding is such that the code length is proportional to the logarithm of occurrence frequency. That is, this is a method of reducing the overall code amount by assigning a code with a small number of bits to an input with a high occurrence frequency. In normal speech compression, a Rice code whose code length is proportional to the amplitude is used, and in order to minimize the amount of code, it is necessary to minimize the sum of the absolute values of the amplitudes, and to minimize the square error Even if the linear prediction error signal d i obtained from the above is entropy-encoded, the code amount is not minimized.
The present invention has been made in view of such a problem. The linear prediction error signal d is approximated by minimizing the absolute value of the amplitude of the linear prediction error signal d i instead of minimizing the square error. It is an object of the present invention to provide a linear prediction coefficient calculation method capable of reducing the code amount when entropy encoding i , an apparatus thereof, a program thereof, and a storage medium thereof.

この発明による線形予測係数算出装置は、離散的時系列ディジタル信号を所定サンプル数毎のフレームに分割するフレーム分割部の出力信号を入力とし、そのフレーム毎の時系列信号から全極型の線形予測係数を生成するものであり、暫定予測誤差生成部と予測係数算出部とを備える。
暫定予測誤差生成部は、フレーム毎に線形予測係数を求めて暫定予測係数を生成し、上記暫定予測係数に基づく予測誤差信号を求めて暫定予測誤差信号として出力する。
予測係数算出部は、フレーム毎の離散的時系列ディジタル信号と暫定予測誤差信号とを入力とし、暫定予測誤差信号の振幅の絶対値を近似する微分可能な連続関数の各次の線形予測係数の偏微分が、全て0となる線形予測係数を生成するものである。
An apparatus for calculating a linear prediction coefficient according to the present invention receives an output signal of a frame division unit that divides a discrete time-series digital signal into frames for each predetermined number of samples, and performs all-pole linear prediction from the time-series signal for each frame. A coefficient is generated, and includes a provisional prediction error generation unit and a prediction coefficient calculation unit.
The provisional prediction error generation unit obtains a linear prediction coefficient for each frame, generates a provisional prediction coefficient, obtains a prediction error signal based on the provisional prediction coefficient, and outputs it as a provisional prediction error signal.
The prediction coefficient calculation unit receives the discrete time-series digital signal for each frame and the provisional prediction error signal as input, and calculates the linear prediction coefficient of each order of a differentiable continuous function that approximates the absolute value of the amplitude of the provisional prediction error signal. A linear prediction coefficient in which the partial differentiation is all 0 is generated.

この発明によれば、線形予測係数を求めるにあたって、従来の二乗誤差を最小にする基準で求めた予測誤差を暫定予測誤差信号として求め、暫定予測誤差信号の振幅の絶対値を微分可能な連続関数に近似し、その連続関数の各次の線形予測係数の偏微分が、全て0となる線形予測係数を生成するので、従来の二乗誤差を基準にした予測誤差の符号量よりも符号量を減らすことが出来る。   According to the present invention, when obtaining a linear prediction coefficient, a continuous function that obtains a prediction error obtained by a conventional criterion for minimizing a square error as a provisional prediction error signal and that can differentiate the absolute value of the amplitude of the provisional prediction error signal. , And the linear derivative of each successive linear prediction coefficient of the continuous function generates a linear prediction coefficient that is all zero, so that the code amount is reduced from the code amount of the prediction error based on the conventional square error. I can do it.

以下、この発明の実施の形態を図面を参照して説明する。複数の図面中同一のものには同じ参照符号を付し、説明は繰り返さない。   Embodiments of the present invention will be described below with reference to the drawings. The same reference numerals are given to the same components in a plurality of drawings, and the description will not be repeated.

この発明の線形予測係数算出装置10の実施例1の機能構成例を図1に示す。この発明の線形予測係数算出装置10は、従来技術の一例として図14に示した音声予測符号化装置130内の線形予測分析部136を構成する線形予測係数算出部136aに相当するものである。
線形予測係数算出装置10は、フレーム分割部134と線形予測係数算出手段50とからなる。線形予測係数算出手段50は、暫定予測誤差生成部20と予測係数算出部30とから構成される。
入力端子132から入力されるディジタル信号x,(i:整数)は、暫定予測誤差生成部20に入力される。暫定予測誤差生成部20は、図14に示した線形予測分析部136そのものである。図14の線形予測係数算出部136aは、暫定予測係数算出部22である。線形予測部136bは暫定線形予測部24である。減算部136cは暫定減算部26である。つまり、実施例1では、暫定的に二乗誤差を最小化する方法でフレーム毎の線形予測誤差信号dを求める。
暫定予測誤差生成部20で求められた線形予測誤差信号dは、従来技術で求めた線形予測誤差信号dと同じものである。
FIG. 1 shows a functional configuration example of the first embodiment of the linear prediction coefficient calculation apparatus 10 according to the present invention. The linear prediction coefficient calculation device 10 of the present invention corresponds to the linear prediction coefficient calculation unit 136a constituting the linear prediction analysis unit 136 in the speech prediction encoding device 130 shown in FIG. 14 as an example of the prior art.
The linear prediction coefficient calculation device 10 includes a frame division unit 134 and a linear prediction coefficient calculation unit 50. The linear prediction coefficient calculation unit 50 includes a provisional prediction error generation unit 20 and a prediction coefficient calculation unit 30.
The digital signal x i , (i: integer) input from the input terminal 132 is input to the provisional prediction error generation unit 20. The provisional prediction error generation unit 20 is the linear prediction analysis unit 136 itself illustrated in FIG. The linear prediction coefficient calculation unit 136a in FIG. 14 is the provisional prediction coefficient calculation unit 22. The linear prediction unit 136b is the provisional linear prediction unit 24. The subtraction unit 136 c is the provisional subtraction unit 26. That is, in the first embodiment, the linear prediction error signal d i for each frame is obtained by a method of temporarily minimizing the square error.
Linear prediction error signal d i obtained by the provisional prediction error generation unit 20 is identical to the linear prediction error signal d i calculated in the prior art.

暫定的に求められた暫定予測誤差信号dの各サンプル(d,d,‥‥,dN−1)の振幅の頻度分布は指数分布で近似できる。暫定予測誤差信号dの振幅の頻度分布を模式的に図2(a)に示す(以降、振幅値も同じ参照符号dで表記する)。図2(a)の横軸は、暫定予測誤差信号dの振幅、縦軸はその頻度である。暫定予測誤差信号dの振幅の頻度分布は、振幅が小さいと頻度Fが高く、振幅が大きいと頻度Fが低くなる。すなわち頻度の対数は振幅に比例する例えば、e−axのような指数関数で近似できる。
これを横軸を時間、縦軸を暫定予測誤差信号dの±振幅で時系列に模式的に表わすと、図2(b)のように表わせる。つまり、振幅の小さな暫定予測誤差信号が多く、振幅の大きな暫定予測誤差信号が少ない。
The frequency distribution of the amplitude of each sample (d 0 , d 2 ,..., D N−1 ) of the provisional prediction error signal d i tentatively obtained can be approximated by an exponential distribution. The frequency distribution of the amplitude of the provisional prediction error signal d i is schematically shown in FIG. 2A (hereinafter, the amplitude value is also expressed by the same reference sign d i ). The horizontal axis in FIG. 2 (a), the amplitude of the provisional prediction error signal d i, the vertical axis represents its frequency. Frequency distribution of the amplitude of the provisional prediction error signal d i is the frequency F is higher amplitude is small, the frequency F is decreased the amplitude is large. That is, the logarithm of the frequency can be approximated by an exponential function such as e- ax , which is proportional to the amplitude.
The horizontal axis represents time this and schematically represented in a time series on the vertical axis ± amplitude interim prediction error signal d i, expressed as in FIG. 2 (b). That is, there are many provisional prediction error signals with small amplitude and few provisional prediction error signals with large amplitude.

したがって、符号量を最小化する目的で、振幅が小さい暫定予測誤差信号の符号長を小さく、振幅が大きい暫定予測誤差信号の符号長を大きくする近似を行う。その関係を図2(c)に模式的に示す。図2(c)の横軸は中央を0として一方は+振幅、他方は−振幅であり、縦軸は符号長を表わす。符号長は暫定予測誤差信号の振幅が0でも0にはならずに所定の値を持つ。
振幅の絶対値が大きくなればそれに比例して符号長も大きくなる。このように近似した符号長からフレーム全体の符号量を求め、この符号量を最小化するように線形予測係数を求める。こうして求めた線形予測係数から予測誤差を求めると、フレーム全体の符号量を最小化することが出来る。
Therefore, for the purpose of minimizing the code amount, approximation is performed to reduce the code length of the provisional prediction error signal having a small amplitude and to increase the code length of the provisional prediction error signal having a large amplitude. The relationship is schematically shown in FIG. In FIG. 2C, the horizontal axis indicates 0 as the center, one is + amplitude, the other is -amplitude, and the vertical axis indicates the code length. The code length does not become 0 even when the amplitude of the provisional prediction error signal is 0 and has a predetermined value.
If the absolute value of the amplitude increases, the code length increases in proportion to it. The code amount of the entire frame is obtained from the code length approximated in this way, and the linear prediction coefficient is obtained so as to minimize the code amount. When the prediction error is obtained from the linear prediction coefficient thus obtained, the code amount of the entire frame can be minimized.

例えばライス符号でエントロピー符号化した場合、暫定予測誤差信号の1サンプル当たりの符号長は、暫定予測誤差信号の振幅dの2倍で近似出来る。これは、ライス符号の符号長E(d)が、振幅dに対して式(13)に示す関係であることによる。
E(d)=2|d+0.25|+0.5 式(13)
したがって、フレーム全体の符号量Jは式(14)で計算出来る。ところが、絶対値は微分値が常に一定で、原点で微分出来ないので、微分に基づく最小化基準として使えない。

Figure 0004746532
そこでこの発明では、暫定予測誤差信号の振幅の絶対値を近似する微分可能な連続関数を用いる。この実施例1では、その連続関数の一つとして式(15)に示す関数を使うことを考える。
E(d)=2(δ+d (1/q) 式(15)
ここでδは定数である。特にq=2の場合が計算上簡便である(式(16))。 For example, when entropy coding is performed using a Rice code, the code length per sample of the provisional prediction error signal can be approximated by twice the amplitude d i of the provisional prediction error signal. This is because the code length E (d i ) of the Rice code has the relationship shown in the equation (13) with respect to the amplitude d i .
E (d i ) = 2 | d i +0.25 | +0.5 Formula (13)
Therefore, the code amount J of the entire frame can be calculated by Expression (14). However, the absolute value of the absolute value is always constant and cannot be differentiated at the origin, so it cannot be used as a minimization standard based on differentiation.
Figure 0004746532
Therefore, in the present invention, a differentiable continuous function that approximates the absolute value of the amplitude of the provisional prediction error signal is used. In the first embodiment, it is considered to use the function shown in Expression (15) as one of the continuous functions.
E (d i ) = 2 (δ + d i q ) (1 / q) Equation (15)
Here, δ is a constant. In particular, the case of q = 2 is simple in calculation (formula (16)).

Figure 0004746532
E(d)を振幅dで微分する(式(17))。
Figure 0004746532
式(16)を線形予測係数αで微分する(式18)。
Figure 0004746532
式(16)からdがδより十分大きいときは、2dで近似出来る。dがδより小さい時は、式(17)からdの微分が一次関数2dで近似できるからdは2次関数で近似できる。
式(16)のδをδ=0.5とした符号長の特性を図3に示す。横軸は暫定予測誤差信号dの振幅、縦軸は符号長E(d)である。振幅=0の時の符号長は1.414、振幅=±1の符号長は2.44、振幅=±2の符号長は4.24、振幅±7以上の振幅は、2×dの一次関数である。つまり、暫定予測誤差信号dの振幅の絶対値に比例した符号長を得ることが出来る。
Figure 0004746532
E (d i ) is differentiated by amplitude d i (formula (17)).
Figure 0004746532
Equation (16) is differentiated by the linear prediction coefficient α j (Equation 18).
Figure 0004746532
When d i is sufficiently larger than δ from equation (16), it can be approximated by 2d i . when d i is less than δ is, d i since differentiation can be approximated by a linear function 2d i of d i from equation (17) can be approximated by a quadratic function.
FIG. 3 shows the characteristics of the code length when δ in Expression (16) is δ = 0.5. The horizontal axis represents the amplitude of the provisional prediction error signal d i , and the vertical axis represents the code length E (d i ). The code length when amplitude = 0 is 1.414, the code length when amplitude = ± 1 is 2.44, the code length when amplitude = ± 2 is 4.24, and the amplitude greater than ± 7 is 2 × d i It is a linear function. That is, a code length proportional to the absolute value of the amplitude of the provisional prediction error signal d i can be obtained.

このように近似した絶対値近似誤差によるフレーム全体の符号量Jは、式(19)で計算出来る。

Figure 0004746532
絶対値近似誤差を最小にするためには、Jについてα(j=1,2,‥‥,p)に関する偏微分を0とおいて解けばよい(式(20))。
Figure 0004746532
暫定予測誤差信号dは、式(1)に示したようにαの関数である。 The code amount J of the entire frame due to the approximate absolute value approximation error can be calculated by Expression (19).
Figure 0004746532
In order to minimize the absolute value approximation error, the partial differentiation with respect to α j (j = 1, 2,..., P) with respect to J may be set to 0 (formula (20)).
Figure 0004746532
The provisional prediction error signal d i is a function of α j as shown in Equation (1).

つまり、dJ/dα=0となるJ=1からj=pまでのαについてp個の連立方程式を解けばよい。この考え方は、従来技術で説明済みの二乗誤差を最小にする場合と同じであり、式(9)に示した正規方程式を解くことでp個の線形予測係数を求めることが出来る。
このようにして求めた線形予測係数は、絶対値近似誤差の振幅を最小にするものであるので、その線形予測係数に基づいて求めた予測誤差信号のエントロピー符号化した際の符号量を最小にすることが出来る。
この発明の線形予測係数算出装置は、実施例1に示したように二乗誤差を最小にする考えで得た暫定予測誤差信号dを、暫定予測誤差信号dの振幅の絶対値の和で近似し、振幅の絶対値の和を、最小化する線形予測係数を求めるものである。なお、振幅の絶対値の和をサンプル数Nで除算した絶対値平均値を最小化する線形予測係数を求めてもよい。つまり、平均値を求める1/Nは定数であり、1/Nを掛けても符号長が振幅の絶対値に比例する関係が変わらないからである。
That is, p simultaneous equations may be solved for α j from J = 1 to j = p where dJ / dα j = 0. This concept is the same as that in the case of minimizing the square error described in the prior art, and p linear prediction coefficients can be obtained by solving the normal equation shown in Equation (9).
Since the linear prediction coefficient obtained in this way minimizes the amplitude of the absolute value approximation error, the code amount when the entropy coding of the prediction error signal obtained based on the linear prediction coefficient is minimized. I can do it.
The linear prediction coefficient calculation apparatus according to the present invention calculates the provisional prediction error signal d i obtained with the idea of minimizing the square error as shown in the first embodiment as the sum of absolute values of the amplitudes of the provisional prediction error signal d i. A linear prediction coefficient that approximates and minimizes the sum of absolute values of amplitudes is obtained. A linear prediction coefficient that minimizes the absolute value average value obtained by dividing the sum of the absolute values of the amplitudes by the number of samples N may be obtained. That is, 1 / N for obtaining the average value is a constant, and even if 1 / N is multiplied, the relationship in which the code length is proportional to the absolute value of the amplitude does not change.

暫定予測誤差信号の振幅の絶対値近似誤差によるフレーム全体の符号量Jを、線形予測係数αで偏微分した式(19)の係数2d/√(δ+d )の分母は、αの関数であるので、式(9)の正規方程式が手間のかかる数値解析を用いないと解けない。
そこで正規方程式を、暫定予測誤差信号dの振幅が大きなサンプル(d,d,‥‥,d)を軽視する対角成分のみの重み係数行列W(式(21))を掛ける形に拡張した形式に近似する(式(20))。重みは、各サンプルが線形予測係数の推定にどのくらい影響を与えるのかを決める値である。
The denominator of the coefficient 2d i / √ (δ + d 2 i ) of the equation (19) obtained by partial differentiation of the code amount J of the entire frame due to the absolute value approximation error of the amplitude of the provisional prediction error signal by the linear prediction coefficient α j is α j Therefore, the normal equation of Equation (9) cannot be solved without using time-consuming numerical analysis.
Therefore, the normal equation is multiplied by the weight coefficient matrix W (equation (21)) of only the diagonal component that neglects the samples (d 1 , d 2 ,..., D i ) whose amplitude of the provisional prediction error signal d i is large. (Formula (20)). The weight is a value that determines how much each sample affects the estimation of the linear prediction coefficient.

Figure 0004746532
重みを考慮した線形予測係数列Aは式(22)で求められる。
A=(YWY)−1WX 式(22)
式(22)の形は、従来からの重み付き線形予測の式と同じである。
この重み係数行列Wは、図1の予測係数算出部30の中に破線で示す重み係数行列生成部32で生成される。重み係数行列Wは、式(21)に示す様に対角成分のみの対角行列である。各対角要素は、振幅大のサンプルの影響度を小さくする目的から、例えば、暫定予測誤差信号dの振幅の逆数(1/d)又は、振幅の平方根の逆数(1/√d)が使用できる。
重み係数行列生成部32は、予測係数算出部30内の図示しないレジスタに記憶された暫定予測誤差信号dを、読み出して暫定予測誤差信号dの逆数若しくは、平方根の逆数を、重み係数行列Wの対角要素に割り付ける動作を行う。
Figure 0004746532
The linear prediction coefficient sequence A in consideration of the weight is obtained by Expression (22).
A = (Y T WY) -1 Y T WX formula (22)
The form of equation (22) is the same as the conventional weighted linear prediction equation.
This weighting coefficient matrix W is generated by a weighting coefficient matrix generation unit 32 indicated by a broken line in the prediction coefficient calculation unit 30 of FIG. The weighting coefficient matrix W is a diagonal matrix having only diagonal components as shown in Expression (21). For the purpose of reducing the influence of a sample having a large amplitude, each diagonal element is, for example, the reciprocal of the amplitude (1 / d i ) of the provisional prediction error signal d i or the reciprocal of the square root of the amplitude (1 / √d i ) Can be used.
Weighting coefficient matrix generating unit 32, a provisional prediction error signal d i stored in the register (not shown) in the prediction coefficient calculation unit 30 reads out the inverse of the provisional prediction error signal d i with or the reciprocal of the square root, the weighting factor matrix The operation of assigning to the diagonal elements of W is performed.

しかし、暫定予測誤差信号dの振幅が大きなサンプルを軽視する重み係数行列Wを用いても、適切な線形予測係数が求まらない場合がある。
そこで、実施例2として図4に示す線形予測係数算出手段50を構成する予測係数算出部30は、フレーム毎に線形予測係数を求める動作を繰り返して行う繰り返し部34を備える。予測係数算出部30は、繰り返し部34内の終了判定部36が繰り返し動作を終了させる終了信号を出力するまでの間、線形予測係数を求める動作を繰り返して行う。また、予測係数算出部30が繰り返して線形予測係数を計算するので、フレーム分割部134が出力する少なくとも1フレームのディジタル信号を記憶するバッファ部28を、暫定予測誤差生成部20内に設ける構成とした。バッファ部28は、繰り返し部34が指定するフレームのディジタル信号を順次、暫定予測係数算出部22と暫定線形予測部24と暫定減算部26とに出力する。
However, even if a weighting coefficient matrix W that neglects a sample with a large amplitude of the provisional prediction error signal d i is used, an appropriate linear prediction coefficient may not be obtained.
Therefore, the prediction coefficient calculation unit 30 included in the linear prediction coefficient calculation unit 50 illustrated in FIG. 4 as the second embodiment includes a repetition unit 34 that repeatedly performs an operation for obtaining a linear prediction coefficient for each frame. The prediction coefficient calculation unit 30 repeatedly performs an operation for obtaining a linear prediction coefficient until the end determination unit 36 in the repetition unit 34 outputs an end signal for ending the repetition operation. In addition, since the prediction coefficient calculation unit 30 repeatedly calculates linear prediction coefficients, a buffer unit 28 that stores at least one frame of digital signal output from the frame division unit 134 is provided in the provisional prediction error generation unit 20. did. The buffer unit 28 sequentially outputs the digital signals of the frames specified by the repetition unit 34 to the provisional prediction coefficient calculation unit 22, the provisional linear prediction unit 24, and the provisional subtraction unit 26.

実施例2の主要な処理の流れを図5に示す。フレーム分割部134で所定サンプル数毎のフレームに分割されたディジタル信号は、フレーム単位でバッファ部28に記憶される(図5のステップS10)。バッファ部28は少なくとも1フレームのディジタル信号を記憶して出力するものである。
新しいフレームLが得られる(ステップS12)と、回数カウント値Kが0に初期化(ステップS14)され、回数カウント値Kが+1計数される(ステップS16)。そして、通常は、バッファ部28の最新のフレームLのディジタル信号xLiが順次読み出され、暫定予測誤差生成部20を構成する暫定予測係数算出部22と暫定線形予測部24と暫定減算部26に入力される(ステップS18)。
暫定予測誤差生成部20は上記した式(8)〜式(10)に示す計算を行って、暫定予測誤差信号dを生成する(ステップS20)。暫定予測誤差信号dが入力される予測係数算出部30は、上記した式(19)〜式(22)に示す計算を行って、予測誤差信号の符号量を最小化する線形予測係数を算出する(ステップS22)。
The main processing flow of the second embodiment is shown in FIG. The digital signal divided into frames for each predetermined number of samples by the frame dividing unit 134 is stored in the buffer unit 28 in units of frames (step S10 in FIG. 5). The buffer unit 28 stores and outputs at least one frame of digital signal.
When a new frame L is obtained (step S12), the count value K is initialized to 0 (step S14), and the count value K is incremented by 1 (step S16). Normally, the digital signal x Li of the latest frame L in the buffer unit 28 is sequentially read, and the provisional prediction coefficient calculation unit 22, the provisional linear prediction unit 24, and the provisional subtraction unit 26 constituting the provisional prediction error generation unit 20. (Step S18).
Preliminary prediction error generation unit 20 performs the calculation shown in the equations (8) to (10), to generate a provisional prediction error signal d i (step S20). The prediction coefficient calculation unit 30 to which the provisional prediction error signal d i is input performs the calculation shown in the above equations (19) to (22), and calculates a linear prediction coefficient that minimizes the code amount of the prediction error signal. (Step S22).

以上述べたステップS16〜ステップS22までの処理を、終了判定部36が終了と判断するまで、ステップ22で求めた予測係数に基づいて暫定予測誤差生成部20が暫定予測誤差を求め直す動作を繰り返すことで(ステップS24)、適切な線形予測係数を求めることが出来る。終了判定部36の終了の判断は、回数カウント値Kが所定回数Nに等しくなったか否かを終了判定部36内の回数判定部36aで行なってもよい。又は、ステップS22で求めた予測係数の絶対値和をステップS26で計算し、前回と今回の予測係数の総和の差がレジスタ38に記憶された所定値Thよりも小、若しくは変化しなくなったかを収束判定部36bで判断した結果で行なってもよい。又は、ステップS22で求めた線形予測係数とディジタル信号とからフレーム内の予測誤差信号の符号量をステップS28で計算し、終了判定部36内の符号量判定部36cで前回と今回の予測誤差信号を演算してその符号量を比較して符号量が最小になった時点としてもよい。   Until the end determination unit 36 determines that the processing from step S16 to step S22 described above is complete, the provisional prediction error generation unit 20 repeats the operation of recalculating the provisional prediction error based on the prediction coefficient obtained in step 22. (Step S24), an appropriate linear prediction coefficient can be obtained. The end determination unit 36 may determine whether or not the end count unit 36a in the end determination unit 36 determines whether or not the count value K is equal to the predetermined number N. Alternatively, the absolute value sum of the prediction coefficients obtained in step S22 is calculated in step S26, and whether the difference between the previous and current prediction coefficient sums is smaller than the predetermined value Th stored in the register 38 or no longer changes. You may carry out by the result judged by the convergence determination part 36b. Alternatively, the code amount of the prediction error signal in the frame is calculated in step S28 from the linear prediction coefficient obtained in step S22 and the digital signal, and the previous and current prediction error signals are calculated by the code amount determination unit 36c in the end determination unit 36. And the code amount may be compared to determine when the code amount is minimized.

以上述べたように予測係数算出部30内に繰り返し部34を設け、繰り返して予測係数を求めることで適切な線形予測係数を得ることが可能になる。但し、この発明において、この繰り返し部34は必須の構成要素ではない。実施例1で説明したように、予測誤差信号の符号量が最小になる予測係数を手間のかかる数値解析を用いて1度だけ算出し、その線形予測係数を用いてもよい。その場合は、フレーム毎に暫定予測係数を生成して、その暫定予測係数に基づく予測誤差信号を求めて暫定予測誤差信号を出力するステップS20に示す過程と、暫定予測誤差信号を入力として、予測誤差の振幅の絶対値を近似する微分可能な連続関数の各次の線形予測係数の偏微分が、全て0となる線形予測係数を生成するステップS22に示す過程、の2つが行なわれるだけである。   As described above, it is possible to obtain an appropriate linear prediction coefficient by providing the repetition unit 34 in the prediction coefficient calculation unit 30 and repeatedly obtaining the prediction coefficient. However, in the present invention, the repeating section 34 is not an essential component. As described in the first embodiment, the prediction coefficient that minimizes the code amount of the prediction error signal may be calculated only once using laborious numerical analysis, and the linear prediction coefficient may be used. In that case, a provisional prediction coefficient is generated for each frame, a prediction error signal based on the provisional prediction coefficient is obtained and a provisional prediction error signal is output. There are only two processes, shown in step S22, in which the linear differential coefficients of all the linear predictive coefficients of the differentiable continuous functions that approximate the absolute value of the error amplitude are all zero. .

実施例2で、線形予測係数を求める正規方程式(式(9))を容易に解くことを目的に、対角成分のみの重み係数行列W(式(22))を掛ける考えを導入した。その重み係数の各要素は、暫定予測誤差信号の振幅の大きなサンプルについて軽視する目的で、例えば暫定予測誤差信号の振幅の逆数などの比較的簡単な例を示した。
この重み係数の各要素を重み係数算出部31で計算して求める他の例を実施例3として説明する。重み係数算出部31を、図4の予測係数算出部30内に破線で示す。
実施例3は、実施例2に対してこの重み係数算出部31が設けられている点のみが異なる。他の構成は同じである。重み係数算出部31内には、図示しない定数を記憶するレジスタが設けられており、実施例2よりも複雑な重み係数を計算出来る点に特徴がある。
In Example 2, the idea of multiplying the weighting coefficient matrix W (equation (22)) of only the diagonal component was introduced for the purpose of easily solving the normal equation (equation (9)) for obtaining the linear prediction coefficient. For the purpose of neglecting a sample having a large amplitude of the provisional prediction error signal, each element of the weighting coefficient has shown a relatively simple example such as the reciprocal of the amplitude of the provisional prediction error signal.
Another example in which each element of the weighting factor is calculated by the weighting factor calculating unit 31 will be described as a third embodiment. The weight coefficient calculation unit 31 is indicated by a broken line in the prediction coefficient calculation unit 30 of FIG.
The third embodiment is different from the second embodiment only in that the weight coefficient calculating unit 31 is provided. Other configurations are the same. The weighting coefficient calculation unit 31 is provided with a register for storing a constant (not shown), and is characterized in that a weighting coefficient more complicated than that in the second embodiment can be calculated.

従来の予測誤差が最小になる線形予測係数を求める式(8)と、この発明の暫定予測誤差信号の振幅の絶対値を最小にする線形予測係数を求める式(20)とを比較すると、1/√(δ+d )が乗算されている点のみが異なる。したがって、この係数1/√(δ+d )を重み係数として考慮することで、従来の予測誤差が最小になる最小二乗法で求めた線形予測係数と同じように、振幅の絶対値を最小にする線形予測係数が求められると考えられる。 Comparing the conventional equation (8) for obtaining the linear prediction coefficient that minimizes the prediction error with the equation (20) for obtaining the linear prediction coefficient that minimizes the absolute value of the amplitude of the provisional prediction error signal according to the present invention, 1 The only difference is that / √ (δ + d 2 i ) is multiplied. Therefore, by considering this coefficient 1 / √ (δ + d 2 i ) as a weighting coefficient, the absolute value of the amplitude is minimized as in the case of the linear prediction coefficient obtained by the least square method that minimizes the conventional prediction error. It is considered that a linear prediction coefficient is obtained.

そこで、重み係数算出部31で式(23)に示す計算で各重み係数を求め、計算された各重み係数を、重み係数行列生成部32で対角要素に割り付ける。

Figure 0004746532
生成された重み係数行列Wを正規方程式に掛けて、最小二乗解を式(22)で求めることで、不適当な重み係数になることがなく常に好ましい線形予測係数を求めることが出来る。 Therefore, the weighting factor calculation unit 31 obtains each weighting factor by the calculation shown in Expression (23), and the weighting factor matrix generation unit 32 assigns each calculated weighting factor to a diagonal element.
Figure 0004746532
By multiplying the generated weight coefficient matrix W by a normal equation and obtaining the least square solution by the equation (22), it is possible to always obtain a preferable linear prediction coefficient without becoming an inappropriate weight coefficient.

予測誤差信号をエントロピー符号化するのにライス符号を使うと、その符号長は、上記した式(13)で求められ、暫定予測誤差信号の振幅dに対して例えば図6に示すようになる。振幅1に対して符号長3、振幅−1に対して符号長2、振幅2に対して符号長5、振幅−2に対して符号長4となる。−振幅の符号長は、+振幅の符号長より符号長が1つ少ない。
暫定予測誤差信号の振幅は例えば1万(1×10,000)と言った数が想定されるので、その1万の振幅を全てライス符号化すると、符号量が2万ビットと極めて大きな値になってしまう。そこで、振幅が大きい場合には、下位のビットを固定長符号化し、所定のビット以上をエントロピー符号化(可変長符号化)する方法が考えられる。その固定長符号化と可変長符号化を組み合わせた実施例4の機能構成例を図7に示す。
When the prediction error signal using Rice codes to entropy coding, the code length is given by Equation (13) mentioned above, as shown in FIG. 6, for example the amplitude d i provisional prediction error signal . The code length is 3 for amplitude 1, code length 2 for amplitude-1, code length 5 for amplitude 2, and code length 4 for amplitude-2. -The code length of the amplitude is one less than the code length of the + amplitude.
As the amplitude of the provisional prediction error signal, for example, a number such as 10,000 (1 × 10,000) is assumed. Therefore, when all the 10,000 amplitudes are subjected to the rice encoding, the code amount becomes an extremely large value of 20,000 bits. turn into. Therefore, when the amplitude is large, a method in which the lower bits are fixed-length encoded and a predetermined bit or more is entropy encoded (variable length encoding) can be considered. FIG. 7 shows a functional configuration example of the fourth embodiment in which the fixed length coding and the variable length coding are combined.

実施例4は実施例3に対して予測係数算出部30内に可変長符号化開始ビット設定部70を備えたことを特徴とする。他の構成は実施例2と同じである。
可変長符号化開始ビット設定部70は、絶対値平均部72と可変長符号化開始ビット計算部74とで構成される。絶対値平均部72は、暫定予測誤差信号dから暫定予測誤差系列の絶対値平均値τを計算する(式(24))。絶対値平均値τは、可変長符号ビット計算部74に入力され、例えば式(25)に基づいて可変長符号化開始ビットであるβが計算される。

Figure 0004746532
Figure 0004746532
ただし、{ }は切捨てを表わす。
この可変長符号化開始ビットβを求める方法は、ISO規格(ISO/IEC14496-5 2001/AMD 10 Reference Software
)に例示されている。 The fourth embodiment is different from the third embodiment in that a variable length coding start bit setting unit 70 is provided in the prediction coefficient calculation unit 30. Other configurations are the same as those of the second embodiment.
The variable length coding start bit setting unit 70 includes an absolute value averaging unit 72 and a variable length coding start bit calculation unit 74. The absolute value average unit 72 calculates the absolute value average value τ of the provisional prediction error sequence from the provisional prediction error signal d i (formula (24)). The absolute value average value τ is input to the variable-length code bit calculation unit 74, and β, which is a variable-length encoding start bit, is calculated based on, for example, Expression (25).
Figure 0004746532
Figure 0004746532
However, {} represents truncation.
The method for obtaining the variable length coding start bit β is defined by the ISO standard (ISO / IEC14496-5 2001 / AMD 10 Reference Software).
).

こうして求めた可変長符号化開始ビットβを用いて、βビット以上のビットを例えばライス符号化した暫定予測誤差信号の符号長は、式(26)で計算出来る。
E(d)=2|(d/2β)+0.25|+β+0.5 式(26)
符号長E(d)は式(27)で近似出来る。

Figure 0004746532
符号長E(d)の近似式である式(27)で符号長を計算した例を図8に示す。図8の横軸と縦軸の交点は、2β未満の振幅を意味し、交点を中心に振幅の絶対値が2β以上の範囲を±で表わす。縦軸は符号長である。図8は、ライス符号の例を示した図6と対比することで容易に理解出来る。2β未満の振幅は、β+1ビットであり縦軸上の○で表わされる。2βの振幅はβ+3ビットとなる。図6からも明らかなように、ライス符号では、−側の振幅の符号長が1ビット少ないので、2β未満の振幅に対して符号長は左右対称ではない。振幅が−2βの時の符号長は、β+2ビットとなる。振幅がその倍(−2β×2)の時の符号長はβ+4ビットとなる。 Using the variable length coding start bit β thus obtained, the code length of the provisional prediction error signal obtained by, for example, rice-encoding bits of β bits or more can be calculated by Expression (26).
E (d i ) = 2 | (d i / 2 β ) +0.25 | + β + 0.5 Equation (26)
The code length E (d i ) can be approximated by equation (27).
Figure 0004746532
FIG. 8 shows an example in which the code length is calculated by Expression (27), which is an approximate expression of the code length E (d i ). Intersection of the horizontal and vertical axes of FIG. 8 denotes an amplitude of less than 2 beta, the absolute value of the amplitude at the center of the intersection represents the range of more than 2 beta at ±. The vertical axis is the code length. FIG. 8 can be easily understood by comparing with FIG. 6 showing an example of the Rice code. The amplitude of less than 2 beta is represented by ○ on and the vertical axis a beta + 1 bits. The amplitude of 2 beta is the beta + 3 bits. As it is apparent from FIG. 6, the Rice code, - since the code length of the amplitude of the side one bit less, code length relative to less than 2 beta amplitude is not symmetrical. Code length when the amplitude -2 beta becomes beta + 2 bits. Amplitude code length at the time of its multiples (-2 β × 2) becomes beta + 4 bits.

このように近似したE(d)を振幅dで微分する(式(28))。

Figure 0004746532
式(27)を線形予測係数αで微分する(式(29))。
Figure 0004746532
絶対値近似誤差を最小にするためには、Jについてα(j=1,2,‥‥,p)に関する偏微分を0とおいて解けばよい(式(30))。
Figure 0004746532
ここでも分母の2β√(δ+(d/2β+0.25))(式(31))は、定数とみなし、dd/dαは各iとαに対してxi−jとなるので、分子第一項のdに対しては、実施例1と同じになる。 E (d i ) approximated in this way is differentiated by the amplitude d i (formula (28)).
Figure 0004746532
Equation (27) is differentiated by the linear prediction coefficient α j (equation (29)).
Figure 0004746532
In order to minimize the absolute value approximation error, the partial differential with respect to α j (j = 1, 2,..., P) with respect to J may be set to 0 (formula (30)).
Figure 0004746532
Again, the denominator 2 β √ (δ + (d i / 2 β +0.25) 2 ) (Equation (31)) is regarded as a constant, and dd i / dα j is x i− for each i and α j . j , the first term d i of the molecule is the same as in Example 1.

Figure 0004746532
更に定数0.25に対するdd/dαの成分uは各α毎に式(32)で表わされる。
Figure 0004746532
を音声信号と仮定すると、交流波形なのでフレーム内の平均値は0と近似出来る。したがって、式(30)は、実施例1に対して重み係数行列Wが異なるだけである。
重み係数行列Wは、重み係数算出部31でフレームの各サンプル毎に式(33)で重みを計算し、その重みを重み係数行列生成部32で対角要素に割り付けることで得られる。
Figure 0004746532
この重みは、可変長符号化開始ビットβ以上の暫定予測誤差信号dに適用される。可変長符号化開始ビットβ未満の符号化ビット数は、振幅の大小とは無関係なので、重みを小さくして軽視すればよい。
Figure 0004746532
Further, the component u of dd i / dα j with respect to the constant 0.25 is expressed by equation (32) for each α j .
Figure 0004746532
Assuming that u j is an audio signal, the average value in the frame can be approximated to 0 because it is an AC waveform. Therefore, the expression (30) is different from the first embodiment only in the weight coefficient matrix W.
The weighting coefficient matrix W is obtained by calculating weights for each sample of the frame by the weighting coefficient calculation unit 31 using Equation (33) and assigning the weights to diagonal elements by the weighting coefficient matrix generation unit 32.
Figure 0004746532
This weight is applied to the provisional prediction error signal d i that is greater than or equal to the variable length coding start bit β. Since the number of encoded bits less than the variable-length encoding start bit β is irrelevant to the magnitude of the amplitude, it may be neglected by reducing the weight.

ただし暫定的な振幅が2βに近い暫定予測誤差信号は予測係数が更新される時に、振幅が2βより大きくなる場合も考えられるので、図9に示すような重み係数γを使えばよい。図9の横軸は、暫定予測誤差信号の振幅であり、縦軸は重みγである。可変長符号化開始ビットβ以上の暫定予測誤差信号には、式(33)で計算される重み係数を掛ける。つまり、振幅の大きな暫定予測誤差信号は軽視するように小さな重み係数を掛ける。可変長符号化開始ビットβ未満の暫定予測誤差サンプルは、つまり重さ1を乗算する。又は、可変長符号化開始ビットβ未満の暫定予測誤差には、図10中に破線で示すように符号長2βに対する重み係数よりも小さな重み係数を掛けてもよい。
また、式(33)のように各サンプル毎に重みを計算するのではなく、図10に示すような符号長の範囲毎に所定の重みを決めておく離散的な重み係数を用いてもよい。符号長の所定の範囲毎に重みを決めておくことで、重み係数算出部31で重みを計算する手間が省ける。
実施例4の主要な処理の流れを図11に示す。実施例4では、実施例2の主要な処理の流れを示した図5の、暫定予測誤差信号を生成するステップS20と予測係数を算出するステップS22との間に、暫定予測誤差信号の絶対値平均値τを算出するステップS80と、絶対値平均値τから可変長符号化開始ビットβを算出するステップS82とが設けられている点のみが異なる。ステップS80の処理は、上記した式(24)を計算するものであり、ステップS82は、上記した式(25)を計算するものである。したがって説明は省略する。
However provisional prediction error signal close tentative amplitude to 2 beta when the prediction coefficients are updated, since it is conceivable if the amplitude is greater than 2 beta, may use the weighting factor γ as shown in Fig. The horizontal axis in FIG. 9 is the amplitude of the provisional prediction error signal, and the vertical axis is the weight γ. The provisional prediction error signal equal to or greater than the variable length coding start bit β is multiplied by the weighting coefficient calculated by Expression (33). That is, the provisional prediction error signal having a large amplitude is multiplied by a small weighting factor so as to be neglected. A provisional prediction error sample less than the variable length coding start bit β is multiplied by a weight of 1. Alternatively, the provisional prediction error less than the variable length coding start bit β may be multiplied by a weighting factor smaller than the weighting factor for the code length 2 β as indicated by a broken line in FIG.
Further, instead of calculating the weight for each sample as shown in Expression (33), a discrete weight coefficient for determining a predetermined weight for each code length range as shown in FIG. 10 may be used. . By determining the weight for each predetermined range of the code length, the weight coefficient calculating unit 31 can save time and effort for calculating the weight.
The main processing flow of the fourth embodiment is shown in FIG. In the fourth embodiment, the absolute value of the temporary prediction error signal between step S20 for generating the temporary prediction error signal and step S22 for calculating the prediction coefficient in FIG. 5 showing the main processing flow of the second embodiment. The only difference is that step S80 for calculating the average value τ and step S82 for calculating the variable length coding start bit β from the absolute value average value τ are provided. The process of step S80 is to calculate the above equation (24), and step S82 is to calculate the above equation (25). Therefore, explanation is omitted.

〔シミュレーション結果〕
例えば、MPEG標準ではライス符号を使用することが決められている。そこで、ライス符号を使用する前提でシミュレーションを行う。ライス符号を使うと、フレーム内の予測誤差信号毎の符号長の総和の符号量は、各予測誤差信号の振幅の絶対値の大きさに比例する。フレーム内の符号量の総和を最小にすることは、各予測誤差信号の振幅の絶対値の総和を最小化することで近似出来る。
従来の線形予測では二乗誤差を最小化する基準で予測係数を求め、その予測係数から予測誤差信号を求めていたので、予測誤差信号の符号量の総和は必ずしも最小化されない。
〔simulation result〕
For example, in the MPEG standard, it is decided to use a rice code. Therefore, the simulation is performed on the assumption that the Rice code is used. When the Rice code is used, the code amount of the total code length for each prediction error signal in the frame is proportional to the absolute value of the amplitude of each prediction error signal. Minimizing the sum of the code amounts in the frame can be approximated by minimizing the sum of the absolute values of the amplitudes of the prediction error signals.
In conventional linear prediction, a prediction coefficient is obtained on the basis of minimizing the square error, and a prediction error signal is obtained from the prediction coefficient. Therefore, the sum of the code amounts of the prediction error signal is not necessarily minimized.

そこで、極端な入力系列の一例を示し、この発明の効果を確認する。例えば、入力系列としてフレーム内のサンプル数を1024個とし、図12に示すように先頭のサンプルx=10、2個目のサンプルx=−1000、以降のサンプルは10又は−10の振幅が交互に並ぶ系列を考える。
=x−αxi−1を使って具体例を示す。通常の一次の線形予測係数αは、一次の相関係数/エネルギー(二乗和)であるからα=(−10000−10000+(−100)×1021)/(1000×1000+10×10×1023)=−122100/1102300=−0.1108となる。
この予測係数αを用いて予測誤差を求めると、つまり上記した式(1)を計算し、整数化すると、d=10、d=−1000+10×0.1108=−999、d=10−(−1000)×(−0.1108)=−101、d=−9、d=9、‥‥、d1023=−9、dを四捨五入して整数化した二乗和は1091003となる。
Therefore, an example of an extreme input sequence is shown to confirm the effect of the present invention. For example, the number of samples in a frame is 1024 as an input sequence, and the first sample x 0 = 10, the second sample x 1 = −1000, and the subsequent samples have an amplitude of 10 or −10 as shown in FIG. Consider a series of alternating lines.
A specific example is shown using d i = x i −αx i−1 . Since the normal first-order linear prediction coefficient α is a first-order correlation coefficient / energy (sum of squares), α = (− 10000−10000 + (− 100) × 1021) / (1000 × 1000 + 10 × 10 × 1023) = − 122100/1102300 = −0.1108
When the prediction error is obtained using the prediction coefficient α, that is, when the above-described equation (1) is calculated and converted into an integer, d 0 = 10, d 1 = −1000 + 10 × 0.1108 = −999, d 2 = 10− ( -1000) × (-0.1108) = - 101, d 3 = -9, d 4 = 9, ‥‥, d 1023 = -9, the square sum that is integer by rounding the d i becomes 1,091,003.

この発明の振幅の絶対値の総和を最小化する近似を用いて予測誤差を求める。重み係数Wを例えば0.1として線形予測係数αを求めると、α=(−10000×W−10000×W+(−100)×1021)/(1000×1000×W+10×10×1023)=−0.51458となる。α=−0.5として予測誤差を求める。d=10、d=−1000+10×0.5=−995、d=10−(−1000)×(−0.5)=490、d=−5、d=5、‥‥、d1023=−5、dの二乗和は1255750となる。
二乗誤差の総和を最小にする方法で求めた予測誤差の二乗和と、絶対値の総和を最小にする方法で求めた予測誤差の二乗和とを比較すると、1091003に対して1255750であり、この発明の絶対値の総和を最小にする方法の方が大きい。
しかし、予測誤差dの絶対値の和を四捨五入した値で比較すると、二乗誤差の総和を最小にする方法では10299であり、絶対値の総和を最小にする方法では6600である。このようにこの発明の暫定予測誤差(予測誤差)の振幅の絶対値の総和を最小にする方法で求めた符号量の方が少ない。したがって、ライス符号化した符号量もこの発明の方が少なくなる。
The prediction error is obtained using the approximation that minimizes the sum of the absolute values of the amplitudes of the present invention. When the linear prediction coefficient α is obtained by setting the weighting coefficient W to 0.1, for example, α = (− 10000 × W−10000 × W + (− 100) × 1021) / (1000 × 1000 × W + 10 × 10 × 1023) = − 0.51458 It becomes. The prediction error is obtained with α = −0.5. d 0 = 10, d 1 = −1000 + 10 × 0.5 = −995, d 2 = 10 − (− 1000) × (−0.5) = 490, d 3 = −5, d 4 = 5,..., d 1023 = -5, square sum of the d i becomes 1,255,750.
Comparing the sum of squares of prediction errors obtained by the method of minimizing the sum of square errors with the sum of squares of prediction errors obtained by the method of minimizing the sum of absolute values, it is 1255750 to 1091003. The method of minimizing the sum of the absolute values of the invention is larger.
However, when the sum of the absolute values of the prediction errors d i is compared to a rounded value, the method that minimizes the sum of the square errors is 10299, and the method that minimizes the sum of the absolute values is 6600. Thus, the code amount obtained by the method of minimizing the sum of the absolute values of the provisional prediction errors (prediction errors) of the present invention is smaller. Therefore, the amount of code encoded by Rice is also smaller in the present invention.

次に、二乗誤差の総和を最小にする従来法と、絶対値の総和を最小にするこの発明による符号量の比較を、予測次数を変えて行なった結果を図13に示す。図13の横軸は予測次数を示し、縦軸は圧縮率を%で示す。圧縮率は、分母を通常のPCM符号の場合の符号量とした値である。
シミュレーション条件:予測次数を8次、16次、32次、64次として、サンプリングレートを48kHz,16bitと、48kHz,24bitと、96kHz,24bitと、192kHz,24bitとした各30秒のファイルの51個分の符号量の比較を行なった。
図13は、51個分のファイルの符号量の平均値を比較したものである。予測次数8次では、従来法の圧縮率≒49.32%に対してこの発明の圧縮率≒49.29%であり、約0.03%符号量が削減されている。予測次数16次では、従来法の圧縮率≒47.68%に対してこの発明の圧縮率≒47.64%であり、約0.04%符号量が削減されている。予測次数32次では、従来法の圧縮率≒47.5%に対してこの発明の圧縮率≒47.45%であり、約0.05%符号量が削減されている。予測次数64次では、従来法の圧縮率≒47.5%に対してこの発明の圧縮率≒47.41%であり、約0.09%符号量が削減されている。
Next, FIG. 13 shows the result of comparison between the conventional method for minimizing the sum of squared errors and the code amount according to the present invention for minimizing the sum of absolute values while changing the prediction order. The horizontal axis in FIG. 13 indicates the predicted order, and the vertical axis indicates the compression rate in%. The compression rate is a value in which the denominator is a code amount in the case of a normal PCM code.
Simulation conditions: 51 files of 30 seconds each with predicted orders of 8th, 16th, 32nd, 64th and sampling rates of 48kHz, 16bit, 48kHz, 24bit, 96kHz, 24bit, 192kHz, 24bit The code amount of the minute was compared.
FIG. 13 shows a comparison of average values of code amounts of 51 files. In the predicted order 8, the compression rate of the present invention is 49.29% compared to the compression rate of the conventional method 49.32%, and the code amount is reduced by about 0.03%. In the prediction order 16th, the compression rate of the conventional method is 47.64% as compared with the compression rate of the conventional method≈47.68%, and the code amount is reduced by about 0.04%. In the predicted order 32, the compression rate of the present invention is 47.45% compared to the compression rate of the conventional method≈47.5%, and the code amount is reduced by about 0.05%. In the predicted order 64, the compression rate of the present invention is 47.41% compared to the compression rate of the conventional method≈47.5%, and the code amount is reduced by about 0.09%.

このようにどの次数でも符号量が削減できていることが分かる。なお、従来法に対する符号量の削減率が少ないような印象を受けるが、一般的に音声予測符号化装置等において符号量を1%減らすことは難しいことである。したがって、この発明による0.03〜0.09%の符号量の削減は、実用上大きな効果である。また、一次の具体例で示したように少数のサンプルが非常に大きな値をとるような場合の効果は非常に大きい。
以上の各実施例の他、この発明である各装置及び方法は上述の実施形態に限定されるものではなく、この発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記装置及び方法において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。
Thus, it can be seen that the code amount can be reduced at any order. In addition, although the impression that the reduction rate of the code amount with respect to the conventional method is small is received, it is generally difficult to reduce the code amount by 1% in a speech predictive encoding device or the like. Therefore, the reduction of the code amount of 0.03 to 0.09% according to the present invention is a great effect in practical use. Further, as shown in the first specific example, the effect is very large when a small number of samples have a very large value.
In addition to the above embodiments, each apparatus and method according to the present invention is not limited to the above-described embodiment, and can be appropriately changed without departing from the spirit of the present invention. Further, the processes described in the above apparatus and method are not only executed in time series according to the order of description, but also may be executed in parallel or individually as required by the processing capability of the apparatus that executes the process. Good.

また、上記各装置における処理機能をコンピュータによって実現する場合、線形予測係数算出装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記線形予測係数算出装置における処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記憶媒体に記憶しておくことができる。コンピュータで読み取り可能な記憶媒体としては、例えば、磁気記憶装置、光ディスク、光磁気記憶媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記憶装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記憶媒体として、MO(Magneto Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
In addition, when the processing functions in the above devices are realized by a computer, the processing contents of the functions that the linear prediction coefficient calculation device should have are described by a program. Then, by executing this program on a computer, the processing function in the linear prediction coefficient calculation device is realized on the computer.
The program describing the processing contents can be stored in a computer-readable storage medium. The computer-readable storage medium may be any medium such as a magnetic storage device, an optical disk, a magneto-optical storage medium, and a semiconductor memory. Specifically, for example, as a magnetic storage device, a hard disk device, a flexible disk, a magnetic tape, etc., and as an optical disk, a DVD (Digital Versatile Disc), a DVD-RAM (Random Access Memory), a CD-ROM (Compact Disc Read Only) Memory), CD-R (Recordable) / RW (ReWritable), etc., magneto-optical storage media, MO (Magneto Optical disc), etc., semiconductor memory, EEP-ROM (Electronically Erasable and Programmable-Read Only Memory), etc. Can be used.

また、このプログラムの流通は、例えば、そのプログラムを記憶したDVD、CD−ROM等の可搬型記憶媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記憶媒体に記憶されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記憶媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記憶媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、この形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
The program is distributed by selling, transferring, or lending a portable storage medium such as a DVD or CD-ROM storing the program, for example. Furthermore, the program may be distributed by storing the program in a storage device of the server computer and transferring the program from the server computer to another computer via a network.
For example, a computer that executes such a program first stores a program stored in a portable storage medium or a program transferred from a server computer in its own storage device. When executing the process, this computer reads a program stored in its own storage medium and executes a process according to the read program. As another execution form of the program, the computer may read the program directly from the portable storage medium and execute processing according to the program, and the program is transferred from the server computer to the computer. Each time, the processing according to the received program may be executed sequentially. Also, the program is not transferred from the server computer to the computer, and the above-described processing is executed by a so-called ASP (Application Service Provider) type service that realizes the processing function only by the execution instruction and result acquisition. It is good. Note that the program in this embodiment includes information that is used for processing by an electronic computer and that conforms to the program (data that is not a direct command to a computer but has a property that defines the processing of the computer).

また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、各装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。   In this embodiment, each apparatus is configured by executing a predetermined program on a computer. However, at least a part of these processing contents may be realized by hardware.

この発明の線形予測係数算出装置10の実施例1の機能構成例を示す図。The figure which shows the function structural example of Example 1 of the linear prediction coefficient calculation apparatus 10 of this invention. 予測誤差信号dを示す図、図2(a)は振幅と頻度との関係を示す図、図2(b)は時系列的に発生する予測誤差信号dを示す図、図2(c)は振幅と符号長との関係を示す図である。FIG. 2A is a diagram showing a prediction error signal d i , FIG. 2A is a diagram showing a relationship between amplitude and frequency, FIG. 2B is a diagram showing a prediction error signal d i generated in time series, and FIG. ) Is a diagram showing the relationship between amplitude and code length. 暫定予測誤差信号の振幅に対する符号長の変化を示す図。The figure which shows the change of the code length with respect to the amplitude of a temporary prediction error signal. この発明の線形予測係数算出装置10の実施例2の機能構成例を示す図。The figure which shows the function structural example of Example 2 of the linear prediction coefficient calculation apparatus 10 of this invention. 実施例2の動作フロー図。FIG. 6 is an operation flowchart of the second embodiment. ライス符号の例を示す図。The figure which shows the example of a rice code | symbol. この発明の線形予測係数算出装置10の実施例4の機能構成例を示す図。The figure which shows the function structural example of Example 4 of the linear prediction coefficient calculation apparatus 10 of this invention. 式(27)で計算した符号長の一例を示す図。The figure which shows an example of the code length calculated by Formula (27). 実施例4に用いる重み係数の一例を示す図。FIG. 10 is a diagram illustrating an example of weighting factors used in the fourth embodiment. 離散的な重み係数の例を示す図。The figure which shows the example of a discrete weighting coefficient. 実施例4の動作フロー図。FIG. 10 is an operation flowchart of the fourth embodiment. この発明と従来法との符号量の比較を示す図。The figure which shows the comparison of the code amount of this invention and the conventional method. 離散的時系列ディジタル信号の一例を示す図。The figure which shows an example of a discrete time series digital signal. 従来の音声予測符号化装置130の構成を示す図。The figure which shows the structure of the conventional audio | voice prediction encoding apparatus 130. FIG. 従来の音声予測符号化装置130と復号器の動作を模式的に示す図。The figure which shows typically operation | movement of the conventional audio | voice prediction encoding apparatus 130 and a decoder.

Claims (20)

離散的時系列ディジタル信号を所定サンプル数毎のフレームに分割するフレーム分割部の出力信号を入力とし、上記フレーム毎の時系列信号から全極型の線形予測係数を生成する線形予測係数算出装置において、
上記フレーム毎に線形予測係数を求めて暫定予測係数を生成し、上記暫定予測係数に基づく予測誤差信号を求めて暫定予測誤差信号として出力する暫定予測係数生成部と、
上記フレーム毎の離散的時系列ディジタル信号と上記暫定予測誤差信号とを入力とし、上記暫定予測誤差信号の振幅の絶対値を近似する微分可能な連続関数の各次の線形予測係数の偏微分が、全て0となる線形予測係数を生成する予測係数算出部とを、
具備する線形予測係数算出手段を備えることを特徴とする線形予測係数算出装置。
In a linear prediction coefficient calculation apparatus that receives an output signal of a frame division unit that divides a discrete time series digital signal into frames for each predetermined number of samples and generates an all-polar linear prediction coefficient from the time series signal for each frame. ,
A provisional prediction coefficient generating unit that obtains a linear prediction coefficient for each frame to generate a provisional prediction coefficient, obtains a prediction error signal based on the provisional prediction coefficient, and outputs the prediction error signal;
The partial differential of each linear predictive coefficient of a differentiable continuous function that takes the discrete time series digital signal for each frame and the provisional prediction error signal as inputs and approximates the absolute value of the amplitude of the provisional prediction error signal is A prediction coefficient calculation unit that generates linear prediction coefficients that are all 0,
A linear prediction coefficient calculation device comprising linear prediction coefficient calculation means.
請求項1に記載の線形予測係数算出装置において、
上記予測係数算出部は、重み係数行列を生成する重み係数行列生成部を具備し、
上記予測係数算出部は、各次の線形予測係数を求める正規方程式に対角成分のみの上記重み係数行列を掛けて上記線形予測係数を生成するものであることを特徴とする線形予測係数算出装置。
The linear prediction coefficient calculation apparatus according to claim 1,
The prediction coefficient calculation unit includes a weight coefficient matrix generation unit that generates a weight coefficient matrix,
The prediction coefficient calculation unit generates the linear prediction coefficient by multiplying a normal equation for obtaining each linear prediction coefficient by the weighting coefficient matrix of only a diagonal component. .
請求項2に記載の線形予測係数算出装置において、
上記予測係数算出部は、上記暫定予測誤差信号から重み係数を算出する重み係数算出部を具備し、上記重み係数行列生成部は、上記重み係数算出部が算出した重み係数を上記重み係数行列の対角成分に割り付けるものであることを特徴とする線形予測係数算出装置。
In the linear prediction coefficient calculation apparatus according to claim 2,
The prediction coefficient calculation unit includes a weight coefficient calculation unit that calculates a weight coefficient from the provisional prediction error signal, and the weight coefficient matrix generation unit uses the weight coefficient calculated by the weight coefficient calculation unit as the weight coefficient matrix. A linear prediction coefficient calculation apparatus characterized by being assigned to a diagonal component.
請求項1乃至3の何れかに記載の線形予測係数算出装置において、
上記予測係数算出部は、上記暫定予測誤差信号の絶対値平均値を計算する絶対値平均部と、可変長符号化開始ビット数を決定する可変長符号化開始ビット計算部とからなる可変長符号化開始ビット設定部を具備し、
上記予測係数算出部は、上記可変長符号化開始ビット設定部が設定した可変長符号化開始ビット数以上の、上記暫定予測誤差信号の振幅の絶対値を近似する微分可能な連続関数の各次の線形予測係数の偏微分が、全て0となる線形予測係数を生成するものであることを特徴とする線形予測係数算出装置。
In the linear prediction coefficient calculation apparatus in any one of Claims 1 thru | or 3,
The prediction coefficient calculation unit includes a variable length code including an absolute value average unit that calculates an absolute value average value of the provisional prediction error signal and a variable length encoding start bit calculation unit that determines the number of variable length encoding start bits. A start bit setting unit,
The prediction coefficient calculation unit is configured to calculate each order of a differentiable continuous function that approximates the absolute value of the amplitude of the provisional prediction error signal that is equal to or greater than the number of variable length coding start bits set by the variable length coding start bit setting unit. A linear prediction coefficient calculation apparatus that generates a linear prediction coefficient in which partial differentiation of the linear prediction coefficient is all zero.
請求項4に記載の線形予測係数算出装置において、
上記可変長符号化開始ビット数未満の上記暫定予測誤差信号に掛けられる重みは、上記可変長符号化開始ビットに掛けられる重み以下であることを特徴とする線形予測係数算出装置。
In the linear prediction coefficient calculation apparatus according to claim 4,
The linear prediction coefficient calculation apparatus according to claim 1, wherein a weight applied to the provisional prediction error signal less than the number of variable length coding start bits is equal to or less than a weight applied to the variable length coding start bit.
請求項1乃至5の何れかに記載の線形予測係数算出装置において、
上記暫定予測誤差生成部は、上記フレーム分割部が出力する少なくとも1フレーム分の上記離散的時系列ディジタル信号を記憶し、上記複数フレーム中の指定されたフレームの上記離散的時系列ディジタル信号を順次出力するバッファ部を具備し、
上記予測係数算出部は、更に上記フレーム毎に線形予測係数を求める動作を繰り返す繰り返し部と、上記繰り返し部の繰り返し動作を終了させるか否かを判定し、終了時に上記繰り返し部へ終了信号を出力する終了判定部とを、具備するものであることを特徴とする線形予測係数算出装置。
The linear prediction coefficient calculation apparatus according to any one of claims 1 to 5,
The provisional prediction error generation unit stores at least one frame of the discrete time-series digital signal output from the frame division unit, and sequentially stores the discrete time-series digital signals of designated frames in the plurality of frames. A buffer unit for output;
The prediction coefficient calculation unit further determines a repetition unit that repeats an operation for obtaining a linear prediction coefficient for each frame, and determines whether or not to end the repetition operation of the repetition unit, and outputs an end signal to the repetition unit when the operation ends. A linear prediction coefficient calculation apparatus comprising: an end determination unit that performs the determination.
請求項6に記載の線形予測係数算出装置において、
上記終了判定部は、上記繰り返し部の繰り返し回数が所定回数に達すると、終了信号を出力する回数判定部を具備するものであることを特徴とする線形予測係数算出装置。
The linear prediction coefficient calculation apparatus according to claim 6,
The linear prediction coefficient calculation apparatus according to claim 1, wherein the end determination unit includes a number determination unit that outputs an end signal when the number of repetitions of the repetition unit reaches a predetermined number.
請求項6に記載の線形予測係数算出装置において、
上記終了判定部は、上記繰り返し求められた前回の線形予測係数の絶対値和と今回の線形予測係数の絶対値和の差が所定値以下になると、終了信号を出力する収束判定部を具備するものであることを特徴とする線形予測係数算出装置。
The linear prediction coefficient calculation apparatus according to claim 6,
The end determination unit includes a convergence determination unit that outputs an end signal when the difference between the absolute value sum of the previous linear prediction coefficient obtained repeatedly and the absolute value sum of the current linear prediction coefficient is equal to or less than a predetermined value. An apparatus for calculating a linear prediction coefficient, wherein
請求項6に記載の線形予測係数算出装置において、
上記終了判定部は、上記繰り返し部が線形予測係数を求める動作を繰り返すたびにフレ
ーム内の符号量を算出する符号量算出部と、上記算出された符号量をそれまで算出された
符号量と比較し、符号量が最小になった時に終了信号を出力する符号量判定部を具備する
ものであることを特徴とする線形予測係数算出装置。
The linear prediction coefficient calculation apparatus according to claim 6,
The termination determination unit compares a code amount calculation unit that calculates a code amount in a frame each time the repetition unit repeats an operation for obtaining a linear prediction coefficient, and compares the calculated code amount with a code amount calculated so far. And a linear prediction coefficient calculation apparatus comprising a code amount determination unit that outputs an end signal when the code amount becomes minimum.
離散的時系列ディジタル信号を所定サンプル数毎のフレームに分割するフレーム分割部の出力信号を入力とし、上記フレーム毎の時系列信号から全極型の予測係数を生成する線形予測係数算出方法において、
暫定予測計数生成部が、上記フレーム毎に線形予測係数を求めて暫定予測係数を生成して上記暫定予測係数に基づく予測誤差信号を求めて暫定予測誤差信号として出力する過程を備え、
予測係数算出部が、上記フレーム毎の離散的時系列ディジタル信号と上記暫定予測誤差信号を入力とし、上記予測誤差信号の振幅の絶対値を近似する微分可能な連続関数の各次の線形予測係数の偏微分が、全て0となる線形予測係数を生成する過程を備えたことを特徴とする線形予測係数算出方法。
In the linear prediction coefficient calculation method for generating an all-pole prediction coefficient from the time series signal for each frame, using the output signal of the frame division unit that divides the discrete time series digital signal into frames for each predetermined number of samples.
The provisional prediction count generation unit includes a process of obtaining a linear prediction coefficient for each frame, generating a provisional prediction coefficient, obtaining a prediction error signal based on the provisional prediction coefficient, and outputting the prediction error signal as a provisional prediction error signal,
The prediction coefficient calculation unit receives the discrete time series digital signal for each frame and the provisional prediction error signal, and each linear prediction coefficient of a differentiable continuous function that approximates the absolute value of the amplitude of the prediction error signal. A method for calculating a linear prediction coefficient, comprising a step of generating a linear prediction coefficient in which partial differentiation of all becomes zero.
請求項10に記載の線形予測係数算出方法において、
上記線形予測係数を生成する過程は、上記各次の線形予測係数を求める正規方程式に対角成分のみの重み係数行列を掛ける過程を含むことを特徴とする線形予測係数算出方法。
The linear prediction coefficient calculation method according to claim 10,
The method of generating a linear prediction coefficient includes a step of multiplying a normal equation for obtaining each linear prediction coefficient by a weight coefficient matrix of only diagonal components.
請求項10に記載の線形予測係数算出方法において、
上記線形予測係数を生成する過程は、上記暫定予測誤差信号から重み係数を算出する重み係数算出過程を含むことを特徴とする線形予測係数算出方法。
The linear prediction coefficient calculation method according to claim 10,
The method of generating a linear prediction coefficient includes a weighting coefficient calculation process of calculating a weighting coefficient from the provisional prediction error signal.
請求項10乃至12の何れかに記載の線形予測係数算出方法において、
上記暫定予測誤差生成部が、上記フレーム分割部が出力する複数フレームに渡って上記離散的時系列ディジタル信号を記憶し、上記複数のフレーム中の指定されたフレームの上記離散的時系列ディジタル信号を順次出力する過程を有し、
上記線形予測係数を生成する過程は、上記フレーム毎に線形予測係数を求める動作を終了判定部が終了信号を出力するまで、繰り返す過程を含むことを特徴とする線形予測係数算出方法。
The linear prediction coefficient calculation method according to any one of claims 10 to 12,
The provisional prediction error generation unit stores the discrete time series digital signal over a plurality of frames output from the frame division unit, and the discrete time series digital signal of a specified frame in the plurality of frames. Have the process of outputting sequentially,
The process of generating the linear prediction coefficient includes a process of repeating the operation of obtaining the linear prediction coefficient for each frame until the end determination unit outputs an end signal.
請求項13に記載の線形予測係数算出方法において、
上記終了信号を出力する過程は、上記繰り返す過程の繰り返し回数が、所定回数に達すると終了信号を出力する過程であることを特徴とする線形予測係数算出方法。
The linear prediction coefficient calculation method according to claim 13,
The method of calculating a linear prediction coefficient, wherein the process of outputting the end signal is a process of outputting an end signal when the number of repetitions of the repeating process reaches a predetermined number.
請求項13に記載の線形予測係数算出方法において、
上記終了信号を出力する過程は、上記繰り返し求められた前回と今回の線形予測係数の絶対値和を計算する過程を含み、前回と今回の上記絶対値和の差が所定値以下になると終了信号を出力する過程であることを特徴とする線形予測係数算出方法。
The linear prediction coefficient calculation method according to claim 13,
The process of outputting the end signal includes a process of calculating the sum of absolute values of the previous and current linear prediction coefficients obtained repeatedly. When the difference between the sum of absolute values of the previous time and the current time is less than a predetermined value, the end signal is output. A linear prediction coefficient calculation method characterized by being a process of outputting.
請求項13に記載の線形予測係数算出方法において、
上記終了信号を出力する過程は、上記フレーム内の予測誤差信号の符号量を計算する過程を含み、上記繰り返し求められた前回と今回の線形予測係数に基づく上記符号量が最小になった時に終了信号を出力する過程であることを特徴とする線形予測係数算出方法。
The linear prediction coefficient calculation method according to claim 13,
The process of outputting the end signal includes a process of calculating the code amount of the prediction error signal in the frame, and ends when the code amount based on the previous and current linear prediction coefficients obtained repeatedly is minimized. A method for calculating a linear prediction coefficient, which is a process of outputting a signal.
請求項13乃至16の何れかに記載の線形予測係数算出方法において、
上記線形予測係数を生成する過程は、上記暫定予測誤差信号から可変長符号化開始ビット数を決定する過程を含み、
上記可変長符号化開始ビット数を決定する過程で決められた可変長符号化開始ビットと、上記暫定予測誤差信号とから符号長を算出する過程を含むことを特徴とする線形予測係数算出方法。
The linear prediction coefficient calculation method according to any one of claims 13 to 16,
The step of generating the linear prediction coefficient includes a step of determining a variable length coding start bit number from the provisional prediction error signal,
A linear prediction coefficient calculation method comprising a step of calculating a code length from the variable length coding start bit determined in the step of determining the variable length coding start bit number and the provisional prediction error signal.
請求項17に記載の線形予測係数算出方法において、
上記符号長を算出する過程は、上記可変長符号化開始ビット数以下の符号に重みを掛ける過程を含み、上記重みは、可変長符号化開始ビットに掛けられる重み以下であることを特徴とする線形予測係数算出方法。
The linear prediction coefficient calculation method according to claim 17,
The process of calculating the code length includes a process of applying a weight to a code having the number of variable length coding start bits or less, wherein the weight is less than or equal to a weight to be applied to the variable length coding start bit. Linear prediction coefficient calculation method.
請求項1乃至9の何れかに記載した各装置としてコンピュータを機能させるための装置プログラム   An apparatus program for causing a computer to function as each apparatus according to claim 1. 請求項19に記載した何れかのプログラムを記憶したコンピュータで読み取り可能な記憶媒体。   A computer-readable storage medium storing the program according to claim 19.
JP2006343319A 2006-12-20 2006-12-20 Linear prediction coefficient calculation method, apparatus thereof, program thereof, and storage medium thereof Active JP4746532B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006343319A JP4746532B2 (en) 2006-12-20 2006-12-20 Linear prediction coefficient calculation method, apparatus thereof, program thereof, and storage medium thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006343319A JP4746532B2 (en) 2006-12-20 2006-12-20 Linear prediction coefficient calculation method, apparatus thereof, program thereof, and storage medium thereof

Publications (2)

Publication Number Publication Date
JP2008157998A JP2008157998A (en) 2008-07-10
JP4746532B2 true JP4746532B2 (en) 2011-08-10

Family

ID=39659006

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006343319A Active JP4746532B2 (en) 2006-12-20 2006-12-20 Linear prediction coefficient calculation method, apparatus thereof, program thereof, and storage medium thereof

Country Status (1)

Country Link
JP (1) JP4746532B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4870635B2 (en) * 2007-09-05 2012-02-08 日本電信電話株式会社 Linear prediction coefficient calculation method, apparatus, program, and recording medium
JP4918103B2 (en) * 2009-01-09 2012-04-18 日本電信電話株式会社 Encoding method, decoding method, apparatus thereof, program, and recording medium
US8576910B2 (en) 2009-01-23 2013-11-05 Nippon Telegraph And Telephone Corporation Parameter selection method, parameter selection apparatus, program, and recording medium

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS4918007B1 (en) * 1969-05-27 1974-05-07
JPS597400B2 (en) * 1981-03-27 1984-02-17 株式会社東芝 speech analysis device
JP2734995B2 (en) * 1994-08-22 1998-04-02 日本電気株式会社 Spectrum parameter extraction device

Also Published As

Publication number Publication date
JP2008157998A (en) 2008-07-10

Similar Documents

Publication Publication Date Title
JP5603484B2 (en) Encoding method, decoding method, encoding device, decoding device, program, recording medium
JP4691082B2 (en) Linear prediction model order determination apparatus, linear prediction model order determination method, program thereof, and recording medium
JP6422813B2 (en) Encoding device, decoding device, method and program thereof
US20070118370A1 (en) Methods and apparatuses for variable dimension vector quantization
KR101661917B1 (en) Encoding method, encoder, program and recording medium
JP4634969B2 (en) Linear prediction model order determination apparatus, linear prediction model order determination method, program thereof, and recording medium
JP4691050B2 (en) PARCOR coefficient calculation method, apparatus thereof, program thereof, and storage medium thereof
US20130101028A1 (en) Encoding method, decoding method, device, program, and recording medium
CN120898241A (en) Audio is generated using non-autoregressive decoding.
JP4746532B2 (en) Linear prediction coefficient calculation method, apparatus thereof, program thereof, and storage medium thereof
JP2013120225A (en) Encoding method, encoding device, program, and recording medium
JP4658852B2 (en) Adaptive block length encoding apparatus, method thereof, program and recording medium
JP6216809B2 (en) Parameter adjustment system, parameter adjustment method, program
EP3786949B1 (en) Coding of a sound signal
JP4989095B2 (en) Multi-channel encoding method, apparatus thereof, program thereof and recording medium
JP2800599B2 (en) Basic period encoder
JP5361565B2 (en) Encoding method, decoding method, encoder, decoder and program
JP2009210644A (en) Linear prediction coefficient calculator, linear prediction coefficient calculation method, linear prediction coefficient calculation program, and storage medium
JP5789816B2 (en) Encoding apparatus, method, program, and recording medium
JPWO2019107041A1 (en) Pitch enhancer, its method, and program
JP5786044B2 (en) Encoding method, encoding apparatus, decoding method, decoding apparatus, program, and recording medium
JP2019197150A (en) Pitch emphasis device, method thereof, and program
JP2001228900A (en) Computer-readable recording medium describing a speech parameter coding device, a coding method used in the device, and a coding algorithm thereof, a voice parameter quantization device, a quantization method used in the device, and a quantization algorithm thereof Computer-readable recording medium describing
JPH11119799A (en) Audio encoding method and audio encoding device
JP3092344B2 (en) Audio coding device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090105

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110307

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110506

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110513

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140520

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4746532

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350