JPS6367200B2 - - Google Patents
Info
- Publication number
- JPS6367200B2 JPS6367200B2 JP56037264A JP3726481A JPS6367200B2 JP S6367200 B2 JPS6367200 B2 JP S6367200B2 JP 56037264 A JP56037264 A JP 56037264A JP 3726481 A JP3726481 A JP 3726481A JP S6367200 B2 JPS6367200 B2 JP S6367200B2
- Authority
- JP
- Japan
- Prior art keywords
- circuit
- value
- pole
- parameter
- address
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 238000004364 calculation method Methods 0.000 claims description 24
- 238000006243 chemical reaction Methods 0.000 claims description 11
- 238000001514 detection method Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 5
- 230000005236 sound signal Effects 0.000 claims description 5
- 238000004458 analytical method Methods 0.000 description 15
- 238000000034 method Methods 0.000 description 10
- 238000001228 spectrum Methods 0.000 description 5
- 238000001914 filtration Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000002940 Newton-Raphson method Methods 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【発明の詳細な説明】
本発明は、音声の分析合成または音声認識等に
用いる音声出力周波数特性パターンの極零パラメ
ータ値抽出装置に関する。DETAILED DESCRIPTION OF THE INVENTION The present invention relates to an apparatus for extracting pole-zero parameter values of a speech output frequency characteristic pattern used for speech analysis and synthesis, speech recognition, and the like.
音声波形の周波数スペクトルは、音道の共振周
波数に対応してフオルマントと呼ばれるエネルギ
ーの集中した周波数成分を持つことが知られてい
る。また、このフオルマントは、音声波形の周波
数スペクトルを全極モデルで近似したときの極パ
ラメータにほぼ対応することが知られている。音
声波形から極パラメータ(フオルマントパラメー
タ)を抽出する方法の代表的な例として、音声波
形から抽出された線形予測係数を係数とする高次
代数方程式を例えばニユートン・ラプソン法等の
逐次近似法を用いて解く方法が知られている。し
かし、この方法は、フオルマントの周波数および
バンド幅を安定に求めることが困難であり、特
に、隣り合う分析フレームにおいて抽出されたフ
オルマントとの対応づけが正確に行なえない場合
が生ずる等の欠点がある。 It is known that the frequency spectrum of a sound waveform has a frequency component with concentrated energy called a formant, which corresponds to the resonance frequency of the sound path. It is also known that this formant approximately corresponds to the polar parameters when the frequency spectrum of the speech waveform is approximated by an all-pole model. A typical example of a method for extracting polar parameters (formant parameters) from a speech waveform is to use a successive approximation method such as the Newton-Raphson method to calculate a high-order algebraic equation whose coefficients are linear prediction coefficients extracted from the speech waveform. There is a known method to solve the problem using However, this method has the disadvantage that it is difficult to stably determine the frequency and bandwidth of the formant, and in particular, it may not be possible to accurately correlate the formants extracted in adjacent analysis frames. .
また、音声生成モデルに基づいて、種々のフオ
ルマントパターンに対して周波数スペクトルを合
成し、自然音声のスペクトルに近づけて行く所謂
AbS法(合成分析法)も知られている。この方法
は、フオルマントの対応付エラー等が避け易く、
比較的正確な抽出を行なうことが可能であるが、
膨大な演算量を必要とする欠点がある。 In addition, based on the speech generation model, frequency spectra are synthesized for various formant patterns, and the so-called so-called synthesis method approaches the spectrum of natural speech.
The AbS method (synthetic analysis method) is also known. This method makes it easy to avoid errors in formant mapping,
Although it is possible to perform relatively accurate extraction,
It has the disadvantage of requiring a huge amount of calculation.
また、例えば極パラメータ値を多数用意してお
いて、各極パラメータ値から導出される線形予測
系数を用いた逆フイルタに音声信号を入力させ、
前記逆フイルタの出力値の2乗を積算したエラー
パワーが最小になる極パラメータを求める方法も
ある。すなわち、音声波形の周波数スペクトル包
絡を全極モデルで近似した時の伝達関係T(z)
(z=jωT、T:サンプリング周期)が、
T(z)=M
〓m=1
Hn(z)
=M
〓m=1
1/1+α1nZ-1+α2nZ-2
…(1)
ただし、α1n=b2 n
α2n=2bncos2πnT
M;極の個数n
;極の周波数
bn;極のバンド巾
Hn(z);第m極の伝達関数
で表わされることから、実際の音声信号を(1)式で
表わされるフイルタの逆フイルタT-1(z)を通
した後の出力波形のエネルギー(エラーパワー)
が最小となるように極パラメータを選ぶ方法であ
る。零パラメータについても係数を変えることに
より同様にできる。 Also, for example, by preparing a large number of extreme parameter values and inputting the audio signal to an inverse filter that uses a linear prediction system derived from each extreme parameter value,
There is also a method of finding a pole parameter that minimizes the error power obtained by integrating the squares of the output values of the inverse filter. In other words, the transfer relationship T(z) when the frequency spectrum envelope of the speech waveform is approximated by an all-pole model
(z=jωT, T: sampling period) is T(z)= M 〓 m=1 H n (z) = M 〓 m=1 1/1+α 1n Z -1 +α 2n Z -2 …(1) However, , α 1n = b 2 n α 2n = 2b n cos2π n TM; Number of poles n ; Pole frequency b n ; Pole band width H n (z); Since it is expressed by the transfer function of the m-th pole, Energy (error power) of the output waveform after passing the actual audio signal through the inverse filter T -1 (z) of the filter expressed by equation (1)
This is a method of selecting the polar parameters so that . The same can be done for the zero parameter by changing the coefficients.
1つのフオルマントに対応する逆フイルタH-1 n
(z)は2つの線形予測係数α1n,α2nを与えたと
き入力信号Soに対して下記式で与えられる出力信
号eoを出力する。 Inverse filter H -1 n corresponding to one formant
(z) outputs an output signal e o given by the following formula for the input signal S o when two linear prediction coefficients α 1n and α 2n are given.
eo=So−α1nSo-1−α2nSo-2 …(2)
従つて、エラーパワーEは、
E=oB
〓n=nA
e2 o …(3)
で与えられる。ただし、nA,nBは分析窓の始めと
終りのサンプリング番号である。音声の分析窓の
時間幅は、30msec程度必要であることが知れら
ており、例えば10KHzで音声波形がサンプリング
されているとすると、(3)式の積算区間長(nB−
nA)は300程度になる。従つて、種々の極パラメ
ータ値に対応する線形予測係数に対して(3)式のエ
ラーパワーを演算することは膨大な演算量が必要
である。さらに例えば4個程度のフオルマントに
対しそれぞれの予測係数を組合せることは大変な
ことである。 e o =S o −α 1n S o-1 −α 2n S o-2 …(2) Therefore, the error power E is given by E= oB 〓 n=nA e 2 o …(3). However, n A and n B are the sampling numbers at the beginning and end of the analysis window. It is known that the time width of the audio analysis window is approximately 30 m sec . For example, if the audio waveform is sampled at 10 KHz, the cumulative interval length (n B −
nA ) will be around 300. Therefore, calculating the error power of equation (3) for linear prediction coefficients corresponding to various extreme parameter values requires a huge amount of calculation. Furthermore, it is difficult to combine prediction coefficients for, for example, four formants.
本発明の目的は、上記(3)式で与えられるエラー
パワーを少ない演算量で算出し、最適の極零パラ
メータ値を求めることができる極零パラメータ値
抽出装置を提供することにある。 An object of the present invention is to provide a pole-zero parameter value extraction device that can calculate the error power given by the above equation (3) with a small amount of calculations and obtain an optimal pole-zero parameter value.
本発明のパラメータ抽出回路は、音声信号から
時間窓内の自己相関値Vi(i=0,1,2,…)
を算出する自己相関値算出回路と、各種の極およ
び又は零パラメータ値をあらかじめ記憶しアドレ
ス入力に対応して該当番地に記憶した極パラメー
タ値等を出力するアドレス・極パラメータ値変換
回路と、該変換回路の出力パラメータ値から線形
予測係数α1およびα2を生成する線形予測係数生成
回路と、前記自己相関値算出回路の出力値Viが入
力され前記線形予測係数生成回路から与えられた
予測係数α1,α2を用いて次式による演算出力値
ri、すなわち
ri=(1+α1 2+α2 2)Vi−(α1−α1α2)Vi+1
−(α1−α1α2)Vi-1−α2Vi-2−α2Vi+2
なるriを演算出力する演算回路と、該演算回路の
出力値を記憶する自己相関値一時記憶回路と、該
記憶回路の記憶するr0すなわちエラーパワーのう
ち最小のものを検出しこれに対応する前記アドレ
ス・極パラメータ変換回路のアドレスを出力する
最小値検出回路とを備えて、前記エラーパワーr0
の最小値を与えた極零パラメータを抽出すること
を特徴とする。 The parameter extraction circuit of the present invention extracts autocorrelation values V i (i=0, 1, 2,...) within a time window from an audio signal.
an autocorrelation value calculation circuit that calculates an autocorrelation value calculation circuit; an address/polarity value conversion circuit that stores various pole and/or zero parameter values in advance and outputs the pole parameter value stored at the corresponding address in response to an address input; A linear prediction coefficient generation circuit that generates linear prediction coefficients α 1 and α 2 from the output parameter values of the conversion circuit, and a prediction given by the linear prediction coefficient generation circuit to which the output value V i of the autocorrelation value calculation circuit is input. Calculated output value using the following formula using coefficients α 1 and α 2
r i , i.e. r i = (1+α 1 2 + α 2 2 )V i −(α 1 −α 1 α 2 )V i+1 −(α 1 −α 1 α 2 )V i-1 −α 2 V i -2 −α 2 V i+2 , an arithmetic circuit that calculates and outputs r i ; an autocorrelation value temporary memory circuit that stores the output value of the arithmetic circuit; and r 0 , that is, the error power stored in the memory circuit. a minimum value detection circuit that detects the minimum value and outputs the corresponding address of the address/pole parameter conversion circuit ;
It is characterized by extracting the pole-zero parameter that gives the minimum value of .
なお、極パラメータ値の推定を前段で粗く推定
し、後段で逐次精度を上げるようにすれば演算回
数を大幅に減少させることができる。 Note that the number of calculations can be significantly reduced by estimating the polar parameter values roughly in the first stage and increasing the precision successively in the second stage.
次に、本発明について、図面を参照して詳細に
説明する。 Next, the present invention will be explained in detail with reference to the drawings.
先ず、本発明の原理について説明する。前記(2)
式で与えられるインバースフイルタの出力値(い
わば近似誤差である)eoの自己相関値riを考える
と、
ri=oB
〓n=nA
eoeo-i …(4)
ただし、eo-iはeoよりiタイムスロツト前の出
力値である。従つて、r0はエラーパワーEに一致
する。(4)式に(2)式を代入して展開すると、
ri=oB
〓
〓n=nA
(So−α1So-1−α2So-2)×(So-i−α1So-i-1−
α2So-i-2)
=oB
〓
〓n=nA
(SoSo-i−α1So-iSo-i−α2So-2So-i−α1SoSo-i-
1+α1 2So-1So-i-1
+α1α2So-2So-i-1−α2SoSo-i-2+α1α2So-1S
o-i-2+α2 2So-2So-i-2)…(5)
となる。分析窓(例えばハミング窓)が一定の時
間区間の外で0となりSoも0となることを考慮す
ると、例えばSoSo-iはSo-1So-i-1と等しいと考え
ることができる。従つて、(5)式は次の(6)式のよう
に表わすことができる。 First, the principle of the present invention will be explained. Said (2)
Considering the autocorrelation value r i of the inverse filter output value (approximation error) e o given by the formula, r i = oB 〓 n=nA e o e oi …(4) However, e oi is e This is the output value i time slots before o . Therefore, r 0 corresponds to the error power E. Substituting equation (2) into equation (4) and expanding it, r i = oB 〓 〓 n=nA (S o −α 1 S o-1 −α 2 S o-2 )×(S oi −α 1 Soi-1 −
α 2 S oi-2 ) = oB 〓 〓 n=nA (S o S oi −α 1 S oi S oi −α 2 S o-2 S oi −α 1 S o S oi-
1 +α 1 2 S o-1 S oi-1 +α 1 α 2 S o-2 S oi-1 −α 2 S o S oi-2 +α 1 α 2 S o-1 S
oi-2 + α 2 2 S o-2 S oi-2 )…(5). Considering that the analysis window (for example, Hamming window) becomes 0 outside a certain time interval and S o also becomes 0, for example, S o S oi can be considered to be equal to S o-1 S oi-1 . Therefore, equation (5) can be expressed as equation (6) below.
ri=(1+α1 2+α2 2)Vi−(α1−α1α2)Vi+1−
(α1−α1α2)Vi-1−α2Vi-2−α2Vi+2…(6)
ただし、
Vi=oB
〓n=nA
SoSo-i(i:タイムスロツト数)
…(7)
すなわち、Viは入力信号Soの自己相関値であ
る。また、分析窓の性質からVi=V-iである。従
つて入力信号Soの自己相関値Viと、線係予測係数
α1,α2とから前記エラパワーoB
〓n=nA
eo 2(すなわちr0)
を求めることができる。極が複数個あるときは(6)
式によつて得られたriを(6)式右辺のViに代入して
新たなriを求め、これをくり返して最終的なr0を
求めることができる。例えばホルマントが4個あ
るときは、音声入力信号Soに対してi=0,1,
…8について自己相関V0,…V8を求め、これに
よつて、第1フオルマントに対するr0,…r6を求
め、このr0,….r6を(6)式右辺のViに代入して第
2ホルマントに対するr0,…r4を求め、さらに同
様にして第3ホルマントおよび第4ホルマントを
全部考慮したr0すなわちエラーパワーΣe2 oを求め
ることができる。各種の極パラメータに対して上
述の演算によりエラーパワーΣe2 oを求め、その最
小値を与える極パラメータ値を抽出することがで
きる。上述の(6)式による演算は、(nB−nA)が300
程度の値であることから、前述の(2),(3)式を用い
てエラーパワーを算出するのに比して、乗算回
数,加算回数とも大幅に低減することができる。 r i = (1+α 1 2 + α 2 2 )V i −(α 1 −α 1 α 2 )V i+1 −
(α 1 −α 1 α 2 )V i-1 −α 2 V i-2 −α 2 V i+2 …(6) However, V i = oB 〓 n=nA S o S oi (i: time slot (7) That is, V i is the autocorrelation value of the input signal S o . Furthermore, due to the nature of the analysis window, V i =V -i . Therefore, from the autocorrelation value V i of the input signal S o and the linearity prediction coefficients α 1 and α 2 , the error power oB 〓 n=nA e o 2 (i.e. r 0 )
can be found. When there are multiple poles (6)
By substituting r i obtained by the equation into V i on the right side of equation (6) to obtain a new r i , and repeating this process, the final r 0 can be obtained. For example, when there are four formants, i=0 , 1,
. . 8 is determined, and from this , r 0 , . . . r 6 for the first formant is determined. Substitute r 6 into Vi on the right side of equation (6) to find r 0 ,...r 4 for the second formant, and then similarly calculate r 0 , that is, the error power Σe 2 taking into account both the third and fourth formants. o can be found. It is possible to obtain the error power Σe 2 o for various polar parameters by the above-mentioned calculation, and extract the polar parameter value that gives the minimum value. In the calculation using equation (6) above, (n B −n A ) is 300
Since the value is of the order of magnitude, both the number of multiplications and the number of additions can be significantly reduced compared to calculating the error power using equations (2) and (3) described above.
さらに、すべての極パラメータ値について、上
述の演算を行なう必要はない。最初は粗く量子化
した極パラメータ値についてエラーパワーの最小
値を求めて、粗い極パラメータ値を求め、逐次極
パラメータ値の精度を上げるようにすれば、最終
抽出までの演算回数はさらに大幅に減小できる。
今、例えば、フオルマントの数をM個とし、極パ
ラメータ値は各フオルマントに対してあらかじめ
用意されたF個のうちから選ぶものとすると、す
べての組合せについて総当り法で演算する場合は
FM回の演算が必要になる。代表的な例としてM
=4,F=32程度としても324回の膨大な演算が
必要である。本発明では、最初は極パラメータを
粗く推定し、その結果を用いて段階的に逐次細か
く推定して行くことが可能である。すなわち、前
段においては前記F個の極パラメータ値の中から
粗く量子化された小数個のパラメータ値について
各極の組合せによつて最適値を求める。そして、
後段においては、前段において求められた極パラ
メータ値の近傍の小数個の極に限定して極パラメ
ータ値の推定を行う。換言すればF個のパラメー
タを量子化符号で表わし、前段では上位桁につい
て最適値を求め、その結果を利用して逐次下位桁
まで求めるようにすればよい。例えば、分割段数
をL,各段における各極の量子化レベルをIとす
ると、分割段数Lを、L=logIF程度に定めれば
十分な精度で極パラメータ値の推定を行なうこと
ができる。従つてIM×L回程度エラーパワーを演
算することによつて極パラメータ値を求めること
ができる。一例として、M=5,F=32,I=2
とすると、分割段数Lは5程度(I=2であるか
ら、一段毎に精度を倍にすることができる)とな
り、160回程度のエラーパワー計算により極パラ
メータ値の推定を行なうことが可能である。 Furthermore, it is not necessary to perform the above calculations for all polar parameter values. The number of calculations until the final extraction can be further reduced significantly by first finding the minimum error power for the coarsely quantized polar parameter values, determining coarse polar parameter values, and increasing the precision of the polar parameter values sequentially. I can do it small.
Now, for example, if the number of formants is M, and the polar parameter value is selected from F prepared in advance for each formant, then when calculating all combinations using the brute force method,
F M calculations are required. As a typical example, M
= 4 and F = 32, a huge number of calculations, 324 times, are required. In the present invention, it is possible to first roughly estimate the polar parameters and then use the results to gradually and finely estimate them. That is, in the first stage, an optimum value is determined for a decimal number of coarsely quantized parameter values from among the F pole parameter values by combining each pole. and,
In the latter stage, the estimation of the pole parameter values is limited to a small number of poles in the vicinity of the pole parameter values determined in the former stage. In other words, the F parameters may be expressed by quantization codes, the optimum values for the upper digits may be obtained in the first stage, and the results may be used to sequentially obtain the optimum values for the lower digits. For example, if the number of division stages is L and the quantization level of each pole in each stage is I, then the pole parameter values can be estimated with sufficient accuracy by setting the number of division stages L to approximately L = log I F. . Therefore, the polar parameter value can be determined by calculating the error power about I M ×L times. As an example, M=5, F=32, I=2
Then, the number of division stages L is about 5 (since I = 2, the accuracy can be doubled for each stage), and it is possible to estimate the polar parameter value by calculating the error power about 160 times. be.
また、極パラメータ値の推定を行なう際に、推
定範囲の制限等の制約を容易に設けることができ
るから、過去の分析フレームにおける推定結果を
参照して、現在の分析フレームにおける極パラメ
ータ値の推定範囲を制限することにより、極パラ
メータ値の大きな不連続が生じることを防ぐこと
ができる利点もある。 Furthermore, when estimating polar parameter values, constraints such as limits on the estimation range can be easily set, so estimation results of past analysis frames can be referenced to estimate polar parameter values in the current analysis frame. Limiting the range also has the advantage of preventing large discontinuities in extreme parameter values from occurring.
以上の説明においては、説明の簡単のため、極
パラメータ値の推定の場合についてのべたが、零
点のパラメータ値の推定も、零点を表わす2つの
線形予測係数を用いて同様に行なうことができ
る。 In the above explanation, for the sake of simplicity, the case of estimating the polar parameter value has been described, but the estimation of the parameter value at the zero point can be similarly performed using two linear prediction coefficients representing the zero point.
また、上述では線形予測係数をα1とα2のみ考え
たが3次以上の予測係数を用いる場合であつても
同様な方法で極パラメータ値を求めることがで
き、同様な効果を奏することは明らかである。 In addition, in the above, only linear prediction coefficients α 1 and α 2 were considered, but even when using third-order or higher prediction coefficients, the polar parameter values can be obtained in the same way, and the same effect can be achieved. it is obvious.
以上の原理に基づいた、本発明の具体的な実施
例を図に示す。先ず、音声波形が、音声波形入力
端子1を介して分析窓回路2に入力される。分析
窓回路2はフレーム同期信号生成回路9の生成す
るフレーム同期信号に従つて、入力音声波形に対
して分析窓をかけ、その結果出力波形を自己相関
値算出回路3に入力させる。自己相関値算出回路
3は、前記フレーム同期信号に従つて、入力波形
の自己相関値Vi(例えばi=0〜8)を算出し、
自己相関値バツフア4に蓄積させる。該自己相関
値Viは、制御回路11から与えられる制御信号に
よつて逆フイルタリング回路(演算回路)5に与
えられる。一方、各種極パラメータ値がアドレス
極パラメータ値変換回路8に記憶されていて、任
意の極の任意のパラメータ(例えば第1フオルマ
ントの第1パラメータ)が制御回路11を介して
線形予測係数生成回路10を与えられ、線形予測
係数生成回路10は該極パラメータ値から線形予
測係数α1,α2を算出して逆フイルタリング回路5
に与える。逆フイルタリング回路(演算回路)5
は、与えられた線形予測係数α1,α2と前記自己相
関値Viにより前記(6)式の演算を行なつて、その結
果を自己相関値一時記憶回路6に記憶させる。例
えば前記自己相関値V0〜V8が与えられたときは、
(6)式の演算結果により、r0〜r6が得られる。自己
相関値一時記憶回路6は、制御回路11からの制
御データに従つて、上記演算結果r0〜r6を前記逆
フイルタリング回路5に与えると共にエラーパワ
ー値を出力する。次に、例えば第2フオルマント
の第1パラメータ値に対応する予測係数α1,α2に
より上記演算結果のr0〜r6から、新たな自己相関
値r0〜r4を演算する。以下同様にして、第4ホル
マントまでについてのr0すなわち、エラーパワー
が演算され自己相関値一時記憶回路6に記憶す
る。同様にして各ホルマントの各極パラメータ値
の組合せについてエラーパワーが演算蓄積される
と、最小値検出回路7は、制御回路11から与え
られる制御データに従つて、上記エラーパワーの
うち最小のものを検出して、該最小のエラーパワ
ーが得られたときの各極の極パラメータ値が格納
されているアドレスデータを出力して、アドレス
極パラメータ値変換回路8に与える。アドレス極
パラメータ値変換回路8は、指定されたアドレス
に記憶されている極パラメータ値を出力する。こ
れによつて、最小エラーパワーを与える極パラメ
ータを得ることができる。 A specific embodiment of the present invention based on the above principle is shown in the drawings. First, an audio waveform is input to the analysis window circuit 2 via the audio waveform input terminal 1. The analysis window circuit 2 applies an analysis window to the input audio waveform in accordance with the frame synchronization signal generated by the frame synchronization signal generation circuit 9, and inputs the resulting output waveform to the autocorrelation value calculation circuit 3. The autocorrelation value calculation circuit 3 calculates the autocorrelation value V i (for example, i=0 to 8) of the input waveform according to the frame synchronization signal,
It is stored in the autocorrelation value buffer 4. The autocorrelation value V i is given to the inverse filtering circuit (arithmetic circuit) 5 by a control signal given from the control circuit 11 . On the other hand, various pole parameter values are stored in the address pole parameter value conversion circuit 8, and any parameter of any pole (for example, the first parameter of the first formant) is sent to the linear prediction coefficient generation circuit 10 via the control circuit 11. is given, the linear prediction coefficient generation circuit 10 calculates the linear prediction coefficients α 1 and α 2 from the pole parameter values, and the inverse filtering circuit 5
give to Inverse filtering circuit (arithmetic circuit) 5
calculates the above equation (6) using the given linear prediction coefficients α 1 and α 2 and the autocorrelation value Vi , and stores the result in the autocorrelation value temporary storage circuit 6. For example, when the autocorrelation values V 0 to V 8 are given,
r 0 to r 6 are obtained from the calculation result of equation (6). The autocorrelation value temporary storage circuit 6 provides the above calculation results r 0 to r 6 to the inverse filtering circuit 5 according to control data from the control circuit 11 and outputs an error power value. Next, new autocorrelation values r 0 to r 4 are calculated from the above calculation results r 0 to r 6 using, for example, prediction coefficients α 1 and α 2 corresponding to the first parameter value of the second formant. Thereafter, in the same manner, r0 , that is, the error power for up to the fourth formant is calculated and stored in the autocorrelation value temporary storage circuit 6. Similarly, when the error power is calculated and accumulated for each combination of polar parameter values of each formant, the minimum value detection circuit 7 detects the minimum error power among the above-mentioned error powers according to the control data given from the control circuit 11. The address data storing the pole parameter value of each pole when the minimum error power is obtained is outputted and given to the address pole parameter value conversion circuit 8. The address pole parameter value conversion circuit 8 outputs the pole parameter value stored at the designated address. This makes it possible to obtain the pole parameters that give the minimum error power.
なお、例えば、前段において、極パラメータ推
定を極パラメータ値の上位桁についてのみ上記の
選択を行つたときは、上記アドレス極パラメータ
値変換回路8は、次段においては上記結果の近傍
における下位桁まで含んだ極パラメータ値を制御
回路11を介して線形予測係数生成回路10に送
り、演算回路5,自己相関値一時記憶回路6,最
小値検出回路7等は前述と同様な動作によつて再
びエラーパワーの最小値を求め該当アドレスを出
力する。上述の動作をくり返して、逐次推定精度
を高めて行き、最下位桁までについての推定が完
了すれば、その極パラメータ値を最終段の推定値
として出力端子17から出力する。すなわち、極
パラメータ値の推定を、前段においては粗く推定
することによつて組合せの数を減じ、逐次推定の
精度を高めて行くようにすることができる。最初
から、全組合せについてエラーパワーを求める場
合に比較して、組合せ数を格段に少なくすること
ができ、従つて演算回数も少なくてよい。 For example, when the above selection is made for pole parameter estimation only for the upper digits of the pole parameter value in the previous stage, the address pole parameter value conversion circuit 8 in the next stage estimates up to the lower digits in the vicinity of the above result. The included polar parameter values are sent to the linear prediction coefficient generation circuit 10 via the control circuit 11, and the arithmetic circuit 5, autocorrelation value temporary storage circuit 6, minimum value detection circuit 7, etc. perform the same operation as described above to generate an error again. Find the minimum power value and output the corresponding address. The above-mentioned operation is repeated to successively improve the estimation accuracy, and when the estimation up to the least significant digit is completed, the polar parameter value is outputted from the output terminal 17 as the final stage estimation value. That is, by roughly estimating the polar parameter values in the first stage, it is possible to reduce the number of combinations and improve the accuracy of successive estimation. Compared to the case where error power is determined for all combinations from the beginning, the number of combinations can be significantly reduced, and therefore the number of calculations can be reduced.
以上のように、本発明においては、入力音声信
号の自己相関値と線形予測係数からエラーパワー
を算出して、該エラーパワー最小値に対応するる
極零パラメータを推定値とするように構成されて
いるから、比較的少ない演算回数で極零パラメー
タを得ることができる効果がある。 As described above, in the present invention, the error power is calculated from the autocorrelation value and the linear prediction coefficient of the input audio signal, and the pole-zero parameter corresponding to the minimum error power value is used as the estimated value. Therefore, it is possible to obtain pole-zero parameters with a relatively small number of calculations.
なお、極パラメータ等の推定を前段で粗く推定
し、その結果を利用して逐次精度を上げて推定す
るようにすれば、組合せの数を大幅に減少させる
ことができるから、演算回数をさらに大幅に減少
させることができるという効果がある。 Note that if the estimation of polar parameters, etc. is roughly estimated in the first stage and the results are used to increase the accuracy and estimate, the number of combinations can be significantly reduced, and the number of calculations can be further reduced. This has the effect that it can be reduced to
また、前の分析フレームから得た極パラメータ
値等に基づいて、推定範囲に制約を加えることが
容易であるから、分析フレーム間における極パラ
メータ値等の大きな不連続を避けることができる
利点がある。 Additionally, it is easy to place constraints on the estimation range based on the extreme parameter values obtained from the previous analysis frame, which has the advantage of avoiding large discontinuities in extreme parameter values, etc. between analysis frames. .
図は本発明の一実施例を示すブロツク図であ
る。
図において、1…音声波形入力端子、2…分析
窓回路、3…自己相関値算出回路、4…自己相関
値バツフア、5…演算回路、6…自己相関値一時
記憶回路、7…最小値検出回路、8…アドレス・
極パラメータ値変換回路、9…フレーム同期信号
生成回路、10…線形予測係数生成回路、11…
制御回路、12〜16…制御データ伝送路、17
…極パラメータ値出力端子。
The figure is a block diagram showing one embodiment of the present invention. In the figure, 1...audio waveform input terminal, 2...analysis window circuit, 3...autocorrelation value calculation circuit, 4...autocorrelation value buffer, 5...arithmetic circuit, 6...autocorrelation value temporary storage circuit, 7...minimum value detection Circuit, 8...Address/
Polar parameter value conversion circuit, 9... Frame synchronization signal generation circuit, 10... Linear prediction coefficient generation circuit, 11...
Control circuit, 12 to 16... Control data transmission line, 17
...Polar parameter value output terminal.
Claims (1)
零および自然数)を算出する自己相関値算出回路
と、 各種の極または零パラメータ値をあらかじめ記
憶しアドレス入力に対応して該当番地に記憶した
極パラメータ値を出力するアドレス・極パラメー
タ値変換回路と、 該変換回路の出力パラメータ値から線形予測係
数α1およびα2を生成する線形予測係数生成回路
と、 前記自己相関値算出回路の出力値Viが入力され
前記線形予測係数生成回路から与えられた予測係
数α1、α2を用いて出力値 ri=(1+α1 2+α2 2)Vi−(α1−α1α2)Vi+1 −(α1−α1α2)Vi-1−α2Vi-2−α2Vi+2 を演算する演算回路と、 該演算回路の出力値を記憶する自己相関値一時
記憶回路と、 該記憶回路の記憶する出力値のうちエラーパワ
ーのうち最小のものr0を検出しこれに対応する前
記アドレス・極パラメータ変換回路のアドレスを
出力する最小値検出回路と を備えたことを特徴とする極零パラメータ値抽出
装置。[Claims] 1. An autocorrelation value calculation circuit that calculates an autocorrelation value V i (i is zero or a natural number) within a time window from an audio signal, and a circuit that stores various pole or zero parameter values in advance and inputs them to an address. an address/polarity parameter value conversion circuit that outputs polar parameter values stored in corresponding addresses; a linear prediction coefficient generation circuit that generates linear prediction coefficients α 1 and α 2 from the output parameter values of the conversion circuit; The output value V i of the autocorrelation value calculation circuit is input and the prediction coefficients α 1 and α 2 given from the linear prediction coefficient generation circuit are used to calculate the output value r i =(1+α 1 2 +α 2 2 )V i −( an arithmetic circuit that calculates α 1 −α 1 α 2 )V i+1 −(α 1 −α 1 α 2 )V i-1 −α 2 V i-2 −α 2 V i+2 ; and the arithmetic circuit. an autocorrelation value temporary storage circuit that stores the output value of the storage circuit, and detects the minimum error power r 0 among the output values stored in the storage circuit, and determines the corresponding address of the address/polarity parameter conversion circuit. 1. A pole-zero parameter value extraction device, comprising: a minimum value detection circuit that outputs a minimum value.
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP56037264A JPS57152000A (en) | 1981-03-17 | 1981-03-17 | Polar zero parameter value extractor |
| CA000398517A CA1164569A (en) | 1981-03-17 | 1982-03-16 | System for extraction of pole/zero parameter values |
| US06/358,638 US4486899A (en) | 1981-03-17 | 1982-03-16 | System for extraction of pole parameter values |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP56037264A JPS57152000A (en) | 1981-03-17 | 1981-03-17 | Polar zero parameter value extractor |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS57152000A JPS57152000A (en) | 1982-09-20 |
| JPS6367200B2 true JPS6367200B2 (en) | 1988-12-23 |
Family
ID=12492801
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP56037264A Granted JPS57152000A (en) | 1981-03-17 | 1981-03-17 | Polar zero parameter value extractor |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS57152000A (en) |
-
1981
- 1981-03-17 JP JP56037264A patent/JPS57152000A/en active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS57152000A (en) | 1982-09-20 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3167787B2 (en) | Digital speech coder | |
| JP3299277B2 (en) | Time-varying spectrum analysis based on speech coding interpolation | |
| JPS60194499A (en) | Voice analysis system | |
| CA1061906A (en) | Speech signal fundamental period extractor | |
| US4922539A (en) | Method of encoding speech signals involving the extraction of speech formant candidates in real time | |
| CA1164569A (en) | System for extraction of pole/zero parameter values | |
| US5577160A (en) | Speech analysis apparatus for extracting glottal source parameters and formant parameters | |
| JPS6367200B2 (en) | ||
| JPH05265495A (en) | Speech encoding device and its analyzer and synthesizer | |
| US4845754A (en) | Pole-zero analyzer | |
| CA1270568A (en) | Formant pattern matching vocoder | |
| JPH0235992B2 (en) | ||
| JP2539351B2 (en) | Speech synthesis method | |
| JPH0863192A (en) | Device for extracting spectrum parameter | |
| JP2898637B2 (en) | Audio signal analysis method | |
| JPH0728497A (en) | Voice coding device and its analyzer and synthesizer | |
| JPS62180398A (en) | Pole parameter value extractor | |
| JPS6220560B2 (en) | ||
| JPH0670753B2 (en) | Polar zero analyzer | |
| JPH0122638B2 (en) | ||
| JPH0670754B2 (en) | Polar zero analyzer | |
| JPS62180400A (en) | Pole zero analyzer | |
| JPH0235990B2 (en) | ||
| JPS62278598A (en) | Band division type vocoder | |
| JPH0644197B2 (en) | Polar zero analyzer |