JPH0441838B2 - - Google Patents
Info
- Publication number
- JPH0441838B2 JPH0441838B2 JP59179694A JP17969484A JPH0441838B2 JP H0441838 B2 JPH0441838 B2 JP H0441838B2 JP 59179694 A JP59179694 A JP 59179694A JP 17969484 A JP17969484 A JP 17969484A JP H0441838 B2 JPH0441838 B2 JP H0441838B2
- Authority
- JP
- Japan
- Prior art keywords
- csm
- lpc
- synthesis
- output
- variable
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 230000015572 biosynthetic process Effects 0.000 claims description 79
- 238000003786 synthesis reaction Methods 0.000 claims description 78
- 230000005540 biological transmission Effects 0.000 claims description 29
- 230000005236 sound signal Effects 0.000 claims description 14
- 238000011156 evaluation Methods 0.000 claims description 3
- 230000002194 synthesizing effect Effects 0.000 claims description 3
- 230000006870 function Effects 0.000 description 38
- 238000001228 spectrum Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 15
- 238000000034 method Methods 0.000 description 14
- 238000001308 synthesis method Methods 0.000 description 12
- 239000011159 matrix material Substances 0.000 description 11
- 230000003595 spectral effect Effects 0.000 description 8
- 230000015654 memory Effects 0.000 description 7
- 239000002131 composite material Substances 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 5
- 230000010355 oscillation Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000005309 stochastic process Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000007423 decrease Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000002940 Newton-Raphson method Methods 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 239000003990 capacitor Substances 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000013441 quality evaluation Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000010356 wave oscillation Effects 0.000 description 1
Landscapes
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
- Magnetic Resonance Imaging Apparatus (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
【発明の詳細な説明】
(技術分野)
本発明は擬フオルマント型ボコーダ、とくに合
成側に2種類の異なる合成手段を設けて動作環境
に適応させる機能を有する擬フオルマント型ボコ
ーダに関する。DETAILED DESCRIPTION OF THE INVENTION (Technical Field) The present invention relates to a pseudo-formant vocoder, and particularly to a pseudo-formant vocoder that has two different types of synthesis means on the synthesis side to adapt to the operating environment.
音声分析側でCSM(Composite Sinusoidal
Modeling:複合正弦波モデル)音声分析により
音声信号の擬フオルマント情報を抽出し、これを
合成側に伝送して、この擬フオルマント情報
(CSMパラメータ)から独特のCSM音声合成手
段を用いて音声を再現させる擬フオルマント型ボ
コーダは、嵯峨山氏らの論文“複合正弦波モデル
による音声スペクトルの分析”電子通信学会誌
Vol.J64−ANo.2により明らかにされている。 CSM (Composite Sinusoidal
Modeling: Composite sine wave model) Extract pseudo-formant information from the audio signal through audio analysis, transmit this to the synthesis side, and reproduce speech from this pseudo-formant information (CSM parameters) using a unique CSM speech synthesis method. The pseudo-formant type vocoder that allows
This is clarified by Vol.J64-ANo.2.
この擬フオルマント型ボコーダは、後述するよ
うに、合成側に伝送されるパラメータによつて帯
域特性が指定されるような帯域フイルタを含ま
ず、このために伝送情報に誤りが生じても不安定
に陥ることがないために、とくに伝送路の誤り率
の劣化に対して強い耐性を有している。しかしな
がら、誤り率が問題にならないような動作環境の
場合には、同じ程度の情報量を用いて再成された
LPC音声合成方式による再生音声に対して音質
がやや劣るという欠点を有している。 As will be explained later, this pseudo-formant vocoder does not include a band filter whose band characteristics are specified by parameters transmitted to the synthesis side, and therefore becomes unstable even if an error occurs in the transmitted information. Because it does not cause errors, it has particularly strong resistance to deterioration in the error rate of the transmission path. However, if the operating environment is such that the error rate is not a problem, the
It has the disadvantage that the sound quality is slightly inferior to the sound reproduced by the LPC speech synthesis method.
(発明の目的)
本発明の目的は、伝送路の誤り率が良好な場合
に、より高度の音声品質が得られるLPC音声合
成方式と、誤り率の劣化に対してより高い耐性を
もつCSM音声合成方式の両者の特徴を併せもつ
擬フオルマント型ボコーダを提供するにある。(Objective of the Invention) The object of the present invention is to provide an LPC speech synthesis method that can obtain higher speech quality when the error rate of the transmission path is good, and a CSM speech synthesis method that has higher resistance to error rate degradation. The object of the present invention is to provide a pseudo-formant type vocoder that combines the features of both synthesis methods.
(発明の構成)
本発明のボコーダは、入力音声信号のCSM分
析によつて抽出されるCSMパラメータ情報を伝
送する送信側と、前記伝送路を介して伝送された
前記CSMパラメータ情報の指定する各周波数に
設定される複数の位相リセツト機能付可変周波数
発振器とこれに対応して前記発振器の出力を伝送
された前記CSMパラメータ情報の指定する各強
度に設定する複数の可変利得増幅器と前記複数の
増幅器の合成出力に演算する可変長窓関数発生器
と乱数発生器とを備え有声音合成時にはピツチ周
期に対応して前記各発振器の位相リセツトを行な
いまた無声音合成時には前記乱数発生器の出力よ
り算出される周期に対応して前記各発振器の位相
リセツトを行ないまた前記窓関数発生器の動作を
前記位相リセツトの動作と同期せしめるようにし
てCSM音声合成を行なうCSM合成手段と、伝送
された前記CSMパラメータ情報をLPCパラメー
タ情報に変換しこれを用いてLPC音声合成を行
なうLPC合成手段と、前記CSM合成手段の出力
と前記LPC合成手段の出力とを前記伝送路の伝
送品質に対する評価に従つて可変荷重合成するよ
うにした可変荷重合成手段とを含む受信側とを有
する。(Structure of the Invention) The vocoder of the present invention includes a transmitter that transmits CSM parameter information extracted by CSM analysis of an input audio signal, and a transmitter that transmits CSM parameter information that is transmitted via the transmission path. a plurality of variable frequency oscillators with a phase reset function that are set to different frequencies; a plurality of variable gain amplifiers that correspondingly set the outputs of the oscillators to respective strengths specified by the transmitted CSM parameter information; and the plurality of amplifiers. The oscillator is equipped with a variable length window function generator and a random number generator that operate on the synthesized output of the oscillator.When synthesizing voiced sounds, the phase of each oscillator is reset in accordance with the pitch period.When synthesizing unvoiced sounds, the phase of each oscillator is reset based on the output of the random number generator. CSM synthesis means for performing CSM speech synthesis by resetting the phase of each of the oscillators in accordance with the period of the oscillator and synchronizing the operation of the window function generator with the operation of the phase reset; LPC synthesis means converts parameter information into LPC parameter information and performs LPC speech synthesis using this; and the output of the CSM synthesis means and the output of the LPC synthesis means are varied according to the evaluation of the transmission quality of the transmission path. and a receiving side including variable weight combining means adapted to perform weight combining.
(原 理)
次に、本ボコーダの成立に重要な関係を有する
CSM音声分析合成の原理について説明する。(Principle) Next, there is an important relationship in the establishment of this vocoder.
The principles of CSM speech analysis and synthesis will be explained.
CSMとは、音声信号を振幅と周波数とを自由
に選べるパラメータとしてもつ特定の個数の正弦
波の和として、表現するものである。この正弦波
の個数としては高々4〜6個の予め定めた数が用
いられる。 CSM expresses an audio signal as the sum of a specific number of sine waves whose amplitude and frequency are freely selectable parameters. A predetermined number of 4 to 6 sine waves is used at most.
従つてCSM音声合成を行なう場合には、まず
音声信号をCSM音声分析により、予め定められ
た個数の正弦波の和として表現する必要がある。
CSM音声分析については後に詳述することとし、
ここではその要点のみを説明する。 Therefore, when performing CSM speech synthesis, it is first necessary to express the speech signal as a sum of a predetermined number of sine waves by CSM speech analysis.
CSM voice analysis will be explained in detail later.
Only the main points will be explained here.
CSM分析においてもLPC分析の場合と同様に、
位相情報の無視、音源の影響の平均化、雑音成分
による不安定性の回避等を目的に、中間パラメー
タとして自己相関係数を使用する。 In CSM analysis, as in LPC analysis,
An autocorrelation coefficient is used as an intermediate parameter for the purpose of ignoring phase information, averaging the influence of sound sources, and avoiding instability due to noise components.
すなわち、CSM分析は、各分析フレーム毎に
表現されるべき音声波形から直接算出される標本
自己相関係数の低次のタツプのN個を、合成波の
自己相関係数の低次のタツプのN個と一致するよ
うに、合成すべき各正弦波の周波数およびその強
度(電力振幅)を決定することである。 In other words, in CSM analysis, N low-order taps of sample autocorrelation coefficients directly calculated from the speech waveform to be expressed for each analysis frame are combined with N low-order taps of autocorrelation coefficients of a synthesized wave. The purpose is to determine the frequency and intensity (power amplitude) of each sine wave to be synthesized so that they match the N sine waves.
今、合成すべき正弦波の個数をnとし、各正弦
波の角周波数をωi(i=1,2,…n)、各正弦波
の強度をmiとすると、CSMの合成波ytは、
yt=o
〓i=1
√isin(ωit+φi)
となるが、このタツプlの自己相関係数γlはωi,
miを用いて容易に表わされ、
γl=o
〓i=1
micosl ωi
である。 Now, if the number of sine waves to be synthesized is n, the angular frequency of each sine wave is ω i (i=1, 2,...n), and the intensity of each sine wave is m i , then the CSM composite wave y t is y t = o 〓 i=1 √ i sin(ω it +φ i ), but the autocorrelation coefficient γ l of this tap l is ω i ,
It is easily expressed using m i , and γ l = o 〓 i=1 m i cosl ω i .
一方、表現されるべき音声波形のサンプルを
Xtとすると、あるフレームにおけるタツプlの
標本自己相関係数υlは
υl=1/MM-1
〓t=l
XtXt-l
として与えられる。 On the other hand, the sample of the audio waveform to be expressed is
If X t , the sample autocorrelation coefficient υ l of tap l in a certain frame is given as υ l =1/M M-1 〓 t=l X t X tl .
但し、Mは1分析フレームにおけるサンプル数
である。 However, M is the number of samples in one analysis frame.
さて、CSM分析においては、上述のγlが、与
えられたυlと低次のN個について等しくなるよう
に各mi,ωiの値を決定することである。 Now, in the CSM analysis, the value of each m i and ω i is determined so that the above-mentioned γ l is equal to the given υ l for N low-order values.
すなわち、
γl=υl:但し、l=0,1,2,…N
が成立するようにmi,ωiの値を決定することであ
る。 That is, γ l =υ l : However, the values of m i and ω i are determined so that l=0, 1, 2, . . . N holds true.
この具体的な方法については後に詳述すること
にして、ここでは、上述のn個の正弦波のmiお
よびωiが、与えられた音声信号に応答して各分析
フレームごとに次次に得られるものとする。 This specific method will be explained in detail later, but here, m i and ω i of the n sine waves mentioned above are shall be obtained.
こうして得られたCSMパラメータmi,ωiによ
る音声特徴ペクトルパターンの一例を第1図に示
す。 FIG. 1 shows an example of a speech feature vector pattern based on the CSM parameters m i and ω i obtained in this way.
また、分析フレームの窓長を30mSECとして分
析した9次(N=9)のCSM(正弦波の個数n=
5)ラインスペクトルと同一の音声サンプルより
求めた9次LPCスペクトル包絡(LPC合成フイ
ルタの周波数伝送特性)との対応例を第2図に示
す。 In addition, the 9th order (N = 9) CSM (number of sine waves n =
5) Figure 2 shows an example of the correspondence between the line spectrum and the 9th-order LPC spectrum envelope (frequency transmission characteristic of the LPC synthesis filter) obtained from the same audio sample.
なお、上述の次数Nと、正弦波の個数nとの間
には後述するように
N=2n−1
の関係がある。 Note that there is a relationship of N=2n-1 between the above-mentioned order N and the number n of sine waves, as described later.
これらの図より、CSMは表現すべき原音声の
特徴を抽出した情報を含んでいることが窺える。 From these figures, it can be seen that the CSM contains information that extracts the features of the original speech that should be expressed.
しかしながら、こうしてCSM分析の結果得ら
れたn個のmi,ωiの値を用いて、このmi,ωiで指
定される強度(実際の振幅は前述のように√i)
および角周波数をもつn個の正弦波を作り、これ
を単純に加算合成しただけでは、人間の耳には、
単に正弦波が合成された音として聞える程度で、
もとの音声を再現するという目的は殆んど達成で
きない。 However, using the n values of m i and ω i obtained as a result of CSM analysis, the intensity specified by these m i and ω i (the actual amplitude is √ i as mentioned above)
If you create n sine waves with angular frequencies and simply add and synthesize them, the human ear will hear:
The sound can simply be heard as a synthesized sine wave,
The purpose of reproducing the original sound is hardly achieved.
これは、正弦波を単純加算しても、発生された
信号のスペクトルは、離散化されたn個の線スペ
クトルに過ぎず、一方、音声信号のスペクトルは
連続的なスペクトル包絡を有し、さらにまた、有
声音ではピツチ構造で表現され、また無声音では
確率過程で表現される微細なスペクトル構造を合
せもつていて、単純加算したCSMと音声信号と
はスペクトル構造が全く異なつていることに起因
すると考えられる。 This means that even if you simply add sine waves, the spectrum of the generated signal is just a discretized n line spectrum, whereas the spectrum of the audio signal has a continuous spectral envelope, and In addition, voiced sounds have a pitch structure, while unvoiced sounds have a fine spectral structure that is represented by a stochastic process. This is because the spectral structure of a simply added CSM and a speech signal is completely different. Conceivable.
そこで、CSMを用いて音声を合成するには、
何らかの方法を用いて線スペクトルを連続的なス
ペクトルへ拡散することが必要となる。つまり
CSM音声合成とは、第1図、第2図で示される
ような線スペクトルで表現された音声特徴スベク
トルパターンから音声スペクトルパターンを発生
させることと考えることができる。 Therefore, to synthesize speech using CSM,
It is necessary to use some method to spread the line spectrum into a continuous spectrum. In other words
CSM speech synthesis can be thought of as generating a speech spectrum pattern from a speech feature vector pattern expressed by a line spectrum as shown in FIGS. 1 and 2.
本発明においては、CSM音声合成において上
述のスペクトル拡散を行なうために、以下のよう
な手法を用いる。 In the present invention, the following method is used to perform the above-described spread spectrum in CSM speech synthesis.
すなわち、有声音は明確なピツチ構造を有する
ため、前述のようにして指定されるn個の各正弦
波を、このピツチ周期ごとに位相のリセツトを行
なう。これにより、簡単にスペクトル包絡の発生
とピツチの微細スペクトル構造の発生とが可能に
なる。 That is, since voiced sounds have a clear pitch structure, the phase of each of the n sine waves specified as described above is reset every pitch period. This makes it possible to easily generate a spectral envelope and a fine pitch spectral structure.
さらにまた、実施例の説明において詳述するよ
うな特殊の時間窓処理を上述の位相リセツト波形
に施すことにより位相リセツト時における合成波
形の不連続性を除き、音声波形のもつ連続性を確
保している。 Furthermore, by applying special time window processing to the above-mentioned phase reset waveform as detailed in the explanation of the embodiment, discontinuity in the synthesized waveform at the time of phase reset can be removed and continuity of the audio waveform can be ensured. ing.
以上の実施により第2図に示したCSMのライ
ンスペクトルは、第3図Aに示されるように拡散
され、スペクトル包絡とピツチの微細構造とを有
するスペクトルに変化し、聴覚的にも充分実用に
耐える音質が得られることが実験結果明らかとな
つている。 Through the above implementation, the CSM line spectrum shown in Figure 2 is diffused as shown in Figure 3A, and changed to a spectrum having a spectral envelope and pitch fine structure, which is sufficiently practical for auditory purposes. Experimental results have shown that durable sound quality can be obtained.
なお参考のため、上述の処理を行なわず単純加
算をしただけのCSMのスペクトルを第3図Bに
示す。前述のように、このようなスペクトルをも
つ波形では聴覚的には単に正弦波が合成された音
として聞える程度で、音声を再現するという目的
は殆んど達成されない。 For reference, FIG. 3B shows a CSM spectrum obtained by simple addition without performing the above-mentioned processing. As mentioned above, a waveform with such a spectrum can only be heard audibly as a synthesized sound of sine waves, and the purpose of reproducing speech is hardly achieved.
以上は有声音の場合であるが、無声音の場合に
は以下のように行なう。すなわち、上述の有声音
の場合に、ピツチ周期毎に行なつた位相のリセツ
トと特殊の時間窓処理とを、無声音の場合にはピ
ツチ周期のかわりに、確率過程としてランダムに
発生するパルスを用い、このパルスの発生時点ご
とに上述の処理を実施するようにする。 The above is for voiced sounds, but in the case of unvoiced sounds, it is performed as follows. That is, in the case of voiced sounds mentioned above, the phase reset and special time window processing performed at every pitch period are performed, whereas in the case of unvoiced sounds, randomly generated pulses are used as a stochastic process instead of pitch periods. , the above-mentioned processing is performed every time this pulse is generated.
以上の手法を用いることにより聴覚的に充分実
用に耐えるCSM音声合成を行なうことができる。
なお、以上のCSM音声合成はフイルタを用いな
い合成法であるため、合成側の安定性に対する考
慮を必要としない。このため、mi,ωiの情報を合
成側に伝送し、合成側で上述のCSM音声合成に
より音声を再現するような通信手段に用いる場合
に、伝送路の品質が比較的劣悪で伝送途中でエラ
ーを発生するような場合にもエラーに対する耐性
が強く、比較的良好な音質を保持するという特徴
がある。 By using the above method, it is possible to perform CSM speech synthesis that is auditorily sufficient for practical use.
Note that since the above CSM speech synthesis is a synthesis method that does not use a filter, there is no need to consider stability on the synthesis side. For this reason, when transmitting the information of m i and ω i to the synthesis side and using it as a communication means to reproduce the voice by the above-mentioned CSM speech synthesis on the synthesis side, the quality of the transmission path is relatively poor and the transmission is interrupted. Even when an error occurs, it is highly resistant to errors and maintains relatively good sound quality.
しかしながら一方、エラーの少ない場合には、
同程度の情報量を用いたLPCパラメータによる
音声合成に対して音質がやや劣るという欠点があ
る。 However, on the other hand, if there are few errors,
The disadvantage is that the sound quality is slightly inferior to speech synthesis using LPC parameters using the same amount of information.
そこで本ボコーダにおいては、合成側におい
て、LPCパラメータによる音声合成を行なう
LPC音声合成手段と、上に述べたCSM音声合成
手段と、上に述べたCSM音声合成手段との両手
段を別に設けておき、両者の出力を伝送路の品質
評価に従つて可変荷重合成を行なう。これにより
伝送路品質が非常に良好な場合には、LPC音声
合成手段の出力が用いられ、また伝送路の品質が
非常に悪い場合にはCSM音声合成手段の出力が
用いられるようにし、この中間の遷移領域におい
ては両者の間で連続的な移行が行なわれるように
し、これによつてかなり異質の音質を有する
LPC合成音からCSM合成音への突然の切替に伴
なう不自然さを除くようにしている。 Therefore, in this vocoder, speech synthesis is performed using LPC parameters on the synthesis side.
The LPC speech synthesis means, the above-mentioned CSM speech synthesis means, and the above-mentioned CSM speech synthesis means are separately provided, and the outputs of both are subjected to variable weight synthesis according to the quality evaluation of the transmission path. Let's do it. As a result, when the quality of the transmission path is very good, the output of the LPC speech synthesis means is used, and when the quality of the transmission path is very poor, the output of the CSM speech synthesis means is used. In the transition region of
This eliminates the unnaturalness caused by the sudden switch from LPC synthesized sound to CSM synthesized sound.
また回線品質に対する評価としては、後述する
ようにCSM音声合成手段の出力とLPC音声合成
手段の出力との比を用いているが、これは伝送路
の品質が劣化してエラーが増しても前者は殆んど
影響を受けないのに、後者はLPC合成フイルタ
が不安定となりこのため出力電力が異常に増加す
る確率が高くなるという特性を利用したものであ
る。 Furthermore, as described later, the ratio between the output of the CSM speech synthesis means and the output of the LPC speech synthesis means is used to evaluate the line quality. is almost unaffected, whereas the latter makes use of the characteristic that the LPC synthesis filter becomes unstable, which increases the probability that the output power will increase abnormally.
(実施例) 次に本発明を実施例を用いて詳細に説明する。(Example) Next, the present invention will be explained in detail using examples.
第4図は本発明の一実施例を示すブロツク図で
ある。 FIG. 4 is a block diagram showing one embodiment of the present invention.
本実施例は、第4図に示すように、CSM分析
部2およびコーダ部3を含む送信側1と、デコー
ダ部5、CSM合成部6、CSM/LPCパラメータ
変換部7、LPC合成部8および可変可重合成部
9を含む受信側4とから構成されている。 As shown in FIG. 4, this embodiment consists of a transmission side 1 including a CSM analysis section 2 and a coder section 3, a decoder section 5, a CSM synthesis section 6, a CSM/LPC parameter conversion section 7, an LPC synthesis section 8 and The receiving side 4 includes a variable multiplexing unit 9.
入力音声信号はライン1000を介して送信側
1に入力され、送信側1から伝送路3000を介
して受信側4に伝送され、受信側4からライン9
000を介して出力音声信号として出力される。 The input audio signal is input to the transmitting side 1 via the line 1000, transmitted from the transmitting side 1 to the receiving side 4 via the transmission line 3000, and from the receiving side 4 to the line 9.
000 as an output audio signal.
前記CSM分析部2は第5図に示すように、さ
らにA/D変換器201、ハミング窓処理器20
2、自己相関係数計測器203、CSM分析器2
04およびピツチ・V/UV分析器205を含
む。 As shown in FIG. 5, the CSM analysis section 2 further includes an A/D converter 201 and a Hamming window processor 20.
2. Autocorrelation coefficient measuring device 203, CSM analyzer 2
04 and a pitch V/UV analyzer 205.
また前記CSM合成部6は、第6図に示すよう
に、n個の位相リセツト機能付可変周波数発振器
601−1〜601−n、n個の可変利得増幅器
602−1〜602−n、加算合成器603、乗
算器604、乗算器605、V/UV切換器60
6、可変長窓関数発生器607、周期算出器60
8および乱数発生器609を含む。 Further, as shown in FIG. 6, the CSM synthesis section 6 includes n variable frequency oscillators 601-1 to 601-n with a phase reset function, n variable gain amplifiers 602-1 to 602-n, and additive synthesis. device 603, multiplier 604, multiplier 605, V/UV switch 60
6. Variable length window function generator 607, period calculator 60
8 and a random number generator 609.
さらにまた、前記CSM/LPCパラメータ変換
部7は、第7図に示すように、CSMパラメー
タ/自己相関係数変換部701および自己相関係
数/LPCパラメータ変換器702を含み、また
前記LPC合成部8は、第8図に示すようにLPC
合成フイルタ801、パルス発振器802、V/
UV切替器803、電力制御器804および雑音
発生器805を含んでいる。 Furthermore, the CSM/LPC parameter converter 7 includes a CSM parameter/autocorrelation coefficient converter 701 and an autocorrelation coefficient/LPC parameter converter 702, as shown in FIG. 8 is LPC as shown in Figure 8.
Synthesis filter 801, pulse oscillator 802, V/
It includes a UV switch 803, a power controller 804, and a noise generator 805.
最後に前記可変荷重合成部9は第9図に示すよ
うに、一時メモリ901,904、電力算出器9
02,905、乗算器903,906、ウエイト
算出器907および加算合成器908を含んでい
る。 Finally, the variable load synthesis section 9 includes temporary memories 901 and 904, a power calculator 9, and
02 and 905, multipliers 903 and 906, a weight calculator 907, and an addition synthesizer 908.
さて、本実施例の動作は下記の通りである。伝
送されるべき音声波形は、入力ライン1000を
介して、A/D変換器201に供給され(第5
図)、ここで振幅および時間軸が量子化されたデ
イジタルデータに変換され、この出力はそれぞ
れ、ハミング窓処理器202およびピツチ・V/
UV分析器205に供給される。ハミング窓処理
器202に供給されたデイジタルデータは、予め
定められている1フレームごとに公知のハミング
窓関数による荷重乗算がなされ、各フレームのデ
ータごとに自己相関係数計測器203に供給され
る。 Now, the operation of this embodiment is as follows. The audio waveform to be transmitted is supplied to the A/D converter 201 via the input line 1000 (the fifth
), where the amplitude and time axes are converted into quantized digital data, the outputs of which are sent to a Hamming window processor 202 and a pitch V/V, respectively.
It is supplied to a UV analyzer 205. The digital data supplied to the Hamming window processor 202 is subjected to weight multiplication by a known Hamming window function for each predetermined frame, and is supplied to the autocorrelation coefficient measuring device 203 for each frame of data. .
自己相関係数計測器203は、こうして入力さ
れた各フレームのデータごとに、前述した下記の
演算から低位のN個の自己相関係数υl(但しl=
1,2,…,N)を求める。 The autocorrelation coefficient measuring device 203 calculates the lowest N autocorrelation coefficients υ l (where l=
1, 2, ..., N).
すなわち、1フレーム分のデータをXt(但しt
=0,1,…M−1)とすると、
υl=1/MM-1
〓t=l
XtXt-l
の演算処理を行なうことにより、N個の各υlを求
める。 In other words, data for one frame is X t (where t
=0, 1,...M-1), each of N υ l is obtained by performing the calculation process υ l =1/M M-1 〓 t=l X t X tl .
こうして求められた各フレームごとのυlの組を
次のCSM分析器204に供給するとともに、こ
の中のυp(つまりυp=1/MM-1
〓t=0
X2 t)をこのフレーム
における電力情報としてコーダ部3に供給する。 The thus obtained set of υ l for each frame is supplied to the next CSM analyzer 204, and υ p (that is, υ p = 1/M M-1 〓 t=0 X 2 t ) is It is supplied to the coder section 3 as power information in the frame.
さて、上述の各フレームごとの自己相関係数υl
の組の供給を受けたCSM分析器204は、後に
詳述する演算を行なうことによつて対応するフレ
ームのCSMのn個の各正弦波の強度および角周
波数を指定するmi,ωi(但しi=1,2,…n)
の組を決定し、これをコーダ部3に供給する。 Now, the autocorrelation coefficient υ l for each frame mentioned above
The CSM analyzer 204, supplied with the set m i , ω i ( However, i=1, 2,...n)
and supplies it to the coder section 3.
また、A/D変換器201から原音声信号のデ
イジタルデータの供給を受けたピツチ・V/UV
分析器205は、ピツチ周期と、有声音(t)/無声
音(UV)に関する情報を抽出してコーダ部3に
供給する。 In addition, the pitch V/UV receiving the digital data of the original audio signal from the A/D converter 201
The analyzer 205 extracts information regarding the pitch period and voiced sounds (t)/unvoiced sounds (UV) and supplies the extracted information to the coder section 3.
さて、以上の各信号の供給を受けたコーダ部3
は、これらの信号を、受信側における分離が容易
に行なえ、また要求された音質と伝送路の伝送容
量とに見合つた粗さで符号化合成し、伝送路30
00を介して受信側4に伝送する。 Now, the coder section 3 receives the above signals.
These signals can be easily separated on the receiving side, and are coded and synthesized with a coarseness commensurate with the required sound quality and the transmission capacity of the transmission line, and then sent to the transmission line 30.
00 to the receiving side 4.
さて、受信側4においては、こうして伝送され
た信号を、第4図に示すようにデコーダ部5にお
いて受信し、送信側1のコーダ部3の入力側に供
給された各種の信号を分離し、これらの信号をそ
れぞれCSM合成部6およびCSM/LPCパラメー
タ変換部7に供給する。 Now, on the receiving side 4, the thus transmitted signal is received by the decoder section 5 as shown in FIG. 4, and various signals supplied to the input side of the coder section 3 of the transmitting side 1 are separated. These signals are supplied to a CSM synthesis section 6 and a CSM/LPC parameter conversion section 7, respectively.
CSM合成部6(第6図)においては、デコー
ダ部5から供給されるCSMのn個の各波の角周
波数を指定するωi(ω1〜ωo)は、n個の位相リセ
ツト機能付可変周波数発振器601−1〜601
−nの周波数制御入力端子に加えられ、これら発
振器の出力角周波数を指定された角周波数ω1〜
ωoに設定する。またCSMのn個の各波の強度
(電力振幅)を指定するパラメータm1〜moは前
記n個の可変利得増幅器602−1〜602−n
の利得制御端子に供給され、これによつて各周波
数の発振電力が指定された値になるように制御す
る。 In the CSM synthesis unit 6 (Fig. 6), ω i (ω 1 to ω o ) specifying the angular frequency of each of the n waves of the CSM supplied from the decoder unit 5 is converted to Variable frequency oscillator 601-1 to 601
−n frequency control input terminals to change the output angular frequency of these oscillators to a specified angular frequency ω 1 ~
Set to ω o . Furthermore, the parameters m 1 to m o specifying the intensity (power amplitude) of each of the n waves of the CSM are the same as those of the n variable gain amplifiers 602-1 to 602-n.
The oscillation power of each frequency is thereby controlled to a specified value.
こうして得られたn個の出力は、加算合成器6
03において加算合成が行なわれた後、次の乗算
器604に供給される。 The n outputs obtained in this way are added to the adder combiner 6
After addition and synthesis are performed in step 03, the signals are supplied to the next multiplier 604.
さて、デコーダ部5で分離されたピツチ周期デ
ータと、V/UV情報(有声音/無声音情報)と
は、それぞれ、V/UV切換器606に供給され
る。 Now, the pitch period data and V/UV information (voiced sound/unvoiced sound information) separated by the decoder section 5 are supplied to a V/UV switch 606, respectively.
一方、乱数発生器609で発生された乱数が、
周期算出器608に供給され、ここで乱数の分布
幅およびその下限値が特定の値になるように変換
され、無声音時の位相リセツト時間間隔を決定す
るデータ列としてV/UV切換器206に供給さ
れる。 On the other hand, the random number generated by the random number generator 609 is
It is supplied to the period calculator 608, where it is converted so that the random number distribution width and its lower limit become specific values, and is supplied to the V/UV switch 206 as a data string that determines the phase reset time interval during unvoiced sound. be done.
かくして、前述のV/UV情報が有声音(t)を指
定する場合には、切替器606は、前述のピツチ
周期データ側を選択し、これを可変長窓関数発生
器607に供給する。またもし前述のV/UV情
報が無声音(UV)を指定する場合には、切替器
606は、前述の周期算出器608の出力の確率
過程で発生するランダムな時間間隔を表わすデー
タ側を選択し、これを上述のピツチ周期を表わす
デイジタルデータ列のかわりに、窓関数発生器6
07に供給する。 Thus, when the above-mentioned V/UV information specifies a voiced sound (t), the switch 606 selects the above-mentioned pitch period data side and supplies it to the variable length window function generator 607. Furthermore, if the aforementioned V/UV information specifies unvoiced sound (UV), the switch 606 selects the data side representing a random time interval generated in the stochastic process of the output of the aforementioned period calculator 608. , instead of the digital data string representing the pitch period described above, the window function generator 6
Supply on 07.
さて、窓関数発生器607は、前述の位相リセ
ツトによつて出力波形に生ずる不連続を除き、音
声波形のもつ連続性を確保する窓関数を発生する
ためのもので、またさらにこの窓関数と密接な時
間関係を有する位相リセツト用パルスをも発生す
る。 Now, the window function generator 607 is for generating a window function that ensures the continuity of the audio waveform except for the discontinuity that occurs in the output waveform due to the above-mentioned phase reset. It also generates closely time-related phase reset pulses.
前述のように、窓関数発生器607には、切替
器606を介して、次次の位相リセツト用パルス
間の間隔を指定するデータ列が入力されるが、窓
関数発生器607は、このデータで指定される時
間間隔を有するインパルスを次次に発生し、これ
をライン6071を介して位相リセツト機能付可
変周波数発振器601−1〜601−nの位相リ
セツト端子に供給し、これによつてこれら発振器
の位相リセツトを行なう。 As mentioned above, a data string specifying the interval between the next phase reset pulse is input to the window function generator 607 via the switch 606. impulses having a time interval specified by , are supplied via line 6071 to the phase reset terminals of variable frequency oscillators with phase reset function 601-1 to 601-n, thereby Performs a phase reset of the oscillator.
さて、窓関数発生器607は上述の位相リセツ
トパルスの発生と同期して下記のような可変長の
窓関数w(x)を発生する。 Now, the window function generator 607 generates a variable length window function w(x) as shown below in synchronization with the generation of the above-mentioned phase reset pulse.
すなわち、入力されたデータにより指定された
その時点における位相リセツト用パルス間間隔の
値をTとし、前の位相リセツト用パルスが発生し
てからの経過時間をxとすると
w(x)=0.5+0.5cos(πx/T)
但し 0<xT
で表わされるような窓関数を発生する。この窓関
数w(x)を第10図Aに示す。上述のTの値は、有
声音の場合にはピツチ周期を表わし、無声音の場
合には確率過程で発生する変数を表わすので、い
ずれの場合にも時間とともに変化する。従つてこ
の窓関数w(x)は可変長であり、上述の位相リセツ
ト用パルスの発生と第10図Bに示すような相対
時間関係で同期している(窓関数の開始時点およ
び終止時点が位相リセツト用パルスの発生時点と
ほぼ一致している)。 That is, if T is the value of the interval between phase reset pulses at that point specified by the input data, and x is the elapsed time since the previous phase reset pulse was generated, w(x) = 0.5 + 0. .5cos(πx/T) However, it generates a window function expressed as 0<xT. This window function w(x) is shown in FIG. 10A. The above-mentioned value of T represents the pitch period in the case of voiced sounds, and represents a variable generated in a stochastic process in the case of unvoiced sounds, so it changes over time in both cases. Therefore, this window function w(x) has a variable length and is synchronized with the generation of the phase reset pulse described above in the relative time relationship shown in FIG. 10B (the start and end points of the window function are (This almost coincides with the time point at which the phase reset pulse is generated.)
こうして発生された窓関数は、ライン6072
を介して、乗算器604に供給される。この結
果、乗算器604において、加算合成器603で
合成された各位相リセツト用パルスごとに位相リ
セツトされるn個の正弦波と、各位相リセツト用
パルスに同期して発生される上述の窓関数w(x)と
の積が得られる。こうして得られる波形は、各正
弦波が、位相リセツトされる直前で窓関数(x)の乗
算により連続的に0に収束されており、また位相
リセツト時点では各正弦波は0から立ち上るよう
にしているので波形の連続性が確保され、かくし
て窓関数w(x)の乗算により位相リセツト波形に生
ずる不連続性を除くことができる。 The window function thus generated is line 6072
is supplied to multiplier 604 via . As a result, the multiplier 604 generates n sine waves whose phase is reset for each phase reset pulse synthesized by the adder synthesizer 603, and the above-mentioned window function generated in synchronization with each phase reset pulse. The product with w(x) is obtained. The waveform obtained in this way is such that each sine wave is continuously converged to 0 by multiplying by the window function (x) just before the phase is reset, and each sine wave rises from 0 at the time of the phase reset. Therefore, continuity of the waveform is ensured, and discontinuity occurring in the phase reset waveform can be removed by multiplication by the window function w(x).
不連続性を除かれた乗算器604の出力は、次
の乗算器605に供給され、ここで、デコーダ部
5によつて分離された各フレームの電力情報υpに
よつて荷重され、CSM合成部6からの合成音声
としてライン6000を介して可変荷重合成部9
へ供給される。 The output of the multiplier 604 from which discontinuities have been removed is supplied to the next multiplier 605, where it is loaded with the power information υ p of each frame separated by the decoder section 5, and is subjected to CSM synthesis. Variable weight synthesis unit 9 via line 6000 as synthesized speech from unit 6
supplied to
さて、一方CSM/LPCパラメータ変換部7
(第7図)においては、デコーダ部5から供給さ
れるCSMのn個の各角周波数を指定するωi(i=
1〜n)およびn個の各波の強度(電力振幅)を
指定するパラメータmi(i=1〜n)はCSMパラ
メータ/自己相関係数変換器701に供給され、
ここで自己相関係数に変換される。 Now, on the other hand, CSM/LPC parameter conversion section 7
(FIG. 7), ω i (i=
1 to n) and parameters m i (i=1 to n) specifying the intensity (power amplitude) of each of the n waves are supplied to the CSM parameter/autocorrelation coefficient converter 701,
Here, it is converted into an autocorrelation coefficient.
すなわち、上述のように指定されたCSMのn
個の正弦波の合成波形のタツプlの自己相関係数
をγlとすると、γlは供給されたパラメータωimiを
用いて
γl=o
〓i=1
micos l ωi
但しl=1,2,…,N
の演算により、容易に求めることができる。 That is, n of the CSM specified as above
Let γ l be the autocorrelation coefficient of tap l of the composite waveform of sine waves, then γ l is calculated using the supplied parameter ω i m i as follows: γ l = o 〓 i=1 m i cos l ω i It can be easily obtained by calculating l=1, 2,...,N.
こうして求められた自己相関係数の組は、次の
自己相関係数/LPCパラメータ変換器702に
供給され、ここでよく知られた手法によりLPC
パラメータに変換されてLPC合成部8に供給さ
れる。 The set of autocorrelation coefficients thus determined is supplied to the next autocorrelation coefficient/LPC parameter converter 702, where the LPC
It is converted into parameters and supplied to the LPC synthesis section 8.
LPCパラメータαi(i=1,…N)は例えば、
Durbin(ダービン)の方法用いて下式を解くこと
により容易に求めることができる。 For example, the LPC parameter α i (i=1,...N) is
It can be easily determined by solving the following equation using Durbin's method.
LPC合成部8(第8図)においては、供給さ
れたLPCパラメータαi(i=1,2,…N)は
LPC合成フイルタ801の定数して設定される。 In the LPC synthesis section 8 (Fig. 8), the supplied LPC parameters α i (i=1, 2,...N) are
It is set as a constant of the LPC synthesis filter 801.
一方デコーダ部5で分離されたピツチ周期デー
タはパルス発振器802に供給され、この出力パ
ルスの周期を指定されたピツチ周期になるように
制御する。 On the other hand, the pitch period data separated by the decoder section 5 is supplied to a pulse oscillator 802, which controls the period of this output pulse to be a specified pitch period.
また、V/UV情報(有声音/無声音情報)は
V/UV切替器803に切替制御信号として供給
され、有声音(t)の場合には切替器803がパルス
発振器802の出力側を選択し、無声音(UV)
の場合には切替器803が雑音発生器805の出
力側を選択するように制御する。 Further, V/UV information (voiced sound/unvoiced sound information) is supplied to the V/UV switch 803 as a switching control signal, and in the case of voiced sound (t), the switch 803 selects the output side of the pulse oscillator 802. , unvoiced (UV)
In this case, the switch 803 is controlled to select the output side of the noise generator 805.
かくして選択された切替器803の出力は電力
制御器804に供給され、ここでデコーダ部5に
よつて分離された電力情報υpによつて電力制御を
受けた後にLPC合成フイルタ801に対する駆
動信号として供給される。 The output of the switch 803 selected in this way is supplied to the power controller 804, where it is subjected to power control based on the power information υ p separated by the decoder section 5, and then output as a drive signal to the LPC synthesis filter 801. Supplied.
以上によりLPC合成フイルタ801は音声信
号を合成し、合成された信号は、LPC合成部8
からの合成音声信号としてライン8000を介し
て可変荷重合成部9へ供給される。 As described above, the LPC synthesis filter 801 synthesizes the audio signals, and the synthesized signal is sent to the LPC synthesis section 8.
It is supplied to the variable weight synthesis unit 9 via line 8000 as a synthesized speech signal from.
さて、CSM合成部6およびLPC合成部8から
ライン6000およびライン8000を介して、
それぞれの合成音声信号の供給を受けた可変荷重
合成部9(第9図)は、両者からの入力音声信号
を以下に示すようにして合成する。 Now, from the CSM synthesis section 6 and the LPC synthesis section 8 via line 6000 and line 8000,
The variable weight synthesis section 9 (FIG. 9), which receives the respective synthetic audio signals, synthesizes the input audio signals from both in the following manner.
まず、それぞれの入力音声信号は、電力算出器
902および905に供給される。これによつ
て、それぞれの信号の刻々の電力(適用な窓関数
を乗じて得られる電力)が計測された電力はウエ
イト算出器907に供給される。ウエイト算出器
907において両者の電力の比によつて定まる荷
重信号すなわちウエイトWCSMおよびウエイト
WLPCが生成され、それぞれ乗算器903および
乗算器906に供給される。 First, each input audio signal is supplied to power calculators 902 and 905. As a result, the power obtained by measuring the momentary power of each signal (power obtained by multiplying by an appropriate window function) is supplied to the weight calculator 907. The weight calculator 907 calculates the weight signal determined by the ratio of the two powers, that is, the weight W CSM and the weight
W LPC is generated and supplied to multiplier 903 and multiplier 906, respectively.
一方、それぞれの前記入力音声信号は、一時メ
モリ901および一時メモリ904を介してそれ
ぞれ前述の乗算器903および乗算器906のも
う一方の入力として供給される。一時メモリ90
1および一時メモリ904は、それぞれの信号の
遅延時間を調整し、両者の遅延時間の差をなくし
て合成時の不自然さを除くためのものである。 On the other hand, each of the input audio signals is supplied as the other input of the aforementioned multiplier 903 and multiplier 906, respectively, via temporary memory 901 and temporary memory 904. Temporary memory 90
1 and temporary memory 904 are used to adjust the delay time of each signal, eliminate the difference in delay time between the two, and eliminate unnaturalness during synthesis.
さて、遅延補正がなされたそれぞれの信号は、
乗算器903および乗算器906において、前述
のウエイトWCSMおよびWLPCによつてそれぞれ荷
重乗算(重みづけ)が施こされた後、加算器90
8において加算合成が行なわれ、出力ライン90
00から最終合成音声信号として出力される。 Now, each signal after delay correction is
After weight multiplication (weighting) is performed by the weights W CSM and W LPC described above in the multiplier 903 and the multiplier 906, the adder 90
8, the summation is performed and the output line 90
00 to be output as the final synthesized speech signal.
以上のような合成法をとることにより、それぞ
れの入力音声信号の電力比に応じて、それぞれの
入力信号に対する荷重(ウエイト)が制御されて
合成されるが、この荷重制御特性の一例を第11
図に示す。 By using the above synthesis method, the weights for each input signal are controlled and synthesized according to the power ratio of each input audio signal.An example of this load control characteristic is shown in the 11th
As shown in the figure.
すなわち、CSM側電力とLPC側電力との比r
が殆んど1に等しい正常な状態の場合には、
LPC側に対するウエイトWLPCは殆んど1となり、
これに対してCSM側に対するウエイトWCSMは殆
んど0となる。 In other words, the ratio r between the CSM side power and the LPC side power
In the normal state where is almost equal to 1,
The weight W LPC for the LPC side is almost 1,
On the other hand, the weight W CSM on the CSM side is almost 0.
伝送路の誤り率が劣化して、前述のように
LPC側の電力が増加し両者の比が小さくなると、
WLPCは、1から除々に減小し、WCSMは0から
除々に増大する。かくして、LPC側の電力が
CSM側の電力に対して4倍程度に増大した状態
(r≒0.25)では、ウエイトWLPCおよびWCSMは殆
んど相等しく0.5として合成される。 The error rate of the transmission path deteriorates, and as mentioned above,
When the power on the LPC side increases and the ratio between the two decreases,
W LPC gradually decreases from 1, and W CSM gradually increases from 0. Thus, the power on the LPC side is
In a state where the power on the CSM side is increased by about 4 times (r≈0.25), the weights W LPC and W CSM are almost equal to each other and are combined as 0.5.
さらに、誤り率が劣化して、LPC側の電力が
大きくなると、WCSMは殆んど1となりWLPCは殆
んど0となる。 Furthermore, when the error rate deteriorates and the power on the LPC side increases, W CSM becomes almost 1 and W LPC becomes almost 0.
以上のようにして、伝送路の状態が良好でエラ
ーが無い場合には、より音質の良いLPC音声合
成による出力が用いられ、伝送路の状態が劣化て
多くのエラーが発生する場合にはエラーに対する
耐性の強いCSM音声合成による出力が用いられ
る。そして中間の遷移領域においては両者の合成
に対するウエイトが連続的に変化して一方から他
方に移行するようにし、これによつて異質の音質
を有する両合成方式の出力の急な切替に伴なう不
自然さをなくすようにしている。 As described above, when the transmission path is in good condition and there are no errors, the output from LPC speech synthesis with better sound quality is used, and when the transmission path is in poor condition and many errors occur, an error occurs. Output from CSM speech synthesis, which is highly resistant to noise, is used. Then, in the intermediate transition region, the weight for the synthesis of both changes continuously and shifts from one to the other, thereby causing a sudden switch in the output of the two synthesis methods, which have different sound qualities. I'm trying to eliminate the unnaturalness.
以上述べたように、本実施例によると、送信側
においてCSM音声分析により、CSMパラメータ
(擬フオルマント情報)を抽出し、これを他の音
源情報とともに符号化て伝送路に送出し、受信側
においては、伝送されたCSMパラメータを用い
て直接CSM音声合成を行なう挟持のCSM音声合
成部と、伝送されたCSMパラメータをいつたん
LPCパラメータに変換してからLPC音声合成を
行なうLPC音声合成部とを設け、両者の出力を
上述のように可変荷重合成することによりそれぞ
れの音声合成方式の優れた特徴を発揮する擬フオ
ルマント型ボコーダを提供できる。 As described above, according to this embodiment, the CSM parameters (pseudo-formant information) are extracted by CSM voice analysis on the transmitting side, encoded together with other sound source information, and sent to the transmission path, and the receiving side is a sandwiched CSM speech synthesizer that directly performs CSM speech synthesis using the transmitted CSM parameters, and a
A quasi-formant vocoder that is equipped with an LPC speech synthesis section that performs LPC speech synthesis after converting into LPC parameters, and performs variable weight synthesis of the outputs of both as described above, thereby demonstrating the excellent characteristics of each speech synthesis method. can be provided.
以下、CSM合成部6に用いられている各種回
路について説明する。 Below, various circuits used in the CSM synthesis section 6 will be explained.
まず、位相リセツト機能付可変周波数発振器6
01の回路例を第12図に示す。周波数制御端子
6011に加わる電圧によつて、定電流源601
2および6013に流れる、容量6014に対す
る充放電電流値を制御し、これによつて発振周波
数を可変とする。υ点の発振電圧波形は基準電圧
の+Vrと−Vrとの間を直線的に上下する三角波
形となる。 First, variable frequency oscillator 6 with phase reset function
An example of the circuit of No. 01 is shown in FIG. The constant current source 601 is controlled by the voltage applied to the frequency control terminal 6011.
2 and 6013 to charge and discharge the capacitor 6014, thereby making the oscillation frequency variable. The oscillation voltage waveform at the υ point is a triangular waveform that linearly rises and falls between the reference voltages +V r and -V r .
位相リセツト端子6015にインパルスを加え
ると、υ点は瞬間的に接地されて、強制的に0電
位に引き戻され、そこから発振を再スタートして
位相リセツトが行なわれる。このυ点の三角波発
振出力を正弦波変換器6016に入力し正弦波に
変換して端子6017より出力し、これを発振器
601の出力として用いる。正弦波変換器601
6は例えばROMに格納したサイン関数値を入力
波形で読出す等の方法により容易に実現できる。 When an impulse is applied to the phase reset terminal 6015, the υ point is momentarily grounded and forcibly pulled back to 0 potential, and oscillation is restarted from there to perform a phase reset. The triangular wave oscillation output at the υ point is input to a sine wave converter 6016, converted to a sine wave, and outputted from a terminal 6017, which is used as the output of the oscillator 601. Sine wave converter 601
6 can be easily realized by, for example, reading out a sine function value stored in a ROM using an input waveform.
またこのような位相リセツト機能付可変周波数
発振器は計算器のプログラムを用いて実現するこ
とも容易である。 Further, such a variable frequency oscillator with a phase reset function can be easily realized using a computer program.
次に可変利得増幅器602の回路側を第13図
に示す。増幅すべき信号を端子6021に加え、
制御信号を端子6022に加えることによつて負
帰還量を制御し出力端子6023に制御された振
幅を有する出力を得る。 Next, the circuit side of variable gain amplifier 602 is shown in FIG. Adding the signal to be amplified to the terminal 6021,
By applying a control signal to the terminal 6022, the amount of negative feedback is controlled and an output having a controlled amplitude is obtained at the output terminal 6023.
またこのほかに、アナログ乗算器を用いて実現
することもできるし、またD/A変換器の基準電
圧にアナログ波形入力を用い、デイジタル入力に
デイジタル量で表現された制御情報を用いる等の
方法によつても容易に実現することができる。 In addition, it can also be realized by using an analog multiplier, or by using an analog waveform input as the reference voltage of the D/A converter and using control information expressed in digital quantities as the digital input. This can also be easily realized by
次に乱数発生器609の一回路例を第14図に
示す。15段のシフトレジスタ6091と1個の半
加算器6092とにより215−1の周期を有する
15次のM系列の擬似乱数を発生する。必要な時点
でクロツク端子6093にシフトパルスを加える
ことにより次の乱数値が得られる。 Next, an example of a circuit of the random number generator 609 is shown in FIG. It has a period of 2 15 −1 with a 15-stage shift register 6091 and one half adder 6092.
Generates 15th order M-sequence pseudo-random numbers. The next random value is obtained by applying a shift pulse to clock terminal 6093 at the required time.
次に周期算出器608のブロツク図を第15図
Aに示す。これは上述の乱数発生器609から出
力される0から215−1の範囲に一様に分布して
いる乱数を、無声音時の位相リセツト用パルスの
時間間隔を指定する乱数として用いるのに適した
分布に変換するもので、定数乗算器6081と定
数加算器6082よりなる。これによつて、第1
5図Bに示すように、乱数の分布幅Dと下限値L
とを適当な値に設定することができる。 Next, a block diagram of the period calculator 608 is shown in FIG. 15A. This is suitable for using the random numbers uniformly distributed in the range of 0 to 215 -1 output from the random number generator 609 mentioned above as random numbers for specifying the time interval of the phase reset pulse during unvoiced speech. It is composed of a constant multiplier 6081 and a constant adder 6082. By this, the first
As shown in Figure 5B, the random number distribution width D and the lower limit L
and can be set to appropriate values.
次に窓関数発生器607の一実施例を第16図
に示す。これは、レジスタ6073、プリセツト
可能なダウンカウンタ6074、カウンタ607
5、読読出し専用メモリ(ROM)6076を含
んでいる。切替器606から供給された位相リセ
ツト用パルス間隔を指定するデータTは、レジス
タ6073に格納される。ダウンカウンタ607
4は一定周期の高速クロツクCLKをカウントす
るカウンタで、まず、レジスタ6073の内容T
をプリセツトし、これをクロツクCLKを用いて
ダウンカウントする。カウンタ6074の内容が
0になると出力端子よりパルスを発生し、これに
より再びレジスタ6073の内容をプリセツトし
てこの値のダウンカウントを開始する。かくして
ダウンカウンタ6074の出力6074−1には
Tに比例した周期(例えばT/k)をもつパルス
列が発生する。このパルス列はカウンタ6075
のクロツクとして加えられる。このクロツクで歩
進されるカウンタ6075のカウント出力607
5−1はROM6076にアドレス指定信号とし
て加えられ、そこに書き込まれている窓関数w(x)
のデータを順番に読出してライン6072に出力
する。カウンタ6075の内容がkになると、
ROM6076の最後のデータが読出されてライ
ン6071にリセツトパルスを出力する。このリ
セツトパルスは、発振器601−1〜601−n
の位相リセツト用端子に供給される前述の位相リ
セツト用パルスとして用いられるとともに、レジ
スタ6073に次の入力データをセツトするため
に用いられる。かくして、パルス間間隔がつぎつ
ぎに指定された値をもつ位相リセツト用パルス
と、これと第10図Bに示すように同期された可
変長の窓関数w(x)とが生成される。 Next, an embodiment of the window function generator 607 is shown in FIG. This includes a register 6073, a presettable down counter 6074, and a counter 607.
5. Contains a read-only memory (ROM) 6076. Data T specifying the phase reset pulse interval supplied from the switch 606 is stored in the register 6073. Down counter 607
4 is a counter that counts high-speed clock CLK of a constant period.First, the contents T of register 6073 are counted.
is preset and counted down using the clock CLK. When the contents of the counter 6074 reach 0, a pulse is generated from the output terminal, thereby presetting the contents of the register 6073 again and starting counting down this value. Thus, a pulse train having a period proportional to T (for example, T/k) is generated at the output 6074-1 of the down counter 6074. This pulse train is processed by the counter 6075.
added as a clock. The count output 607 of the counter 6075 is incremented by this clock.
5-1 is the window function w(x) that is added to the ROM6076 as an address designation signal and written there.
data are read out in order and output to line 6072. When the contents of the counter 6075 reach k,
The last data in ROM 6076 is read and a reset pulse is output on line 6071. This reset pulse is generated by the oscillators 601-1 to 601-n.
It is used as the above-mentioned phase reset pulse supplied to the phase reset terminal of the register 6073, and is also used to set the next input data in the register 6073. In this way, phase reset pulses whose interpulse intervals have successively specified values and a variable length window function w(x) synchronized with these pulses as shown in FIG. 10B are generated.
最後にCSM分析について説明する。 Finally, I will explain CSM analysis.
前述のように、CSM分析は、各分析フレーム
毎に、表現されるべき音声波形から直接算出され
る標本自己相関係数のN個の低次のタツプ値と、
合成波(n個の正弦波の和)のN個の低次のタツ
プ値とが一致するように、合成すべき各正弦波の
角周波数wiとその強度(電力振幅)miとを決定
することである。 As mentioned above, CSM analysis uses, for each analysis frame, N low-order tap values of sample autocorrelation coefficients calculated directly from the speech waveform to be represented;
Determine the angular frequency w i of each sine wave to be synthesized and its intensity (power amplitude) m i so that the N low-order tap values of the synthesized wave (sum of n sine waves) match. It is to be.
今、合成波のタツプlの自己相関係数をγlとす
ると、前述のように、
γl=o
〓i=1
micos l ωi
となる。 Now, if the autocorrelation coefficient of tap l of the composite wave is γ l , then as mentioned above, γ l = o 〓 i=1 m i cos l ω i .
一方、表現されるべき音声波形のサンプルXt
から、あるフレームのタツプlの標本自己相関係
数υlは、
υl=1/MM-1
〓t=l
XtXt-l …(1)
である。 On the other hand, the sample of the audio waveform to be represented X t
Therefore, the sample autocorrelation coefficient υ l of tap l in a certain frame is υ l =1/M M-1 〓 t=l X t X tl (1).
これより、 γl=υl …(2) l=0,1,2,…N 但しN=2n−1 とすると下記のマトリツクス表現が得られる。 From this, γ l =υ l ...(2) l=0, 1, 2,...N However, if N=2n-1, the following matrix expression is obtained.
しかし上式は、ωiおよびmiが未知のため単純な
行列演算では解けない。そこで、
ωi=cos-1xi …(4)
とおき、
coslωi=coslcos-1xi≡Tl(xi) …(5)
の置換を行なう。このTl(x)はTchebycheff(チエ
ビシエフ)の多項式である。この置換を行なうと
(3)式は次のように変換される。 However, the above equation cannot be solved by simple matrix operations because ω i and m i are unknown. Therefore, we set ω i = cos -1 x i ...(4) and perform the substitution coslω i = cosl cos -1 x i ≡T l (x i ) ...(5). This T l (x) is a Tchebycheff polynomial. If you do this substitution
Equation (3) is converted as follows.
ところが、一般にxlはTp(x),Tl(x)…T1(x)の線
決結合として表わすことができる。 However, in general, x l can be expressed as a linear combination of T p (x), T l (x)...T 1 (x).
すなわち
xl=l
〓j=o
S(l) jTj(x) …(7)
但しS(l) jは逆Tchebycheff(チエビシエフ)係数
である。 That is, x l = l 〓 j=o S (l) j T j (x) …(7) where S (l) j is the inverse Tchebycheff coefficient.
このS(l) jを用いて、前述の標本自己相関係数υj
の線形結合Alを下式のように定義する。 Using this S (l) j , the sample autocorrelation coefficient υ j
Define the linear combination A l as shown below.
Al=l
〓j=o
S(l) jυj …(8)
但し l=0,1,2,…,2n−1
こうすると、(6)式の左辺および右辺にそれぞれ
(7)式および(8)式の関係を用いることにより、下記
の関係式が成立する。 A l = l 〓 j=o S (l) j υ j …(8) However, l=0, 1, 2,…, 2n−1 Then, on the left and right sides of equation (6), respectively
By using the relationships of equations (7) and (8), the following relational expression is established.
さて、ここで、x1,x2,…,xoに零点をもつn
次の多項式
Pn(x)≡o
〓k=o
P(n) kxk=o
Πi=1
(x−xi)
を定義し、このPn(x)を用いて、(9)式の左辺と似
た式の
o
〓i=1
miPn(xi)l i
を作り、これを検討してみる。上式が0であるこ
とは明らかであるが、さらにこれは次のように書
き変えることができる。 Now, here, n with zero points at x 1 , x 2 , ..., x o
Define the following polynomial Pn(x)≡ o 〓 k=o P (n) k x k = o Π i=1 (x−x i ), and use this Pn(x) to solve equation (9). Create an equation similar to the left side, o 〓 i=1 m i Pn(x i ) l i , and examine it. It is clear that the above equation is 0, but it can be further rewritten as follows.
0=o
〓i=1
miPn(xixl i=o
〓i=1
mio
〓k=o
P(n) j
=o
〓k=o
P(n) ko
〓i=1
mixk+l j=o
〓k=o
P(n) kAk+l
以上より、l=0,1,2,…nとして下式が
得られる。 0= o 〓 i=1 m i Pn(x i x l i = o 〓 i=1 m io 〓 k=o P (n) j = o 〓 k=o P (n) ko 〓 i=1 m i x k+l j = o 〓 k=o P (n) k A k +l From the above, the following formula is obtained with l=0, 1, 2,...n.
しかるにP(n) o=1であるから
が成立する。左辺のAiでできるマトリクスは一般
にHankcl(ハンケル)行列と呼ばれているもので
ある。前述のように各Aiは、表現すべき音声波形
の標本自己相関係数υjから(8)式により与えられる
もので既知である。 However, since P (n) o = 1 holds true. The matrix formed by A i on the left side is generally called the Hankcl matrix. As described above, each A i is given by equation (8) from the sample autocorrelation coefficient υ j of the speech waveform to be expressed and is known.
従つて(10)式を解くことによ、P(n) p,P(n) 1,…P(n)
o-1
の値を求めることができる。 Therefore, by solving equation (10), P (n) p , P (n) 1 ,...P (n)
o-1
The value of can be found.
この各P(n) iが求まると、n次方程式 Pn(x)=xn+P(n) o-1xn-1+…P(n) 0=0 の解として、{x1,x2…,xo}が求められる。 Once each P (n) i is found, as a solution to the n-dimensional equation Pn(x)=x n +P (n) o-1 x n-1 +...P (n) 0 =0, {x 1 , x 2 …, x o } is found.
これより各CSM周波数ωiは(4)式の
ωi=cos-1xi
より求められ、またCSM強度miは(9)式より導か
れる下式を用いて求められる。 From this, each CSM frequency ω i is obtained from ω i =cos −1 x i in equation (4), and the CSM intensity m i is obtained using the following equation derived from equation (9).
なお、上式の左辺の行列は一般にVander
Monde(フアレデルモンデ)行列と呼ばれている
ものである。 Note that the matrix on the left side of the above equation is generally Vander
This is called the Monde (Juare del Monde) matrix.
以上をまとめると、CSM分析の分析アルゴリ
ズムは以下のようになる。 To summarize the above, the analysis algorithm for CSM analysis is as follows.
(1) 標本自己相関係数を計算する。(1) Calculate the sample autocorrelation coefficient.
υl=1/MM-1 〓t=l XtXt-l (2) 逆チエビシエフ係数を用いてAlを定義する。 υ l =1/M M-1 〓 t=l X t X tl (2) Define A l using the inverse Tievisiev coefficient.
All
〓j=o
S(l) jυj
(3) AlによるHankel(ハンケル)行列方程式を解
いてP(n) iを求める。 A ll 〓 j=o S (l) j υ j (3) Find P (n) i by solving the Hankel matrix equation by A l .
(4) P(n) iを係数としてもつn次代数方程式を解い
てn個のxiを求める。 (4) P ( n ) Find n x i by solving an n-dimensional algebraic equation with i as a coefficient.
Pn(x)≡xn+P(n) o-1xn-1+…+P(n) 1x+P0=0
(5) cos逆変換を行なつてCSM角周波数{ωi}を
求めると
ωi=cos-1xi
(6) Van der Monde(フアンデルモンデ)行列
方程式を解いてCSM強度{mi}を求める。 Pn(x)≡x n +P (n) o-1 x n-1 +…+P (n) 1 x+P 0 =0 (5) Performing cos inverse transformation to find the CSM angular frequency {ω i }, i = cos -1 x i (6) Find the CSM intensity {m i } by solving the Van der Monde matrix equation.
以上の各ステツプを実行することによりCSM
の各角周波数{ω1,ω2…ωo}および各波の強度
{m1,m2,…mo}を求めることができる。 By performing each of the above steps, CSM
Each angular frequency {ω 1 , ω 2 ...ω o } and the intensity of each wave {m 1 , m 2 , ... m o } can be obtained.
なお、上述のHankel(ハンケル)行列方程式の
能率的解法として、初期条件を与えて逐次的に解
を求める方法が知られている。 Note that, as an efficient method for solving the above-mentioned Hankel matrix equation, a method is known in which initial conditions are given and solutions are sequentially obtained.
また、上記n次の代数方程式は実根のみを有す
ることが証明されているため、ニユートン・ラプ
ソン方法等を用いて根を求めることができる。 Furthermore, since it has been proven that the above nth-order algebraic equation has only real roots, the roots can be found using the Newton-Raphson method or the like.
さらに、上記Vander Monde(フアンデルモン
デ)行列方程式の能率的解法として三角行列化を
行なつて順次に解を求める方法を用いることがで
きる。 Further, as an efficient method for solving the above-mentioned Vander Monde matrix equation, it is possible to use a method of sequentially obtaining solutions by performing triangular matrix formation.
以上に述べたCSM分析において、本実施例で
は、標本自己相関係数とCSMの自己相関係数と
を等しいとする方程式を解く方法を用いたが、こ
のかわりに、LPC係数の無損失化による線スペ
クトル周波数の算出および留数計算による方法を
用いることもできる。 In the CSM analysis described above, this example uses a method of solving an equation in which the sample autocorrelation coefficient and the CSM autocorrelation coefficient are equal. A method based on line spectral frequency calculation and residue calculation can also be used.
また本実施例においては、特定の関数形をもつ
可変長窓関数を用いたが、この関数形は一例を示
したもので、他の関数形が用いられることも明ら
かである。 Further, in this embodiment, a variable length window function having a specific function form is used, but this function form is merely an example, and it is clear that other function forms may be used.
さらに乱随発生器、周期算出器等も一例を示し
たものでこれを限定される必要はない。 Furthermore, the randomization generator, the period calculator, etc. are also shown as examples, and there is no need to be limited thereto.
なお、以上の実施例においてはCSMの各正弦
波の強度(電力振幅)を指定する量としてmiを
用いて説明したが、実際の可変利得増幅器を制御
する信号としては振幅に比例する√iを用いて
行なつてもよいことは明らかである。 In the above embodiments, m i was used as the quantity specifying the intensity (power amplitude) of each sine wave of the CSM, but as a signal that actually controls the variable gain amplifier, √ i which is proportional to the amplitude is used. It is clear that this can also be done using
また本実施例においては伝送路の誤り率を評価
する方法として、エラーが大きくなるとLPC合
成フイルタが不安定領域に近ずく確率が大きくな
る結果LSP合成側の出力が、CSM合成側の出力
に対して大きくなることを利用し、両者の比を用
いて、CSM側出力に荷重すべきウエイトWCSMと
LPC側出力に荷重すべきウエイトWLPCとを算出
しているが、別の適当な方法により伝送路のエラ
ーを評価しこれを用いて荷重すべきウエイト
WCSMおよびWLPCを決定するようにすることもで
きる。 In addition, in this example, as a method for evaluating the error rate of the transmission path, as the error increases, the probability that the LPC synthesis filter approaches the unstable region increases. Taking advantage of the fact that the weight increases, and using the ratio of the two, calculate the weight W CSM and the weight that should be applied to the CSM side output.
The weight W LPC to be applied to the LPC side output is calculated, but the error in the transmission path is evaluated using another appropriate method, and this is used to calculate the weight to be applied.
It is also possible to determine W CSM and W LPC .
なお第11図に示した可変荷重合成特性は一例
を示したものでこれに限定される必要がないこと
は明らかである。 Note that the variable load composite characteristic shown in FIG. 11 is an example, and it is clear that there is no need to be limited thereto.
(発明の効果)
以上述べたように本発明を用いると、伝送路の
誤り率が良好な場合にはより優れた音声品質が得
られるLPC音声合成方式と、誤り率の劣化に対
してより高い耐性をもつCSM音声合成方式との
両者の優れた特徴を併せもつような擬フオルマン
ト型ボコーダを提供できる。(Effects of the Invention) As described above, when the present invention is used, an LPC speech synthesis method that can obtain better speech quality when the error rate of the transmission path is good, and a It is possible to provide a pseudo-formant type vocoder that combines the excellent features of both the CSM speech synthesis method and the durable CSM speech synthesis method.
これによりボコーダの性能向上を達成できる。 This makes it possible to improve the performance of the vocoder.
第1図はCSMパラメータによる音声特徴ベク
トルパターンの一例を示す図、第2図はCSMラ
インスペクトルと、同一音声サンプルより求めた
LPCスペクトル包絡との対応例を示す図、第3
図Aは拡散されたCSMのスペクトル包絡とピツ
チの微細構造とを示す図、第3図Bは単純加算し
ただけのCSMスペクトルを示す図、第4図は本
発明の一実施例を示すブロツク図、第5図は前記
実施例のCSM分析部の詳細を示すブロツク図、
第6図は前記実施例のCSM合成部、第7図は
CSM/LPCパラメータ変換部、第8図はLPC合
成部、第9図は可変荷重合成部のそれぞれの詳細
を示すブロツク図、第10図Aは可変長窓関数の
関数形を示す図、第10図Bは前記可変長窓関数
と位相リセツト用パルスとの相対時間関係を示す
図、第11図は可変荷重合成特性の一例を示す
図、第12図は位相リセツト機能付可変周波数発
振器の一回路例を示す図、第13図は可変利得増
幅器の一回路例を示す図、第14図は乱数発生器
の一回路例を示す図、第15図Aは周期算出器の
ブロツク図、第15図Bは前記周期算出器の出力
の乱数の分布を示す図および第16図は可変長窓
関数発生器の一例を示すブロツク図である。
図において、1…送信側、2…CSM分析、3
…コーダ部、4…受信側、5…デコーダ部、6…
CSM分成部、7…CSM/LPCパラメータ変換
部、8…LPC合成部、9…可変荷重合成部、2
01…A/D変換器、202…ハミング窓処理
器、203…自己相関係数計測器、204…
CSM分析器、205…ピツチ・V/UV分析器、
601−1〜601−n…位相リセツト機能付可
変周波数発振器、602−1〜602−n…可変
利得増幅器、603…加算合成器、604…乗算
器、605…乗算器、606…V/UV替器、6
07…可変長窓関数発生器、608…周期算出
器、609…乱数発生器、701…CSMパラメ
ータ/自己相関係数変換器、702…自己相関係
数/LPCパラメータ変換器、801…LPC合成
フイルタ、802…パルス発振器、803…V/
UV切替器、804…電力制御器、805…雑音
発生器、901,904…一時メモリ、902,
905…電力算出器、903,906…乗算器、
907…ウエイト算出器、908…加算合成器。
Figure 1 shows an example of a voice feature vector pattern based on CSM parameters, and Figure 2 shows a CSM line spectrum and a pattern obtained from the same voice sample.
Diagram showing an example of correspondence with LPC spectrum envelope, 3rd
Figure A is a diagram showing the spectral envelope of the diffused CSM and the pitch fine structure, Figure 3B is a diagram showing the CSM spectrum obtained by simple addition, and Figure 4 is a block diagram showing an embodiment of the present invention. , FIG. 5 is a block diagram showing details of the CSM analysis section of the above embodiment,
Figure 6 shows the CSM synthesis section of the above embodiment, and Figure 7 shows
A block diagram showing the details of the CSM/LPC parameter conversion section, FIG. 8 shows the LPC synthesis section, and FIG. 9 shows the details of the variable weight synthesis section. FIG. Figure B is a diagram showing the relative time relationship between the variable length window function and the phase reset pulse, Figure 11 is a diagram showing an example of variable load synthesis characteristics, and Figure 12 is a circuit of a variable frequency oscillator with phase reset function. 13 is a diagram showing an example of a variable gain amplifier circuit, FIG. 14 is a diagram showing an example of a random number generator circuit, FIG. 15A is a block diagram of a period calculator, and FIG. 15 B is a diagram showing the distribution of random numbers output from the period calculator, and FIG. 16 is a block diagram showing an example of a variable length window function generator. In the figure, 1... Sending side, 2... CSM analysis, 3
...coder section, 4...receiving side, 5...decoder section, 6...
CSM component section, 7... CSM/LPC parameter conversion section, 8... LPC synthesis section, 9... Variable load synthesis section, 2
01...A/D converter, 202...Hamming window processor, 203...autocorrelation coefficient measuring device, 204...
CSM analyzer, 205... Pituchi V/UV analyzer,
601-1 to 601-n...Variable frequency oscillator with phase reset function, 602-1 to 602-n...Variable gain amplifier, 603...Summing synthesizer, 604...Multiplier, 605...Multiplier, 606...V/UV switching vessel, 6
07...Variable length window function generator, 608...Period calculator, 609...Random number generator, 701...CSM parameter/autocorrelation coefficient converter, 702...Autocorrelation coefficient/LPC parameter converter, 801...LPC synthesis filter , 802...pulse oscillator, 803...V/
UV switcher, 804...power controller, 805...noise generator, 901, 904...temporary memory, 902,
905... Power calculator, 903, 906... Multiplier,
907...Weight calculator, 908...Addition synthesizer.
Claims (1)
るCSMパラメータ情報を伝送路に送出する送信
側と、 前記伝送路を介して伝送された前記CSMパラ
メータ情報の指定する各周波数に設定される複数
の位相リセツト機能付可変周波数発振器とこれに
対応して前記発振器の出力を伝送された前記
CSMパラメータ情報の指定する各強度に設定す
る各強度に設定する複数の可変利得増幅器と前記
複数の増幅器の合成出力演算する可変長窓関数発
生器と乱数発生器とを備え有声音合成時にはピツ
チ周期に対応して前記各発振器の位相リセツトを
行ないまた無声音合成時には前記乱数発生器の出
力より算出される周期に対応して前記各発振器の
位相リセツトを行ないまた前記窓関数発生器の動
作を位相リセツトの動作と同期せしめるようにし
てCSM音声合成を行なうCSM合成手段と、伝送
された前記CSMパラメータ情報をLPCパラメー
タ情報に変換しこれを用いてLPC音声合成を行
なうLPC合成手段と、前記CSM合成手段の出力
と前記LPC合成手段の出力とを前記伝送路の伝
送品質に対する評価に従つて可変荷重合成するよ
うにした可変荷重合成手段とを含む受信側と、 を有することを特徴とする擬フオルマント型ボコ
ーダ。 2 前記伝送路の伝送品質に対する評価として前
記CSM合成手段の出力と前記LSP合成手段の出
力との比を用いるようにしたことを特徴とする特
許請求の範囲第1項記載の擬フオルマント型ボコ
ーダ。[Claims] 1. A transmitting side that sends CSM parameter information extracted by CSM analysis of an input audio signal to a transmission path, and each frequency specified by the CSM parameter information transmitted via the transmission path. A plurality of variable frequency oscillators with a phase reset function are set to
It is equipped with a plurality of variable gain amplifiers set to each intensity specified by the CSM parameter information, a variable length window function generator and a random number generator for calculating the combined output of the plurality of amplifiers, and a pitch period when synthesizing voiced sounds. The phase of each of the oscillators is reset in accordance with the period calculated from the output of the random number generator during unvoiced sound synthesis, and the phase of the operation of the window function generator is CSM synthesis means that performs CSM speech synthesis in synchronization with the reset operation; LPC synthesis means that converts the transmitted CSM parameter information into LPC parameter information and uses this to perform LPC speech synthesis; a receiving side comprising variable weight combining means configured to perform variable weight combining of the output of the LPC combining means and the output of the LPC combining means in accordance with an evaluation of the transmission quality of the transmission line; type vocoder. 2. The pseudo-formant vocoder according to claim 1, wherein the ratio between the output of the CSM synthesis means and the output of the LSP synthesis means is used as an evaluation of the transmission quality of the transmission path.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP59179694A JPS6157999A (en) | 1984-08-29 | 1984-08-29 | Pseudo formant type vocoder |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP59179694A JPS6157999A (en) | 1984-08-29 | 1984-08-29 | Pseudo formant type vocoder |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS6157999A JPS6157999A (en) | 1986-03-25 |
| JPH0441838B2 true JPH0441838B2 (en) | 1992-07-09 |
Family
ID=16070238
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP59179694A Granted JPS6157999A (en) | 1984-08-29 | 1984-08-29 | Pseudo formant type vocoder |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS6157999A (en) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5179626A (en) * | 1988-04-08 | 1993-01-12 | At&T Bell Laboratories | Harmonic speech coding arrangement where a set of parameters for a continuous magnitude spectrum is determined by a speech analyzer and the parameters are used by a synthesizer to determine a spectrum which is used to determine senusoids for synthesis |
| US5023910A (en) * | 1988-04-08 | 1991-06-11 | At&T Bell Laboratories | Vector quantization in a harmonic speech coding arrangement |
-
1984
- 1984-08-29 JP JP59179694A patent/JPS6157999A/en active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS6157999A (en) | 1986-03-25 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CA1157564A (en) | Sound synthesizer | |
| CA1242279A (en) | Speech signal processor | |
| De Poli | A tutorial on digital sound synthesis techniques | |
| JPS62289900A (en) | Voice analyzer/synthesizer | |
| US5308918A (en) | Signal delay circuit, FIR filter and musical tone synthesizer employing the same | |
| US4231277A (en) | Process for forming musical tones | |
| JPH0441838B2 (en) | ||
| US5245127A (en) | Signal delay circuit, FIR filter and musical tone synthesizer employing the same | |
| US5524173A (en) | Process and device for musical and vocal dynamic sound synthesis by non-linear distortion and amplitude modulation | |
| JPH0363079B2 (en) | ||
| JPH051957B2 (en) | ||
| US4084472A (en) | Electronic musical instrument with tone generation by recursive calculation | |
| JPS6227397B2 (en) | ||
| JP2699629B2 (en) | Music signal generator | |
| JPH0439678B2 (en) | ||
| JPH051958B2 (en) | ||
| JPH0131638B2 (en) | ||
| JPH051959B2 (en) | ||
| JPH0582958B2 (en) | ||
| JP2606006B2 (en) | Noise sound generator | |
| JP2715692B2 (en) | Electronic musical instrument | |
| JPH0754436B2 (en) | CSM type speech synthesizer | |
| JPS638955Y2 (en) | ||
| JP3235315B2 (en) | Formant sound source | |
| JPS6338719B2 (en) |