Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JPS5912194B2 - speech synthesizer - Google Patents
[go: Go Back, main page]

JPS5912194B2 - speech synthesizer - Google Patents

speech synthesizer

Info

Publication number
JPS5912194B2
JPS5912194B2 JP12942981A JP12942981A JPS5912194B2 JP S5912194 B2 JPS5912194 B2 JP S5912194B2 JP 12942981 A JP12942981 A JP 12942981A JP 12942981 A JP12942981 A JP 12942981A JP S5912194 B2 JPS5912194 B2 JP S5912194B2
Authority
JP
Japan
Prior art keywords
register
interpolation processing
signal
information
sound source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP12942981A
Other languages
Japanese (ja)
Other versions
JPS5831394A (en
Inventor
誠 森戸
賢一郎 細田
隆 矢頭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP12942981A priority Critical patent/JPS5912194B2/en
Publication of JPS5831394A publication Critical patent/JPS5831394A/en
Publication of JPS5912194B2 publication Critical patent/JPS5912194B2/en
Expired legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reciprocating, Oscillating Or Vibrating Motors (AREA)

Description

【発明の詳細な説明】 本発明は、線型予測による音声合成器に関するものであ
る。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to a speech synthesizer using linear prediction.

従来より線型予測による方法には進展した方式も含めて
各種の方式が提案されている。
Various methods have been proposed for linear prediction, including advanced methods.

それらの代表的な方式として、LPC(LinearP
redictiveCodlng)方式、PARCOR
(Partial10ResponseandAuto
correlation)方式、LSP(LineSp
ectrumPair)方式が提案されている。これら
の方式は音声の情報圧縮率、合成音声の品質などの点で
すぐれた方式である。これらの方式は人間の発声機構を
第1図のようにモデル化15することが基本となつてい
る。第1図において、1は発声部であり、有声音に関し
ては声帯による空気の振動、無声音に関しては肺からの
空気圧などによる乱空気流を表わしている。
A typical method is LPC (LinearP
redirectiveCodlng) method, PARCOR
(Partial 10 Response and Auto
correlation) method, LSP (LineSp
ectrumPair) method has been proposed. These methods are excellent in terms of speech information compression rate, quality of synthesized speech, etc. These methods are based on modeling 15 the human vocal mechanism as shown in FIG. In FIG. 1, reference numeral 1 represents a voice producing section, which represents the air vibration caused by the vocal cords for voiced sounds, and the turbulent airflow caused by air pressure from the lungs for unvoiced sounds.

2は共振部であり、生体的には咽、鼻、舌、20歯、唇
などの声道と呼ばれる共振管を意味する。
Reference numeral 2 is a resonant part, which in biological terms refers to a resonant tube called the vocal tract, such as the throat, nose, tongue, teeth, lips, etc.

第1図のように、モデル化された発声機構は第2図のよ
うに電気回路系におきかえられる。第2図において、3
は励振回路で第1図に“ける発声部1に相当する。4は
共振フィルタで第125図における共振部2に相当する
The modeled vocal mechanism as shown in FIG. 1 is replaced by an electric circuit system as shown in FIG. In Figure 2, 3
1 is an excitation circuit, which corresponds to the voicing section 1 in FIG. 1. 4 is a resonance filter, which corresponds to the resonance section 2 in FIG. 125.

さて、第1図、第2図のような発声機構のモデル化のた
めの音声の分析あるいは合成方式について、次に説明す
る。第3図に、従来のこの種の方式を実施した音声分析
合成装置の一例を示す。30第3図において、11は音
声の分析装置、12は分析系から合成系・\の伝送路(
又は記憶装置)、13は音声の合成装置である。
Next, a speech analysis or synthesis method for modeling a vocal mechanism as shown in FIGS. 1 and 2 will be explained. FIG. 3 shows an example of a conventional speech analysis and synthesis device implementing this type of method. 30 In Figure 3, 11 is a speech analysis device, 12 is a transmission line from the analysis system to the synthesis system (
13 is a voice synthesis device.

14は音声のアナログ信号入力端子で、15はローパス
フィルタ、16はアナログ信号をディジタル信号に変換
する35AD変換器、ITは自己相関係数を算出する自
己相関回路、18は自己相関係数によつて各種パラメー
タ(LPC系分析合成装置においてはαパラメータ、P
ARCOR系分析合成装置においてはkパラメータ、L
SP系分析合成装置においてはLSPパラメータ)を算
出するパラメータ算出回路、19はこれらのパラメータ
によつて構成される音源抽出フイルタ(このフイルタは
音声を合成する際に用いている音声合成フイルタの逆フ
イルタである)、20は音源判定を行う音源判定回路、
21はそれぞれのパラメータ出力信号、22は音源情報
出力信号、23は符号器で、これらは分析装置11を構
成している。
14 is an audio analog signal input terminal, 15 is a low-pass filter, 16 is a 35AD converter that converts the analog signal into a digital signal, IT is an autocorrelation circuit that calculates an autocorrelation coefficient, and 18 is an autocorrelation circuit that calculates an autocorrelation coefficient. various parameters (α parameter, P
In the ARCOR system analysis and synthesis equipment, the k parameter, L
In the SP-based analysis/synthesis device, a parameter calculation circuit that calculates LSP parameters), and 19 a sound source extraction filter configured by these parameters (this filter is an inverse filter of the speech synthesis filter used when synthesizing speech). ), 20 is a sound source determination circuit that performs sound source determination;
21 is each parameter output signal, 22 is a sound source information output signal, and 23 is an encoder, which constitute the analysis device 11.

24は符号器23によつて符号化され、伝送路12(又
は記憶装置)を通つて伝送されてきた符号を復号化する
復号器、25は復号化された各種パラメータ(αパラメ
ータ、kパラメータ又はLSPパラメータ)で、26は
復号化された音源情報信号であり、27は音源信号を発
生する音源発生回路、28は音声合成フイルタ、29は
デイジタル信号をアナログ信号に変換するDA変換器、
30はローパスフイルタ、31は合成音声のアナログ信
号出力端子である。
24 is a decoder that decodes the code encoded by the encoder 23 and transmitted through the transmission path 12 (or storage device); 25 is a decoder that decodes the code encoded by the encoder 23 and transmitted through the transmission path 12 (or storage device); 26 is a decoded sound source information signal, 27 is a sound source generation circuit that generates a sound source signal, 28 is a speech synthesis filter, 29 is a DA converter that converts a digital signal into an analog signal,
30 is a low-pass filter, and 31 is an analog signal output terminal for synthesized speech.

これらによつて合成装置13は構成されている。以下第
3図に従い、その作用を詳細に説明する。
The synthesis device 13 is constituted by these. The operation will be explained in detail below with reference to FIG.

音声のアナログ信号入力端子14から加えられた音声信
号はローパスフイルタ15によつて高い周波数成分が除
去される。このローパスフイルタは後述するAD変換器
による音声信号のひずみを小さくするために用いられ、
ローバスフイルタ15の遮断周波数ωCは油変換器によ
る標本化周波数の%以上の周波数成分を除去するように
設定されなければならない。例えば、AD変換器16の
標本化周波数が8KHzである場合には4KHz以上の
周波数成分を除去しなければならないため、ローパスフ
イルタ15の遮断周波数は3.4KHz程度に選ばれる
。ローパスフイルタ15の出力は、AD変換器16によ
つて標本化周期Tごとに標本化される。ここで、t=N
Tごとに標本化されたデイジタル信号をX。とする。A
D変換器16の出力であるデイジタル信号Xnは、例え
ば符号1ビット、値11ビツトによつて構成される。こ
れらのデイジタル信号は自已相関回路17、ならびに音
源抽出フイルタ19に入力される。自己相関回路17で
は音源の自己相関係数ρ。が演算される。自己相関係数
ρ。は次の式で与えられる。(ここで、Nは自己相関係
数を算出する標本点数である。)(1)式によつて算出
された自己相関係数ρ。
A low-pass filter 15 removes high frequency components from the audio signal applied from the audio analog signal input terminal 14. This low-pass filter is used to reduce distortion of the audio signal caused by the AD converter, which will be described later.
The cutoff frequency ωC of the low-pass filter 15 must be set so as to remove frequency components that are greater than % of the frequency sampled by the oil converter. For example, when the sampling frequency of the AD converter 16 is 8 KHz, frequency components of 4 KHz or higher must be removed, so the cutoff frequency of the low-pass filter 15 is selected to be about 3.4 KHz. The output of the low-pass filter 15 is sampled at every sampling period T by the AD converter 16. Here, t=N
The digital signal sampled every T is X. shall be. A
The digital signal Xn, which is the output of the D converter 16, is composed of, for example, 1 bit for the sign and 11 bits for the value. These digital signals are input to an autocorrelation circuit 17 and a sound source extraction filter 19. The autocorrelation circuit 17 calculates the autocorrelation coefficient ρ of the sound source. is calculated. Autocorrelation coefficient ρ. is given by the following formula. (Here, N is the number of sample points for calculating the autocorrelation coefficient.) Autocorrelation coefficient ρ calculated by equation (1).

はパラメータ算出回路18に入力され、それぞれの方式
に従つたパラメータが算出される。パラメータ算出回路
18においては、LPC方式、PARCOR方式、LS
P方式の各種方式に従つてαパラメータ、kパラメータ
、LSPパラメータが算出される。
are input to the parameter calculation circuit 18, and parameters are calculated according to each method. In the parameter calculation circuit 18, LPC method, PARCOR method, LS
α parameters, k parameters, and LSP parameters are calculated according to various P methods.

共通してこれらのパラメータは第1図の発声機構モデル
図における共振部2、また第2図における共振フイルタ
4を構成する上でのフイルタの係数を与えるものである
。すなわち、これらのパラメータによつて咽や鼻や舌な
どの伝達関数が決定される。これらのパラメータによつ
て決定された声道の伝達関数(第2図における共振フイ
ルタの伝達関数)をH(jω)とする。一方、AD変換
器16から出力される音声のスペクトラム関数をY(j
ω)とする。パラメータ算出回路18によつて算出され
た各パラメータによつて音源抽出フイルタ19では声道
の伝達関数H(jω)の逆の特性、すなわち、1/H(
jω)なる特性をもつフイルタを構成する。すると、音
源抽出フイルタ19はAD変換器16からの信号Y(j
ω)を入力とし、声道の伝達関数の逆特性、すなわち、
1/H(jω)なる特性を有するフイルタとなる。音源
抽出フイルタ19の出力は、一般に残差信号と呼ばれ、
第1図における発声部1、あるいは第2図における励振
回路3、又は生体的にいう声帯に相当する。音源抽出フ
イルタ19の出力残差信号は音源判定回路20に送られ
、音源の解析が行われる。音源判定回路20によつて解
析される音源の情報は有声音の基本周期情報T(一般に
ピpツチ周期と呼ばれている)、有声音と無声音の判定
情報V/UV、音声の振幅情報Aの三種類である。
Commonly, these parameters provide filter coefficients for configuring the resonant section 2 in the vocal mechanism model diagram of FIG. 1 and the resonant filter 4 in FIG. 2. That is, the transfer functions of the throat, nose, tongue, etc. are determined by these parameters. Let H(jω) be the transfer function of the vocal tract (transfer function of the resonance filter in FIG. 2) determined by these parameters. On the other hand, the spectrum function of the audio output from the AD converter 16 is expressed as Y(j
ω). Using each parameter calculated by the parameter calculation circuit 18, the sound source extraction filter 19 calculates the inverse characteristic of the vocal tract transfer function H(jω), that is, 1/H(
A filter with the characteristic jω) is constructed. Then, the sound source extraction filter 19 receives the signal Y(j
ω) as input, the inverse characteristic of the vocal tract transfer function, i.e.,
This results in a filter having a characteristic of 1/H(jω). The output of the sound source extraction filter 19 is generally called a residual signal,
This corresponds to the vocalization section 1 in FIG. 1, the excitation circuit 3 in FIG. 2, or the biologically speaking vocal cords. The output residual signal of the sound source extraction filter 19 is sent to the sound source determination circuit 20, where the sound source is analyzed. The sound source information analyzed by the sound source determination circuit 20 includes voiced sound fundamental period information T (generally called piptsuchi period), voiced and unvoiced sound determination information V/UV, and audio amplitude information A. There are three types.

音源判定回路20からの各音源情報出力は前述の三種類
の情報(有声音のピツチ周期情報T一Pゝ有声音・無声
音判定情報V/U、音声の振幅情報A)である。音源抽
出フイルタ19からの出力である残差信号をそのまま伝
送する方法やローパスフイルタを通して別の符号化方式
によつて符号化して伝送する方式も提案されているが、
伝送路12を通過する情報量(又は記憶装置に記憶され
る情報量)が極めて多くなるため一般的ではない。前述
の三種類の音源情報出力信号(有声音ピツチ周期情報T
、有声音・無声音判定情SV/4JV、p音声の振幅情
報A)は符号器23によつて、それぞれ数ビツトに符号
化される。
Each sound source information output from the sound source determination circuit 20 is the aforementioned three types of information (voiced sound pitch period information T1P, voiced sound/unvoiced sound determination information V/U, and audio amplitude information A). There have also been proposals for transmitting the residual signal, which is the output from the sound source extraction filter 19, as it is, or for transmitting it after passing it through a low-pass filter and encoding it using another encoding method.
This is not common because the amount of information passing through the transmission path 12 (or the amount of information stored in the storage device) is extremely large. The aforementioned three types of sound source information output signals (voiced sound pitch period information T
, voiced sound/unvoiced sound determination information SV/4JV, and p voice amplitude information A) are each encoded into several bits by the encoder 23.

同様に、パラメータ算出回路18によつて算出されたパ
ラメータは符号器23によつてやはり数ビツトに符号化
され、伝送路12(又は記憶装置)を通して5ミリ秒〜
30ミリ秒程度のフレーム周期と呼ばれる周期ごとに合
成装置13に送られる。次に、合成装置13において、
5〜30ミリ秒のフレーム周期Tfごとに送られてくる
符号化された各信号を復号器24によつて復号する。
Similarly, the parameters calculated by the parameter calculation circuit 18 are also encoded into several bits by the encoder 23, and passed through the transmission line 12 (or storage device) for 5 milliseconds to
The data is sent to the synthesis device 13 at every cycle called a frame cycle of about 30 milliseconds. Next, in the synthesis device 13,
A decoder 24 decodes each encoded signal sent every frame period Tf of 5 to 30 milliseconds.

復号器24によつて復号された信号のうち、音源情報信
号26は音源発生回路27に入力され、一方、復号器2
4によつて復号された信号のうち、パラメータ25(α
パラメータ又はkパラメータ又はLSPパラメータ)は
音声合成フイルタ28に入力される。音源発生回路27
では、第1図における発声部、第2図における励振回路
3に相当する信号で合成フイルタ28を励振するための
信号を作成する。
Among the signals decoded by the decoder 24, the sound source information signal 26 is input to the sound source generation circuit 27;
Among the signals decoded by 4, parameter 25 (α
parameters (or k parameters or LSP parameters) are input to the speech synthesis filter 28. Sound source generation circuit 27
Now, a signal for exciting the synthesis filter 28 is created using a signal corresponding to the voice generating section in FIG. 1 and the excitation circuit 3 in FIG. 2.

音源発生回路27は、パルス発生器と雑音発生器で構成
され、両者は音源情報信号26の内の有声音・無声音判
定情報V/UV信号によつて選択される。また、パルス
発生器におけるパルス間隔は音源情報信号26の内のピ
ッチ周期情報T によpつて決定される。
The sound source generation circuit 27 includes a pulse generator and a noise generator, both of which are selected by the voiced sound/unvoiced sound determination information V/UV signal of the sound source information signal 26. Further, the pulse interval in the pulse generator is determined by the pitch period information T in the sound source information signal 26.

これらの選択された信号は音源情報信号26の内の音声
の振幅情報Aによつて音声の振幅レベルにあわせた信号
となる。音源発生回路27によつて作られた音源信号は
合成フイルタ28に入力される。
These selected signals become signals matched to the amplitude level of the audio according to audio amplitude information A in the audio source information signal 26. The sound source signal generated by the sound source generation circuit 27 is input to a synthesis filter 28.

合成フイルタ28は、復号器24によつて復号された各
パラメータによつて音声を合成するための声道のフイル
タを構成する。その伝達関数は前述したH(jω)で与
えられる。また、各パラメータによる合成フイルタ28
の係数は伝送路12(又は記憶装置)を通してパラメー
タが送られてくる周期、すなわち、フレーム周期Tfご
とに更新される。一方、音源発生回路27からの入力信
号は分析装置11におけるAD変換器16の標本化周波
数に対応する標本化周期T(標本化周波数が8kHzの
場合には125μ秒)ごとに入力されるため、音声合成
回路28の演算は標本化周期T秒ごとに行われ、その出
力は前記標本化周期と同じ周期である出力周期T秒ごと
にDA変換器29に送られる。
The synthesis filter 28 constitutes a vocal tract filter for synthesizing speech using each parameter decoded by the decoder 24. The transfer function is given by H(jω) mentioned above. In addition, a synthesis filter 28 based on each parameter
The coefficients are updated every cycle at which parameters are sent through the transmission path 12 (or storage device), that is, every frame cycle Tf. On the other hand, since the input signal from the sound source generation circuit 27 is input every sampling period T (125 μs when the sampling frequency is 8 kHz) corresponding to the sampling frequency of the AD converter 16 in the analyzer 11, The operation of the speech synthesis circuit 28 is performed every sampling period T seconds, and its output is sent to the DA converter 29 every output period T seconds, which is the same period as the sampling period.

DA変換器29では、音声合成フイルタからのデイジタ
ル信号をアナログ信号に変換してローパスフイルタ30
に送る。ローパスフイルタ30では、デイジタル信号か
らアナログ信号に変換する際に発生する高周波数成分を
除去する働きをする。ローパスフイルタ30の出力は、
合成音声のアナログ出力端子31を通して外部オーデイ
オ装置(アンプ、スピーカ)によつて聴かれる。このよ
うにして、音声合成装置13は動作する。このような音
声の分析および合成方式では、パラメータ算出回路18
によつて算出されたパラメータ信号21を音源判定回路
20によつて決定された音源情報信号22を符号化し、
フレーム周期と呼ばれる周期5〜30ミリ秒ごとに合成
系に情報を転送し、合成装置においては、復号化された
パラメータ信号25から合成フイルタを、復号化された
音源情報信号26から音源となる励振信号を作り出し、
合成音を合成していた。このような分析合成系では分析
部と合成部とは互いに逆の関係にあるといえよう。従つ
て、分析部において、分析された音声の情報をすべて合
成部に転送し、音声を合成すると、かなり良質の合成音
が得られることが予想される。しかし、分析部によつて
分析された音声の情報すべてを伝送路12(もしくは記
憶装置)を通じて合成部に転送することは、音声の情報
圧縮ならびに記憶装置における記憶領域の軽減という目
的とは矛盾する。従つて、音声の情報圧縮ならびに記憶
装置における記憶領域の軽減という目的から伝送路もし
くは蓄積装置における音声の情報は極力小さくされるべ
きである。
The DA converter 29 converts the digital signal from the voice synthesis filter into an analog signal and passes it through the low-pass filter 30.
send to The low-pass filter 30 functions to remove high frequency components generated when converting a digital signal to an analog signal. The output of the low pass filter 30 is
The synthesized voice is listened to by an external audio device (amplifier, speaker) through the analog output terminal 31. In this manner, the speech synthesizer 13 operates. In such a speech analysis and synthesis method, the parameter calculation circuit 18
encodes the parameter signal 21 calculated by the sound source information signal 22 determined by the sound source determination circuit 20,
Information is transferred to the synthesis system at intervals of 5 to 30 milliseconds called a frame period. create a signal,
They were synthesizing synthesized sounds. In such an analysis-synthesis system, the analysis section and the synthesis section can be said to have an inverse relationship to each other. Therefore, if the analysis section transfers all the analyzed speech information to the synthesis section and synthesizes the speech, it is expected that a synthesized speech of fairly high quality will be obtained. However, transferring all the audio information analyzed by the analysis unit to the synthesis unit via the transmission line 12 (or storage device) is inconsistent with the purpose of compressing audio information and reducing the storage area of the storage device. . Therefore, for the purpose of compressing audio information and reducing the storage area in the storage device, the audio information in the transmission path or storage device should be made as small as possible.

そのために、第3図における分析装置11から合成装置
13に送られる音声の情報も音声のパラメータ(αパラ
メータ又はkパラメータ又はLSPパラメータ)、音源
情報信号(有声音のピツチ周期情報T 、有声音無声音
判定情p報V/UV、音声の振幅情報A)に制限されて
いる。
For this purpose, the voice information sent from the analyzer 11 to the synthesizer 13 in FIG. The determination information is limited to p information V/UV and audio amplitude information A).

ここで注目すべきことは、音源情報信号として第3図の
音源抽出フイルタ19の出力である残差信号そのものを
符号化して伝送あるいは蓄積するのではなく、残差信号
を有声音、無声音に分けてそれぞれインパルス、ランダ
ム雑音にモデル化して、そのモデル化情報を伝送(ある
いは記憶)している。第4図に音源発生回路27の詳細
なプロツク図を示す。
What should be noted here is that instead of encoding and transmitting or storing the residual signal itself, which is the output of the sound source extraction filter 19 in FIG. Each signal is modeled as an impulse or random noise, and the modeling information is transmitted (or stored). FIG. 4 shows a detailed block diagram of the sound source generating circuit 27.

40は雑音発生回路、41はインパルス発生回路、42
は有声音のピツチ周期情報T,の入力端子、43は切り
換えスイツチ、44は有声音・無声音判定情報/UVの
入力端子、45は振幅乗算回路、46は音声振幅情報A
の入力端子、47は音源信号の出力端子であつて、以上
のごとく、音源発生回路27は構成されている。
40 is a noise generation circuit, 41 is an impulse generation circuit, 42
is an input terminal for voiced pitch period information T, 43 is a changeover switch, 44 is an input terminal for voiced/unvoiced sound determination information/UV, 45 is an amplitude multiplication circuit, and 46 is audio amplitude information A.
The input terminal 47 is an output terminal for the sound source signal, and the sound source generating circuit 27 is configured as described above.

第4図に従つて、音源発生回路27の機能について説明
する。
The function of the sound source generation circuit 27 will be explained with reference to FIG.

雑音発生回路40では、ランダム雑音がT秒ごとに発生
させられ、その雑音の振幅値は+1又は−1である。
In the noise generation circuit 40, random noise is generated every T seconds, and the amplitude value of the noise is +1 or -1.

インパルス発生回路41では、有声音のピッチ周期情報
T,、入力端子42から入力されるピツチ周期情報T,
にしたがつてT,秒ごとにインパルス性の信号が発生さ
せられ、その振幅は1である。これら雑音発生回路40
の出力とインパルス発生回路41の出力は、切り換えス
イツチ43によつてどちらか一方が選択される。スイツ
チ43の選択情報としては44から入力される有声音・
無声音判定情報V/Uが用いられる。すなわち、有声音
・無声音判定情報/UVが゛11のときは有声音と判定
され、インパルス発生回路41からの出力が選択される
。また、有声音・無声音判定信号/Uが”O”のときは
無声音と判定され、ランダム雑音発生回路40からの出
力が選択され、振幅乗算回路45に出力される。選択さ
れた音源は振幅乗算回路45において、入力端子46か
ら入力される音声の振幅情報Aを乗せられ、音源信号出
力端子47より音源信号として出力される。このように
して得られた音源信号は合成フイルタ28の入力となる
。一方、振幅情報Aに関して、合成フイルタ28の演算
ビツト数の軽減を目昨として音声の振幅情報Aを乗算す
る以前の信号、すなわち、スイツチ43の出力そのまま
を合成フイルタ28に入力し、音声の振幅情報Aは合成
フイルタ28の出力演算後に乗じる方式も提案されてい
るが、本提案事項に直接関係がないため、音声の振幅情
報Aは合成フイルタ28の入力前に乗せられるものとす
る。
In the impulse generation circuit 41, the pitch period information T of the voiced sound, the pitch period information T input from the input terminal 42,
Therefore, an impulsive signal is generated every T seconds, and its amplitude is 1. These noise generating circuits 40
The output of the impulse generating circuit 41 and the output of the impulse generating circuit 41 are selected by a changeover switch 43. The selection information for the switch 43 includes voiced sounds input from the switch 44.
Unvoiced sound determination information V/U is used. That is, when the voiced sound/unvoiced sound determination information/UV is '11', the sound is determined to be a voiced sound, and the output from the impulse generation circuit 41 is selected. Further, when the voiced sound/unvoiced sound determination signal /U is "O", the sound is determined to be an unvoiced sound, and the output from the random noise generation circuit 40 is selected and output to the amplitude multiplication circuit 45. The selected sound source is loaded with audio amplitude information A input from an input terminal 46 in an amplitude multiplication circuit 45, and is output as a sound source signal from a sound source signal output terminal 47. The sound source signal obtained in this manner becomes an input to the synthesis filter 28. On the other hand, regarding the amplitude information A, the signal before being multiplied by the audio amplitude information A, that is, the output of the switch 43 as it is, is input to the synthesis filter 28 in order to reduce the number of calculation bits of the audio signal. A method has also been proposed in which the information A is multiplied after the output calculation of the synthesis filter 28, but this is not directly related to the present proposal, so the audio amplitude information A is multiplied before the input to the synthesis filter 28.

ここで、音源信号として特に有声音の場合の音源信号に
ついて考える。前述したように、有声音の場合の音源と
しては通常インパルス列が用いられ、その周期は音源情
報信号25の中のピツチ周期情報T,によつて与えられ
る。
Here, a sound source signal in the case of a voiced sound will be considered in particular. As mentioned above, an impulse train is usually used as a sound source for voiced sounds, and its period is given by pitch period information T, in the sound source information signal 25.

このピツチ周期情報T,の値は、通常、男性の場合は5
〜10msec1女性の場合は3〜5msec程度であ
る。一方、音源情報などの一連のデータばフレーム周期
゛2と呼ばれる5〜30msecの周期ごとに更新され
ることは前に述べたが、フレーム周期が長い場合、すな
わち、低ビツトによる音声の情報圧縮を行う場合、フレ
ーム周期を30msec付近に設定する場合には、1フ
レーム内に数本のインパルスが入つた有声音源となる。
The value of this pitch cycle information T, is normally 5 for men.
~10 msec For a woman, it is about 3 to 5 msec. On the other hand, as mentioned earlier, a series of data such as sound source information is updated every 5 to 30 msec called frame period 2, but when the frame period is long, in other words, audio information compression using low bits is If this is done, and the frame period is set to around 30 msec, the result will be a voiced sound source with several impulses in one frame.

1フレーム周期内におけるそれらのパルス間隔はピツチ
周期Tpですべて同じである。
The pulse intervals within one frame period are all the same pitch period Tp.

第5図aに、フレーム周期Tfが30ミリ秒、n番目の
フレーム周期におけるピツチ周期情報T を8ミリ秒、
n+1番目のフレーム周期におpけるピツチ周期T を
10ミリ秒とした場合の音p源信号の図を示す。
In Fig. 5a, the frame period Tf is 30 milliseconds, the pitch period information T in the nth frame period is 8 milliseconds,
A diagram of the sound p source signal when the pitch period T in p in the n+1th frame period is 10 milliseconds is shown.

第5図aにおいて、n番目のフレーム周期内では8ミリ
秒ごとのインパルスが4本、n+1番目のフレーム周期
内では10ミリ秒ごとのインパルスが3本、音源発生回
路27内のインパルス発生回路41によつて発生される
In FIG. 5a, there are four impulses every 8 milliseconds within the n-th frame period, three impulses every 10 milliseconds within the n+1-th frame period, and the impulse generating circuit 41 in the sound source generating circuit 27. generated by.

このインパルスの間隔、8ミリ秒又は10ミリ秒、すな
わち、ピツチ周期T,は分析装置11における残差信号
のパルス間隔の同一フレーム周期内での平均的な値と思
われる。それに対して、実際の声の発声部、すなわち、
声帯などにおいて発せられる励振波形のパルス間隔はゆ
つくりと第5図bのごとく変化しているものと思われる
。従つて、合成装置13内におけるインパルス発生回路
41においても、n番目のフレーム周期内はすべて8ミ
リ秒間隔のパルス、n+1番目のフレーム周期内はすべ
て10ミリ秒間隔のパルスといつた具合いにフレーム周
期ごとに不連続にかわるパルス列を用いるよりも、第5
図bのように、徐々にパルス間隔が変化していくインパ
ルス列を用いて合成フイルタを駆動した方が実際の残差
信号との類似性が増すことになり、音質が向上すると思
われる。
The interval between these impulses, 8 or 10 milliseconds, ie, the pitch period T, is considered to be the average value of the pulse interval of the residual signal in the analyzer 11 within the same frame period. On the other hand, the vocal part of the actual voice, that is,
It seems that the pulse interval of the excitation waveform emitted from the vocal cords etc. slowly changes as shown in Fig. 5b. Therefore, the impulse generating circuit 41 in the synthesizer 13 generates frames in such a manner that all pulses are generated at 8 ms intervals within the n-th frame period, and pulses are generated at 10 ms intervals within the n+1 th frame period. Rather than using a pulse train that discontinuously changes every cycle,
As shown in FIG. b, if the synthesis filter is driven using an impulse train whose pulse intervals gradually change, the similarity with the actual residual signal will increase, and the sound quality will be improved.

本発明は、合成音声の品質を向上させることを目的とし
ており、合成フイルタ28の入力となる。
The present invention aims to improve the quality of synthesized speech, and serves as an input to the synthesis filter 28.

有声音の音源信号のパルス列の間隔をフレーム周期Tf
内で徐々に変化させることによつて、フレーム間でのパ
ルス列の間隔が不連続になることを防ぎ、分析部11に
おける残差信号により近い形で有声音時の音源を与える
ことを特徴としているものであり、以下詳細に説明する
。前に述べたように、フレーム周期ごとに送られてくる
各種の情報は、そのフレーム周期内での平均的な値であ
るため、フレーム周期間ではかなりの不連続性をもつて
いると思われる。
The interval of the pulse train of the voiced sound source signal is the frame period Tf
By gradually changing the pulse train interval within the frame, discontinuity in the pulse train interval between frames is prevented, and the sound source of the voiced sound is given in a form that is closer to the residual signal in the analysis unit 11. This will be explained in detail below. As mentioned earlier, the various information sent every frame period is an average value within that frame period, so there is likely to be considerable discontinuity within the frame period. .

一方、実際の各種の情報はゆるやかに連続的に変化して
いるものであつて、フレーム周期内での不連続を小さく
するためには、フレーム周期を短く設定しなければなら
ない。
On the other hand, various types of actual information change slowly and continuously, and in order to reduce discontinuities within the frame period, the frame period must be set short.

しかし、フレーム周期を短く設定することは情報量の増
加を招く。従つて、長いフレーム周期設定時において、
各種の情報の不連続性をなくす方法として”補間”とい
う処理が通常とられる。第6図に、補間の処理について
述べる。
However, setting the frame period short causes an increase in the amount of information. Therefore, when setting a long frame period,
A process called "interpolation" is usually used to eliminate discontinuities in various types of information. FIG. 6 describes the interpolation process.

第6図によつて、50は各フレーム周期内に送られてく
る各種の情報であり、51は補間を行つた結果の各種の
情報である。
According to FIG. 6, 50 is various types of information sent within each frame period, and 51 is various types of information as a result of interpolation.

この補間という処理は通常各種パラメータ25(LPC
方式のαパラメータ、PARCOR方式のkパラメータ
、LSP方式のLSPパラメータ)、あるいは音源情報
信号26の内の音声の振幅情報Aについては行われてい
る処理であるが、ピツチ周期T,について補間を行つた
合成器は提案されていない。第7図に、本発明の音声合
成器の有声音源発生部に用いるピツチ周期情報T の補
間処理を行うpピツチ周期補間処理回路を示す。
This process of interpolation usually involves various parameters 25 (LPC
This process is performed for the α parameter of the PARCOR method, the k parameter of the PARCOR method, the LSP parameter of the LSP method), or the amplitude information A of the sound in the sound source information signal 26, but interpolation is performed for the pitch period T. No ivy synthesizer has been proposed. FIG. 7 shows a p-pitch period interpolation processing circuit that performs interpolation processing of pitch period information T used in the voiced sound source generating section of the speech synthesizer of the present invention.

第7図において、60はピツチ周期情報T のSP入力
端子で、61は減算器、62はシフタ、63は補間処理
単位レジスタ、64は加算器、65はピツチ周期レジス
タ、66はパルス発生のタイミングを得るカウンタ、6
7はパルス発生タイミング信号、68はパルス又はパル
ス列発生回路、69は有声音の音源信号(音声の振幅情
報Aを乗じる前の信号)の出力端子である。
In FIG. 7, 60 is the SP input terminal of pitch cycle information T, 61 is a subtracter, 62 is a shifter, 63 is an interpolation processing unit register, 64 is an adder, 65 is a pitch cycle register, and 66 is the timing of pulse generation. A counter that obtains 6
7 is a pulse generation timing signal, 68 is a pulse or pulse train generation circuit, and 69 is an output terminal for a voiced sound source signal (signal before being multiplied by audio amplitude information A).

また、第8図aにこれらの補間処理のタイムチヤート、
第8図bに第8図aを部分的に拡大したタイムチヤート
を示す。
In addition, Fig. 8a shows a time chart of these interpolation processes.
FIG. 8b shows a partially enlarged time chart of FIG. 8a.

第1クロツク信号70はフレーム周期Tf毎に発生する
信号で、差分レジスタ63、減算器61における減算処
理タイミング、差分レジスタ63における読み込みタイ
ミングを与える。
The first clock signal 70 is a signal generated every frame period Tf, and provides the timing for subtraction processing in the difference register 63 and the subtracter 61, and the timing for reading in the difference register 63.

第2クロック信号71は補間処理周期T(合成フイルタ
の出力クロツク、および分析装置におけるAD変換器の
標本化の周期と同じ)毎に発生する信号を表わし、補間
処理単位レジスタ63とピッチ周期レジスタ65の駆動
パルスとして働く。第1クロツク信号70の周期Tfと
第2クロツク信号71の周期Tは回路構成の簡略化をは
かるために、TfはTの2のべき乗倍に選ばれるのが常
である。従つて、本実施例の説明においては、一例とし
て、補間処理周期 T=125マイクロ秒フレーム周期
Tf−32ミリ秒 に設定し、TとTfの比はT:Tf=1:256=1:
28とする。
The second clock signal 71 represents a signal generated every interpolation processing period T (same as the output clock of the synthesis filter and the sampling period of the AD converter in the analyzer), and is generated in the interpolation processing unit register 63 and the pitch period register 65. Acts as a driving pulse. The period Tf of the first clock signal 70 and the period T of the second clock signal 71 are usually selected to be a power of 2 times Tf in order to simplify the circuit configuration. Therefore, in the description of this embodiment, as an example, the interpolation processing period T=125 microseconds, the frame period Tf-32 milliseconds, and the ratio of T and Tf is T:Tf=1:256=1:
28.

従つて、第1クロツク信号70のパルス70000と7
0001の間には256個の第2クロツク信号71のパ
ルスが存在する。それらのパルスの番号を71000〜
71255とする。また、第1クロツク信号70におけ
るパルス70000と第2クロツク信号71におけるパ
ルス71000、および第1クロツク信号70における
パルス70001と第2クロツク信号71におけるパル
ス71256は同じタイミングであるとする。階段状線
72は第2クロツク信号の各タイミングにおけるピツチ
周期レジスタ65の内容をアナログ的に表示したグラフ
で、階段状線73はカウンタ66の内容をアナログ的に
表示したグラフである。パルス発生タイミング信号74
はカウンタ66によつて発せられるインパルスのタイミ
ングを示す。では、第7図と第8図A,bに従つて、隣
接するフレーム周期Tfにおいて異なるピッチ周期情報
Tの補間処理を行うピツチ周期補間処理回p路の動作に
ついて説明する。
Therefore, pulses 70,000 and 7 of first clock signal 70
There are 256 pulses of the second clock signal 71 between 0001 and 0001. Change the number of those pulses from 71000 to
71255. It is also assumed that the pulse 70000 in the first clock signal 70 and the pulse 71000 in the second clock signal 71, and the pulse 70001 in the first clock signal 70 and the pulse 71256 in the second clock signal 71 have the same timing. A stepped line 72 is a graph representing the contents of the pitch period register 65 in an analog manner at each timing of the second clock signal, and a stepped line 73 is a graph representing the contents of the counter 66 in an analog manner. Pulse generation timing signal 74
indicates the timing of the impulses issued by counter 66. The operation of the pitch period interpolation processing circuit p which performs interpolation processing of different pitch period information T in adjacent frame periods Tf will now be described with reference to FIGS. 7 and 8A and 8B.

入力端子60より各フレーム周期の最初に入力される有
声音のピツチ周期情報Tは7ビツトのpデイジタル符号
によつて構成されている。
The pitch period information T of the voiced sound input from the input terminal 60 at the beginning of each frame period is composed of a 7-bit p digital code.

このディジタル符号は第3図における合成装置13の復
号器24の出力であつて、伝送路12(あるいは記憶装
置)を通じて得られるデイジタル符号そのものでないこ
とを明記しておく。入力端子60から入力されるピツチ
周期情報T,を7ビツトのデイジタル符号に設定した理
由は、人間のピツチ周期の範囲を考慮に入れた結果であ
つて、理由を簡単に説明する。ピツチ周期T は合成フ
イルタの出力周期Tをp基準として設定されており、6
0から入力されるデイジタル符号が1の場合はピツチ周
期 T =T p 2の場合は 〃 T =2T p 3の場合は 〃 T =3T p なる値をとる。
It should be noted that this digital code is the output of the decoder 24 of the synthesizer 13 in FIG. 3, and is not the digital code itself obtained through the transmission line 12 (or storage device). The reason why the pitch period information T, inputted from the input terminal 60 is set to a 7-bit digital code is as a result of taking into account the range of human pitch periods, and the reason will be briefly explained. The pitch period T is set with the output period T of the synthesis filter as p reference, and is 6
When the digital code input from 0 is 1, the pitch period is T = T p 2, T = 2T p 3, T = 3T p .

従つて、T=125マイクロ秒である場合、60から入
力される7ビツトのデイジタル符号の最大値は127で
あるから127×125マイクロ秒=15.875ミリ
秒となり、人間のピツチ周期3〜10ミリ秒を再現でき
る。
Therefore, when T = 125 microseconds, the maximum value of the 7-bit digital code input from 60 is 127, so 127 x 125 microseconds = 15.875 milliseconds, which is a human pitch period of 3 to 10 Can reproduce milliseconds.

入力端子60からのピツチ周期T,のデイジタル符号は
第8図aにおけるパルス70000のタイミングで入力
される。次に、減算器61において、今回入力されたピ
ツチ周期T,のデイジタル符号とピツチ周期レジスタ6
5の内容との減算が行われる。
A digital code with a pitch period T from the input terminal 60 is input at the timing of the pulse 70000 in FIG. 8a. Next, in the subtracter 61, the digital code of the pitch period T, input this time and the pitch period register 6
Subtraction with the contents of 5 is performed.

ピツチ周期65には前のフレーム周期における補間処理
のピッチ周期情報の最終値が格納されている。ピツチ周
期レジスタ65のビツト構成は小数点以上7ビツト、小
数点以下8ビツトの計15ビツトである。小数点以上の
7ビツトは入力端子60から入力されるピツチ周期情報
T,のデイジタルビツト構成の7ビツトに対応している
。減算器61では、前フレーム周期における最終ピツチ
周期情報と今のフレーム周期情報との差分を演算してい
ることになる。減算器61の出力は、シフタ62によつ
て1/256される。このシフタ62は、シフトレジス
タ等を用いてもよいが、配線を工夫することによつても
実現できる。すなわち、減算器61の出力を8ビツト右
にシフトする結線を減算器61と補間処理単位レジスタ
63との間で行つている。従つて、シフタ62に相当す
る素子的な構成要素は特に設けなくてもよい。シフタ6
2によつて1/256する理由は、減算器61によつて
得られた隣接するフレーム周期間Tfでのピツチ周期T
,の差を補間処理周期Tあたりの補間処理単位に変換す
るためで、1フレーム周期Tfと補間処理周期Tとの比
を2のべき乗(本処理では256)に選んだ処理は、こ
の変換処理の構成を簡略化するためである。シフタ62
によつて8ビツト右にシフトされた減算器61の出力は
、補間処理単位レジスタ63に補間処理単位として格納
される。補間処理単位レジスタ63の内容は前述したよ
うに補間処理周期Tあたりのフレーム周期間での差を意
味している。補間処理単位レジスタ63のデイジタル符
号構成は符号1ビツトと小数点以下8ビツトによつて構
成される。次に加算器64において、補間処理単位レジ
スタ63とピツチ周期レジスタ65が加算され、その結
果はパルス71001のタイミングによつてピッチ周期
レジスタ65に読み込まれる。
The pitch period 65 stores the final value of the pitch period information of the interpolation process in the previous frame period. The pitch period register 65 has a total of 15 bits, 7 bits above the decimal point and 8 bits below the decimal point. The 7 bits above the decimal point correspond to the 7 bits of the digital bit configuration of the pitch period information T input from the input terminal 60. The subtracter 61 calculates the difference between the final pitch cycle information in the previous frame cycle and the current frame cycle information. The output of the subtracter 61 is reduced by 1/256 by a shifter 62. This shifter 62 may be implemented using a shift register or the like, but it can also be realized by devising wiring. That is, a connection is made between the subtracter 61 and the interpolation processing unit register 63 to shift the output of the subtracter 61 to the right by 8 bits. Therefore, there is no need to provide any elemental component corresponding to the shifter 62. shifter 6
2 is 1/256 because the pitch period T in the adjacent frame period Tf obtained by the subtractor 61 is
, into an interpolation processing unit per interpolation processing period T, and the processing in which the ratio of one frame period Tf and the interpolation processing period T is selected as a power of 2 (256 in this processing) is this conversion processing. This is to simplify the configuration. shifter 62
The output of the subtracter 61 shifted to the right by 8 bits is stored in the interpolation processing unit register 63 as an interpolation processing unit. The contents of the interpolation processing unit register 63 mean the difference in frame period per interpolation processing period T, as described above. The digital code structure of the interpolation processing unit register 63 consists of a 1-bit code and 8 bits below the decimal point. Next, in the adder 64, the interpolation processing unit register 63 and the pitch period register 65 are added, and the result is read into the pitch period register 65 at the timing of the pulse 71001.

パルス71001からパルス71002までは、補間処
理単位レジスタ63の内容とピツチ周期レジスタ65の
内容を加算器64で加算し、その結果をパルス7100
2のタイミングによつてピッチ周期レジスタ65に読み
込む処理を行う。
From pulse 71001 to pulse 71002, the contents of the interpolation processing unit register 63 and the contents of the pitch period register 65 are added by the adder 64, and the result is added to the pulse 71000.
The process of reading into the pitch period register 65 is performed at timing 2.

このとき、補間処理単位レジスタ63の内容は変化しな
い。パルス71002からパルス71003までも同様
の処理を行う。以下254回、同様の処理を行い、パル
ス71256によつてフレーム周期内の最終の補間デー
タがピツチ周期レジスタ65に読み込まれる。
At this time, the contents of the interpolation processing unit register 63 do not change. Similar processing is performed for pulses 71002 to 71003. The same process is repeated 254 times, and the final interpolated data within the frame period is read into the pitch period register 65 by pulse 71256.

ピツチ周期レジスタ65に格納される補間されたピツチ
周期情報の変化のようすを第8図A,bの階段状線72
で示す。ピツチ周期レジスタ65のデイジタル出力のう
ち、小数点以上の7ビツトはカウンタ66のプリセツト
入力となる。
The change in the interpolated pitch cycle information stored in the pitch cycle register 65 is shown by the stepped line 72 in FIGS. 8A and 8B.
Indicated by Of the digital output of the pitch period register 65, seven bits above the decimal point serve as a preset input to the counter 66.

カウンタ66はクロツク71によつてダウンカウント動
作を行い、カウンタ出力値がOになつたとき、レジスタ
65の小数点以上の7ビツトの値をロードする。また、
このとき、出力端子67からインパルスを発生する。第
8図bのタイムチヤートに従つて、カウンタ66の動作
を説明する。
The counter 66 performs a down-count operation by the clock 71, and when the counter output value reaches O, the value of 7 bits above the decimal point of the register 65 is loaded. Also,
At this time, an impulse is generated from the output terminal 67. The operation of the counter 66 will be explained according to the time chart shown in FIG. 8b.

パルス71050が入つてきたときのカウンタ66の内
容を00000101レジスタ65の内容を00010
00.00000000、差分レジスタ63の内容を0
.01000000とする。
The contents of the counter 66 when the pulse 71050 comes in are 00000101, and the contents of the register 65 are 00010.
00.00000000, set the contents of difference register 63 to 0
.. 01000000.

すると、各パルス時におけるピツチ周期レジスタ65の
内容、カウンタ66の内容、パルス発生のタイミング信
号67の動作は次の表1の如くなる。前記表1に従う動
作におけるカウンタ66の内容の変化の様子を第8図b
の階段状線73で示し、カウンタ66から得られるパル
ス発生タイミング信号67を第8図bに示す。パルス発
生タイミング信号67によつてパルス発生回路はパルス
又はパルス列を発生させ、音源信号出力端子69から有
声音の音源信号を出力する。パルス発生回路68によつ
て発生するパルスはインパルス、又はバーカ一系列信号
、正弦二乗波など、各信号が提案されているが、本発明
ではそれらのパルスの発生を与えるパルス発生タイミン
グ信号の間隔を補間することを特徴としており、パルス
又はパルス列の種類は問題ではない。以上の如く、有声
音源発生回路は動作する。本発明によるピツチ周期の補
間処理を行うことによつてフレーム間でのピツチ周期の
不連続性を軽減することができ、そのため合成音の抑揚
がなめらかになり、合成音の音質が向上する。
Then, the contents of the pitch period register 65, the contents of the counter 66, and the operation of the pulse generation timing signal 67 at the time of each pulse are as shown in Table 1 below. FIG. 8b shows how the contents of the counter 66 change during the operation according to Table 1.
The pulse generation timing signal 67 obtained from the counter 66 is shown in FIG. 8b. The pulse generation circuit generates a pulse or a pulse train according to the pulse generation timing signal 67, and outputs a voiced sound source signal from the voice signal output terminal 69. Various signals have been proposed for the pulses generated by the pulse generation circuit 68, such as an impulse, a Barker series signal, or a sine square wave, but in the present invention, the interval of the pulse generation timing signal that gives the generation of these pulses is It is characterized by interpolation, and the type of pulse or pulse train does not matter. As described above, the voiced sound source generation circuit operates. By performing pitch period interpolation processing according to the present invention, discontinuity in the pitch period between frames can be reduced, resulting in smoother intonation of the synthesized sound and improved sound quality of the synthesized sound.

本発明は、フレーム周期間でのピツチ周期Tpの不連続
性を解消する回路を有しているので、有声音時の音源と
してピツチ周期ごとのパルスもしくはパルス列を用いる
音声合成装置において利用することができる。
Since the present invention has a circuit that eliminates the discontinuity of the pitch period Tp in the frame period, it can be used in a speech synthesis device that uses pulses or pulse trains for each pitch period as a sound source for voiced sounds. can.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は発生機構のモデル化の図、第2図は発声機構を
電気回路におきかえたモデル図、第3図は従来の音声の
分析合成装置、第4図は音源発生回路の説明図、第5図
aはn番目とn+1番目のフレームにおける有声音のピ
ツチ周期T,の不連続性を説明する図、第5図bは実際
の有声音時の励振波形を示した図、第6図は補間処理を
示した図、第7図はピツチ周期補間処理回路を示した図
、第8図aはピツチ周期の補間処理を説明するためのタ
イムチヤート、第8図bは第8図aを部分的に拡大して
示したタイムチヤートである。 11・・・・・・音声の分析装置、12・・・・・・伝
送路又は記憶装置、13・・・・・・音声の合成装置、
14・・・・・・音声のアナログ信号入力端子、15・
・・・・・ローパスフイルタ、16・・・・・・AD変
換器、17・・・・・泪已相関回路、18・・・・・・
パラメータ算出回路、19・・・・・・音源抽出フイル
タ、20・・・・・・音源判定回路、21・・・・・・
パラメータ(αパラメータ、又はkパラメータ、又はL
SPパラメータ)、22・・・・・・音源情報信号(T
,、V/UV.A)、23・・・・・・符号器、24・
・・・・・復号器、25・・・・・・復号されたパラメ
ータ、26・・・・・・復号された音源情報信号、27
・・・・・・音源発生回路、28・・・・・・合成フィ
ルタ、29・・・・・・DA変換器、30・・・・・・
ローパスフイルタ、31・・・・・・合成音声出力端子
、40・・・・・・雑音発生回路、41・・・・・・イ
ンパルス発生回路、42・・・・・・ピッチ周期情報T
入力端子、43・・・・・・スイッチ、44・・・・・
・有声・P ・ )
無声判定信号V/UV入力端子、45・・・・・・振幅
乗算回路、46・・・・・・振幅Aの入力端子、47・
・・・・・音源信号出力端子、60・・・・・・ピツチ
周期情報Tのp入力端子、61・・・・・・減算器、6
2・・・・・・シフタ、63・・・・・・差分レジスタ
、64・・・・・・加算器、65・・・・・・レジスタ
、66・・・・・・カウンタ、67・・・・・・パルス
発生タイミング信号、68・・・・・・パルス又はパル
ス列発生回路、69・・・・・・有声音の音源信号出力
端子、70・・・・・・フレーム周期Tfる表わす第1
クロツク信号、70000,70001・・・・・・第
1クロツク信号70のパルス、71・・・・・・補間処
理周期Tを表わす第2クロツク信号、71000〜71
256・・・・・・第2クロツク信号71のパルス、7
2・・・・・・レジスタ65の内容を表わす階段状線、
73・・・・・・カウンタ66の内容を示す階段状線、
74・・・・・・カウンタ60より発せられるインパル
スのタイミング。
Figure 1 is a diagram showing the modeling of the generation mechanism, Figure 2 is a model diagram in which the voice generation mechanism is replaced with an electric circuit, Figure 3 is a conventional speech analysis and synthesis device, and Figure 4 is an explanatory diagram of the sound source generation circuit. Figure 5a is a diagram explaining the discontinuity of the pitch period T of the voiced sound in the nth and n+1th frames, Figure 5b is a diagram showing the excitation waveform during an actual voiced sound, and Figure 6 7 is a diagram showing the interpolation process, FIG. 7 is a diagram showing the pitch period interpolation processing circuit, FIG. 8a is a time chart for explaining the pitch period interpolation process, and FIG. 8b is the same as FIG. This is a partially enlarged time chart. 11...Speech analysis device, 12...Transmission path or storage device, 13...Speech synthesis device,
14...Audio analog signal input terminal, 15.
...Low pass filter, 16...AD converter, 17...Yumi correlation circuit, 18...
Parameter calculation circuit, 19... Sound source extraction filter, 20... Sound source determination circuit, 21...
Parameter (α parameter, or k parameter, or L
SP parameter), 22... sound source information signal (T
,,V/UV. A), 23... Encoder, 24...
... Decoder, 25 ... Decoded parameters, 26 ... Decoded sound source information signal, 27
......Sound source generation circuit, 28...Synthesis filter, 29...DA converter, 30...
Low pass filter, 31...Synthesized voice output terminal, 40...Noise generation circuit, 41...Impulse generation circuit, 42...Pitch period information T
Input terminal, 43...Switch, 44...
・Voiced・P・)
Silence determination signal V/UV input terminal, 45... Amplitude multiplier circuit, 46... Input terminal for amplitude A, 47.
... Sound source signal output terminal, 60 ... P input terminal for pitch period information T, 61 ... Subtractor, 6
2...Shifter, 63...Difference register, 64...Adder, 65...Register, 66...Counter, 67... . . . Pulse generation timing signal, 68 . . . Pulse or pulse train generation circuit, 69 . . . Voiced sound source signal output terminal, 70 . . . 1
Clock signal, 70000, 70001...Pulse of first clock signal 70, 71...Second clock signal representing interpolation processing period T, 71000-71
256...Pulse of second clock signal 71, 7
2...A stepped line representing the contents of the register 65,
73...A stepped line indicating the contents of the counter 66,
74... Timing of the impulse emitted from the counter 60.

Claims (1)

【特許請求の範囲】[Claims] 1 線型予測タイプの音声合成器の有声音源発生部にお
いて、補間処理結果を格納しておく第1のレジスタ65
とフレーム周期ごとに送られてくる有声音のピッチ周期
情報と第1のレジスタ65に格納される補間処理結果と
の差分をとる減算器と、その差分を補間処理周期対応の
補間処理単位に変換する手段とその補間処理単位を格納
しておく第2のレジスタ63と補間処理周期ごとに第2
のレジスタ63に格納された補間処理単位と第1のレジ
スタ65に格納される補間処理結果を逐次加算し、その
加算結果を第1のレジスタ65に再び格納させる加算器
と前記第1のレジスタ65並びにパルス発生回路に接続
されているものであつて、補間処理周期ごとにカウント
ダウンし、格納値が特定値に達すると、第1のレジスタ
65の内容でその格納値を更新し、且つ前記パルス発生
回路を起動させるための信号を発生するカウンタ66と
を有するピッチ周期補間処理回路を備えたことを特徴と
する音声合成器。
1. In the voiced sound source generation section of the linear prediction type speech synthesizer, the first register 65 stores the interpolation processing result.
and a subtracter that takes the difference between the pitch period information of the voiced sound sent every frame period and the interpolation processing result stored in the first register 65, and converts the difference into an interpolation processing unit corresponding to the interpolation processing period. A second register 63 stores a unit of interpolation processing and a second register 63 for storing a unit of interpolation processing.
an adder that sequentially adds the interpolation processing unit stored in the register 63 and the interpolation processing result stored in the first register 65, and stores the addition result in the first register 65 again; It is also connected to the pulse generation circuit, and counts down every interpolation processing cycle, and when the stored value reaches a specific value, updates the stored value with the contents of the first register 65, and starts the pulse generation circuit. 1. A speech synthesizer comprising a pitch period interpolation processing circuit having a counter 66 that generates a signal for activating the circuit.
JP12942981A 1981-08-20 1981-08-20 speech synthesizer Expired JPS5912194B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP12942981A JPS5912194B2 (en) 1981-08-20 1981-08-20 speech synthesizer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP12942981A JPS5912194B2 (en) 1981-08-20 1981-08-20 speech synthesizer

Publications (2)

Publication Number Publication Date
JPS5831394A JPS5831394A (en) 1983-02-24
JPS5912194B2 true JPS5912194B2 (en) 1984-03-21

Family

ID=15009265

Family Applications (1)

Application Number Title Priority Date Filing Date
JP12942981A Expired JPS5912194B2 (en) 1981-08-20 1981-08-20 speech synthesizer

Country Status (1)

Country Link
JP (1) JPS5912194B2 (en)

Also Published As

Publication number Publication date
JPS5831394A (en) 1983-02-24

Similar Documents

Publication Publication Date Title
US5321794A (en) Voice synthesizing apparatus and method and apparatus and method used as part of a voice synthesizing apparatus and method
JP2000155597A (en) Voice coding method to be used in digital voice encoder
US5673361A (en) System and method for performing predictive scaling in computing LPC speech coding coefficients
JP2615548B2 (en) Highly efficient speech coding system and its device.
JPS5912194B2 (en) speech synthesizer
US4809330A (en) Encoder capable of removing interaction between adjacent frames
JPH0738116B2 (en) Multi-pulse encoder
JPH05158497A (en) Audio transmission system
JP2615991B2 (en) Linear predictive speech analysis and synthesis device
JP3515216B2 (en) Audio coding device
JP3274451B2 (en) Adaptive postfilter and adaptive postfiltering method
JP3166697B2 (en) Audio encoding / decoding device and system
JPS62102294A (en) Voice coding system
JPS5961891A (en) Encoding of residual signal
JP2898641B2 (en) Audio coding device
JP3071800B2 (en) Adaptive post filter
JPS5915299A (en) Voice analyzer
JP2658438B2 (en) Audio coding method and apparatus
JPS5831393A (en) Voice synthesizer
JP2615862B2 (en) Voice encoding / decoding method and apparatus
JPS6332599A (en) Voice encoder
JPH05167457A (en) Voice coder
JPS6036597B2 (en) speech synthesizer
JPS621000A (en) Voice processor
JPS6087400A (en) Multipulse type voice code encoder