Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JPS5952840B2 - Speech synthesizer interpolation device - Google Patents
[go: Go Back, main page]

JPS5952840B2 - Speech synthesizer interpolation device - Google Patents

Speech synthesizer interpolation device

Info

Publication number
JPS5952840B2
JPS5952840B2 JP2391780A JP2391780A JPS5952840B2 JP S5952840 B2 JPS5952840 B2 JP S5952840B2 JP 2391780 A JP2391780 A JP 2391780A JP 2391780 A JP2391780 A JP 2391780A JP S5952840 B2 JPS5952840 B2 JP S5952840B2
Authority
JP
Japan
Prior art keywords
register
interpolation
frame
data
delay circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP2391780A
Other languages
Japanese (ja)
Other versions
JPS56121099A (en
Inventor
格 川崎
友明 入路
靖文 河野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2391780A priority Critical patent/JPS5952840B2/en
Publication of JPS56121099A publication Critical patent/JPS56121099A/en
Publication of JPS5952840B2 publication Critical patent/JPS5952840B2/en
Expired legal-status Critical Current

Links

Landscapes

  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

【発明の詳細な説明】 本発明は人間の音声生成モデルに基づく音声合成器に使
われる音声パラメータの補間装置に関するものである。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to a speech parameter interpolation device used in a speech synthesizer based on a human speech production model.

上記方式の音声合成器は一般にはターミナルアナログ方
式や線形予測(LPC)方式の合成器として知られるも
のである。
The above-mentioned type of speech synthesizer is generally known as a terminal analog type or linear prediction (LPC) type synthesizer.

フオルマント周波数、有声音源のピッチ周期、振幅など
のパラメータが合成器に与えられて発声がなされるもの
である。通常、上記パラメータは20msまたは10m
s程度のフレームの間、同一の値として取扱われる。し
かし、このフレーム長では不十分であり、さらに短かい
フレーム長でパラメータを設定していく方が良質の音質
が得られるが、このようにすると当然、ビット数の増大
を招く。このため、フレーム長は或る程度長くしておき
、音声合成器内で2.5ms程度の単位で補間を行なう
ことにより、ビット数を増加させずに良質な音声を得る
ことが出来ることが一般に知られている。第1図は一般
に使われる補間回路のブロック図である。
Parameters such as the formant frequency, the pitch period of the voiced sound source, and the amplitude are given to a synthesizer to produce a voice. Usually the above parameters are 20ms or 10m
It is treated as the same value for about s frames. However, this frame length is insufficient, and better sound quality can be obtained by setting parameters with an even shorter frame length, but this naturally results in an increase in the number of bits. For this reason, it is generally possible to obtain high-quality speech without increasing the number of bits by setting the frame length to a certain extent and performing interpolation in units of about 2.5 ms within the speech synthesizer. Are known. FIG. 1 is a block diagram of a commonly used interpolation circuit.

同図において、メモリ1に蓄えられたデ;一タが補間演
算部3で演算され、メモリ4に蓄えられる。この場合、
補間の基準点となるデータを蓄えるメモリがメモリ1と
メモリ2といつたように2組必要で、さらに補間の結果
を蓄えるメモリ3と合せると3組のメモリが必要となる
In the figure, data stored in a memory 1 is calculated by an interpolation calculation section 3 and stored in a memory 4. in this case,
Two sets of memories, memory 1 and memory 2, are required to store data serving as reference points for interpolation, and three sets of memories are required when including memory 3, which stores interpolation results.

音声合成器で使用されるフレームあたりのビツト数はか
なり多いのでメモリ容量は大きくなる。本発明は、その
ような問題を解決し、更に補間回路に工夫を加えること
により、音声合成器の発声速度を容易に可変できるよう
にしたものである。
Since the number of bits per frame used by the speech synthesizer is quite large, the memory capacity is large. The present invention solves such problems and furthermore makes it possible to easily vary the speech rate of the speech synthesizer by adding a modification to the interpolation circuit.

以下、本発明を図示の実施例に基いて説明する。第2図
は本発明の基本を説明するためのプロツク図である。同
図において、5は第1レジスタ、6は第2レジスタ、7
は減算器、8,9,10は各各1/2,1/4,1/8
の割算器、11は加算器である0上記第1レジスタ5に
は音声合成に使用されるパラメータがフレーム毎に入力
されるOフレームの最後に第1レジスタ5のデータは直
接第2レジスタ6に送られる。従つて各フレームの最初
は第2レジスタ6は前のフレームのデータが記憶されて
いることになる。補間点では第1レジスタ5のデータと
第2レジスタ6のデータが減算器7で減算され、割算器
8,9,10のいずれかを通る。上記割算器は補間値の
変化分を作るので、第2レジスタ6のデータと上記割算
器の出力を加算器11で加算して、第2レジスタ6に記
憶させれば、第2レジスタ6は補間データを次々と得る
ことが出来る。第3図は本発明の実施例を示すプロツク
図である。
Hereinafter, the present invention will be explained based on illustrated embodiments. FIG. 2 is a block diagram for explaining the basics of the present invention. In the figure, 5 is the first register, 6 is the second register, and 7 is the first register.
is a subtracter, 8, 9, 10 are each 1/2, 1/4, 1/8
Divider 11 is an adder 0 Parameters used for speech synthesis are input to the first register 5 for each frame O At the end of the frame, the data in the first register 5 is directly input to the second register 6 sent to. Therefore, at the beginning of each frame, the second register 6 stores the data of the previous frame. At the interpolation point, the data in the first register 5 and the data in the second register 6 are subtracted by a subtracter 7, and then passed through one of the dividers 8, 9, and 10. Since the divider creates a change in the interpolated value, if the data in the second register 6 and the output of the divider are added together in the adder 11 and stored in the second register 6, the data in the second register 6 can obtain interpolated data one after another. FIG. 3 is a block diagram showing an embodiment of the present invention.

同図において、第2図の5,6にそれぞれ相当する第1
レジスタ20および第2レジスタ21はシフトレジスタ
からなり、クロツクに応じてデータを最下位ビツト(L
SB)から送り出す。29ごは補間演算部であり、第1
レジスタ20および第2レジスタ21のデータをとり込
み、第2レジスタ21へ補間結果を送り込む。
In the same figure, the first
The register 20 and the second register 21 are made up of shift registers and shift data to the least significant bit (L) according to the clock.
SB). 29 is an interpolation calculation unit, and the first
The data in the register 20 and the second register 21 are taken in, and the interpolation result is sent to the second register 21.

22は減算器であり、上記第1レジスタ20、第2レジ
スタ21からのデータをクロツクに合せて1ビツトずつ
演算して加算器25に入力する。
22 is a subtracter which operates the data from the first register 20 and second register 21 bit by bit in synchronization with the clock and inputs the result to the adder 25.

23,26は単位遅延回路の直列結合によりクロツクに
同期して動作する遅延回路である。
23 and 26 are delay circuits which operate in synchronization with a clock by connecting unit delay circuits in series.

24,27は上記各遅延回路23,26における単位遅
延回路の各ステージの出力を必要に応じて出力出来るセ
レクタである。
24 and 27 are selectors that can output the output of each stage of the unit delay circuit in each of the delay circuits 23 and 26 as required.

くセレクタ24の出力は加算器25に入力される。加算
器25の出力は遅延回路26に入力される。28はセレ
クタであり、これは前記セレクタ27の出力と第]レジ
スタ20の出力をセレクトして第2レジスタ21に送り
出す0遅延回路23は第2レジスタ21の出力を遅延さ
せる。
The output of selector 24 is input to adder 25. The output of adder 25 is input to delay circuit 26. 28 is a selector which selects the output of the selector 27 and the output of the register 20 and sends it to the second register 21. The zero delay circuit 23 delays the output of the second register 21.

その遅延時間はセレクタ24で調整される。減算器22
の遅延時間と遅延回路23の遅延時間の差で加算器25
に達する減算器22による減算結果のデータと第1レジ
スタ21からのデータのタイミングが決定される。遅延
時間の調整で第2図の割算器8.9,10の選択がなさ
れる。遅延回路26とセレクタ27は遅延回路23とセ
レクタ24で発生したタイミングの差を調整するために
設けたものである。セレクタ28は、フレームの最後に
第1レジスタ20から第2レジスタ21に直接送られる
経路を作り出すために設けられたものである。次表は第
2図の割算器の選択を示す表である。20msフレーム
の場合、10msフレームの場合、各々2,5ms間隔
で補間がなされる。
The delay time is adjusted by the selector 24. Subtractor 22
The difference between the delay time of the adder 25 and the delay time of the delay circuit 23
The timing of the data of the subtraction result by the subtracter 22 and the data from the first register 21 that reach . The selection of dividers 8.9 and 10 in FIG. 2 is made by adjusting the delay time. The delay circuit 26 and the selector 27 are provided to adjust the timing difference generated between the delay circuit 23 and the selector 24. The selector 28 is provided to create a path directly sent from the first register 20 to the second register 21 at the end of the frame. The following table shows the selection of the divider of FIG. In the case of a 20 ms frame and in the case of a 10 ms frame, interpolation is performed at intervals of 2 and 5 ms, respectively.

従つて、20msフレームの場合は8点、10msフレ
ームの場合は4点で補間がなされる。前記表中の通常モ
ードの場合がこれを表わす。20msフレームで第1補
間点から第3補間点の場合が14の割算器を使用し、第
4補間点から第6補間点の場合がZの割算器を使用し、
第7補間点ではZの割算器を使用する。
Therefore, interpolation is performed at 8 points for a 20 ms frame and at 4 points for a 10 ms frame. This is shown in the case of normal mode in the table above. In a 20ms frame, from the first interpolation point to the third interpolation point, a divider of 14 is used, from the fourth interpolation point to the sixth interpolation point, a divider of Z is used,
At the seventh interpolation point, a Z divider is used.

第4図は本発明の実施例による補間結果を示すグラフで
ある。
FIG. 4 is a graph showing interpolation results according to an embodiment of the present invention.

横軸は時間であり、図示の番号は補間点のフレーム内番
号である。縦軸は補間値である。補間点をOと補間点8
の補間値は第1レジスタに外部から送られてくるデータ
である。上記のアルゴリズムで補間を実行すると、点a
から点iに至る補間値が順次得られる。10msフレー
ムにおける場合を第5図に示す0点pから点tに至る補
間値が得られることになる。
The horizontal axis is time, and the numbers shown are the intraframe numbers of interpolation points. The vertical axis is the interpolated value. Interpolation point O and interpolation point 8
The interpolated value is data sent to the first register from the outside. When performing interpolation with the above algorithm, point a
Interpolated values from to point i are sequentially obtained. In the case of a 10 ms frame, interpolated values from point 0 p to point t shown in FIG. 5 are obtained.

補間値は完全な線型補間にはなり得ないが、音声合成器
のパラメータ補間などでは十分であり音声合成器からの
音質には何ら影響を与えない。上記のごとき補間回路の
制卿に工夫を加えることによつて発声速度の制御を容易
に行なわすことができる。
Although the interpolated values cannot be perfectly linear interpolated, parameter interpolation of the speech synthesizer is sufficient and does not affect the quality of the sound from the speech synthesizer. By adding a device to the control of the interpolation circuit as described above, the speech rate can be easily controlled.

このことについて説明する。音声合成のパラメータのと
り込み速度が変化した場合、発声速度の制御が実現され
る。音声生成モデルに基づく音声合成器では音源と声道
が分離されるので、有声音源のピッチを変えることなく
声道のパラメータの変化を早く、または遅く出来るので
音質の低下を招くことなく早口、遅口の発声が可能とな
る。前記の表では20msフレームで早口の場合、第6
補間点を最終補間点とし、第1レジスタの内容を第2レ
ジスタへ直接転送し次のフレームへ入る例を示している
。補間値は第4図の点aから点Jに至る値となる。発声
速度は2570早くなる。方、遅口の場合、フレーム最
終での第1レジスタから第2レジスタへの直接転送を延
長し、補間をその間続ける。前記表の20msフレーム
の遅口の場合、2補間時間だけフレームが延長され、第
8および第9補間点においても1/2割算器を通した補
間が続行虹れる。この結果、補間値は第4図の点aから
点mに至る値をとる。フレームは2570のびるので2
5?の遅口となる。前記表と第5図に10msフレーム
に設定されたバラメータで同碌jこ25%の且口と遅口
を実現するための条件と補間値の変化を示している。一
般にはXmsのフレームで通常モードではN個(但し、
Nは正の整数)の補間点を設け、ΣMs毎に補間を求め
て行き、早口、遅口のモードではN±M個(但し、Mは
正の整数)の補間点を設け、上記と同毎に補間を求めて
行き、フレーム周期をMx(1±−)Ms毎に変更すれ
は容易に発声速度Nを調整することが出来る。
This will be explained. When the speed of capturing parameters for speech synthesis changes, control of the speaking speed is realized. In a speech synthesizer based on a speech generation model, the sound source and vocal tract are separated, so the parameters of the vocal tract can be changed quickly or slowly without changing the pitch of the voiced sound source, so it is possible to change the parameters of the vocal tract quickly or slowly without degrading the sound quality. Mouth speech becomes possible. In the table above, in the case of fast speaking in a 20ms frame, the 6th
An example is shown in which the interpolation point is set as the final interpolation point, the contents of the first register are directly transferred to the second register, and the next frame is entered. The interpolated value is the value from point a to point J in FIG. The speaking speed increases by 2570 points. On the other hand, in the case of slow transfer, the direct transfer from the first register to the second register at the end of the frame is extended, and interpolation continues during that time. In the case of the 20 ms frame delay in the table above, the frame is extended by two interpolation times, and the interpolation through the 1/2 divider continues at the 8th and 9th interpolation points. As a result, the interpolated value takes a value ranging from point a to point m in FIG. The frame stretches 2570, so 2
5? Becomes a slow talker. The above table and FIG. 5 show the conditions and changes in interpolated values for achieving 25% of the same speed and slow speed using parameters set to a 10 ms frame. In general, it is a frame of Xms, and in normal mode there are N frames (however,
N is a positive integer) interpolation points are set, and interpolation is obtained for each ΣMs. In fast and slow speaking modes, N±M interpolation points (where M is a positive integer) are set and the same as above is performed. The utterance rate N can be easily adjusted by calculating interpolation for each time and changing the frame period every Mx(1±-)Ms.

なお、先の例では20msフレームと10msフレーム
の例を示したが、20msフレームで設定されたパラメ
ータを使つて10msフレームの補間回路を採用すれは
2倍の早口が得られるし、逆の場合は2倍の遅口が得ら
れる。
In addition, the previous example showed an example of 20ms frame and 10ms frame, but if you use the interpolation circuit of 10ms frame using the parameters set for 20ms frame, you can get twice as fast speech, and vice versa. You get twice as slow.

以上の説明から明らかなように本発明によれば、第1図
の従来例のように3個のメモリは不要であり、例えば第
1レジスタおよび第2レジスタといつた2個のメモリで
十分であるので、低コスト化に有利であり、また、比較
的簡単な構成で発声速度を容易に変化させることも可罷
であるという非常にすぐれた効果が得られるものである
As is clear from the above description, according to the present invention, three memories are not required as in the conventional example shown in FIG. 1, and two memories, for example, the first register and the second register, are sufficient. Therefore, it is advantageous for cost reduction, and it is also possible to easily change the speaking speed with a relatively simple configuration, which is a very excellent effect.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は従来例のプロツク図、第2図は本発明の基本を
説明するためのプロツク図、第3図は本発明の実施例の
プロツク図、第4図および第5図は本発明の実施例によ
る補間値の経過を示すグラフである。 5,20・・・・・・第1レジスタ、6,21・・・・
・・第2レジスタ、7,22・・・・・・減算器、8,
9,10・・・・・・割算器、11,25・・・・・・
加算器、23,26・・・・・・遅延回路、24,27
,28・・・・・・セレクタ、29・・・・・・補間演
算部。
Fig. 1 is a block diagram of a conventional example, Fig. 2 is a block diagram for explaining the basics of the present invention, Fig. 3 is a block diagram of an embodiment of the present invention, and Figs. 4 and 5 are block diagrams of the present invention. It is a graph showing the progress of interpolated values according to an example. 5, 20... 1st register, 6, 21...
...Second register, 7, 22...Subtractor, 8,
9, 10... Divider, 11, 25...
Adder, 23, 26...Delay circuit, 24, 27
, 28... Selector, 29... Interpolation calculation unit.

Claims (1)

【特許請求の範囲】 1 クロックに同期してデータの最下位ビットより1ビ
ット毎に演算を行ない順次に演算結果を出力して行く形
態の減算器および加算器と、単位遅延回路の直列結合に
よりクロックに同期して動作する遅延回路と、第1レジ
スタおよび第2レジスタを具備し、前記第1レジスタに
はフレーム周期毎にデータが更新され、前記第1レジス
タと第2レジスタのデータが最下位ビットより前記減算
器に供給され、この減算器の出力と、前記第1レジスタ
と前記第2レジスタの一方の出力を前記遅延回路を通し
て前記加算器に供給することによつて補間演算部を構成
し、前記遅延回路における単位遅延回路の遅延時間を変
化させることによつて補間値の変化分を作り出し、フレ
ーム周期内の補間個数に応じた補間値を補間演算部で演
算し、その補間結果を順次シリアルに前記第2レジスタ
に転送するように構成したことを特徴とする音声合成器
の補間装置。 2 特許請求の範囲第1項の記載において、音声合成器
の音声パラメータをxミリ秒毎に設定させておき、第1
モードではフレーム周期xミリ秒毎に前記第1レジスタ
にとり込み、1フレーム内でN個(但し、Nは正の整数
)の補間点を求めるように動作させ、第2モードではフ
レーム周期x(1±M/N)ミリ秒(但し、Mは正の整
数)毎に前記第1レジスタにとり込み、1フレーム内で
(N±M)個の補間点を求めるように動作させることに
よつて、前記第1モードと第2モードで音声合成器から
の発声速度を調整可能に構成したことを特徴とする音声
合成器の補間装置。
[Claims] 1. By serially connecting a subtracter and an adder that perform operations bit by bit starting from the least significant bit of data in synchronization with a clock and sequentially output the operation results, and a unit delay circuit. It is equipped with a delay circuit that operates in synchronization with a clock, and a first register and a second register, and data is updated in the first register every frame period, and the data in the first register and the second register are the lowest. bits to the subtracter, and the output of the subtracter and the output of one of the first register and the second register are supplied to the adder through the delay circuit, thereby forming an interpolation calculation section. , by changing the delay time of the unit delay circuit in the delay circuit, a change in interpolation value is created, an interpolation value corresponding to the number of interpolations within a frame period is calculated in an interpolation calculation section, and the interpolation results are sequentially processed. An interpolation device for a speech synthesizer, characterized in that the interpolation device is configured to serially transfer data to the second register. 2. In the statement of claim 1, the voice parameters of the voice synthesizer are set every x milliseconds, and
In the second mode, the frame period x (ms) is read into the first register and N (N is a positive integer) interpolation points are obtained within one frame. In the second mode, the frame period x (1 ±M/N) milliseconds (where M is a positive integer), the data is input into the first register, and is operated to obtain (N±M) interpolation points within one frame. 1. An interpolation device for a speech synthesizer, characterized in that the rate of speech from the speech synthesizer can be adjusted in a first mode and a second mode.
JP2391780A 1980-02-27 1980-02-27 Speech synthesizer interpolation device Expired JPS5952840B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2391780A JPS5952840B2 (en) 1980-02-27 1980-02-27 Speech synthesizer interpolation device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2391780A JPS5952840B2 (en) 1980-02-27 1980-02-27 Speech synthesizer interpolation device

Publications (2)

Publication Number Publication Date
JPS56121099A JPS56121099A (en) 1981-09-22
JPS5952840B2 true JPS5952840B2 (en) 1984-12-21

Family

ID=12123843

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2391780A Expired JPS5952840B2 (en) 1980-02-27 1980-02-27 Speech synthesizer interpolation device

Country Status (1)

Country Link
JP (1) JPS5952840B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58193596A (en) * 1982-05-07 1983-11-11 株式会社日立製作所 speech synthesizer
JPS58195899A (en) * 1982-05-11 1983-11-15 カシオ計算機株式会社 Interpolation circuit of LSP speech synthesizer
JP2665902B2 (en) * 1984-11-19 1997-10-22 東洋通信機株式会社 Speech synthesis / recognition method

Also Published As

Publication number Publication date
JPS56121099A (en) 1981-09-22

Similar Documents

Publication Publication Date Title
US4435832A (en) Speech synthesizer having speech time stretch and compression functions
JP3563772B2 (en) Speech synthesis method and apparatus, and speech synthesis control method and apparatus
JP2921376B2 (en) Tone generator
JPS645720B2 (en)
JPS5952840B2 (en) Speech synthesizer interpolation device
US4653099A (en) SP sound synthesizer
JP3087744B2 (en) Music generator
JPS6286394A (en) Generation of musical sound signal
GB2097636A (en) Speech synthesizer
JP4639527B2 (en) Speech synthesis apparatus and speech synthesis method
JP2758688B2 (en) Speech synthesizer
JPS5816297A (en) Voice synthesizing system
JPH0477320B2 (en)
JPH04125699A (en) Residual driving type voice synthesizer
JPS6038720B2 (en) speech synthesizer
JPH10282991A (en) Speech rate converting device
JPH0498299A (en) Method for controlling lasting time of phoneme of voice synthesizer
JPS5950997B2 (en) Audio parameter information extraction method
JP2834736B2 (en) Speech synthesizer
JPH0431900A (en) Speech synthesizer
JPH0536797B2 (en)
JPS5898800A (en) Phoneme editing type speech synthesis method
JPS5925236B2 (en) speech synthesizer
JPH01304499A (en) System and device for speech synthesis
JPS5848920B2 (en) Speech synthesizer sound source creation device