Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JPS5855519B2 - speech synthesizer - Google Patents
[go: Go Back, main page]

JPS5855519B2 - speech synthesizer - Google Patents

speech synthesizer

Info

Publication number
JPS5855519B2
JPS5855519B2 JP54132181A JP13218179A JPS5855519B2 JP S5855519 B2 JPS5855519 B2 JP S5855519B2 JP 54132181 A JP54132181 A JP 54132181A JP 13218179 A JP13218179 A JP 13218179A JP S5855519 B2 JPS5855519 B2 JP S5855519B2
Authority
JP
Japan
Prior art keywords
speech
spectral envelope
frequency
signal
formant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP54132181A
Other languages
Japanese (ja)
Other versions
JPS5655999A (en
Inventor
洋一 東倉
芳典 匂坂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP54132181A priority Critical patent/JPS5855519B2/en
Publication of JPS5655999A publication Critical patent/JPS5655999A/en
Publication of JPS5855519B2 publication Critical patent/JPS5855519B2/en
Expired legal-status Critical Current

Links

Description

【発明の詳細な説明】 この発明は音声信号の特徴であるスペクトル包絡特性と
音声基本周波数との少くとも二つを使って音声信号を合
成する音声合成装置に関し、特に人工的に音声基本周波
数を与え、かつ品質の高い合成音が得られるようにしよ
うとするものである。
[Detailed Description of the Invention] The present invention relates to a speech synthesis device that synthesizes a speech signal using at least two characteristics of the speech signal, namely, the spectral envelope characteristic and the speech fundamental frequency, and particularly relates to a speech synthesis device that synthesizes a speech signal using at least two characteristics of the speech signal, namely, the spectral envelope characteristic and the speech fundamental frequency. The aim is to provide high-quality synthesized speech.

第1図を用いて従来のこの種の音声合成装置を説明する
A conventional speech synthesis device of this type will be explained using FIG.

音声の振幅し、基本周期、いわゆるピッチT及び有声音
と無声音とを区別する有声/無声信号などの音源情報が
記憶装置11に貯えられ、音源信号制御装置12により
合成しようとする音声信号と対応する一組の音源信号が
記憶装置11から一定時間ごとに読み出される。
Sound source information such as the amplitude of the sound, the fundamental period, so-called pitch T, and the voiced/unvoiced signal that distinguishes between voiced and unvoiced sounds is stored in the storage device 11 and corresponds to the sound signal to be synthesized by the sound source signal control device 12. A set of sound source signals are read out from the storage device 11 at regular intervals.

読み出された基本周期Tはパルス発生器13に、有声/
無声信号は切換装置14に、音声振幅りは可変利得増幅
器15へそれぞれ供給される。
The read fundamental period T is sent to the pulse generator 13 as voiced/
The unvoiced signal is supplied to a switching device 14, and the voice amplitude is supplied to a variable gain amplifier 15.

パルス発生器13は入力された基本周期T毎のパルスを
発生し切換装置15は入力された有声/無声信号が有声
音を示す時はパルス発生器13の出力を選択し、無声音
を示す時は白線音発生器16の出力を選択して増幅器1
5へ供給する。
The pulse generator 13 generates a pulse for each input basic period T, and the switching device 15 selects the output of the pulse generator 13 when the input voiced/unvoiced signal indicates a voiced sound, and selects the output of the pulse generator 13 when the input voiced/unvoiced signal indicates a voiced sound. Select the output of the white line sound generator 16 and apply it to the amplifier 1.
Supply to 5.

増幅器15は切換装置14の出力を、振幅りに従って増
幅する。
Amplifier 15 amplifies the output of switching device 14 according to its amplitude.

その出力はディジタルフィルタの音声合成フィルタ17
に入力される。
The output is the digital filter's speech synthesis filter 17.
is input.

一方音声信号のスペクトル包絡を表わすパラメータが記
憶装置18に記憶されている。
On the other hand, parameters representing the spectral envelope of the audio signal are stored in the storage device 18.

このパラメータとしては、例えばPARCOR係数(k
i)”j=1(参考文献、日本音響学全編、音響工学講
座7 「音声」中田和男著pp、93〜97)を用いる
ことができる。
As this parameter, for example, PARCOR coefficient (k
i)"j=1 (References, Japanese Acoustics Complete Edition, Acoustic Engineering Course 7 "Speech" by Kazuo Nakata, pp. 93-97) can be used.

このパラメータは一定時間ごとにパラメータ制御装置1
9で読み出してフィルタ17に送出され、このパラメー
タに応じて音声合成フィルタ17の特性が制御される。
This parameter is sent to the parameter control device 1 at regular intervals.
9 and sent to the filter 17, and the characteristics of the speech synthesis filter 17 are controlled according to this parameter.

フィルタ17の出力はディジタルアナログ変換装置21
によりアナログ信号に変換され、出力端子22より合成
音声信号として送出される。
The output of the filter 17 is a digital to analog converter 21.
The signal is converted into an analog signal and sent out from the output terminal 22 as a synthesized audio signal.

このような従来の音声合成装置では音源信号制御装置1
2とパラメータ制御装置19とが独立に動作するもので
あった。
In such a conventional speech synthesis device, the sound source signal control device 1
2 and the parameter control device 19 operated independently.

このため音源信号とスペクトル包絡との不整合が生じ、
意図したスペクトル包絡を実現できない場合があった。
This causes a mismatch between the sound source signal and the spectral envelope,
In some cases, the intended spectrum envelope could not be achieved.

即ち、例えば10個のPARCOR係数 (kl ) 14 =1によって記述される音声のスペ
クトル包絡と、これに対応するフーリエのスペクトルを
第2図Aに示す。
That is, FIG. 2A shows the spectral envelope of speech described by, for example, 10 PARCOR coefficients (kl) 14 =1 and the corresponding Fourier spectrum.

このスペクトル包絡は音声の周波構造で表されるフーリ
エスペクトルを最適近似するように決定されている(参
考文献、電子通信学会論文誌Vol、 53−A、
A;、1.1970、板金、斉藤「統計的手法による音
声スペクトル密度とホルマント周波数の推定」)。
This spectral envelope is determined to optimally approximate the Fourier spectrum represented by the frequency structure of audio (References, Journal of the Institute of Electronics and Communication Engineers Vol. 53-A,
A;, 1.1970, Saito, Saito "Estimation of speech spectral density and formant frequency using statistical methods").

従って、この周波構造と一致した基本周波数を持つ音源
信号をスペクトル包絡特性再生用ディジタルフィルタ1
7に付加すれば、音源信号とスペクトル包絡とは整合し
、その結果得られた合成音声のスペクトル包絡も原音声
のスペクトル包絡に近いものとなる。
Therefore, the digital filter 1 for reproducing the spectral envelope characteristic is used to reproduce the sound source signal having a fundamental frequency that matches this frequency structure.
7, the sound source signal and the spectral envelope match, and the spectral envelope of the resulting synthesized speech also becomes close to the spectral envelope of the original speech.

これらの問題点は音声の分析により、その音源情報とス
ペクトル包絡情報とを抽出し、これらを再び組み合せて
原音声を再生する場合には問題とならない。
These problems do not arise when the sound source information and spectral envelope information are extracted by analyzing the sound, and these are recombined to reproduce the original sound.

しかし音源情報のみを独立に変更する場合、例えば第1
図に示したように記憶装置11の音源情報が記憶装置1
8のスペクトル包絡情報と独立に生成されるような場合
には、大きな問題点となる。
However, when changing only the sound source information independently, for example, the first
As shown in the figure, the sound source information of the storage device 11 is stored in the storage device 1.
If the spectral envelope information is generated independently from the spectral envelope information of No. 8, it will be a big problem.

第2図Aに示したスペクトル包絡に対応したスペクトル
包絡パラメータをディジタルフィルタ17に与えるが、
このフィルタ17に第2図Aに示した調波構造、即ち基
本周波数F。
The spectral envelope parameters corresponding to the spectral envelope shown in FIG. 2A are given to the digital filter 17,
This filter 17 has a harmonic structure shown in FIG. 2A, that is, a fundamental frequency F.

=350Hzとは異なった調波構造、例えば基本周波数
F。
= 350 Hz and a different harmonic structure, e.g. fundamental frequency F.

=230Hzの音源信号を付加した場合、その合成音声
のスペクトル包絡及びフーリエスペクトルは第2図Bに
示すようになる。
When a sound source signal of =230 Hz is added, the spectral envelope and Fourier spectrum of the synthesized speech are as shown in FIG. 2B.

これら第2図A及びBを比較して明らかなように、第2
図Bでは第2図Aにおいて存在した低周波数領域の明瞭
なピーク23が失なわれ、意図したスペクトル包絡が得
られていない。
As is clear from comparing these Figures 2 A and B,
In FIG. 2B, the clear peak 23 in the low frequency region that existed in FIG. 2A is lost, and the intended spectral envelope is not obtained.

従って第2図Bに示したようなスペクトル包絡を持つ合
成音声はスペクトルの大きなひずみを持ち、品質の劣化
したものになる。
Therefore, synthesized speech having a spectral envelope as shown in FIG. 2B has a large spectral distortion and is of degraded quality.

従って実際の音声信号より得られたスペクトル包絡特性
を示すパラメータを用い、その音声信号の基本周期(ピ
ッチ)と異なる、例えば高い又は低い音声信号を合成し
ようとすると、その合成音声の品質は可成り劣化したも
のになった。
Therefore, if you try to synthesize a voice signal that is different from the fundamental period (pitch) of the voice signal, for example, higher or lower, using parameters that indicate the spectral envelope characteristics obtained from an actual voice signal, the quality of the synthesized voice will be quite low. It has become degraded.

この発明は音源信号とスペクトル包絡との不整合が生む
合成音声の品質劣化を除去し、意図したスペクトル包絡
と聴覚的に近いスペクトル包絡を実現することを可能と
する音声合成装置を提供するものである。
The present invention provides a speech synthesis device that eliminates the quality deterioration of synthesized speech caused by mismatch between the sound source signal and the spectral envelope, and makes it possible to realize a spectral envelope that is audibly close to the intended spectral envelope. be.

この発明によれば与えられた音声基本周波数と得ようと
する音声信号のスペクトル包絡のピーク周波数、例えば
第17オルマント周波数とが相関を持つように対応する
スペクトル包絡特性を表わすパラメータを変換する。
According to the present invention, the parameters representing the corresponding spectral envelope characteristics are converted so that the given audio fundamental frequency and the peak frequency of the spectral envelope of the audio signal to be obtained, for example, the 17th ormant frequency, have a correlation.

第3図はこの発明による音声合成装置の一例を示し、第
1図と対応する部分には同一符号を付けである。
FIG. 3 shows an example of a speech synthesis device according to the present invention, and parts corresponding to those in FIG. 1 are given the same reference numerals.

この発明においては整合装置24が設けられ、この整合
装置24に制御装置12より基本周波Tが、制御装置1
9からパラメータがそれぞれ供給される。
In this invention, a matching device 24 is provided, and the fundamental frequency T is transmitted to the matching device 24 from the control device 12.
Parameters are supplied from 9 respectively.

この整合装置24はパラメータにより記述されるスペク
トル包絡を基本周波数F。
This matching device 24 adjusts the spectral envelope described by the parameters to the fundamental frequency F.

(=1/T)の周波構造と整合するようにパラメータを
変換する。
The parameters are converted to match the frequency structure of (=1/T).

即ち得ようとする音声信号のスペクトル包絡のピーク周
波数と、制御装置12からの基本周波数F。
That is, the peak frequency of the spectral envelope of the audio signal to be obtained and the fundamental frequency F from the control device 12.

−1/Tとが相関をもつように制御装置19からのパラ
メータが変換される。
The parameters from the control device 19 are converted so that they have a correlation with -1/T.

例えば記憶装置18に配置されているパラメータがPA
RCOR係数(ki)i=、で記述される場合、このP
ARCOR係数から、原音声のスペクトル包絡の低周波
、一般に500Hz以下のピーク周波数、通常第1ホル
マントの周波数F1及びその帯域幅B1を抽出する。
For example, the parameters stored in the storage device 18 are PA
When described by the RCOR coefficient (ki)i=, this P
From the ARCOR coefficients, a low frequency of the spectral envelope of the original speech, generally a peak frequency of 500 Hz or less, usually the frequency F1 of the first formant, and its bandwidth B1 are extracted.

この抽出は公知の方法によることができる。This extraction can be performed by a known method.

Fl−nF’o (nは正整数)を演算し、その差出
力がB1/2以下又はそれと等しい場合は記憶装置18
から読み出されたパラメータをそのまま利用する。
Fl−nF'o (n is a positive integer) is calculated, and if the difference output is less than or equal to B1/2, the storage device 18
Use the parameters read from .

しかし FlnFo がB1/2以上の場合は前記第1
ホルマント周波数F に僅かの周波数ΔFを加えた周波
数F1′を考え、このl Fl’ nFo 1がB1
/2より小又は等しくなるF1′で△F1が最小のもの
を設定する。
However, if FlnFo is B1/2 or more, the first
Considering the frequency F1' which is the formant frequency F plus a slight frequency ΔF, this l Fl' nFo 1 is B1
Set the one in which ΔF1 is the smallest among F1′ that is smaller than or equal to /2.

このF□′を第1ホルマント周波数とし、その他のホル
マント周波数はそのまSとして、これ等よりPARCO
R係数(ki’) 、 =1を演算する。
Let this F□′ be the first formant frequency, and let the other formant frequencies be S as they are, and from these, PARCO
Calculate R coefficient (ki'), =1.

この演算は公知の方法によることができる。This calculation can be performed using a known method.

この演算されたPARCOR係数を音声合成フィルタ1
7の特性を制御するパラメータとする。
This calculated PARCOR coefficient is applied to the speech synthesis filter 1.
7 as a parameter to control the characteristics.

このようなパラメータ変換はPARCOR係数のみに限
らず音声の線形予測分析で導出される線形予測係数、対
数断面積比、更に線スペクトルパラメタータに関しても
同様に行なうことができる。
Such parameter conversion can be performed not only on PARCOR coefficients but also on linear prediction coefficients derived by linear prediction analysis of speech, logarithmic cross-sectional area ratios, and even line spectrum parameters.

た文し線スペクトルパラメータはそれ自体が擬似ホルマ
ントであるから、その第1次のパラメータと与えられた
基本周波数F。
Since the tabular line spectrum parameter is itself a pseudo-formant, its first-order parameter and the given fundamental frequency F.

とから前記F1′と対応するものを求め、これを線スペ
クトルパラメータの1次のパラメータとすればよい。
What is necessary is to find a value corresponding to the above-mentioned F1' from , and use this as the first-order parameter of the line spectrum parameter.

例えば原音声信号のスペクトル包絡とフーリエスペクト
ルが第2図Aに示した場合であり、その第1ホルマント
周波数がF1=350Hzその帯域幅B1が20Hzで
ある場合に、合成音声の基本周波数F。
For example, if the spectral envelope and Fourier spectrum of the original speech signal are shown in FIG. 2A, and its first formant frequency is F1 = 350 Hz and its bandwidth B1 is 20 Hz, then the fundamental frequency F of the synthesized speech.

とじて230 Hzが与えられた時、第1図に示した従
来装置で得られる合成音声のスペクトル包絡は第2図B
に示したように大きなスペクトルひずみを含んだものと
なる。
When 230 Hz is given, the spectral envelope of the synthesized speech obtained with the conventional device shown in Fig. 1 is shown in Fig. 2B.
As shown in the figure, it contains large spectral distortion.

しかし、この発明では整合装置24により、F1’=
2 F。
However, in this invention, the matching device 24 allows F1'=
2 F.

−(Bl/2)=460H2が求められ、とのF1/を
第1ホルマント周波数とするようにパラメータが変換さ
れ、このパラメータによりフィルタ17が制御され、そ
の時得られる合成音声のスペクトル包絡は第4図に示す
ようになる。
-(Bl/2)=460H2 is obtained, and the parameters are converted so that F1/ of is the first formant frequency. The filter 17 is controlled by this parameter, and the spectral envelope of the synthesized speech obtained at that time is the fourth formant frequency. The result will be as shown in the figure.

この第4図には低周波にスペクトルのピーク25、即ち
第1ホルマントが生じ、第2図Aに示した包絡に近くな
るが、第1ホルマントの周波数が異なるものとなる。
In FIG. 4, a spectral peak 25, ie, the first formant, occurs at a low frequency, and the envelope is close to that shown in FIG. 2A, but the frequency of the first formant is different.

よって音声品質がよく、しかも目的とするピッチ(高さ
)の音声が得られる。
Therefore, it is possible to obtain audio of good quality and at the desired pitch (height).

以上説明したように、この発明による音声合成装置を使
用して音声の合成を行った場合、与えられた基本周波数
F。
As explained above, when the speech synthesis device according to the present invention is used to synthesize speech, the given fundamental frequency F.

に依存するようにスペクトル包絡を変形するため、第1
ホルマントF工に代表されるようなスペクトルのピーク
を失うことなく、明確なスペクトルピークを持つ品質が
高い合成音声を得ることができる。
In order to transform the spectral envelope so that it depends on the first
It is possible to obtain high quality synthesized speech having clear spectral peaks without losing the spectral peaks typified by formant F.

このスペクトル包絡の変形により合成音声の第1ホルマ
ント周波数F1′は、与えられたパラメータの原音声の
第1ホルマント周波数F1 とは異なった周波数になる
が、ホルマント周波数が基本周波数に依存して変化する
ことは第5図及び第6図に示された自然音声の観察結果
からも明らかであり、この点、この発明の音声合成装置
で得られる合成音声は自然音声に近いホルマント周波数
と基本周波数の関係を保つことができる。
Due to this modification of the spectral envelope, the first formant frequency F1' of the synthesized speech becomes a frequency different from the first formant frequency F1 of the original speech of the given parameters, but the formant frequency changes depending on the fundamental frequency. This is clear from the observation results of natural speech shown in FIGS. 5 and 6, and in this respect, the synthesized speech obtained by the speech synthesizer of the present invention has a relationship between formant frequency and fundamental frequency that is close to that of natural speech. can be kept.

第5図は日本語母音のホルマント分布を示し、また第6
図は英語の母音のホルマント分布を示し、何れも基本周
波数が変化するとホルマン4周波数も変化したものとな
っている。
Figure 5 shows the formant distribution of Japanese vowels, and also shows the formant distribution of Japanese vowels.
The figure shows the formant distribution of English vowels, and in both cases, when the fundamental frequency changes, the four-formant frequency also changes.

以上述べたようにこの発明の装置によって得られた合成
音声はその自然性と明瞭性の双方において従来の合成音
声より優れており、合成音声の品質向上効果も犬である
As described above, the synthesized speech obtained by the apparatus of the present invention is superior to conventional synthesized speech in both its naturalness and clarity, and the quality improvement effect of the synthesized speech is also excellent.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は従来の音声合成装置を示すブロック図、第2図
Aは自然音声を分析して得られたスペクトル包絡及びフ
ーリエスペクトルを示す曲線図、第2図Bは自然音声の
ピッチを変化させたのち第2図Aと同様のスペクトル包
絡を使って合成した合成音声のスペクトル包絡とフーリ
エスペクトルを示す曲線図、第3図はこの発明による音
声合成装置の実施例を示すブロック図、第4図はこの発
明の装置により得られた合成音声のスペクトル包絡及び
フーリエスペクトルを示す曲線図、第5図及び第6図は
それぞれ自然音声における基本周波数とホルマントとの
関係を示す図である。 11:音源情報を記憶した記憶装置、12:音源情報制
御装置、13:パルス発生器、14:切換装置、15:
可変利得増幅器、16:白線音発生器、17:音声合成
フィルタ、18ニスベクトル包絡を表わすパラメータを
記憶した記憶装置、19:パラメータ制御装置、21:
DA変換器、22:出力端子、24:整合装置。
Figure 1 is a block diagram showing a conventional speech synthesis device, Figure 2A is a curve diagram showing the spectral envelope and Fourier spectrum obtained by analyzing natural speech, and Figure 2B is a curve diagram showing the spectral envelope and Fourier spectrum obtained by analyzing natural speech. Fig. 2 is a curve diagram showing the spectral envelope and Fourier spectrum of synthesized speech synthesized using the same spectral envelope as in Fig. 2A; Fig. 3 is a block diagram showing an embodiment of the speech synthesis device according to the present invention; Fig. 4; is a curve diagram showing the spectral envelope and Fourier spectrum of synthesized speech obtained by the apparatus of the present invention, and FIGS. 5 and 6 are diagrams showing the relationship between fundamental frequency and formant in natural speech, respectively. 11: Storage device storing sound source information, 12: Sound source information control device, 13: Pulse generator, 14: Switching device, 15:
variable gain amplifier, 16: white line sound generator, 17: speech synthesis filter, 18 storage device storing parameters representing varnish vector envelope, 19: parameter control device, 21:
DA converter, 22: output terminal, 24: matching device.

Claims (1)

【特許請求の範囲】[Claims] 1 音声信号のスペクトル包絡特性を表わすパラメータ
により音声合成フィルタのフィルタ特性を設定し、与え
られた音声基本周波数と等しい周波数のパルス信号で前
記音声合成フィルタを駆動してそのフィルタ出力より音
声信号を得る音声合成装置において、前記与えられた音
声基本周波数と、得ようとする音声信号のスペクトル包
絡のピーク周波数とが相関を持つように対応するスペク
トル包絡特性を表わすパラメータを変換する手段を設け
たことを特徴とする音声合成装置。
1. Setting the filter characteristics of the voice synthesis filter using a parameter representing the spectral envelope characteristic of the voice signal, driving the voice synthesis filter with a pulse signal of a frequency equal to the given voice fundamental frequency, and obtaining the voice signal from the filter output. In the speech synthesis device, means is provided for converting a parameter representing the corresponding spectral envelope characteristic so that the given speech fundamental frequency and the peak frequency of the spectral envelope of the speech signal to be obtained have a correlation. Characteristic speech synthesizer.
JP54132181A 1979-10-13 1979-10-13 speech synthesizer Expired JPS5855519B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP54132181A JPS5855519B2 (en) 1979-10-13 1979-10-13 speech synthesizer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP54132181A JPS5855519B2 (en) 1979-10-13 1979-10-13 speech synthesizer

Publications (2)

Publication Number Publication Date
JPS5655999A JPS5655999A (en) 1981-05-16
JPS5855519B2 true JPS5855519B2 (en) 1983-12-09

Family

ID=15075268

Family Applications (1)

Application Number Title Priority Date Filing Date
JP54132181A Expired JPS5855519B2 (en) 1979-10-13 1979-10-13 speech synthesizer

Country Status (1)

Country Link
JP (1) JPS5855519B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58129500A (en) * 1982-01-27 1983-08-02 日本電気株式会社 Singing voice synthesizer

Also Published As

Publication number Publication date
JPS5655999A (en) 1981-05-16

Similar Documents

Publication Publication Date Title
Childers et al. Voice conversion: Factors responsible for quality
US6240388B1 (en) Audio data decoding device and audio data coding/decoding system
KR20040028932A (en) Speech bandwidth extension apparatus and speech bandwidth extension method
US8073688B2 (en) Voice processing apparatus and program
US5369730A (en) Speech synthesizer
US5588089A (en) Bark amplitude component coder for a sampled analog signal and decoder for the coded signal
JP6337698B2 (en) Sound processor
JPS5855519B2 (en) speech synthesizer
US5826231A (en) Method and device for vocal synthesis at variable speed
JPS6237798B2 (en)
US20080215330A1 (en) Audio Signal Modification
US12170092B2 (en) Signal processing device, method, and program
JP3197975B2 (en) Pitch control method and device
JPH04116700A (en) Voice analyzing and synthesizing device
JP4468506B2 (en) Voice data creation device and voice quality conversion method
JP3063088B2 (en) Speech analysis and synthesis device, speech analysis device and speech synthesis device
JP2615856B2 (en) Speech synthesis method and apparatus
JP3979213B2 (en) Singing synthesis device, singing synthesis method and singing synthesis program
US6418406B1 (en) Synthesis of high-pitched sounds
JPH02247700A (en) speech synthesizer
JPH0690638B2 (en) Speech analysis method
JP2000099094A (en) Time series signal processing device
JPH0644199B2 (en) Variable-length frame speech analysis / synthesis method
JPH10187180A (en) Tone generator
JPS60239129A (en) Method for compressing sound information quantity