JPS5936273B2 - Fragment editing type speech synthesizer - Google Patents
Fragment editing type speech synthesizerInfo
- Publication number
- JPS5936273B2 JPS5936273B2 JP52037738A JP3773877A JPS5936273B2 JP S5936273 B2 JPS5936273 B2 JP S5936273B2 JP 52037738 A JP52037738 A JP 52037738A JP 3773877 A JP3773877 A JP 3773877A JP S5936273 B2 JPS5936273 B2 JP S5936273B2
- Authority
- JP
- Japan
- Prior art keywords
- segment
- waveform
- pitch
- circuit
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 239000012634 fragment Substances 0.000 title description 2
- 230000015572 biosynthetic process Effects 0.000 claims description 9
- 238000003786 synthesis reaction Methods 0.000 claims description 9
- 239000002131 composite material Substances 0.000 description 12
- 238000013500 data storage Methods 0.000 description 10
- 238000000034 method Methods 0.000 description 5
- 238000001308 synthesis method Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Landscapes
- Electrophonic Musical Instruments (AREA)
Abstract
Description
【発明の詳細な説明】 本発明は素片編集型音声合成装置に関する。[Detailed description of the invention] The present invention relates to a segment editing type speech synthesis device.
あらかじめ、1ピッチ区間から数ピッチ区間程度の時間
長を持つ種々の音声素片波形を自然音声波形より抽出す
る等して用意しておき、合成データとして与えられる素
片番号、ピッチ周期データ、素片波形の平均的な振巾値
を与える振巾データ等に従つて前記音声素片波形を編集
合成することにより合成音声波形を生成する型の素片編
集型音声合成方式が知られている。また、前記音声素片
波形を編集合成する方式として合成データとして与えら
れる前記振巾データに従つて各素片波形の振巾処理を行
なつた後、素片波形をピッチ周期だけずらして後続する
素片波形と加え合わせて合成波形を生成する方式が知ら
れている。前記の合成方式は第1図に示されるようにあ
るピッチ区間において指定された素片波形のサンプル値
をfl(nT)(第1図の101)、それ以前のピッチ
区間において選択された素片波形のサンプル値を該ピッ
チ区間に近いものからf2(nT)(第1図の102)
、f3(nT)(第1図の103)、・・・・・・・・
・(ここで、n■1、2、・・・・・・・・・、NNは
素片波形のサンプル値数、Tはサンプリング周期を表わ
す)と表わし、各ピッチ区間のピッチ周期をP1T、P
2T、P3T・・・・・・(Piは正整数)、平均振巾
値をそれぞれAl、A2、As、・、・・・・と表わす
と合成波形ン(iT)(第1図の1041は次の(1拭
で与えられる。V(iT)=A1f1(iT)+A2f
2((i+p2)T)+・・・・−・・・・・・・(1
)前記の合成方式は先行するピッチ区間において用ぃら
れた素片波形を加え合わせずに素片波形をピッチ周期毎
に切り捨てる方式に比較すると合成波形の連続性がよく
音質もよいが(ハ式からも明らかなように乗算の回数が
多く合成波形を生成する際の演算量が多いという欠点が
あり、特に時分割処理により同一の合成回路を用いて多
チャンネルの合成処理を行なう場合等には不利となる。In advance, various speech segment waveforms with time lengths ranging from one pitch section to several pitch sections are prepared by extracting them from natural speech waveforms, and the segment number, pitch period data, and segment number given as synthetic data are prepared. A segment editing type speech synthesis method is known in which a synthesized speech waveform is generated by editing and synthesizing the speech segment waveform according to amplitude data that gives an average amplitude value of a segment waveform. In addition, as a method for editing and synthesizing the speech segment waveforms, after performing amplitude processing on each segment waveform according to the amplitude data given as synthesis data, the segment waveform is shifted by a pitch period and continues. A method is known in which a composite waveform is generated by adding elemental waveforms. As shown in Fig. 1, the above synthesis method uses the sample value of a segment waveform specified in a certain pitch section as fl(nT) (101 in Fig. 1), and uses the sample value of the segment waveform specified in a certain pitch section as fl(nT) (101 in FIG. Sample values of the waveform are f2 (nT) (102 in Fig. 1) from those closest to the pitch section.
, f3(nT) (103 in Figure 1), ...
・(Here, n■1, 2, ......, NN represents the number of sample values of the elemental waveform, T represents the sampling period), and the pitch period of each pitch section is expressed as P1T, P
2T, P3T... (Pi is a positive integer), and the average amplitude values are respectively expressed as Al, A2, As,..., the composite waveform n (iT) (1041 in Figure 1 is Next (given in 1 wipe.V(iT)=A1f1(iT)+A2f
2((i+p2)T)+・・・・−・・・・・・・・・(1
) The above synthesis method provides better continuity of the synthesized waveform and better sound quality than the method of cutting off the segment waveforms for each pitch period without adding the segment waveforms used in the preceding pitch section. As is clear from the above, it has the disadvantage of a large number of multiplications and a large amount of calculation when generating a synthesized waveform, especially when performing multi-channel synthesis processing using the same synthesis circuit by time-division processing. It will be disadvantageous.
本発明の目的は、前記素片編集型音声合成における音声
素片波形の編集合成を音質の劣化をほとんど伴わずに比
較的少ない演算量で行なうことにより実時間で多チャン
ネルの音声素片波形の編集合成を行なう場合にも適した
素片編集型音声合成装置を提供することにある。本発明
の素片編集型音声合成装置は時間的に先行するピッチ区
間において選択された素片波形が時間的に後続するピッ
チ区間に重なる部分の波形と前記後続するピッチ区間に
おいて選択された素片波形とを加え合わせた加算値を算
出する加算回路と、前記加算回路より出力される加算値
と前記後続するピツチ区間において与えられる前記後続
するピツチ区間近傍の平均振巾値とを乗じた値を合成音
声波形として出力する乗算回路とから構成されている。An object of the present invention is to edit and synthesize speech segment waveforms in the segment editing type speech synthesis with almost no deterioration in sound quality and with a relatively small amount of calculations, thereby generating multi-channel speech segment waveforms in real time. It is an object of the present invention to provide a segment editing type speech synthesis device suitable for performing editing synthesis. The segment editing type speech synthesis device of the present invention combines a segment waveform selected in a temporally preceding pitch section with a waveform of a portion where a segment waveform selected in a temporally preceding pitch segment overlaps with a temporally subsequent pitch segment, and a segment waveform selected in the temporally preceding pitch segment. an adding circuit that calculates an added value by adding the waveforms, and a value obtained by multiplying the added value output from the adding circuit by the average amplitude value near the subsequent pitch section given in the subsequent pitch section. It consists of a multiplication circuit that outputs a synthesized speech waveform.
本発明の特徴は時間的に先行するピツチ区間において用
いられた素片波形が後続するピツチ区間に重なる延長波
形の振巾を前記後続するピツチ区間において与えられる
平均振巾データにより制御することにある。A feature of the present invention is that the amplitude of an extended waveform in which a segment waveform used in a temporally preceding pitch section overlaps with a subsequent pitch section is controlled by average amplitude data given in the subsequent pitch section. .
このため本発明を用いると相隣るピツチ区間の境界にお
ける不連続が比較的小さく、比較的少ない乗算回数によ
り素片波形の編集合成を行なうことができるという効果
がある。本発明においては、ピツチ区間の境界時点にお
ける波形の小さな不連続性はほとんど合成音の音質に影
響を与えないという性質を利用して次の(2)式に示す
ように、時間的に先行するピツチ区間において選択され
た素片波形F2(NT),F3(NT),・・・と該ピ
ツチ区間において選択された索片波形fl(NT)の加
算を行なつた後に該ピツチ区間において与えられた平均
振巾データA1を乗じて該ピツチ区間における合成波形
(y’(□T)を算出する。前記(2)式により与えら
れる合成波形y’(IT】ま(1)式により与えられる
合成波形y(IT)においては生じなかつた不連続を相
隣るピツチ区間の境界において生ずる。しかしながら、
相隣るピツチ区間において与えられる平均振巾データの
値はほとんどの場合小さな変化し力化ないことから前記
の不連続は小さくほとんど合成音の音質に影響を与えな
い。本発明による(2)式で表わされる編集合成方式は
各タイムスロツト当りの乗算回数が1回であり、(1)
式で表わされる従来の方式に比較して乗算回数が少なく
なることは明らかである。従つて、本発明の方式は1タ
イムスロツトの合成波形の算出時間が比較的少なく、同
時に複数個のチヤンネルに対する異つた合成波形を生成
する言わゆる多チヤンネル音声応答方式に適している。
次に第2図に示す本発明の一実施例について詳細に説明
する。Therefore, when the present invention is used, discontinuities at the boundaries between adjacent pitch sections are relatively small, and elemental waveforms can be edited and synthesized with a relatively small number of multiplications. In the present invention, by utilizing the property that a small discontinuity in the waveform at the boundary point of the pitch interval has almost no effect on the sound quality of the synthesized sound, the temporally preceding After adding the segment waveforms F2 (NT), F3 (NT), ... selected in the pitch interval and the segment waveform fl (NT) selected in the pitch interval, the waveforms given in the pitch interval are added. The composite waveform (y'(□T)) in the pitch interval is calculated by multiplying the average amplitude data A1 obtained by A discontinuity that did not occur in the waveform y(IT) occurs at the boundary between adjacent pitch sections. However,
Since the value of the average amplitude data given in adjacent pitch sections changes small in most cases and does not become significant, the above-mentioned discontinuity is small and hardly affects the sound quality of the synthesized sound. In the editing and synthesis method according to the present invention expressed by equation (2), the number of multiplications per each time slot is one, and (1)
It is clear that the number of multiplications is reduced compared to the conventional method expressed by Eq. Therefore, the method of the present invention requires a relatively short amount of time to calculate a composite waveform for one time slot, and is suitable for a so-called multi-channel voice response method that simultaneously generates different composite waveforms for a plurality of channels.
Next, an embodiment of the present invention shown in FIG. 2 will be described in detail.
まず音声出力指令データが音声出力指令入力端子201
を介して制御回路202に入力される。First, the audio output command data is input to the audio output command input terminal 201.
The signal is input to the control circuit 202 via.
制御回路202は前記音声出力指令データに従い合成デ
ータ記憶回路制御データを合成データ記憶回路制御ゼー
タ伝送路203を介して合成データ記憶回路206に出
力するとともに素片波形出力回路制御ゼータを素片波形
出力回路制御データ伝送路204を介して素片波形出力
回路208に出力する。合成データ記憶回路206は前
記合成データ記憶回路制御データに従い、あらかじめ記
憶されている素片波形を指定する素片番号データ、ピツ
チデータ、および振巾データをそれぞれ素片波形アドレ
スレジスタ209、ピツチ周期データー時記憶回路21
1および振巾データー時記憶回路212に出力する。な
お、前記の素片番号データが素片アドレスレジスタ20
9に出力される前に素片アドレスレジスタ209に一時
記憶されていた古い素片番号データは素片アドレスレジ
スタ210に出力される。素片アドレスレジスタ209
,210に一時記憶される前記素片番号データは、素片
波形出力回路208に出力される。素片波形出力回路2
08は前記素片波形出力回路制御データに従い素片波形
記憶回路20Tにあらかじめ記憶されている素片波形の
なかから前記素片アドレスレジスタ209,210より
出力される素片番号データに対応する二つの素片波形を
アクセスしスイツチ219を介してそれぞれ素片波形を
アクセスしスイツチ219を介してそれぞれ素片波形デ
ーター時記憶回路213あるいは214に一時記憶させ
る。加算回路215はピツチ周期データー時記憶回路2
11より出力されるピツチ周期データに従い、素片波形
データー時記憶回路213と214よりそれぞれ出力さ
れる二つの素片波形データを前記ピツチ周期データによ
り指定されるピツチ周期だけずらして加え合わせその結
果を乗算回路216に出力する。乗算回路216は振巾
データー時記憶回路212より出力される振巾データと
加算回路215より出力される波形データとの乗算を行
ないそのデイジタル値をDA変換回路21Tに出力する
。0A変換回路21Tは乗算回路216より出力される
デイジタル値をデイジタルーアナログ変換し合成波形出
力端子218を介して合成波形を出力する。The control circuit 202 outputs the synthetic data storage circuit control data to the synthetic data storage circuit 206 via the synthetic data storage circuit control zeta transmission line 203 according to the audio output command data, and outputs the segment waveform output circuit control zeta as a segment waveform. It is output to the elemental piece waveform output circuit 208 via the circuit control data transmission line 204. According to the synthetic data storage circuit control data, the composite data storage circuit 206 stores the segment number data, pitch data, and amplitude data specifying the segment waveform stored in advance in the segment waveform address register 209, respectively, and the pitch period data. Memory circuit 21
1 and amplitude data are output to the storage circuit 212. Note that the segment number data mentioned above is stored in the segment address register 20.
The old segment number data, which was temporarily stored in the segment address register 209 before being output to the segment address register 210, is output to the segment address register 210. Fragment address register 209
, 210 is output to the segment waveform output circuit 208. Piece waveform output circuit 2
08 indicates two numbers corresponding to the segment number data outputted from the segment address registers 209 and 210 from among the segment waveforms previously stored in the segment waveform storage circuit 20T according to the segment waveform output circuit control data. The segment waveforms are accessed via the switch 219, and the segment waveform data is temporarily stored in the memory circuit 213 or 214 via the switch 219. The adder circuit 215 is the pitch period data storage circuit 2.
According to the pitch period data outputted from the unit 11, the two unit waveform data outputted from the unit waveform data storage circuits 213 and 214, respectively, are shifted by the pitch period specified by the pitch period data and added. It is output to the multiplication circuit 216. The multiplication circuit 216 multiplies the amplitude data output from the amplitude data storage circuit 212 by the waveform data output from the addition circuit 215, and outputs the digital value to the DA conversion circuit 21T. The 0A conversion circuit 21T performs digital-to-analog conversion on the digital value output from the multiplication circuit 216, and outputs a composite waveform via the composite waveform output terminal 218.
以上の操作を前記ピツチ周期毎に繰返し行なうことによ
り合成波形出力端子218より合成波形が得られる。By repeating the above operations for each pitch period, a composite waveform is obtained from the composite waveform output terminal 218.
なお、上記の実施例においては直前のピツチ区間におい
て指定された素片波形と後続するピツチ区間において指
定された二つの素片波形のみが重なり合うものとして加
算回路215により加算値が算出されたが、さらに時間
的に先行するピツチ区間において指定された素片波形を
も用いた装置も、実現できることは明らかである。In the above embodiment, the addition value is calculated by the addition circuit 215 on the assumption that only the segment waveform specified in the immediately preceding pitch interval and the two segment waveforms specified in the subsequent pitch interval overlap. It is clear that it is also possible to realize a device that also uses a segment waveform specified in a temporally preceding pitch interval.
第1図は素片波形の編集合成方式を説明するための図で
、101は該ピツチ区間において選択された素片波形f
l(NT)を表わし、102は1ピツチ区間前において
選択された素片波形F2(NT)を表わし、103は2
ピツチ区間前において選択された素片波形F3(NT)
を表わし、104は合成波形V(IT)を表わす。
第2図は本発明の一実施例を示すブ頭ノク図で、201
は音声出力指令入力端子、202は制御回路、203は
合成データ記憶回路制御データ伝送路、204は素片波
形出力回路制御データ伝送路、206は合成データ記憶
回路、20Tは素片波形記憶回路、208は素片波形出
力回路、209および210は素片波形アドレスレジス
タ、211はピツチ周期データー時記憶回路、212は
振巾データー時記憶回路、213および214は素片波
形データー時記憶回路、215は加算回路、216は乗
算回路、211はDA変換回路、218は合成波形出力
端子、219はスイツチである。FIG. 1 is a diagram for explaining the editing and synthesis method of segment waveforms, and 101 is the segment waveform f selected in the pitch section.
1 (NT), 102 represents the segment waveform F2 (NT) selected one pitch interval ago, and 103 represents 2
Piece waveform F3 (NT) selected before pitch interval
, and 104 represents the composite waveform V(IT). FIG. 2 is a block diagram showing an embodiment of the present invention.
202 is an audio output command input terminal, 202 is a control circuit, 203 is a synthetic data storage circuit control data transmission line, 204 is a segmental waveform output circuit control data transmission line, 206 is a synthetic data storage circuit, 20T is a segmental waveform storage circuit, 208 is a segment waveform output circuit, 209 and 210 are segment waveform address registers, 211 is a pitch period data memory circuit, 212 is an amplitude data memory circuit, 213 and 214 are segment waveform data memory circuits, and 215 is a segment waveform data memory circuit. 216 is a multiplication circuit, 211 is a DA conversion circuit, 218 is a composite waveform output terminal, and 219 is a switch.
Claims (1)
間長を持つ音声素片波形を編集合成する型の素片編集型
音声合成装置において、時間的に先行するピッチ区間に
おいて選択された素片波形が後続するピッチ区間に重な
る部分の波形と前記後続するピッチ区間において選択さ
れた素片波形とを加え合わせた加算値を出力する加算回
路と、前記加算回路より出力される加算値と前記後続す
るピッチ区間において与えられる振巾値とを乗じた値を
合成音声波形として出力する乗算回路とを有することを
特徴とする素片編集型音声合成装置。1. In a segment-editing speech synthesizer that edits and synthesizes speech segment waveforms having a time length equivalent to a plurality of pitch segments prepared in advance, a segment waveform selected in a temporally preceding pitch segment is an adding circuit that outputs an added value obtained by adding a waveform of a portion that overlaps with a subsequent pitch section and an elemental waveform selected in the subsequent pitch section; an added value output from the adding circuit and the subsequent pitch; 1. A segment editing type speech synthesis device comprising: a multiplication circuit that outputs a value multiplied by an amplitude value given in an interval as a synthesized speech waveform.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP52037738A JPS5936273B2 (en) | 1977-04-01 | 1977-04-01 | Fragment editing type speech synthesizer |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP52037738A JPS5936273B2 (en) | 1977-04-01 | 1977-04-01 | Fragment editing type speech synthesizer |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS53123007A JPS53123007A (en) | 1978-10-27 |
| JPS5936273B2 true JPS5936273B2 (en) | 1984-09-03 |
Family
ID=12505818
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP52037738A Expired JPS5936273B2 (en) | 1977-04-01 | 1977-04-01 | Fragment editing type speech synthesizer |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS5936273B2 (en) |
Families Citing this family (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS56168700A (en) * | 1980-05-30 | 1981-12-24 | Nippon Electric Co | Waveform edition type voice synthesizer |
| JPS57185097A (en) * | 1981-05-08 | 1982-11-15 | Nippon Electric Co | Voice analyzer/synthesizer |
| JPS6046600U (en) * | 1983-09-08 | 1985-04-02 | 日本コロムビア株式会社 | Audio signal processing device |
| JPH02239292A (en) * | 1989-03-13 | 1990-09-21 | Canon Inc | speech synthesizer |
-
1977
- 1977-04-01 JP JP52037738A patent/JPS5936273B2/en not_active Expired
Also Published As
| Publication number | Publication date |
|---|---|
| JPS53123007A (en) | 1978-10-27 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5630013A (en) | Method of and apparatus for performing time-scale modification of speech signals | |
| JP3451900B2 (en) | Pitch / tempo conversion method and device | |
| US5498835A (en) | Digital signal processing apparatus for applying effects to a musical tone signal | |
| JPS5936273B2 (en) | Fragment editing type speech synthesizer | |
| JPH07199979A (en) | Reverberation adding device | |
| JP2905191B1 (en) | Signal processing apparatus, signal processing method, and computer-readable recording medium recording signal processing program | |
| GB2103005A (en) | Modulation effect device | |
| US4653099A (en) | SP sound synthesizer | |
| JP3379348B2 (en) | Pitch converter | |
| JP2890530B2 (en) | Audio speed converter | |
| JP3829134B2 (en) | GENERATION DEVICE, REPRODUCTION DEVICE, GENERATION METHOD, REPRODUCTION METHOD, AND PROGRAM | |
| JP3263015B2 (en) | Speech unit connection method and speech synthesis device | |
| JP5169533B2 (en) | Impulse response processing device, reverberation imparting device and program | |
| JP5169566B2 (en) | Reverberation imparting device and program | |
| JP3246012B2 (en) | Tone signal generator | |
| JP3520931B2 (en) | Electronic musical instrument | |
| JPH04104200A (en) | Device and method for voice speed conversion | |
| JPS5948396B2 (en) | Fragment editing type speech synthesis device | |
| JPH10282991A (en) | Speech rate converting device | |
| JPH08292764A (en) | Signal switching device | |
| JP3017042B2 (en) | Speech synthesizer | |
| JPH10187180A (en) | Tone generator | |
| JP2535808B2 (en) | Sound source waveform generator | |
| JPH04234100A (en) | Voice synthesizing method and device | |
| JP2000003179A (en) | Waveform compression / expansion device |