Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP2848604B2 - Speech synthesizer - Google Patents
[go: Go Back, main page]

JP2848604B2 - Speech synthesizer - Google Patents

Speech synthesizer

Info

Publication number
JP2848604B2
JP2848604B2 JP63025941A JP2594188A JP2848604B2 JP 2848604 B2 JP2848604 B2 JP 2848604B2 JP 63025941 A JP63025941 A JP 63025941A JP 2594188 A JP2594188 A JP 2594188A JP 2848604 B2 JP2848604 B2 JP 2848604B2
Authority
JP
Japan
Prior art keywords
unvoiced
vowel
degree
occurrence
speech synthesis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP63025941A
Other languages
Japanese (ja)
Other versions
JPH01200290A (en
Inventor
治 木村
延佳 海木
淳悟 鬼頭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Consejo Superior de Investigaciones Cientificas CSIC
Original Assignee
Consejo Superior de Investigaciones Cientificas CSIC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Consejo Superior de Investigaciones Cientificas CSIC filed Critical Consejo Superior de Investigaciones Cientificas CSIC
Priority to JP63025941A priority Critical patent/JP2848604B2/en
Publication of JPH01200290A publication Critical patent/JPH01200290A/en
Application granted granted Critical
Publication of JP2848604B2 publication Critical patent/JP2848604B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 〈産業上の利用分野〉 この発明は、規則合成音声を生成する音声合成装置に
関する。
DETAILED DESCRIPTION OF THE INVENTION <Industrial Application Field> The present invention relates to a speech synthesizer that generates rule-synthesized speech.

〈従来の技術〉 自然な合成音声を生成するためには所定の母音を無声
化することが重要である。 従来、母音の無声化の規則
としては、「桜井茂治“共通語の発音で注意すべきこと
がら”日本語発音アクセント辞典(改定新版)NHK編,
解説・付録P.128 1985年」に一般的な法則として示され
ている。これには、母音無音化の生起する典型的な音韻
環境について詳しく述べられている。
<Prior Art> In order to generate a natural synthesized voice, it is important to make a predetermined vowel unvoiced. Conventionally, rules for devoicing vowels include the following: "Shigeru Sakurai" What to Watch Out for Common Language Pronunciations "Japanese Pronunciation Accent Dictionary (revised new edition) NHK,
Commentary / Appendix P.128 1985 ”is shown as a general rule. It describes in detail the typical phonological environment in which vowel silencing occurs.

また、実際に音声合成装置において用いられる無声化
の規則としては、例えば「佐藤大和,箱田和雄“法則に
よる音声合成”研究実用化報告第27巻第12号、P.2562
(62)電々公社編1978年」がある。
Examples of the devoicing rules that are actually used in a speech synthesizer include, for example, “Yamato Sato, Kazuo Hakoda,“ Speech Synthesis by Law ”, Research and Application Report, Vol. 27, No. 12, P.2562
(62) Dentsu Public Corporation, 1978. "

第3図は上記従来の母音無声化規則を用いた無声化判
定ルーチンのフローチャートである。以下、第3図を用
いてこの従来の無声化判定ルーチンについて説明する。
FIG. 3 is a flowchart of a devoicing determination routine using the conventional vowel devoicing rule. Hereinafter, the conventional voiceless judgment routine will be described with reference to FIG.

ステップS31で、対象とする母音が高舌母音(/i/,/u
/)であるか否かが判別される。その結果、高舌母音で
あればステップS32に進み、そうでなければ有声と判断
してステップS37に進む。
In step S 31, the vowel of interest are those vowels (/ i /, / u
/) Is determined. As a result, the process proceeds to step S 32 if it is such a vowel, the process proceeds to step S 37 it is determined that the voiced otherwise.

ステップS32で、対象とする母音が無声子音に挾まれ
るか否かが判別される。その結果、挾まれていればステ
ップS33に進み、そうでなければ有声と判断してステッ
プS37に進む。
In step S 32, whether or not a vowel of interest is sandwiched unvoiced consonant is determined. As a result, the process proceeds to step S 33 if it is pinched, the process proceeds to step S 37 it is determined that the voiced otherwise.

ステップS33で、対象とする母音がアクセント核(音
の高さが相対的に高から低に変化する位置)を有してい
るか否かが判別される。その結果、アクセント核を有し
ていればステップS39に進み、そうでなければステップS
34に進む。
In step S 33, the vowel of interest accents nuclear whether it has the (pitch of a sound from a relatively high position changes to low) is determined. As a result, the process proceeds to step S 39 if it has an accent nucleus, step S otherwise
Proceed to 34 .

ステップS34で、対象とする母音が第1モーラである
か否かが判別される。その結果、第1モーラであればス
テップS36に進み、そうでなければステップS35に進む。
In step S 34, whether or not a vowel of interest is the first mora is determined. As a result, if the first mora proceeds to step S 36, the process proceeds to step S 35 otherwise.

ステップS35で、先行する母音がすでに無声化されて
いるか否かが判別される。その結果、無声化されていれ
ば準無声化としてステップS39へ進み、そうでなければ
ステップS36に進む。
In step S 35, whether or not the preceding vowel is already devoiced is determined. As a result, the process proceeds to step S 39 as a quasi-unvoiced if it is silent and proceeds to step S 36 otherwise.

ステップS36で、対象とする母音が同種の無声摩擦音
に挾まれているか否かが判別される。その結果、挾まれ
ていれば準無声化としてステップS39に進み、そうでな
ければステップS38に進む。
In step S 36, whether or not a vowel of interest is sandwiched unvoiced fricative of the same type is determined. As a result, the process proceeds to step S 39 as a quasi-unvoiced if sandwiched, the process proceeds to step S 38 otherwise.

ステップS37で、対象とする母音を有声化すると判定
される。
In step S 37, it is determined to voicing the vowel of interest.

ステップS38で、対象とする母音を無声化すると判定
される。
In step S 38, the vowels of interest is determined to be unvoiced.

ステップS39で、対象とする母音の継続時間を短くす
るなどの準無声化処理が実行される。
In step S 39, the quasi-unvoiced processing such as shortening the duration of the vowels of interest is performed.

〈発明が解決しようとする課題〉 しかしながら、上記従来の無声化規則では、母音無声
化と音韻系列との間および母音無声化とアクセントパタ
ーンとの間に明確な無声化基準が示されておらず、無声
化の判定基準としは曖昧な点がある。また、発生速度が
変わると一般に無声化する割合も変わるが、発生速度と
無声化基準との関係が定量時に記述されていない。その
ため、無声化の規則が実音声と必ずしも一致しない場合
がある。したがって、上記従来の無声化の規則によって
生成された合成音声は不自然に聞えるという問題があ
る。
<Problems to be Solved by the Invention> However, the above-mentioned conventional devoicing rules do not show a clear devoicing criterion between vowel devoicing and a phonological sequence and between vowel devoicing and an accent pattern. However, there is an ambiguous point as a criterion for devoicing. In addition, when the generation speed changes, the rate of voicelessness generally changes, but the relationship between the generation speed and the voiceless reference is not described at the time of quantification. For this reason, the rule of silence may not always match the actual voice. Therefore, there is a problem that the synthesized speech generated by the above-mentioned conventional rule of silence sounds unnatural.

そこで、この発明の目的は、音韻系列別の無声化生起
度合いと、アクセントパターン別の無声化生起度合い
と、発声速度に応じて設定される無声化閾値とに基づい
て、対象母音の有声化・無声化を判定することによっ
て、実音声に近い自然な合成音声を生成することができ
る音声合成装置を提供することにある。
Therefore, an object of the present invention is to make the target vowel voicing / voicing based on the degree of unvoiced occurrence for each phoneme sequence, the degree of unvoiced occurrence for each accent pattern, and the unvoiced threshold set according to the utterance speed. It is an object of the present invention to provide a speech synthesizer that can generate a natural synthesized speech close to a real speech by judging unvoiced voice.

〈課題を解決するための手段〉 上記目的を達成するため、請求項1に係る発明は、入
力される文字列から音韻系列/アクセントパターンを決
定する文字列解析部,音韻系列/アクセントパターン/
規則ファイルに格納された規則に従って音声合成パラメ
ータを作成する音声合成パラメータ作成部,音声合成パ
ラメータに基づいて音声合成を行う音声合成部を備えた
音声合成装置であって、音声合成パラメータ作成部は、
音韻系列と,規則ファイルに格納された音韻系列別の無
声化生起度合いに基づいて,各母音毎の音韻系列無声化
生起度合いを設定する第1無声化生起度合い設定手段
と、アクセントパターンと,規則ファイルに格納された
アクセントパターン別の無声化生起度合いに基づいて,
各母音毎のアクセントパターン無声化生起度合いを設定
する第2無声化生起度合い設定手段と、音韻系列無声化
生起度合いとアクセントパターン無声化生起度合いか
ら,各母音毎の無声化生起度合いを算出する無声化生起
度合い算出手段と、指定される発声速度と,規則ファイ
ルに格納された発声速度別の無声化判定閾値に基づいて
無声化判定閾値を設定する設定手段と、設定された無声
化生起度合い,無声化判定閾値に基づいて各母音毎に無
声化・有声化を判定する母音有声化無声化判定手段とを
備え、母音有声化無声化判定手段の判定結果に従って音
声合成パラメータを作成することを特徴としている。
<Means for Solving the Problems> In order to achieve the above object, an invention according to claim 1 is a character string analysis unit that determines a phoneme sequence / accent pattern from an input character string, and a phoneme sequence / accent pattern / accent pattern.
A speech synthesis device comprising: a speech synthesis parameter creation unit that creates speech synthesis parameters according to rules stored in a rule file; and a speech synthesis unit that performs speech synthesis based on the speech synthesis parameters.
First unvoiced occurrence degree setting means for setting a degree of unvoiced occurrence for each vowel based on the phoneme sequence and the degree of unvoiced occurrence for each phonological sequence stored in the rule file; Based on the degree of unvoiced occurrence for each accent pattern stored in the file,
Second unvoiced occurrence degree setting means for setting an accent pattern unvoiced occurrence degree for each vowel, and unvoicedness calculation for each vowel from the phonological sequence unvoiced occurrence degree and accent pattern unvoiced occurrence degree. Means for calculating a degree of voicing occurrence, setting means for setting a voicing determination threshold based on the specified vocalization rate and a voicing determination threshold for each vocalization rate stored in the rule file; Vowel voicing / voicing determining means for determining voicing / voicing for each vowel based on the voicing determining threshold, and generating voice synthesis parameters according to the determination result of the vowel voicing / voicing determining means. And

〈作用〉 任意の文字列が文字列解析部に入力されて上記文字列
の音韻系列およびアクセントパターンが決定される。そ
して、上記文字列解析部からの音韻系列およびアクセン
トパターンが音声合成パラメータ作成部に入力される
と、上記音韻系列およびアクセントパターンと規則ファ
イルに格納された規則とに従って音声合成パラメータが
作成される。
<Operation> An arbitrary character string is input to the character string analysis unit, and the phoneme sequence and the accent pattern of the character string are determined. When the phoneme sequence and the accent pattern from the character string analysis unit are input to the speech synthesis parameter creation unit, speech synthesis parameters are created according to the phoneme sequence and the accent pattern and rules stored in the rule file.

その際に、上記音声合成パラメータ作成部の第1無声
化生起度合い設定手段によって、上記音韻系列と上記規
則ファイルに格納された音韻系列別の無声化生起度合い
とに基づいて、上記入力文字列の各母音毎の音韻系列無
声化生起度合いが設定される。また、第2無声化生起度
合い設定手段によって、上記アクセントパターンと上記
規則ファイルに格納されたアクセントパターン別の無声
化生起度合いとに基づいて、上記入力文字列の各母音毎
のアクセントパターン無声化生起度合いが設定される。
そして、無声化生起度合い算出手段によって、上記設定
された音韻系列無声化生起度合いとアクセントパターン
無声化生起度合いとから上記各母音毎の無声化生起度合
いが算出される。
At this time, the first unvoiced occurrence degree setting means of the speech synthesis parameter creation unit sets the input character string based on the phoneme sequence and the unvoiced occurrence degree for each phoneme sequence stored in the rule file. A phonemic sequence unvoiced occurrence degree is set for each vowel. The second unvoiced occurrence degree setting means sets an accent pattern unvoiced occurrence for each vowel of the input character string based on the accent pattern and the degree of unvoiced occurrence for each accent pattern stored in the rule file. The degree is set.
Then, the unvoiced occurrence degree calculating means calculates the unvoiced occurrence degree for each vowel from the set phonological sequence unvoiced occurrence degree and the accent pattern unvoiced occurrence degree.

さらに、設定手段によって、上記規則ファイルに格納
された発声速度別の無声化判定閾値に基づいて、指定さ
れた発声速度に応じた無声化判定閾値が設定される。そ
して、母音有声化無声化判定手段によって、上記算出さ
れた無声化生起度合いと上記設定された無声化判定閾値
とに基づいて、入力文字列の各母音毎に有声化・無声化
が判定される。そして、上記母音有声化無声化判定手段
による判定結果に従って上記音声合成パラメータが生成
される。
Further, the setting means sets a de-voice determination threshold corresponding to the specified utterance speed based on the de-voice determination threshold for each utterance speed stored in the rule file. Then, based on the calculated degree of occurrence of unvoicedness and the set unvoicedness determination threshold, voiced / unvoiced is determined for each vowel of the input character string by the vowel voiced and unvoiced determination unit. . Then, the speech synthesis parameters are generated according to the determination result by the vowel voiced / unvoiced determination means.

上述のようにして、上記合成パラメータ生成部によっ
て上記音声合成パラメータが生成されると、この生成さ
れた音声合成パラメータに基づいて、音声合成部によっ
て音声合成が行われる。
When the speech synthesis parameters are generated by the synthesis parameter generation unit as described above, speech synthesis is performed by the speech synthesis unit based on the generated speech synthesis parameters.

こうして、母音の無声化現象に大きな影響を与える音
韻系列およびアクセントパターンと発声速度とが考慮さ
れて母音の無声化が行われ、自然な合成音声が得られる
のである。
In this way, the vowel is devoiced in consideration of the phonological sequence and the accent pattern and the utterance speed, which greatly affect the vowel devoicing phenomenon, and a natural synthesized speech is obtained.

〈実施例〉 以下、第1図のブロック図により、この発明の音声合
成装置の構成および動作の該要を説明する。
<Embodiment> The configuration and operation of the speech synthesizer according to the present invention will be described below with reference to the block diagram of FIG.

任意の文字列が文字列解析部1に入力されると、文字
列解析部1は入力された上記文字列の構文解釈を行い、
文字列全体のイントネーションパターンを決定する。さ
らに、単語辞書2を参照して上記文字列に含まれる単語
を検索し、文字列内の各単語のアクセント及び音韻系列
を決定することにより、上記文字列の音韻系列及びアク
セントパターンを決定する。このようにして、上記文字
列解析部1において決定された文字列全体のイントネー
ションパターンと、上記文字列の音韻系列およびアクセ
ントパターンとは、上記音声合成パラメータ作成部とし
ての規則制御部3に出力される。
When an arbitrary character string is input to the character string analysis unit 1, the character string analysis unit 1 performs syntax interpretation of the input character string,
Determine the intonation pattern for the entire string. Further, a word included in the character string is searched with reference to the word dictionary 2, and the accent and phoneme sequence of each word in the character string are determined, thereby determining the phoneme sequence and accent pattern of the character string. In this way, the intonation pattern of the entire character string determined by the character string analysis unit 1 and the phoneme sequence and accent pattern of the character string are output to the rule control unit 3 as the speech synthesis parameter creation unit. You.

特徴パラメータファイル8はターゲット特徴パラメー
タファイル6と時系列特徴パラメータファイル7とから
構成され、上記ターゲット特徴パラメータファイル6
は、母音の特徴を表わすターゲット特徴パラメータを上
記規則制御部3に出力し、また、上記時系列特徴パラメ
ータファイル7は子音の特徴を表わす時系列特徴パラメ
ータを規則制御部3に出力する。一方、規則ファイル4
は上記特徴パラメータファイルから出力されるターゲッ
ト特徴パラメータと時系列特徴パラメータとを接続する
ための音韻制御規則と、各韻律を制御するための韻律制
御規則とをそれぞれ上記規則制御部3に出力する。この
韻律制御規則の中に、後述する無声化音韻系列,音韻系
列毎の母音無声化生起度合いおよびアクセントパターン
別の母音無声化生起度合いが含まれている。
The feature parameter file 8 includes a target feature parameter file 6 and a time-series feature parameter file 7.
Outputs a target feature parameter representing a vowel feature to the rule control unit 3, and the time-series feature parameter file 7 outputs a time-series feature parameter representing a consonant feature to the rule control unit 3. On the other hand, rule file 4
Outputs to the rule control unit 3 a phonological control rule for connecting the target characteristic parameter and the time-series characteristic parameter output from the characteristic parameter file, and a prosody control rule for controlling each prosody. The prosody control rules include an unvoiced phoneme sequence described later, a vowel unvoiced occurrence degree for each phoneme sequence, and a vowel unvoiced occurrence degree for each accent pattern.

上記規則制御部3は、上記特徴パラメータファイル8
から入力されたターゲット特徴パラメータおよび時系列
特徴パラメータと、上記規則ファイル4から入力された
各音韻を結合させるための上記音韻制御規則および各韻
律を制御するための上記韻律制御規則を参照して、上記
文字列解析部1から入力された文字列全体のイントネー
ションパターン、文字列の音韻系列、アクセントパター
ン、及び、後述する母音の有声化・無声化の判定結果に
より、音声合成に必要なパラメータを生成し、生成され
た上記パラメータを音声合成器5に出力する。
The rule control unit 3 stores the feature parameter file 8
With reference to the target feature parameter and the time-series feature parameter input from the above, the phoneme control rule for combining each phoneme input from the rule file 4 and the prosody control rule for controlling each prosody, The parameters necessary for speech synthesis are generated based on the intonation pattern of the entire character string, the phoneme sequence of the character string, the accent pattern, and the vowel voiced / unvoiced determination results described later, which are input from the character string analysis unit 1. Then, the generated parameters are output to the speech synthesizer 5.

音声合成器5は、入力されたパラメータに基づいて、
音声合成を行ない入力された文字列に対応する規則合成
装置を出力する。
The voice synthesizer 5 determines, based on the input parameters,
Speech synthesis is performed, and a rule synthesizer corresponding to the input character string is output.

第2図は上記規則制御部3で行なわれている有声化・
無声化判定ルーチンのフローチャートである。以下第2
図を用いて有声化・無声化判定ルーチンについて説明す
る。
FIG. 2 shows the voicing performed by the rule control unit 3.
It is a flowchart of a voiceless judgment routine. The second
The voiced / unvoiced determination routine will be described with reference to the drawings.

ステップS1で、まず、文字列解析部1から入力される
音韻系列および規則ファイル4に格納された音韻系列別
の無声化生起度合いを表した無声化生起係数から、母音
毎に音韻系列無声化生起係数が求められる。
In step S 1 , first, a vowel sequence is devoiced for each vowel from the phoneme sequence input from the character string analysis unit 1 and the unvoiced occurrence coefficient representing the degree of unvoiced occurrence for each phoneme sequence stored in the rule file 4. An occurrence coefficient is determined.

但し、前後の子音のどちらかが促音のときは上記音韻
系列無声化生起係数をα倍(α:0<α<1の定数)して
無声化生起度合いを低くするようにしている。
However, if either of the preceding and following consonants is a consonant, the phonological sequence unvoiced occurrence coefficient is multiplied by α (α: 0 <α <1) to reduce the degree of unvoiced occurrence.

また、この音韻系列無声化生起係数は、例えば、以下
の特徴をもつ。
The phoneme sequence unvoiced occurrence coefficient has, for example, the following characteristics.

1.母音が高舌母音(/i/,/u/)であり、この母音に先行
する子音が無声摩擦音(/s/,/sh/,/h/)または無声破擦
音(/ch/,/ts/)であって、後続する子音が無声破裂音
(/p/,/t/,/k/,/py/,/ky/)または無声破擦音(/ch/,/t
s/)のときは、前後の子音が無声破裂音(/p/,/t/,/k
/、後続子音は/py/,/ky/を含む)のときよりも無声化の
度合いが高い。
1. The vowel is a high tongue vowel (/ i /, / u /) and the consonant preceding this vowel is unvoiced fricative (/ s /, / sh /, / h /) or unvoiced affricate (/ ch / , / ts /) and the subsequent consonant is a voiceless plosive (/ p /, / t /, / k /, / py /, / ky /) or a voiceless affricate (/ ch /, / t
s /), the consonants before and after are silent plosives (/ p /, / t /, / k
/, And subsequent consonants include / py /, / ky /).

2.母音が高舌母音(/i/,/u/)であり、前後の子音が無
声破裂音(/p/,/t/,/k/、後続子音は/py/,/ky/を含む)
のときは、前後の子音が種類の異なる無声摩擦音(/s/,
/sh/,/h/、後続子音は/hy/を含む)のときよりも無声化
の度合いが高い。
2. The vowel is a high tongue vowel (/ i /, / u /), the consonants before and after are unvoiced plosives (/ p /, / t /, / k /, and the following consonants are / py /, / ky / Including)
In the case of, the consonants before and after are different types of unvoiced fricatives (/ s /,
/ sh /, / h /, and the following consonants include / hy /).

3.母音が高舌母音(/i/,/u/)であり、前後の子音が種
類の異なる無声摩擦音(/s/,/sh/,/h/、後続子音は/hy/
を含む)のときは、前後の子音が同一の無声摩擦音(/s
/,/sh/,/h/)のときよりも無声化の度合いが高い。
3.The vowel is a high tongue vowel (/ i /, / u /), the consonants before and after are different types of unvoiced fricatives (/ s /, / sh /, / h /, and the following consonants are / hy /
), The preceding and following consonants have the same unvoiced fricative (/ s
/, / sh /, / h /), the degree of silence is higher.

4.母音が高舌母音(/i/,/u/)であり、前後の子音が同
一の無声摩擦音(/s/,/sh/,/h/)のときは、前後の子音
のどちらかが無声子音でないときよりも無声化の度合い
が高い。
4. If the vowel is a high tongue vowel (/ i /, / u /) and the preceding and following consonants are the same unvoiced fricative (/ s /, / sh /, / h /), one of the preceding and following consonants Is more unvoiced than when it is not a voiceless consonant.

5.母音が高舌母音(/i/,/u/)でないときは無声化はし
ない。
5. If the vowel is not a high tongue vowel (/ i /, / u /), do not devoice.

表1に高舌母音の前後の子音で場合分けした音韻系列
無声化生起係数の一例を示す。縦は先行子音、横は後続
子音であり、各係数は数字が大きいほど無声化の度合い
が高いことを示す。括弧内の数字は前後の子音が同一の
場合を示している。
Table 1 shows an example of a phonological sequence unvoiced occurrence coefficient classified by consonants before and after a high tongue vowel. The vertical is the preceding consonant and the horizontal is the succeeding consonant, and the larger the coefficient, the higher the degree of unvoicedness. The numbers in parentheses indicate the case where the preceding and following consonants are the same.

次に、文字列解析部1から入力されるアクセントパタ
ーンと規則ファイル4に格納されたアクセントパターン
別無声化生起係数から、母音毎にアクセントパターン無
声化生起係数が求められる。
Next, an accent pattern unvoiced occurrence coefficient is determined for each vowel from the accent pattern input from the character string analysis unit 1 and the accent pattern unvoiced occurrence coefficient stored in the rule file 4.

上記アクセントパターン別の無声化生起度合いは、以
下の特徴を持つ。
The degree of silence occurrence for each accent pattern has the following characteristics.

a.アクセント核にある母音はほとんど無声化することが
ない。
a. Vowels in the accent nucleus are hardly devoiced.

b.O型の発声は、1型以上の発声に比べて母音が無声化
する度合いが高い。
The bO type utterance has a higher degree of vowel devoicing than the type 1 or higher utterance.

c.語頭は1型の発声を除いて無声化の度合いが高い。c. Except for Type 1 utterances, the degree of devoicing is high.

d.アクセント核の直前にある母音はアクセント核にある
母音より無声化の度合いが高いが、アクセント核より後
にある母音より無声化の度合いが低い。
d. Vowels immediately before the accent nucleus are more devoiced than vowels in the accent nucleus, but less devoiced than vowels after the accent nucleus.

第2表にアクセントパターン別の無声化生起度合いの
一例を示す。縦はアクセント型、横は対象母音のモーラ
位置を示し、各係数は数字が大きい程無声化の度合いが
高いことを示す。ここで、上記アクセント型とは、単語
を形成する音節のうち高く唱える音節の位置によって分
類するものであり、例えば“n型”とは第2番目の音節
からn番目までを高く唱え、1番目の音節とn+1番目
以下の音節はすべて低く唱えることを表わす(新明解国
語事典 第3版 付録 アクセント一覧)。
Table 2 shows an example of the degree of unvoiced occurrence for each accent pattern. The vertical indicates the accent type, the horizontal indicates the mora position of the target vowel, and the larger the coefficient, the higher the degree of unvoicedness. Here, the accent type is classified according to the position of the syllable that is higher among the syllables forming the word. For example, “n-type” means that the syllables from the second syllable to the nth are sung higher, Syllable and all syllables after the (n + 1) -th syllable indicate that it is to be chanted low.

さらに、上記音韻系列無声化生起係数とアクセントパ
ターン無声化生起係数から、次式により母音毎に無声化
生起度合いρ(n) (n=1,2,‥,WM+1 WMは入力し
た音韻系列別のモーラ数であり、WM+1は語尾の無音を
表わす)が求められる。
Further, from the phonological sequence unvoiced occurrence coefficient and the accent pattern unvoiced occurrence coefficient, the unvoiced occurrence degree ρ (n) (n = 1, 2, 1 ,, WM + 1 WM for each vowel is calculated according to the following equation. Mora number, and WM + 1 represents silence at the end).

ρ(n)=音韻系列無声化生起係数×アクセントパター
ン無声化生起係数 ステップS2で、規則ファイル4に格納してある発声速
度毎に定めた無声化を判定するための無声化判定閾値
と、文字列解析部1から入力された発声速度とから、次
のようにして無声化の判定基準となる閾値θが求められ
る。すなわち、普通の発声速度のときの閾値を定め、そ
れより発声速度が速いときは閾値を下げ、それより発声
速度が遅いときは閾値を上げる。
ρ (n) = phonetic sequence unvoiced occurrence coefficient × accent pattern unvoiced occurrence coefficient In step S 2 , a voiceless determination threshold for determining voicelessness determined for each voice speed stored in the rule file 4, From the utterance speed input from the character string analysis unit 1, a threshold θ as a criterion for de-voicing is obtained as follows. That is, a threshold value for a normal utterance speed is determined, and when the utterance speed is higher than that, the threshold value is lowered, and when the utterance speed is lower than that, the threshold value is raised.

一例として、普通発声速度の閾値を6としたときの発
声速度毎の閾値を第3表に示す。
As an example, Table 3 shows threshold values for each utterance speed when the threshold value of the normal utterance speed is 6.

また、無声化の生起しやすい母音が連鎖したときの無
声化判定閾値θ2が次式で求められる。
Further, a voicing determination threshold value θ2 when vowels that are likely to be voicing occur is obtained by the following equation.

θ2=θ×β(βは、1<βの実数) 次に、母音毎に無声化の判定に入る。[theta] 2 = [theta] * [beta] ([beta] is a real number satisfying 1 <[beta]) Next, a determination of voicelessness is started for each vowel.

ステップS3で、1モーラ目から判定を行なうためにn
=1とする。
In step S 3, n in order to perform the determination of one mora th
= 1.

ステップS4で、現モーラ(nモーラ)の無声化生起度
合いρ(n)と無声化判定閾値θとが比較される。その
結果、ρ(n)≧θのときは現モーラの母音は無声化の
可能性があるとしてステップS5に進み、ρ(n)<θの
ときは無声化しないと判定してステップS11へ進む。
In Step S 4, devoicing degree of the current mora (n Mora) [rho and (n) and unvoiced assessment threshold θ is compared. As a result, ρ (n) ≧ θ current mora vowel when the process proceeds to step S 5 as a possible devoicing, ρ (n) <θ step S 11 it is determined that no devoicing when the Proceed to.

ステップS5で、次モーラ(n+1)の無声化生起度合
いρ(n+1)と、現モーラ(n)の無声化生起度合い
ρ(n)とが比較される。その結果、ρ(n)≧ρ(n
+1)すなわち現モーラの方が無声化の度合が高い場合
は、現モーラの母音は無声化するが、次モーラの母音は
無声化しない場合があるとしてステップS8へ進む。一
方、ρ(n)<ρ(n+1)すなわち現モーラの方が無
声化の度合いが低い場合は、現モーラの母音は無声化し
ない場合があるとしてステップS6へ進む。
In step S 5, the devoicing degree follows mora (n + 1) ρ (n + 1), and devoicing degree [rho of the current mora (n) (n) are compared. As a result, ρ (n) ≧ ρ (n
+1) That case towards the current mora high degree of devoicing the vowel current mora although silent and proceeds to step S 8 as there are cases where vowels following mora not unvoiced. On the other hand, if ρ (n) <ρ (n + 1) i.e. towards the current mora degree of devoicing is low, the flow proceeds to step S 6 as there are cases where vowels current mora not unvoiced.

これは、無声化する母音が続く場合は、発音の不明確
になるのを避けるために無声化の度合いの低い一方の母
音を無声化させないためである。
This is because if vowels to be unvoiced continue, one vowel with a low degree of unvoicedness is not unvoiced in order to avoid unclear pronunciation.

ステップS6で、次モーラの母音が必ず無声化されるよ
うにρ(n+1)を大きくしてステップS7へ進む。
In step S 6, the process proceeds by increasing the ρ (n + 1) as a vowel follows mora is always devoiced to step S 7.

ステップS7で、現モーラの無声化生起度合いρ(n)
と、上記無声化の生起しやすい母音が連鎖したときの無
声化判定閾値θ2とが比較される。その結果、ρ(n)
≧θ2の場合は現モーラの母音は無声化の度合いが強い
ためステップS10へ進む。一方、ρ(n)<θ2の場合
は現モーラの母音を無声化しないためステップS11へ進
む。
In step S 7, devoicing the degree of the current mora ρ (n)
Is compared with a voicing determination threshold θ2 when vowels that are likely to cause voicing are chained. As a result, ρ (n)
Current Mora of the vowel in the case of ≧ θ2, the process proceeds to step S 10 for a strong degree of devoicing. On the other hand, in the case of ρ (n) <θ2 proceeds to step S 11 since no silent the current mora vowel.

ステップS8で、次モーラの無声化生起度合ρ(n+
1)と、無声化の生起しやすい母音が連鎖したときの無
声化判定閾値θ2とが比較される。その結果、ρ(n+
1)<θ2の場合は次モーラの母音を無声化しないと判
定してステップS9に進む。一方、ρ(n+1)≧θ2の
場合は次モーラの母音は無声化の度合いが強いためその
ままステップS10に進む。
In step S 8, devoicing degree of next mora ρ (n +
1) is compared with a voicing determination threshold value θ2 when vowels that are likely to cause voicing are chained. As a result, ρ (n +
1) In the case of <.theta.2 proceeds vowel follows Mora Step S 9 determines not to unvoiced. On the other hand, vowel follows Mora For ρ (n + 1) ≧ θ2 is directly proceeds to step S 10 a strong degree of unvoiced.

ステップS9で、次モーラの母音を無声化させないため
に、ρ(n+1)=0としてステップS10に進む。
In step S 9, the vowels following mora in order not to devoiced, the process proceeds to step S 10 as ρ (n + 1) = 0 .

ステップS10で、nモーラ目の母音を無声化すると判
定してステップS12に進む。
In step S 10, the process proceeds to step S 12 it is determined that the unvoiced the n mora th vowel.

ステップS11で、nモーラ目の母音を有声化すると判
定してステップS12に進む。
In step S 11, the process proceeds to step S 12 it is determined that the voicing an n mora th vowel.

ステップS12で、次モーラの母音の判定に移るため
に、nを1つインクリメントされる。
In step S 12, in order to move to the determination of the vowel next Mora, it is incremented by one n.

ステップS13で、nが入力した音韻系列のモーラ数(W
M)以下であるか否かが判定される。その結果、n≦WM
の場合は上記ステップS4からステップS12が繰返され、
n>WMの場合はこの無声化の判定ルーチンを終了する。
In step S 13, n is number of moras phoneme sequences inputted (W
M) It is determined whether or not: As a result, n ≦ WM
For Step S 12 is repeated from the step S 4,
If n> WM, the unvoiced determination routine ends.

以上のように、この発明では、音韻系列別の無声化生
起度合いとアクセントパターン別の無声化生起度合いと
発声速度に応じて設定される無声化判定閾値と無声化の
生起しやすい母音が連鎖したときの無声化判定閾値とに
基づいて、対象母音の有声化・無声化を判定するので、
入力された文字列に対して、この文字列の音韻系列とア
クセントパターンと発声速度に則して母音の無声化を行
なうことができる。したがって、この発明によれば、よ
り自然な合成音声を生成することができる。
As described above, in the present invention, the unvoiced occurrence threshold for each phoneme sequence, the unvoiced occurrence for each accent pattern, and the unvoiced determination threshold set according to the utterance speed are linked to the vowels that are likely to be unvoiced. Based on the unvoiced determination threshold at the time, the voiced / unvoiced voice of the target vowel is determined,
For an input character string, vowels can be devoiced in accordance with the phoneme sequence, accent pattern, and utterance speed of the character string. Therefore, according to the present invention, a more natural synthesized speech can be generated.

〈発明の効果〉 以上より明らかなように、請求項1に係る発明の音声
合成装置は、音声合成パラメータ作成部によって、規則
ファイルの音韻系列別の無声化生起度合いとアクセント
パターン別の無声化生起度合いとに基づいて、入力文字
列の各母音毎の無声化生起度合いを算出し、さらに、発
声速度別の無声化判定閾値に基づいて、指定された発声
速度に応じた無声化判定閾値を設定し、上記各無声化生
起度合いと無声化判定閾値とに基づいて入力文字列の各
母音毎に有声化・無声化を判定し、この有声化・無声化
判定結果に従って音声合成パラメータを生成するので、
この音声合成パラメータに基づいて音声合成を行うこと
によって、母音の無声化現象に大きな影響を与える音韻
系列とアクセントパターンと発声速度を考慮して対象と
なる母音を無声化できる。すなわち、この発明によれ
ば、実音声に近い自然な合成音声を生成することができ
るのである。
<Effects of the Invention> As is apparent from the above description, in the speech synthesis apparatus according to the first aspect of the present invention, the speech synthesis parameter creation unit uses the phonetic sequence of the rule file to generate unvoiced voices and accent patterns to generate voiceless voices. Based on the degree, the degree of unvoiced occurrence for each vowel of the input character string is calculated, and further, based on the unvoiced determination threshold for each vocalization rate, a devoicing determination threshold is set according to the specified vocalization rate Then, voicing / voicing is determined for each vowel of the input character string based on each of the unvoiced occurrence degrees and the voicing determination threshold, and a voice synthesis parameter is generated according to the voicing / voicing determination result. ,
By performing speech synthesis based on these speech synthesis parameters, a target vowel can be devoiced in consideration of a phoneme sequence, an accent pattern, and a utterance speed that greatly affect the vowel devoicing phenomenon. That is, according to the present invention, it is possible to generate a natural synthesized speech that is close to a real speech.

【図面の簡単な説明】[Brief description of the drawings]

第1図はこの発明の音声合成装置の一実施例を示すブロ
ック図、第2図は上記実施例における母音の有声化・無
声化判定ルーチンのフローチャート、第3図は従来の有
声化・無声化判定ルーチンのフローチャートである。 1……文字列解析部、2……単語辞書、3……規則制御
部、4……規則ファイル、5……音声合成器、6……タ
ーゲット特徴パラメータファイル、7……時系列特徴パ
ラメータファイル、8……特徴パラメータファイル。
FIG. 1 is a block diagram showing an embodiment of a voice synthesizing apparatus according to the present invention, FIG. 2 is a flowchart of a voicing / voicing determination routine for vowels in the above embodiment, and FIG. 3 is conventional voicing / voicing. It is a flowchart of a determination routine. 1 ... character string analysis unit, 2 ... word dictionary, 3 ... rule control unit, 4 ... rule file, 5 ... speech synthesizer, 6 ... target feature parameter file, 7 ... time-series feature parameter file , 8 ... Feature parameter file.

───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G10L 5/02 G10L 3/00──────────────────────────────────────────────────続 き Continued on front page (58) Field surveyed (Int. Cl. 6 , DB name) G10L 5/02 G10L 3/00

Claims (1)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】入力される文字列から音韻系列、アクセン
トパターンを決定する文字列解析部(1)、音韻系列、
アクセントパターン、規則ファイル(4)に格納された
規則に従って音声合成パラメータを作成する音声合成パ
ラメータ作成部(3)、音声合成パラメータに基づいて
音声合成を行う音声合成部(5)を備えた音声合成装置
であって、 音声合成パラメータ作成部(3)は、 音韻系列と、規則ファイル(4)に格納された音韻系列
別の無声化生起度合いに基づいて、各母音毎の音韻系列
無声化生起度合いを設定する第1無声化生起度合い設定
手段(S1)と、 アクセントパターンと、規則ファイル(4)に格納され
たアクセントパターン別の無声化生起度合いに基づい
て、各母音毎のアクセントパターン無声化生起度合いを
設定する第2無声化生起度合い設定手段(S1)と、 音韻系列無声化生起度合いとアクセントパターン無声化
生起度合いから、各母音毎の無声化生起度合いを算出す
る無声化生起度合い算出手段(S1)と、 指定される発声速度と、規則ファイル(4)に格納され
た発声速度別の無声化判定閾値に基づいて無声化判定閾
値を設定する設定手段(S2)と、 設定された無声化生起度合い、無声化判定閾値に基づい
て各母音毎に無声化・有声化を判定する母音有声化無声
化判定手段(S4〜S13)とを備え、 母音有声化無声化判定手段(S4〜S13)の判定結果に従
って音声合成パラメータを作成する 音声合成装置。
A character string analysis unit for determining a phoneme sequence and an accent pattern from an input character string;
Speech synthesis including a speech synthesis parameter creation unit (3) for creating speech synthesis parameters in accordance with the rules stored in the accent file and the rule file (4), and a speech synthesis unit (5) for performing speech synthesis based on the speech synthesis parameters. A speech synthesis parameter creation unit (3), based on the phoneme sequence and the degree of unvoiced occurrence for each phonological sequence stored in the rule file (4), a degree of unvoiced occurrence of a phonological sequence for each vowel. First unvoiced occurrence degree setting means (S1) for setting an accent pattern and an unvoiced occurrence degree for each vowel based on the accent pattern and the degree of unvoiced occurrence for each accent pattern stored in the rule file (4). A second unvoiced occurrence degree setting means (S1) for setting the degree; a phonetic sequence unvoiced occurrence degree and an accent pattern unvoiced occurrence degree; Based on the voicing occurrence degree calculating means (S1) for calculating the voicing occurrence degree for each vowel, the specified vocalization rate, and the voicing determination threshold for each vocalization rate stored in the rule file (4). Setting means (S2) for setting a devoicing judgment threshold value; and vowel voiced and unvoiced judgment means (S4) for judging devoicing / voicing for each vowel based on the set devoiced occurrence degree and devoiced judgment threshold value. To S13), and generates a speech synthesis parameter in accordance with the determination result of the vowel voiced and unvoiced determination means (S4 to S13).
JP63025941A 1988-02-03 1988-02-03 Speech synthesizer Expired - Fee Related JP2848604B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63025941A JP2848604B2 (en) 1988-02-03 1988-02-03 Speech synthesizer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63025941A JP2848604B2 (en) 1988-02-03 1988-02-03 Speech synthesizer

Publications (2)

Publication Number Publication Date
JPH01200290A JPH01200290A (en) 1989-08-11
JP2848604B2 true JP2848604B2 (en) 1999-01-20

Family

ID=12179782

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63025941A Expired - Fee Related JP2848604B2 (en) 1988-02-03 1988-02-03 Speech synthesizer

Country Status (1)

Country Link
JP (1) JP2848604B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5794602B2 (en) * 2010-02-24 2015-10-14 国立大学法人九州工業大学 Speech synthesis apparatus and method, and speech synthesis program
CN109559733B (en) * 2018-11-29 2023-06-27 创新先进技术有限公司 Voice rhythm processing method and device

Also Published As

Publication number Publication date
JPH01200290A (en) 1989-08-11

Similar Documents

Publication Publication Date Title
US20090094035A1 (en) Method and system for preselection of suitable units for concatenative speech
JP2000305582A (en) Speech synthesizing device
JPH0632020B2 (en) Speech synthesis method and apparatus
Venditti et al. Modeling Japanese boundary pitch movements for speech synthesis
JP2761552B2 (en) Voice synthesis method
JP2904279B2 (en) Voice synthesis method and apparatus
JP2848604B2 (en) Speech synthesizer
US6829577B1 (en) Generating non-stationary additive noise for addition to synthesized speech
JPH0580791A (en) Device and method for speech rule synthesis
Lobanov et al. Development of multi-voice and multi-language TTS synthesizer (languages: Belarussian, Polish, Russian)
JP3124791B2 (en) Speech synthesizer
JPH01197794A (en) Speech synthesizer
JPH0242496A (en) Voice synthesizer
JP3078073B2 (en) Basic frequency pattern generation method
JPH0727392B2 (en) Speech synthesizer
JP3397406B2 (en) Voice synthesis device and voice synthesis method
Low et al. Application of microprosody models in text to speech synthesis.
JP3318290B2 (en) Voice synthesis method and apparatus
JP2995814B2 (en) Voice synthesis method
JP3368948B2 (en) Voice rule synthesizer
JPH01321496A (en) Speech synthesizing device
Chowdhury Concatenative text-to-speech synthesis: A study on standard colloquial Bengali
JPH09292897A (en) Voice synthesizing device
O’Shaughnessy Approaches to improve automatic speech synthesis
JPH01200291A (en) Voice synthesizer

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees