JPS5847719B2

JPS5847719B2 - ブンオンセイノポ−ズソウニユウホウシキ

Info

Publication number: JPS5847719B2
Application number: JP49101654A
Authority: JP
Inventors: 大和佐藤; 和雄箱田
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: NTT Inc
Priority date: 1974-09-04
Filing date: 1974-09-04
Publication date: 1983-10-24
Also published as: JPS5128702A

Description

【発明の詳細な説明】本発明は、文音声合成の際の文節間にポーズを挿入する
文音声のポーズ挿入方式に関するものである。

従来から各種の音声応答サービスにおいては、単語もし
くは文節を基本単位とした録音編集方式が用いられてい
る。

これらの方式では、録音の時間スコットが一定で、かつ
録音される音声単位の長さが不揃いであるため、出力さ
れる文音声に入るポーズはまちまちの長さとなり、聴き
手に不自然な感じを与えるという欠点があった。

また、各文節間に一定の長さのポーズを置くという簡単
な方法も考えられるが、各文節間の構文上のつながりの
弱いところではポーズが入りやすく、強く結合している
ところでは入りにくいなど、ポーズの挿入には一定の傾
向があるため、固定長のポーズでは自然な感じを得るこ
とはできない。

したがって、文節間に入るポーズを、できるだけ自然音
声と同一となるように挿入する規則を求めることが必要
となる。

本発明は、上記の点を考慮して、合成すべき文音声に自
然らしさを付与するために、文の構文情報と句の長さに
よる情報を用いて、文節間のポーズの挿入と長さを自動
的に決定する文音声のポーズ挿入方式を提供するもので
ある。

以下、図面により実施例を詳細に説明する。

第１図は、入力として合成すべき文の文字記号列が与え
られたとき、この文中の文節間におけるポーズ挿入の可
否と、ポーズが挿入された場合、その長さを決定する方
法の一実施例を示すブロック構成図である。

第１図において、１は入力端子で、合成すべき文を表わ
す文字記号列が入り、２０入力記号読み取り装置で読み
込まれる。

３は単語解析器、４は単語辞書で、この単語解析器３で
は、単語辞書４を用いて入力記号列を単語系列に変換し
て出力する。

５は文節解析器で、単語の系列を結合して文節単位の系
列に変換する。

６は構文解析器で、文節解析器５の出力に基づいて構文
解析をおこない、もしくは係り受け構造の形で入力文を
出力する。

７から１３までがポーズ挿入決定部で、後に詳しく説明
する。

１４は出力端子で、ポーズ記号とポーズ長を含む文系列
を出力する。

以下、ポーズの挿入方式について具体的に説明する。

文音声中のポーズの生起を規定する第１の要因は、着目
している文節間の前後の句の長さである。

すなわち、長い音声を発声したあとでは息が切れるなど
の理由でポーズが生じ、長い句をこれから発声しようと
するときには、その準備のためにポーズが生じやすくな
ると考えられる。

そこで、文の構造上のつながりを一定に保ち、あるポー
ズ候補点に着目し、その前後の句の長さを種々に変えた
文を発声し、そのポーズを調べてみると、前後の句の長
さが増すとポーズの挿入確率も増すばかりでなく、ポー
ズ長と前後の句の長さとの関係が次式で近似できること
が明らかとなった。

但し、句の長さはモーラ数にて表現している。

（１）式は、そのポーズの前後の句の長さが長くなると
、それに伴ってポーズの長さが長くなることを意味して
いる。

また（１）式は、ポーズ挿入の可否に関する一つの評価
関数として用いることができる。

また、このポーズの生起を規定する第２の要因は、構文
上の位置である。

すなわち、２つの文※節間の結合関係の強い位置ではポ
ーズが入りにくく、逆に弱い位置ではポーズが入りやす
い。

このような結合の程度は、着目しているポーズ候補点の
文構造を示すツリーの節の深さ、あるいは前後の文節の
格や修飾関係例えば係り受け構造を用いて定量化するこ
とができる。

ここでは最も簡単な方法として、構文ツリーの最下層レ
ベルすなわち文節レベルを第１レベルとし、着目してい
るポーズ候補点の節レベルをＬｉ１最高レベルを”ｍ
ａｘとして、結合度に関連した量ＴＬを次式で定義する
。

ＴＬＯ値が小さいほど構文上の結合は強いと考えること
ができる。

第２図に構文ツリーの例を示す。

また、この外、第３図に示すように、文の係り受け構造
に基づき、着目する文節から受けの文節に至る道のり（
文節数）によっても接続文節との結合度を表現すること
も可能である。

ここでは以下の説明において、構文ツリーの節レベルを
用いた手法を例にとって説明する。

次に、（１）式と（司式を用いて文音声のポーズを決定
する方法に関して述べる。

文中のポーズ候補点は、その点の文節間の結合度を表現
するＴＬと、前後の句の長さに関連した次式で表わされ
るポーズ挿入確率評価関数Ｌで表現することができる。

関数Ｌは（１）式の第２項の積である。

第４図は、上記のＴＬとＬをそれぞれ縦軸と横軸にとっ
た平面であり、あるポーズ候補点はこの平面の一点と対
応している。

種々の文を実際に発声して、ポーズ挿入の有無を調べて
みると、この平面はポーズの入る領域とポーズの入らな
い領域に分かれ、２つの領域を近似的に直線で分離する
ことができる。

第４図において、１５はポーズの入る領域、１６はポー
ズの入らない領域であり、１７は２つの領域を分離する
直線を表わす。

この直線は次式で表現される。

ここで、γ、θ・・・・・・定数すなわち、文音声中のポーズの挿入は、候補点における
構文上の結合度と前後の句の長さとのかねあいで決まり
、このかねあいを決めているのが式（４）である。

以上の結果、ポーズ長Ｐを挿入する規則として次式が考
えられる。

ポーズが挿入された場合のポーズ長は、 γＬの定数倍で表現している。

ＴＬ＋ＴＬ＋γＬと挿入ポーズ長の関係を第５図に示す。

以上述べてきたポーズ挿入方式を第１図に基づいて説明
する。

構文解析器６によって、入力文の構造が決定されること
はすでに述べたが、必要ならば、各文節の格の指定等も
なされる。

また、ポーズ候補点決定器７で各文節間のポーズ候補点
が選び出され、文節結合度計算回路８で各候補点の構文
上の結合度が計算される。

ここでは、簡単に（２）式に基づいた除算回路で構成さ
れても良いが、係り受け距離や格関係を用いて更に詳細
な関数の値を計算するハードウエアから構成することも
可能である。

次に文頭から数えて第１番目の候補点がとり出され、句
長測定回路９において候補点の前後の句の長さが決定さ
れ、関数Ｌ計算回路１０によって（３）式Ｌが計算され
る。

この関数Ｌ計算回路１０は加算器、乗算器、除算回路、
指数計算回路等によって構成される。

ポーズ挿入判定器１１は、加・乗算器と閾値判定回路か
ら成り、関数Ｌ計算回路１０の出力と文節結合度計算回
路８の出力とを用いてポーズ挿入の可否を決定する。

もしもポーズの挿入が決定されたならば、ポーズ長計算
回路１２によってその長さが決められ、文末検出回路１
３を通って、出力端子１４にポーズ記号とポーズ長を出
力する。

ポーズが挿入されない場合は、ポーズ長計算回路１２を
とび越えて文末検出回路１３に入る。

文末検出回路１３で文末に達していないことが判定され
ると、ポーズ候補点をひとつ進めて再び句長測定回路９
に入る。

以上の操作は、文全体のポーズがすべて決定されるまで
繰り返される。

この表は〔文例、山田太郎君はＰ１急いでＰ２あのＰ３
山へＰ４登りました。

〕の文に対して、本発明のポーズ挿入方式を適用した例
と実測値とを比較して示したもので、Ｐ１、Ｐ２、Ｐ３
、Ｐ４はポーズ候補点を示し、また、定数Ｃ、θ、γは
、１例として、Ｃ＝２２５、θ−１．３、γ−１．７３
にした。

以上説明したように、本発明は入力文の構文を解析し、
しかるのちに文音声のポーズ挿入候補点における文節間
の結合の強さと、その前後における句の長さとから、ポ
ーズ挿入の可否とその長さを決定する方法であるため、
文の記号系列のみが入力として与えられたとき、自然音
声におけると同じようなポーズを自動的に出力すること
ができるもので、本発明を用いれば、文音声の法則合成
において合成音声に自然な感じを付与することができる
など、本発明は非常に有用性のある文音声のポーズ挿入
方式を提供することができる。

【図面の簡単な説明】

第１図は本発明の一実施例のブロック図、第２図は構文
ツリーの文節結合度の例を示す図、第３図は係り受け構
造と係り受け距離の例を示す図、第４図は種々の文音声
中のポーズ有無の分布を示す図、第５図はポーズ長とパ
ラメータの関係の一例を示す図である。１・・・・・・入力端子、２・・・・・・入力記号読み
とり装置、３・・・・・・単語解析器、４・・・・・・
単語辞書、５・・・・・・文節解析器、６・・・・・・
構文解析器、７・・・・・・ポーズ候補点決定器、８・
・・・・・文節結合度計算回路、９・・・・・・句長測
定回路、１０・・・・・・関数Ｌ計算回路、１１・・・
・・・ポーズ挿入判定器、１２・・・・・・ポーズ長計
算回路、１３・・・・・・文末検出回路、１４・・・・
・・出力端子。

Claims

【特許請求の範囲】

１文音声の法則合成において、入力として文の文字記
号が与えられたとき、この文の構文を解析する手段と、
構文ツリーの構造から決まる文節相互の距離を示す関数
値を一方の軸とし、文節境界の前後の句の長さを変数と
するポーズ挿入確率評価関数値を他方の軸とする平面を
構成し、この平面を２分する直線でポーズ挿入部分と非
挿入部分を設定してポーズ挿入の可否を決定し、前記平
面を２分する直線からの隔りによってポーズ長を決定す
る手段とを有することを特徴とする文音声のポーズ挿入
方式。