Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JPS5847719B2 - ブンオンセイ ノ ポ−ズソウニユウホウシキ - Google Patents
[go: Go Back, main page]

JPS5847719B2 - ブンオンセイ ノ ポ−ズソウニユウホウシキ - Google Patents

ブンオンセイ ノ ポ−ズソウニユウホウシキ

Info

Publication number
JPS5847719B2
JPS5847719B2 JP49101654A JP10165474A JPS5847719B2 JP S5847719 B2 JPS5847719 B2 JP S5847719B2 JP 49101654 A JP49101654 A JP 49101654A JP 10165474 A JP10165474 A JP 10165474A JP S5847719 B2 JPS5847719 B2 JP S5847719B2
Authority
JP
Japan
Prior art keywords
sentence
pause
length
pose
clauses
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP49101654A
Other languages
English (en)
Other versions
JPS5128702A (en
Inventor
大和 佐藤
和雄 箱田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP49101654A priority Critical patent/JPS5847719B2/ja
Publication of JPS5128702A publication Critical patent/JPS5128702A/ja
Publication of JPS5847719B2 publication Critical patent/JPS5847719B2/ja
Expired legal-status Critical Current

Links

Description

【発明の詳細な説明】 本発明は、文音声合成の際の文節間にポーズを挿入する
文音声のポーズ挿入方式に関するものである。
従来から各種の音声応答サービスにおいては、単語もし
くは文節を基本単位とした録音編集方式が用いられてい
る。
これらの方式では、録音の時間スコットが一定で、かつ
録音される音声単位の長さが不揃いであるため、出力さ
れる文音声に入るポーズはまちまちの長さとなり、聴き
手に不自然な感じを与えるという欠点があった。
また、各文節間に一定の長さのポーズを置くという簡単
な方法も考えられるが、各文節間の構文上のつながりの
弱いところではポーズが入りやすく、強く結合している
ところでは入りにくいなど、ポーズの挿入には一定の傾
向があるため、固定長のポーズでは自然な感じを得るこ
とはできない。
したがって、文節間に入るポーズを、できるだけ自然音
声と同一となるように挿入する規則を求めることが必要
となる。
本発明は、上記の点を考慮して、合成すべき文音声に自
然らしさを付与するために、文の構文情報と句の長さに
よる情報を用いて、文節間のポーズの挿入と長さを自動
的に決定する文音声のポーズ挿入方式を提供するもので
ある。
以下、図面により実施例を詳細に説明する。
第1図は、入力として合成すべき文の文字記号列が与え
られたとき、この文中の文節間におけるポーズ挿入の可
否と、ポーズが挿入された場合、その長さを決定する方
法の一実施例を示すブロック構成図である。
第1図において、1は入力端子で、合成すべき文を表わ
す文字記号列が入り、20入力記号読み取り装置で読み
込まれる。
3は単語解析器、4は単語辞書で、この単語解析器3で
は、単語辞書4を用いて入力記号列を単語系列に変換し
て出力する。
5は文節解析器で、単語の系列を結合して文節単位の系
列に変換する。
6は構文解析器で、文節解析器5の出力に基づいて構文
解析をおこない、もしくは係り受け構造の形で入力文を
出力する。
7から13までがポーズ挿入決定部で、後に詳しく説明
する。
14は出力端子で、ポーズ記号とポーズ長を含む文系列
を出力する。
以下、ポーズの挿入方式について具体的に説明する。
文音声中のポーズの生起を規定する第1の要因は、着目
している文節間の前後の句の長さである。
すなわち、長い音声を発声したあとでは息が切れるなど
の理由でポーズが生じ、長い句をこれから発声しようと
するときには、その準備のためにポーズが生じやすくな
ると考えられる。
そこで、文の構造上のつながりを一定に保ち、あるポー
ズ候補点に着目し、その前後の句の長さを種々に変えた
文を発声し、そのポーズを調べてみると、前後の句の長
さが増すとポーズの挿入確率も増すばかりでなく、ポー
ズ長と前後の句の長さとの関係が次式で近似できること
が明らかとなった。
但し、句の長さはモーラ数にて表現している。
(1)式は、そのポーズの前後の句の長さが長くなると
、それに伴ってポーズの長さが長くなることを意味して
いる。
また(1)式は、ポーズ挿入の可否に関する一つの評価
関数として用いることができる。
また、このポーズの生起を規定する第2の要因は、構文
上の位置である。
すなわち、2つの文※節間の結合関係の強い位置ではポ
ーズが入りにくく、逆に弱い位置ではポーズが入りやす
い。
このような結合の程度は、着目しているポーズ候補点の
文構造を示すツリーの節の深さ、あるいは前後の文節の
格や修飾関係例えば係り受け構造を用いて定量化するこ
とができる。
ここでは最も簡単な方法として、構文ツリーの最下層レ
ベルすなわち文節レベルを第1レベルとし、着目してい
るポーズ候補点の節レベルをLi1最高レベルを”m
axとして、結合度に関連した量TLを次式で定義する
TLO値が小さいほど構文上の結合は強いと考えること
ができる。
第2図に構文ツリーの例を示す。
また、この外、第3図に示すように、文の係り受け構造
に基づき、着目する文節から受けの文節に至る道のり(
文節数)によっても接続文節との結合度を表現すること
も可能である。
ここでは以下の説明において、構文ツリーの節レベルを
用いた手法を例にとって説明する。
次に、(1)式と(司式を用いて文音声のポーズを決定
する方法に関して述べる。
文中のポーズ候補点は、その点の文節間の結合度を表現
するTLと、前後の句の長さに関連した次式で表わされ
るポーズ挿入確率評価関数Lで表現することができる。
関数Lは(1)式の第2項の積である。
第4図は、上記のTLとLをそれぞれ縦軸と横軸にとっ
た平面であり、あるポーズ候補点はこの平面の一点と対
応している。
種々の文を実際に発声して、ポーズ挿入の有無を調べて
みると、この平面はポーズの入る領域とポーズの入らな
い領域に分かれ、2つの領域を近似的に直線で分離する
ことができる。
第4図において、15はポーズの入る領域、16はポー
ズの入らない領域であり、17は2つの領域を分離する
直線を表わす。
この直線は次式で表現される。
ここで、γ、θ・・・・・・定数 すなわち、文音声中のポーズの挿入は、候補点における
構文上の結合度と前後の句の長さとのかねあいで決まり
、このかねあいを決めているのが式(4)である。
以上の結果、ポーズ長Pを挿入する規則として次式が考
えられる。
ポーズが挿入された場合のポーズ長は、 γLの定数倍で表現している。
TL+ TL+γLと挿入ポーズ長の関係を第5図に示す。
以上述べてきたポーズ挿入方式を第1図に基づいて説明
する。
構文解析器6によって、入力文の構造が決定されること
はすでに述べたが、必要ならば、各文節の格の指定等も
なされる。
また、ポーズ候補点決定器7で各文節間のポーズ候補点
が選び出され、文節結合度計算回路8で各候補点の構文
上の結合度が計算される。
ここでは、簡単に(2)式に基づいた除算回路で構成さ
れても良いが、係り受け距離や格関係を用いて更に詳細
な関数の値を計算するハードウエアから構成することも
可能である。
次に文頭から数えて第1番目の候補点がとり出され、句
長測定回路9において候補点の前後の句の長さが決定さ
れ、関数L計算回路10によって(3)式Lが計算され
る。
この関数L計算回路10は加算器、乗算器、除算回路、
指数計算回路等によって構成される。
ポーズ挿入判定器11は、加・乗算器と閾値判定回路か
ら成り、関数L計算回路10の出力と文節結合度計算回
路8の出力とを用いてポーズ挿入の可否を決定する。
もしもポーズの挿入が決定されたならば、ポーズ長計算
回路12によってその長さが決められ、文末検出回路1
3を通って、出力端子14にポーズ記号とポーズ長を出
力する。
ポーズが挿入されない場合は、ポーズ長計算回路12を
とび越えて文末検出回路13に入る。
文末検出回路13で文末に達していないことが判定され
ると、ポーズ候補点をひとつ進めて再び句長測定回路9
に入る。
以上の操作は、文全体のポーズがすべて決定されるまで
繰り返される。
この表は〔文例、山田太郎君はP1急いでP2あのP3
山へP4登りました。
〕の文に対して、本発明のポーズ挿入方式を適用した例
と実測値とを比較して示したもので、P1、P2、P3
、P4はポーズ候補点を示し、また、定数C、θ、γは
、1例として、C=225、θ−1.3、γ−1.73
にした。
以上説明したように、本発明は入力文の構文を解析し、
しかるのちに文音声のポーズ挿入候補点における文節間
の結合の強さと、その前後における句の長さとから、ポ
ーズ挿入の可否とその長さを決定する方法であるため、
文の記号系列のみが入力として与えられたとき、自然音
声におけると同じようなポーズを自動的に出力すること
ができるもので、本発明を用いれば、文音声の法則合成
において合成音声に自然な感じを付与することができる
など、本発明は非常に有用性のある文音声のポーズ挿入
方式を提供することができる。
【図面の簡単な説明】
第1図は本発明の一実施例のブロック図、第2図は構文
ツリーの文節結合度の例を示す図、第3図は係り受け構
造と係り受け距離の例を示す図、第4図は種々の文音声
中のポーズ有無の分布を示す図、第5図はポーズ長とパ
ラメータの関係の一例を示す図である。 1・・・・・・入力端子、2・・・・・・入力記号読み
とり装置、3・・・・・・単語解析器、4・・・・・・
単語辞書、5・・・・・・文節解析器、6・・・・・・
構文解析器、7・・・・・・ポーズ候補点決定器、8・
・・・・・文節結合度計算回路、9・・・・・・句長測
定回路、10・・・・・・関数L計算回路、11・・・
・・・ポーズ挿入判定器、12・・・・・・ポーズ長計
算回路、13・・・・・・文末検出回路、14・・・・
・・出力端子。

Claims (1)

    【特許請求の範囲】
  1. 1 文音声の法則合成において、入力として文の文字記
    号が与えられたとき、この文の構文を解析する手段と、
    構文ツリーの構造から決まる文節相互の距離を示す関数
    値を一方の軸とし、文節境界の前後の句の長さを変数と
    するポーズ挿入確率評価関数値を他方の軸とする平面を
    構成し、この平面を2分する直線でポーズ挿入部分と非
    挿入部分を設定してポーズ挿入の可否を決定し、前記平
    面を2分する直線からの隔りによってポーズ長を決定す
    る手段とを有することを特徴とする文音声のポーズ挿入
    方式。
JP49101654A 1974-09-04 1974-09-04 ブンオンセイ ノ ポ−ズソウニユウホウシキ Expired JPS5847719B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP49101654A JPS5847719B2 (ja) 1974-09-04 1974-09-04 ブンオンセイ ノ ポ−ズソウニユウホウシキ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP49101654A JPS5847719B2 (ja) 1974-09-04 1974-09-04 ブンオンセイ ノ ポ−ズソウニユウホウシキ

Publications (2)

Publication Number Publication Date
JPS5128702A JPS5128702A (en) 1976-03-11
JPS5847719B2 true JPS5847719B2 (ja) 1983-10-24

Family

ID=14306358

Family Applications (1)

Application Number Title Priority Date Filing Date
JP49101654A Expired JPS5847719B2 (ja) 1974-09-04 1974-09-04 ブンオンセイ ノ ポ−ズソウニユウホウシキ

Country Status (1)

Country Link
JP (1) JPS5847719B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6154230U (ja) * 1984-09-14 1986-04-11

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6154230U (ja) * 1984-09-14 1986-04-11

Also Published As

Publication number Publication date
JPS5128702A (en) 1976-03-11

Similar Documents

Publication Publication Date Title
JP4354653B2 (ja) ピッチ追跡方法および装置
JP2000505914A (ja) 音声認識装置において、隠れマルコフ音声モデルを多言語で適用するための方法
KR20030035522A (ko) 스무딩 필터를 이용한 음성 합성 시스템 및 그 방법
CN110634479B (zh) 语音交互系统、其处理方法以及其程序
CN109102800A (zh) 一种确定歌词显示数据的方法和装置
CN112349274A (zh) 一种训练韵律预测模型方法、装置、设备及存储介质
JP2003295880A (ja) 録音音声と合成音声を接続する音声合成システム
TWI467566B (zh) 多語言語音合成方法
CN111312216A (zh) 一种包含多说话人的语音标记方法及计算机可读存储介质
CN112992183B (zh) 歌唱气息评分方法及装置
JP5007401B2 (ja) 発音評定装置、およびプログラム
JP5294700B2 (ja) 音声認識及び合成システム、プログラム及び方法
JPS5847719B2 (ja) ブンオンセイ ノ ポ−ズソウニユウホウシキ
CN107610691A (zh) 英语元音发声纠错方法及装置
JP4778402B2 (ja) 休止時間長算出装置及びそのプログラム、並びに音声合成装置
JPH067357B2 (ja) 音声認識装置
Maddela et al. Durational and Formantshift characteristics of Telugu alveolar and bilabial nasal phonemes
US20020016709A1 (en) Method for generating a statistic for phone lengths and method for determining the length of individual phones for speech synthesis
JP3142160B2 (ja) 発音記号生成装置
JP2748445B2 (ja) ポーズ挿入位置決定方式
JP3299170B2 (ja) 音声登録認識装置
KR19990050440A (ko) 유성음, 무성음, 묵음 구간 정보를 이용한 음성인식방법 및 음성인식장치
JP5066668B2 (ja) 音声認識装置、およびプログラム
CN116013246A (zh) 说唱音乐自动生成方法及系统
CN120412613A (zh) 一种基于人工智能的语音处理方法和装置