JP7125599B2 - Prosody control device, prosody control method and program - Google Patents
Prosody control device, prosody control method and program Download PDFInfo
- Publication number
- JP7125599B2 JP7125599B2 JP2018133062A JP2018133062A JP7125599B2 JP 7125599 B2 JP7125599 B2 JP 7125599B2 JP 2018133062 A JP2018133062 A JP 2018133062A JP 2018133062 A JP2018133062 A JP 2018133062A JP 7125599 B2 JP7125599 B2 JP 7125599B2
- Authority
- JP
- Japan
- Prior art keywords
- prosody
- scale value
- control amount
- phrase
- prosody control
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
Description
特許法第30条第2項適用 高田 一眞が、学校法人早稲田大学 2017(平成29)年度 修士論文・卒業論文発表会において、「判断のモダリティに基づく対話韻律の分析」と題して、中嶋 秀治、匂坂 芳典、及び、高田 一眞が発明した「韻律制御装置、韻律制御方法及びプログラム」に関する技術について公開。Application of Article 30,
本発明は対話音声の音声合成において、韻律制御、特に基本周波数(声の高さ)の制御を行う韻律制御装置、韻律制御方法及びプログラムに関する。 The present invention relates to a prosody control device, a prosody control method, and a program for controlling prosody, particularly fundamental frequency (pitch) in speech synthesis of dialogue speech.
従来、音声合成対象の意図又は意味に対応する基本周波数変化形状の関係分析(例えば非特許文献1)と、形状分類に基づく制御(例えば非特許文献2)とが行われていた。 Conventionally, relationship analysis of fundamental frequency change shapes corresponding to intentions or meanings of speech synthesis targets (for example, Non-Patent Document 1) and control based on shape classification (for example, Non-Patent Document 2) have been performed.
非特許文献1及び2記載の方法は、音声合成対象の句の単語、特に、発話末尾の終助詞に着目して、その終助詞の基本周波数の変化形状を分類して利用している。当該方法は、終助詞を含む句を終助詞とその前部の要素とに分け、それらの組合せと句全体で伝える意味又は意図との対応から基本周波数の変化形状を選択することで、尤もらしい基本周波数の変化形状を与える。
The methods described in
上記の方法は、例えば、終助詞が「ね」で、その前部要素が「食べて」で、全体の句が「食べてね」の場合、その句が依頼を意味する場合と命令を意味する場合との間で基本周波数の変化形状を選択しわける。 For example, if the final particle is ``ne'', its front element is ``eat'', and the whole phrase is ``eat ne'', the above method can be used to Select the shape of change in the fundamental frequency between
しかし、終助詞の前には、上記の非特許文献1又は2で調べられた以外の要素が付く場合も有るが、上記非特許文献では調べられていない要素が句全体に与える影響についての知見が無い。このため基本周波数の制御が困難であるという課題が有る。例えば、「する+らしい+よ」と「する+みたいだ+よ」では、どちらも基本周波数は上昇する。しかし、非特許文献1記載の方法は変化の方向を示すのみであり、その程度を選択することができない。また、「する+にちがいない+よ」と「する+みたいだ+よ」では、「よ」の基本周波数は前者で大きく下がり、後者で大きく上がる。しかし、非特許文献2では細かな意図又は意味の分類との対応が無いため、基本周波数を適切に選択することは難しい。以下、終助詞の前側につく「らしい」、「みたいだ」、「にちがいない」等の要素を変化要因部と称して本発明を説明する。
However, before the final particle, there may be cases where elements other than those examined in the above
かかる点に鑑みてなされた本開示の目的は、終助詞の前側につく要素が細かく変わっても、それに対応する多様な韻律制御が可能である韻律制御装置、韻律制御方法及びプログラムを提供することにある。 An object of the present disclosure, which has been made in view of this point, is to provide a prosody control device, a prosody control method, and a program that are capable of various prosody control corresponding to even if the element attached to the front side of the final particle changes finely. It is in.
上記課題を解決するため、本発明に係る韻律制御装置は、
句を含む表現の入力を受け付けて、当該句を単語に分割し、終助詞と動詞部分とを特定し、前記終助詞と前記動詞部分とに挟まれた部分があれば前記部分を変化要因部として設定する言語分析部と、
前記変化要因部に対応する尺度値を決定する尺度化部と、
前記尺度値を韻律制御量へ変換する尺度値制御量変換部と、
前記韻律制御量に基づいて前記表現の韻律を制御する韻律生成部と、
を有し、
前記句に前記変化要因部が存在しないと前記言語分析部により判定されると、前記尺度値制御量変換部により前記韻律制御量として所定の定数を設定する。
In order to solve the above problems, the prosody control device according to the present invention includes:
Receiving an input of an expression including a phrase, dividing the phrase into words, identifying a final particle and a verb part, and if there is a part sandwiched between the final particle and the verb part, the part is treated as a change factor part. a linguistic analyzer configured as
a scaling unit that determines a scale value corresponding to the variable factor;
a scale value control amount conversion unit that converts the scale value into a prosody control amount;
a prosody generator that controls the prosody of the expression based on the prosody control amount;
has
When the language analysis unit determines that the change factor part does not exist in the phrase, the scale value control amount conversion unit sets a predetermined constant as the prosody control amount.
上記課題を解決するため、本発明に係る韻律制御方法は、
言語分析部により、句を含む表現の入力を受け付けて、当該句を単語に分割し、終助詞と動詞部分とを特定し、前記終助詞と前記動詞部分とに挟まれた部分があれば前記部分を変化要因部として設定するステップと、
尺度化部により、前記変化要因部に対応する尺度値を決定するステップと、
尺度値制御量変換部により、前記尺度値を韻律制御量へ変換するステップと、
韻律生成部により、前記韻律制御量に基づいて前記表現の韻律を制御するステップと、
前記句に前記変化要因部が存在しないと前記言語分析部により判定されると、前記尺度値制御量変換部により前記韻律制御量として所定の定数を設定するステップと、
を有する。
In order to solve the above problems, the prosody control method according to the present invention includes:
The language analysis unit receives an input of an expression including a phrase, divides the phrase into words, identifies a final particle and a verb part, and if there is a part sandwiched between the final particle and the verb part, setting the portion as the variable factor portion;
determining, by a scaling unit, a scale value corresponding to the variable factor;
a step of converting the scale value into a prosodic control quantity by a scale value control quantity conversion unit;
controlling the prosody of the expression based on the prosody control amount by a prosody generator;
setting a predetermined constant as the prosody control amount by the scale value control amount conversion unit when the language analysis unit determines that the change factor part does not exist in the phrase;
have
本開示に係る韻律制御装置、韻律制御方法及びプログラムによれば、終助詞の前側につく要素が細かく変わっても、それに対応する多様な韻律制御が可能である。 According to the prosody control device, the prosody control method, and the program according to the present disclosure, even if the element that precedes the final particle changes in detail, various prosody controls corresponding to it are possible.
以下、図面を参照して本発明がより具体的に説明される。 Hereinafter, the present invention will be described more specifically with reference to the drawings.
図1は、本実施形態の韻律制御装置Dの機能ブロック図である。韻律制御装置Dは言語分析部1、尺度化部2、尺度値制御量変換部3及び韻律生成部4を含む。図1内の矢印は情報が流れる方向を示す。以下、韻律制御装置Dの各機能を説明するが、韻律制御装置Dが有する他の機能を排除することを意図したものではない。
FIG. 1 is a functional block diagram of the prosody control device D of this embodiment. The prosody control device D includes a
言語分析部1、尺度化部2、尺度値制御量変換部3及び韻律生成部4が実行する処理は、1又は複数のCPU(Central Processing Unit)等のプロセッサ(図示せず)によって実行される。プロセッサは、種々の処理のためのプログラム及び演算中の情報を記憶する1又は複数のメモリを含んでよい。メモリは揮発性メモリ及び不揮発性メモリを含む。メモリは、プロセッサと独立しているメモリ、及びプロセッサの内蔵メモリを含む。プロセッサは特定のプログラムを読み込ませて特定の機能を実行する汎用のプロセッサ、特定の処理に特化した専用のプロセッサを含む。
The processing executed by the
各種情報、及び/又は韻律制御装置Dを動作させるためのプログラム等は、韻律制御装置D内部又は外部の記憶部に記憶されてよい。記憶部は半導体メモリ又は磁気メモリ等で構成される。記憶部はワークメモリとして機能してもよい。 Various kinds of information and/or programs for operating the prosody control device D may be stored in the internal or external storage unit of the prosody control device D. The storage unit is composed of a semiconductor memory, a magnetic memory, or the like. The storage unit may function as a work memory.
図2のフローチャートを参照しながら、韻律制御装置Dが実行する韻律制御方法を説明する。 The prosody control method executed by the prosody control device D will be described with reference to the flow chart of FIG.
ステップS1にて、言語分析部1は句を含む表現の入力を受け付ける。言語分析部1は、既存の形態素解析技術を用いて、句を単語に分割する。言語分析部1は形態素解析の結果に基づいて各単語に品詞を付与し、終助詞を特定する。言語分析部1は、各単語に付与された品詞に基づいて、終助詞の前(文頭側)の述部の主要素である動詞語幹と活用変化部分とをまとめて動詞部分として設定する。言語分析部1は、動詞部分と終助詞とに挟まれて残された部分があれば、当該部分を変化要因部としてまとめる。すなわち単語のいずれかは変化要因部である。言語分析部1は、このようなまとめる処理の代わりに、各単語に対して、終助詞のラベル、動詞部分のラベル、及び変化要因部のラベルを付与してよい。
At step S1, the
例えば句が「するみたいだよ」のとき、言語分析部1は、形態素解析の結果として、「する、動詞、基本形」、「みたいだ、助動詞、基本形」及び「よ、助詞、終助詞」の3つの要素を得る。このとき1つの要素は3つの情報を含む。3つの情報は、具体的には左から、字面である表層形、品詞大分類、及び、品詞小分類である。この句の場合、左から1つ目の単語である「する」が動詞部分であり、左から三つ目の単語である「よ」が終助詞であり、それらの間の単語「みたいだ」が変化要因部である。なお他の実施形態では、言語分析部1は、用いる形態素解析器によっては上記の句を更に細かい単位に分割してよい。
For example, when the phrase is "Suru mita da yo", the
別の機能として、言語分析部1は、「する」に動詞部分のラベルを、「みたいだ」に変化要因部のラベルを、「よ」に終助詞のラベルを与えることで、分割処理を行ってよい。
As another function, the
本実施形態では変化要因部が存在しないことをφで表す。したがって言語分析部1は、句が「するよ」の場合、当該句を「する」と「φ」と「よ」とへ分割する。
In this embodiment, φ indicates that there is no change factor portion. Therefore, when the phrase is ``suruyo'', the
ステップS2にて言語分析部1は、句に変化要因部が存在する否かを判定する。変化要因部が存在しないとき、言語分析部1は終助詞と動詞部分とを尺度値制御量変換部3へ送信する。変化要因部が存在するとき、言語分析部1は、終助詞、動詞部分及び変化要因部を尺度化部2へ送信する。
At step S2, the
ステップS2にて言語分析部1が、単語内に変化要因部が存在すると判定したとき、ステップS3にて尺度化部2は変化要因部に対応する尺度値を決定する。具体的には尺度化部2は様々な句の尺度値を、確信度(確信の度合い)、指摘度(指摘行為である度合い)、主張度(主張の強さの度合い)、などの観点から評点付けすることで得ることができる。当該評点付けは例えば、1人以上の人が例えば手作業等にて、各句の印象が図3に示すような印象対のどこに位置するかを判断して行う。尺度化部2は、尺度値として、それらの評点の平均値等を設定可能である。
When the
別の機能として、尺度化部2は、この尺度値と表現との対応付けに、例えば図4に示すような表を用いることが可能である。当該表は例えば1以上の人によって手作業等にて作成される。
As another function, the
別の機能として尺度化部2は、言語表現の違いを吸収する目的で、例えば、変化要因部をカテゴリカルな説明変数とし尺度値を連続値の従属変数とする、数量化I類のモデルを用いてよい。これにより尺度化部2は、変化要因部に対応する尺度値を決定することが可能である。
Another function of the
尺度化部2は数量化I類にて、カテゴリカル変数とその重み係数の線形和で連続値の従属変数の値を決定する。この重み係数は、事前に集めておいた従属変数の値とそれに対応するカテゴリカル変数の多数の組から計算される。尺度化部2は、上記のさまざまな句に現れる変化要因部を構成する単語に対してカテゴリカル変数を1つずつ割り当てておく。尺度化部2は、ある変化要因部に対応する尺度値を決定する場合には、その変化要因部に含まれる単語に対応するカテゴリカル変数を1とし、その重みとの積和演算で尺度値を決定する。データから重みを決めるなどの、一般的な数量化理論での処理は下記の参考文献1等に開示される。その記述はここでは割愛する。
参考文献1:駒沢勉、「数量化理論とデータ処理」、朝倉書店、1982年
In the quantification class I, the
Reference 1: Tsutomu Komazawa, "Quantification Theory and Data Processing", Asakura Shoten, 1982
別の機能として尺度化部2は、変化要因部を構成する各単語を、その各単語を表わす実数値ベクトルに変換し、変化要因部を構成する各単語を文頭から文末までの順に受け付ける数値変換器(例えば巡回型ニューラルネットなど)を用いて、変化要因部に対応する尺度値を決定してよい。離散的な単語を実数値ベクトルに変換するこのような処理はWord Embeddingと呼ばれる。この処理は次の参考文献2等に開示されるのでここでの説明を割愛する。
参考文献2:Mikolov Tomas、Sutskever Ilya、Chen Kai、Corrado Greg、Dean Jeffrey、「Distributed Representations of Words and Phrases and their Compositionality」、[Online]、2013年、[平成30年6月1日検索]、arXiv:1310.4546、インターネット〈URL:https://arxiv.org/abs/1310.4546〉
As another function, the
Reference 2: Mikolov Tomas, Sutskever Ilya, Chen Kai, Corrado Greg, Dean Jeffrey, "Distributed Representations of Words and Phrases and their Compositionality", [Online], 2013, [searched June 1, 2018], arXiv : 1310.4546, Internet <URL: https://arxiv.org/abs/1310.4546>
また尺度化部2は、上記のように変化要因部の言語表現の確信度、指摘度及び主張度を直接求める代わりに、確信度、指摘度、主張度などの尺度値を、変化要因部に対する一般的な印象評価から求めることも可能である。例えば尺度化部2は、変化要因部に対して、一般的な印象評価で用いられる単語対(例えば、鈍い-鋭い、澄んだ-濁った、暗い-明るい、汚い-きれい、尖った-丸まった、重い-軽い、固い-柔らかい、派手な-地味な、太い-細い、ざらざらした-さらさらした、等)のどちらに近いかを定量的に評価した結果に対して複数人に渡る平均化を行なって尺度化してよい。当該結果は例えば人の手作業により与えられてよい。尺度化部2はそれぞれの尺度値を求める場合には上記と同様の数量化I類又は巡回型ニューラルネットワークを用いてよい。
In addition, instead of directly obtaining the degree of certainty, the degree of indication, and the degree of assertion of the linguistic expression of the change factor portion as described above, the
図2のステップS4にて尺度値制御量変換部3は、変化要因部に対応する尺度値を、任意の変換式を用いて韻律制御量に変換する。本実施形態の韻律制御量は、一例として基本周波数の変化量である。当該変化量は、変化要因部の末尾の基本周波数から、当該変化要因部の影響を受ける終助詞の基本周波数への変化量である。なおステップS2にて変化要因部が存在しないと判定された場合、尺度値制御量変換部3は、韻律制御量を所定の定数に設定してよい。
At step S4 in FIG. 2, the scale value
図5は、表現(図の「判断のモダリティ」)ごとの基本周波数の上昇量(図の「F0上昇量(log)」)の例を示す。図5において、横軸の左から右に向かう順に、変化要因部の表現が、尺度値の1つである確信度(折れ線グラフ参照)が高い順に並ぶ。各表現には、対話時の基本周波数の上昇量と、読み上げ時の基本周波数の上昇量とが柱状グラフで対応付けられる。 FIG. 5 shows an example of the amount of increase in the fundamental frequency (“F0 increase (log)” in the figure) for each expression (“modality of judgment” in the figure). In FIG. 5 , representations of the change factor part are arranged in order from left to right on the horizontal axis in descending order of confidence (see the line graph), which is one of the scale values. Each expression is associated in a columnar graph with the amount of increase in the fundamental frequency during dialogue and the amount of increase in the fundamental frequency during reading.
例えば図5の最も左に記載される「にちがいない」との表現の基本周波数の上昇量は、対話時に約-0.18で、読み上げ時に約-0.08である。すなわち、当該表現の末尾の「い」から、当該表現直後の終助詞(例えば「よ」)への基本周波数は下降する。よって声が低く変化することが読み取れる。 For example, the amount of increase in the fundamental frequency of the expression "must be" shown on the far left in FIG. 5 is about -0.18 during dialogue and about -0.08 during reading. That is, the fundamental frequency from "i" at the end of the expression to the final particle immediately following the expression (for example, "yo") descends. Therefore, it can be read that the voice changes to low.
図2のステップS4にて尺度値制御量変換部3は、例えば図5に示す値を用いて、対話時又は読み上げ時のうち対応する柱状グラフの高さに応じた基本周波数上昇量へと尺度値を変換して韻律を制御する。別の機能として、尺度値制御量変換部3は、変化要因部の基本周波数の変動量、又は、動詞部分の変動量を韻律制御量に設定してもよい。
In step S4 of FIG. 2, the scale value control
尺度値制御量変換部3は、韻律の制御を次の参考文献3の指令応答モデルを用いて行なうことができる。
参考文献3:H. Fujisaki and S. Nagashima、「A model for the synthesis of pitch contours of connected speech」、1969年、Annual Report of the Engineering Research Institute」、Faculty of Engineering、University of Tokyo、pp.53-60
The scale value control
Reference 3: H. Fujisaki and S. Nagashima, "A model for the synthesis of pitch contours of connected speech", 1969, Annual Report of the Engineering Research Institute, Faculty of Engineering, University of Tokyo, pp.53- 60
この場合には尺度値制御量変換部3は、指令応答モデルが用いるフレーズ成分又はアクセント成分の大きさ、並びに、生起及び効力を失う時刻等の複数の制御量を用いてよい。
In this case, the scale value control
上記いずれの場合も、尺度値制御量変換部3は尺度化部2で得られた1つ以上の尺度値を韻律制御量へ変換する。尺度値制御量変換部3は当該変換の際、上記の1つ以上の尺度値を説明変数として、韻律制御量を従属変数として、制御量毎個別に変換する線形若しくは非線形の重回帰モデル、又は、同時に変換するニューラルネットワークを用いることが可能である。
In any of the above cases, the scale value control
図2のステップS5にて韻律生成部4は尺度値制御量変換部3で得られた制御量に基づいて韻律生成を行なう。例えば制御量として基本周波数の上昇量を用いる場合、韻律生成部4は、基本周波数の上昇量が正であれば基本周波数が上昇する(声が高くなる)ように、あるいは、当該上昇量が負の値であれば基本周波数が下降する(声が低くなる)ように、句内の基本周波数を制御することが可能である。
At step S5 in FIG. 2, the
韻律生成部4は、制御量として上記の参考文献3の指令応答モデルの制御量を用いる場合、フレーズ成分とアクセント成分との大きさにより声の高さの変化を制御し、それらの成分の生起時刻により基本周波数の立ち上がりの緩急を制御可能である。
When the control amount of the command response model of
以上のように本実施形態によれば、韻律制御装置Dは、終助詞の前側につく要素が細かく変わっても、それに対応する多様な韻律制御が可能である。具体的には韻律制御装置Dは、動詞部分、終助詞、それらの間の変化要因部といった、句を構成する表現の各部の影響を加味し、それらを一旦1以上の尺度値に変換して、更に尺度値から韻律制御量に変換する。これにより細かな意図又は意味に応じて、柔軟に韻律の程度を制御することが可能である。 As described above, according to the present embodiment, the prosody control device D can perform various prosody controls corresponding to minute changes in the element that precedes the final particle. Specifically, the prosody control device D considers the influence of each part of the expressions that make up the phrase, such as the verb part, the final particle, and the change factor part between them, and once converts them into a scale value of 1 or more. , and further converts the scale value into the prosody control amount. This makes it possible to flexibly control the degree of prosody according to detailed intentions or meanings.
また本実施形態によれば、言語分析部1は句に変化要因部が存在するか否かを判定し、句に変化要因部が存在しないと判定されたとき、尺度値制御量変換部3は制御量として所定の定数を設定する。このため、変化要因部の有無にかかわらず、句に対し、柔軟で多様な韻律制御が可能である。
Further, according to this embodiment, the
上記した実施形態は一例である。発明の趣旨及び範囲内で、当該実施形態に対して多くの変更及び置換ができることは当業者に明らかである。したがって、本開示は、上述の実施形態によって制限するものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形又は変更が可能である。例えば、実施例の構成図に記載の複数の構成ブロックを1つに組み合わせたり、あるいは1つの構成ブロックを分割したりすることが可能である。 The above-described embodiment is an example. It will be apparent to those skilled in the art that many modifications and substitutions can be made to the embodiments within the spirit and scope of the invention. Therefore, the disclosure should not be construed as limited by the above-described embodiments, and various modifications and changes are possible without departing from the scope of the claims. For example, it is possible to combine a plurality of configuration blocks described in the configuration diagrams of the embodiments into one, or divide one configuration block.
本発明の装置はコンピュータとプログラムによっても実現でき、プログラムを記録媒体に記録することも、ネットワークを通して提供することも可能である。例えば韻律制御装置Dをコンピュータで構成する場合、各機能を実現する処理内容を記述したプログラムを、当該コンピュータの内部又は外部の記憶手段に格納しておき、当該コンピュータの中央演算処理装置(CPU)によってこのプログラムを読み出して実行させることでコンピュータを機能させることができる。また、このようなプログラムは、例えばDVD又はCD-ROM等の可搬型記録媒体の販売、譲渡、貸与等により流通させることができるほか、そのようなプログラムを、例えばネットワーク上にあるサーバの記憶手段に記憶しておき、ネットワークを介してサーバから他のコンピュータにそのプログラムを転送することにより、流通させることができる。また、そのようなプログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラム又はサーバから転送されたプログラムを、一旦、自己の記憶手段に格納することができる。また、このプログラムの別の実施態様として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、更に、このコンピュータにサーバからプログラムが転送される度に、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。 The apparatus of the present invention can also be realized by a computer and a program, and the program can be recorded on a recording medium or provided through a network. For example, when the prosody control device D is configured by a computer, a program describing the processing contents for realizing each function is stored in a storage means inside or outside the computer, and the central processing unit (CPU) of the computer stores the program. By reading and executing this program, the computer can function. In addition, such programs can be distributed by selling, assigning, or lending portable recording media such as DVDs or CD-ROMs. , and can be distributed by transferring the program from a server to another computer via a network. Also, a computer that executes such a program can once store, for example, a program recorded on a portable recording medium or a program transferred from a server in its own storage means. Also, as another embodiment of this program, the computer may read the program directly from a portable recording medium and execute processing according to the program. In addition, it is also possible to sequentially execute processing according to the received program.
D 韻律制御装置
1 言語分析部
2 尺度化部
3 尺度値制御量変換部
4 韻律生成部
D
Claims (3)
前記変化要因部に対応する尺度値を決定する尺度化部と、
前記尺度値を韻律制御量へ変換する尺度値制御量変換部と、
前記韻律制御量に基づいて前記表現の韻律を制御する韻律生成部と、
を有し、
前記句に前記変化要因部が存在しないと前記言語分析部により判定されると、前記尺度値制御量変換部により前記韻律制御量として所定の定数を設定する、韻律制御装置。 Receiving an input of an expression including a phrase, dividing the phrase into words, identifying a final particle and a verb part, and if there is a part sandwiched between the final particle and the verb part, the part is treated as a change factor part. a linguistic analyzer configured as
a scaling unit that determines a scale value corresponding to the variable factor;
a scale value control amount conversion unit that converts the scale value into a prosody control amount;
a prosody generator that controls the prosody of the expression based on the prosody control amount;
has
A prosody control device , wherein, when the language analysis unit determines that the change factor part does not exist in the phrase, the scale value control amount conversion unit sets a predetermined constant as the prosody control amount .
尺度化部により、前記変化要因部に対応する尺度値を決定するステップと、
尺度値制御量変換部により、前記尺度値を韻律制御量へ変換するステップと、
韻律生成部により、前記韻律制御量に基づいて前記表現の韻律を制御するステップと、
前記句に前記変化要因部が存在しないと前記言語分析部により判定されると、前記尺度値制御量変換部により前記韻律制御量として所定の定数を設定するステップと、
を有する韻律制御方法。 The language analysis unit receives an input of an expression including a phrase, divides the phrase into words, identifies a final particle and a verb part, and if there is a part sandwiched between the final particle and the verb part, setting the portion as the variable factor portion;
determining, by a scaling unit, a scale value corresponding to the variable factor;
a step of converting the scale value into a prosodic control quantity by a scale value control quantity conversion unit;
controlling the prosody of the expression based on the prosody control amount by a prosody generator;
setting a predetermined constant as the prosody control amount by the scale value control amount conversion unit when the language analysis unit determines that the change factor part does not exist in the phrase;
A prosody control method having
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2018133062A JP7125599B2 (en) | 2018-07-13 | 2018-07-13 | Prosody control device, prosody control method and program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2018133062A JP7125599B2 (en) | 2018-07-13 | 2018-07-13 | Prosody control device, prosody control method and program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2020012867A JP2020012867A (en) | 2020-01-23 |
| JP7125599B2 true JP7125599B2 (en) | 2022-08-25 |
Family
ID=69169803
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2018133062A Active JP7125599B2 (en) | 2018-07-13 | 2018-07-13 | Prosody control device, prosody control method and program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7125599B2 (en) |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2004145015A (en) | 2002-10-24 | 2004-05-20 | Fujitsu Ltd | Text-to-speech synthesis system and method |
| WO2007138944A1 (en) | 2006-05-26 | 2007-12-06 | Nec Corporation | Information giving system, information giving method, information giving program, and information giving program recording medium |
Family Cites Families (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH03249800A (en) * | 1990-02-28 | 1991-11-07 | Nec Corp | Text voice synthesizer |
-
2018
- 2018-07-13 JP JP2018133062A patent/JP7125599B2/en active Active
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2004145015A (en) | 2002-10-24 | 2004-05-20 | Fujitsu Ltd | Text-to-speech synthesis system and method |
| WO2007138944A1 (en) | 2006-05-26 | 2007-12-06 | Nec Corporation | Information giving system, information giving method, information giving program, and information giving program recording medium |
Non-Patent Citations (2)
| Title |
|---|
| グリーンバーグ陽子,外3名,語彙が与える印象に基づく対話韻律生成,日本音響学会誌,2011年02月,第67巻,第2号,p.65-74 |
| 高田一眞,匂坂芳典,判断のモダリティに基づく対話韻律の分析,日本音響学会講演論文集,2017年09月,p.203-204 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2020012867A (en) | 2020-01-23 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR102398993B1 (en) | Apparatus for generating text and method thereof | |
| US20190018838A1 (en) | Electronic device and method for text processing | |
| Tasnim et al. | Detecting depression from voice | |
| CN107273352B (en) | A word embedding learning model and training method based on Zolu function | |
| US11087745B2 (en) | Speech recognition results re-ranking device, speech recognition results re-ranking method, and program | |
| Kimura et al. | Comparison of speech recognition performance between Kaldi and Google cloud speech API | |
| CN114357152A (en) | Information processing method, information processing device, computer-readable storage medium and computer equipment | |
| Hettiarachchi et al. | BRUMS at SemEval-2020 task 3: Contextualised embeddings for predicting the (graded) effect of context in word similarity | |
| CN117828072B (en) | A conversation classification method and system based on heterogeneous graph neural network | |
| Gupta et al. | Hybrid deep learning based automatic speech recognition model for recognizing non-Indian languages | |
| CN117764669A (en) | Article recommendation method, device, equipment, medium and product | |
| CN116861855A (en) | Multi-mode medical resource determining method, device, computer equipment and storage medium | |
| JP7125599B2 (en) | Prosody control device, prosody control method and program | |
| JP6082657B2 (en) | Pose assignment model selection device, pose assignment device, method and program thereof | |
| Sheikhan | Generation of suprasegmental information for speech using a recurrent neural network and binary gravitational search algorithm for feature selection | |
| JP2024034725A (en) | Information processing system, information processing method, and program | |
| Song et al. | Multimodal representation: Kneser-ney smoothing/skip-gram based neural language model | |
| Přibil et al. | GMM-based evaluation of emotional style transformation in czech and slovak | |
| US20180276568A1 (en) | Machine learning method and machine learning apparatus | |
| Abazari et al. | Vortex shedding modes around oscillating non-uniform double heave plates | |
| JP2024080119A (en) | Document classification device, method and program | |
| JP2016048463A (en) | Next utterance candidate ranking device, method and program | |
| Zaid et al. | Jewelry shop conversational chatbot | |
| JP6773074B2 (en) | Response generation method, response generator and response generation program | |
| Singh et al. | Straight-based emotion conversion using quadratic multivariate polynomial |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20180713 |
|
| A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A80 Effective date: 20180731 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201113 |
|
| A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20201113 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20201113 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210831 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210914 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211104 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220208 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20220406 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220419 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220712 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220725 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7125599 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |