JPH0442680B2 - - Google Patents
Info
- Publication number
- JPH0442680B2 JPH0442680B2 JP60243564A JP24356485A JPH0442680B2 JP H0442680 B2 JPH0442680 B2 JP H0442680B2 JP 60243564 A JP60243564 A JP 60243564A JP 24356485 A JP24356485 A JP 24356485A JP H0442680 B2 JPH0442680 B2 JP H0442680B2
- Authority
- JP
- Japan
- Prior art keywords
- pitch
- boundary
- accent
- accent phrase
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000605 extraction Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 238000000034 method Methods 0.000 description 2
- 238000007906 compression Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明は、音声蓄積サービス等に用いる音声編
集装置に関する。DETAILED DESCRIPTION OF THE INVENTION (Field of Industrial Application) The present invention relates to an audio editing device used for audio storage services and the like.
(従来技術とその問題点)
従来、音声の蓄積サービスにおいては、符号化
によるデータ量の圧縮等の処理は行なわれている
が、音声の内容に対しては処理は行なつていなか
つた。そこで、出力される音声を書きとる時に筆
記する速度に合わせて休止区間を適宜挿入するな
どということは不可能であつた。例えば、電子通
信学会技術研究報告SE79−98に「音声蓄積サー
ビスの構想」と題して発表された論文において
は、音声の符号化によるデータ圧縮・蓄積・再生
については言及されているが、音声の内容に立ち
入つた処理は、なされていない。(Prior Art and its Problems) Conventionally, in audio storage services, processing such as compression of the amount of data through encoding has been performed, but no processing has been performed on the content of the audio. Therefore, it has been impossible to insert pause sections as needed to match the writing speed when writing down the output audio. For example, in a paper published in IEICE Technical Report SE79-98 entitled "Sound Storage Service Concept," it mentions data compression, storage, and playback through audio encoding; No in-depth processing has been done on the contents.
(発明の目的)
本発明の目的は、入力された音声のアクセント
句境界を検出することにより、アクセント句ごと
に休止区間を挿入して聴取による書き取りを容易
にする音声編集装置を提供することにある。(Object of the Invention) An object of the present invention is to provide a speech editing device that inserts a pause section for each accent phrase to facilitate dictation by listening by detecting accent phrase boundaries in input speech. be.
(問題点を解決するための手段)
前述の問題点を解決するために本発明が提供す
る音声編集装置は、入力された音声のピツチ周波
数の時系列を抽出するピツチ抽出手段と、前記ピ
ツチ周波数の時系列から前記音声のアクセント句
の境界のアドレスを検出する手段と、前記アクセ
ント句境界のアドレスで区切られる前記アクセン
ト句ごとに前記波形メモリに前記音声を出力させ
る手段と、前記波形メモリから出力された前記音
声にアクセント句境界ごとに休止区間を挿入する
境界処理手段とを有してなる。(Means for Solving the Problems) In order to solve the above-mentioned problems, the audio editing device provided by the present invention includes pitch extraction means for extracting a time series of pitch frequencies of input audio; means for detecting addresses of accent phrase boundaries of the speech from a time series of the speech, means for outputting the speech to the waveform memory for each of the accent phrases separated by the addresses of the accent phrase boundaries, and outputting from the waveform memory. and a boundary processing means for inserting a pause section into the voice at each accent phrase boundary.
(発明の原理)
ここで本発明の原理について説明する。本発明
による音声編集装置は、ピツチ周波数の谷となつ
ている区間からアクセント句境界を推定し、出力
に際しては、そのアクセント句境界に休止区間を
挿入することにより、聴取による書き取りを容易
にするものである。以下、本発明の原理を例をも
とに説明する。第2図は、「子供の時から損ばか
りしている」という発話のピツチ周波数の時間変
化を表わした例である。縦軸は入力音声のピツチ
周波数であり、横軸は時間軸である。このピツチ
周波数の時系列は、例えば、「日本音響学会講演
論文集」(1977年10月)35〜36ページに「ピツチ
周期系列最適選択の一方式」と題して発表された
論文に述べられた方法によつて得ることができ
る。ピツチ周波数の軌跡がなだらかな谷をなす部
分をアクセント句境界として検出する。なだらか
な谷は、例えば、ピツチ時系列p(i),i=1…
…Nの移動平均
P(i)=p(i−1)+2p(i)+p(i+1)/4
の極
小となる部分として得ることができる。第2図に
おけるa点およびb点は、アクセント句境界の例
である。蓄積された音声を出力する際は、このア
クセント句境界に適宜休止区間を挿入することに
より、ユーザーが聴取して書き取るのに適した速
度で音声を出力することが可能となる。(Principle of the invention) The principle of the invention will now be explained. The audio editing device according to the present invention estimates the accent phrase boundary from the interval where the pitch frequency is a valley, and when outputting it, inserts a pause interval at the accent phrase boundary, thereby facilitating dictation by listening. It is. Hereinafter, the principle of the present invention will be explained based on an example. FIG. 2 is an example showing the change in pitch frequency over time for the utterance "I have been losing money ever since I was a child." The vertical axis is the pitch frequency of the input audio, and the horizontal axis is the time axis. This time series of pitch frequencies is described, for example, in a paper published in the Proceedings of the Acoustical Society of Japan (October 1977), pages 35-36, entitled ``A method for optimal selection of pitch periodic sequences.'' It can be obtained by the following method. The part where the locus of the pitch frequency forms a gentle valley is detected as an accent phrase boundary. A gentle valley is, for example, a pitch time series p(i), i=1...
…N moving average P(i)=p(i-1)+2 p (i)+p(i+1)/4
It can be obtained as the minimum part of . Points a and b in FIG. 2 are examples of accent phrase boundaries. When outputting the accumulated audio, by inserting pauses as appropriate at accent phrase boundaries, it is possible to output the audio at a speed suitable for the user to listen to and write down.
(実施例)
次に、図面を参照して本発明の実施例を説明す
る。(Example) Next, an example of the present invention will be described with reference to the drawings.
第1図は本発明の一実施例を示すブロツク図で
ある。入力音声1は、波形メモリ5に保持され、
またピツチ抽出部2に供給される。ピツチ抽出部
2は、供給された入力音声1からピツチ周波数の
時系列を計算し、アクセント句境界検出部3に供
給する。アクセント句境界検出部3は、供給され
たピツチ周波数の時系列より谷となる部分を検出
し、その部分の波形上でのアドレスを境界アドレ
スメモリ4に出力する。出力指令8の入力によ
り、制御回路6は、境界アドレスメモリ4より供
給された句境界アドレスを用いて波形メモリより
音声波形をアクセント句ごとに境界処理部7へ出
力せしめる。境界処理部7は、供給されたアクセ
ント句単位の音声波形に休止区間を付加して出力
する。 FIG. 1 is a block diagram showing one embodiment of the present invention. Input audio 1 is held in waveform memory 5,
It is also supplied to the pitch extraction section 2. The pitch extractor 2 calculates a time series of pitch frequencies from the supplied input speech 1 and supplies it to the accent phrase boundary detector 3. The accent phrase boundary detection unit 3 detects a valley portion from the time series of pitch frequencies supplied, and outputs the address on the waveform of that portion to the boundary address memory 4. Upon input of the output command 8, the control circuit 6 uses the phrase boundary address supplied from the boundary address memory 4 to output the speech waveform from the waveform memory to the boundary processing unit 7 for each accented phrase. The boundary processing unit 7 adds a pause section to the supplied speech waveform of each accent phrase and outputs the speech waveform.
(発明の効果)
本発明によれば、入力された音声のアクセント
句境界を検出することにより、アクセント句ごと
に休止区間を挿入して聴取による書き取りを容易
にする音声編集装置が得られる。(Effects of the Invention) According to the present invention, it is possible to obtain a speech editing device that inserts a pause section for each accent phrase to facilitate dictation by listening by detecting accent phrase boundaries in input speech.
第1図は本発明の一実施例を示すブロツク図、
第2図は本発明の原理を説明するために示すピツ
チ周波数軌跡図である。
2……ピツチ抽出部、3……アクセント句境界
検出部、4……境界アドレスメモリ、5……波形
メモリ、6……制御回路、7……境界処理部。
FIG. 1 is a block diagram showing one embodiment of the present invention;
FIG. 2 is a pitch frequency locus diagram shown to explain the principle of the present invention. 2... Pitch extraction section, 3... Accent phrase boundary detection section, 4... Boundary address memory, 5... Waveform memory, 6... Control circuit, 7... Boundary processing section.
Claims (1)
出するピツチ抽出手段と、前記ピツチ周波数の時
系列から前記音声のアクセント句の境界のアドレ
スを検出する手段と、前記アクセント句境界のア
ドレスで区切られる前記アクセント句ごとに前記
波形メモリに前記音声を出力させる手段と、前記
波形メモリから出力された前記音声にアクセント
句境界ごとに休止区間を挿入する境界処理手段と
を有してなる音声編集装置。1. Pitch extraction means for extracting a time series of pitch frequencies of input speech, means for detecting addresses of boundaries of accent phrases of the voice from the time series of pitch frequencies, and means for detecting addresses of boundaries of accent phrases of the voice, separated by addresses of boundaries of accent phrases. A voice editing device comprising means for outputting the voice to the waveform memory for each accent phrase, and boundary processing means for inserting a pause section at each accent phrase boundary into the voice output from the waveform memory.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP60243564A JPS62102295A (en) | 1985-10-30 | 1985-10-30 | Voice editing apparatus |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP60243564A JPS62102295A (en) | 1985-10-30 | 1985-10-30 | Voice editing apparatus |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS62102295A JPS62102295A (en) | 1987-05-12 |
| JPH0442680B2 true JPH0442680B2 (en) | 1992-07-14 |
Family
ID=17105714
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP60243564A Granted JPS62102295A (en) | 1985-10-30 | 1985-10-30 | Voice editing apparatus |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS62102295A (en) |
-
1985
- 1985-10-30 JP JP60243564A patent/JPS62102295A/en active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS62102295A (en) | 1987-05-12 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR950009596A (en) | Video recording and playback apparatus and method for song accompaniment | |
| JPH0226240B2 (en) | ||
| JPS62115199A (en) | Voice responder | |
| JPS5982608A (en) | System for controlling reproducing speed of sound | |
| JPH0442680B2 (en) | ||
| JPH10133678A (en) | Audio playback device | |
| JPH0442679B2 (en) | ||
| JP4979336B2 (en) | Audio output device | |
| KR970008129A (en) | Reserved playback method of audio signal playback device | |
| JPS63231493A (en) | Reciting of sentence using voice rule synthesizer | |
| JPH07295465A (en) | Language learning device | |
| JP3201327B2 (en) | Recording and playback device | |
| JPS6331120Y2 (en) | ||
| TW394928B (en) | A process for adjusting voice speed at a fixed frequency | |
| JPS5644175A (en) | Reproduction system | |
| KR100194659B1 (en) | Voice recording method of digital recorder | |
| JPH0664915B2 (en) | Audio signal recording / reproducing method using solid-state memory | |
| JP3321578B2 (en) | Voice synthesis guidance device | |
| JPH05344214A (en) | Guidance output device | |
| JP2814385B2 (en) | Slowdown tape recorder for writing | |
| JPH087595B2 (en) | Audio signal playback device | |
| JPH08292796A (en) | Reproducing device | |
| JP2821276B2 (en) | Speech synthesizer | |
| JPH08255000A (en) | Voice signal reproducing device | |
| JPS62231992A (en) | Voice analysis processing |