JPH0442679B2 - - Google Patents
Info
- Publication number
- JPH0442679B2 JPH0442679B2 JP60243566A JP24356685A JPH0442679B2 JP H0442679 B2 JPH0442679 B2 JP H0442679B2 JP 60243566 A JP60243566 A JP 60243566A JP 24356685 A JP24356685 A JP 24356685A JP H0442679 B2 JPH0442679 B2 JP H0442679B2
- Authority
- JP
- Japan
- Prior art keywords
- accent phrase
- pitch
- accent
- waveform
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明は、音声蓄積サービス等に用いる音声編
集装置に関する。
集装置に関する。
(従来技術とその問題点)
従来、音声の蓄積サービスにおいては、符号化
によるデータ量の圧縮等の処理は行なわれている
が、音声の内容に対しては処理は行なつていなか
つた。そこで、入力された音声からキーワードの
みを抽出して蓄積するなどという処理は不可能で
あつた。例えば、電子通信学会技術研究報告
SE79−98に「音声蓄積サービスの構想」と題し
て発表された論文においては、音声の蓄積・再生
については言及されているが、音声の内容に立ち
入つた処理は、なされていない。
によるデータ量の圧縮等の処理は行なわれている
が、音声の内容に対しては処理は行なつていなか
つた。そこで、入力された音声からキーワードの
みを抽出して蓄積するなどという処理は不可能で
あつた。例えば、電子通信学会技術研究報告
SE79−98に「音声蓄積サービスの構想」と題し
て発表された論文においては、音声の蓄積・再生
については言及されているが、音声の内容に立ち
入つた処理は、なされていない。
そこで、本発明の目的は、入力された音声のア
クセント句境界を検出し、強調して発声されたア
クセント句のみを選択して蓄積するような、キー
ワード抽出機能をもつ音声編集装置を提供するこ
とにある。
クセント句境界を検出し、強調して発声されたア
クセント句のみを選択して蓄積するような、キー
ワード抽出機能をもつ音声編集装置を提供するこ
とにある。
(問題点を解決するための手段)
前述の問題点を解決するために本発明が提供す
る音声編集装置は、入力された音声のピツチ周波
数の時系列を抽出するピツチ抽出手段と、前記入
力音声を一時記憶しておく波形一時メモリと、前
記ピツチ周波数の時系列から前記入力音声のアク
セント句の境界を検出する手段と、前記アクセン
ト句の強調度を算出する手段と、前記アクセント
句の強調度の大きさによりアクセント句を選択
し、選択されたアクセント句に対応する音声波形
を前記波形一時メモリから出力する手段とを有し
てなる。
る音声編集装置は、入力された音声のピツチ周波
数の時系列を抽出するピツチ抽出手段と、前記入
力音声を一時記憶しておく波形一時メモリと、前
記ピツチ周波数の時系列から前記入力音声のアク
セント句の境界を検出する手段と、前記アクセン
ト句の強調度を算出する手段と、前記アクセント
句の強調度の大きさによりアクセント句を選択
し、選択されたアクセント句に対応する音声波形
を前記波形一時メモリから出力する手段とを有し
てなる。
(発明の原理)
ここで本発明の原理について説明する。日本語
音声は、アクセント核を1つ保有する発声のまと
まりであるアクセント句により構成されている。
本発明による音声編集装置は、ピツチ周波数が谷
となつている区間よりアクセント句境界を推定
し、推定されたアクセント句の平均ピツチレベル
が、十分に大であるならば選択することによつ
て、強調されたアクセント句のみを抽出し、蓄
積・出力するものである。以下、本発明の原理を
例をもとに説明する。
音声は、アクセント核を1つ保有する発声のまと
まりであるアクセント句により構成されている。
本発明による音声編集装置は、ピツチ周波数が谷
となつている区間よりアクセント句境界を推定
し、推定されたアクセント句の平均ピツチレベル
が、十分に大であるならば選択することによつ
て、強調されたアクセント句のみを抽出し、蓄
積・出力するものである。以下、本発明の原理を
例をもとに説明する。
第2図は、「子供の時から損ばかりしている」
という発話のピツチ周波数の時間変化を表わした
例である。縦軸は、入力音声のピツチ周波数であ
り、横軸は、時間軸である。このピツチ周波数の
時系列は、例えば、「日本音響学会講演論文集」
(1977年10月)35〜36ページに「ピツチ周期系列
最適選択の一方式」と題して発表された論文に述
べられた方法によつて得ることができる。ピツチ
周波数の軌跡がなだらかな谷をなす部分をアクセ
ント句境界として検出する。なだらかな谷は、例
えば、ピツチの時系列p(i),i=1……Nの移動
平均 p(i)=p(i−1)+2p(i)+p(i+1)/4 の極小となる部分として得ることができる。第2
図におけるa点およびb点は、アクセント句境界
の例である。また、一点鎖線は、各アクセント句
の平均ピツチレベルをあらわしている。この平均
ピツチレベルが、例えば、あるしきい値θを超え
るならば、そのアクセント句を選択するようにす
る。
という発話のピツチ周波数の時間変化を表わした
例である。縦軸は、入力音声のピツチ周波数であ
り、横軸は、時間軸である。このピツチ周波数の
時系列は、例えば、「日本音響学会講演論文集」
(1977年10月)35〜36ページに「ピツチ周期系列
最適選択の一方式」と題して発表された論文に述
べられた方法によつて得ることができる。ピツチ
周波数の軌跡がなだらかな谷をなす部分をアクセ
ント句境界として検出する。なだらかな谷は、例
えば、ピツチの時系列p(i),i=1……Nの移動
平均 p(i)=p(i−1)+2p(i)+p(i+1)/4 の極小となる部分として得ることができる。第2
図におけるa点およびb点は、アクセント句境界
の例である。また、一点鎖線は、各アクセント句
の平均ピツチレベルをあらわしている。この平均
ピツチレベルが、例えば、あるしきい値θを超え
るならば、そのアクセント句を選択するようにす
る。
このように本発明において、入力音声は、アク
セント句ごとに区切られ、それらのうち、ピツチ
レベルが十分大きいもののみが選択されて、蓄
積・出力されるので、音声の強調して発声された
部分を選択的に蓄積・出力でき、データ圧縮効果
のある音声編集装置が得られる。
セント句ごとに区切られ、それらのうち、ピツチ
レベルが十分大きいもののみが選択されて、蓄
積・出力されるので、音声の強調して発声された
部分を選択的に蓄積・出力でき、データ圧縮効果
のある音声編集装置が得られる。
(実施例)
次に、図面を参照して本発明の実施例を説明す
る。
る。
第1図は本発明の一実施例を示すブロツク図で
ある。入力音声1は、波形一時メモリ5に保持さ
れ、またピツチ抽出部2に供給される。ピツチ抽
出部2は、供給された入力音声1よりピツチ周波
数の時系列を計算し、アクセント句境界検出部3
に供給する。アクセント句境界検出部3は、供給
されたピツチ周波数の時系列より谷となる部分を
検出し、その部分の波形上でのアドレスを境界ア
ドレスメモリ4に出力する。また、アクセント句
境界検出部3は、アクセント句ごとに区切られた
ピツチ周波数の時系列をピツチレベル算出部6に
出力する。ピツチレベル算出部6は、各アクセン
ト句の平均ピツチレベルを算出する。アクセント
句選択部7は、ピツチレベル算出部6より供給さ
れた各アクセント句の平均ピツチレベルが十分大
きいか否かを判定し、アクセント句選択可否の情
報を出力する。波形一時メモリ5中に保持された
音声波形からは、境界アドレスメモリ4より供給
されたアクセント句境界の波形上でのアドレスの
情報と、アクセント句選択部7より供給されたア
クセント句選択可否の情報をもとに、選択された
アクセント句に対応する波形のみ、波形メモリ1
0に出力される。出力指令8の入力により、制御
回路9は、波形メモリより音声波形をアクセント
句ごとに境界処理部11へ出力せしめる。境界処
理部11は、供給されたアクセント句単位の音声
波形に適宜休止区間を付加して音声出力12を出
力する。
ある。入力音声1は、波形一時メモリ5に保持さ
れ、またピツチ抽出部2に供給される。ピツチ抽
出部2は、供給された入力音声1よりピツチ周波
数の時系列を計算し、アクセント句境界検出部3
に供給する。アクセント句境界検出部3は、供給
されたピツチ周波数の時系列より谷となる部分を
検出し、その部分の波形上でのアドレスを境界ア
ドレスメモリ4に出力する。また、アクセント句
境界検出部3は、アクセント句ごとに区切られた
ピツチ周波数の時系列をピツチレベル算出部6に
出力する。ピツチレベル算出部6は、各アクセン
ト句の平均ピツチレベルを算出する。アクセント
句選択部7は、ピツチレベル算出部6より供給さ
れた各アクセント句の平均ピツチレベルが十分大
きいか否かを判定し、アクセント句選択可否の情
報を出力する。波形一時メモリ5中に保持された
音声波形からは、境界アドレスメモリ4より供給
されたアクセント句境界の波形上でのアドレスの
情報と、アクセント句選択部7より供給されたア
クセント句選択可否の情報をもとに、選択された
アクセント句に対応する波形のみ、波形メモリ1
0に出力される。出力指令8の入力により、制御
回路9は、波形メモリより音声波形をアクセント
句ごとに境界処理部11へ出力せしめる。境界処
理部11は、供給されたアクセント句単位の音声
波形に適宜休止区間を付加して音声出力12を出
力する。
(発明の効果)
本発明によれば、入力された音声のアクセント
句境界を検出し、強調して発声されたアクセント
句のみを選択して蓄積するような、キーワード抽
出機能をもつ音声編集装置が得られる。
句境界を検出し、強調して発声されたアクセント
句のみを選択して蓄積するような、キーワード抽
出機能をもつ音声編集装置が得られる。
第1図は本発明の一実施例を示すブロツク図、
第2図は本発明の原理を説明するためにピツチ周
波数の時系列の一例を示す図である。 2……ピツチ抽出部、3……アクセント句境界
検出部、4……境界アドレスメモリ、5……波形
一時メモリ、6……ピツチレベル算出部、7……
アクセント句選択部、9……制御回路、10……
波形メモリ、11……境界処理部。
第2図は本発明の原理を説明するためにピツチ周
波数の時系列の一例を示す図である。 2……ピツチ抽出部、3……アクセント句境界
検出部、4……境界アドレスメモリ、5……波形
一時メモリ、6……ピツチレベル算出部、7……
アクセント句選択部、9……制御回路、10……
波形メモリ、11……境界処理部。
Claims (1)
- 1 入力された音声のピツチ周波数の時系列を抽
出するピツチ抽出手段と、前記入力音声を一時記
憶しておく波形一時メモリと、前記ピツチ周波数
の時系列から前記入力音声のアクセント句の境界
を検出する手段と、前記アクセント句の強調度を
算出する手段と、前記アクセント句の強調度の大
きさによりアクセント句を選択し、選択されたア
クセント句に対応する音声波形を前記波形一時メ
モリから出力する手段とを有してなる音声編集装
置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP60243566A JPS62102296A (ja) | 1985-10-30 | 1985-10-30 | 音声編集装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP60243566A JPS62102296A (ja) | 1985-10-30 | 1985-10-30 | 音声編集装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS62102296A JPS62102296A (ja) | 1987-05-12 |
| JPH0442679B2 true JPH0442679B2 (ja) | 1992-07-14 |
Family
ID=17105743
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP60243566A Granted JPS62102296A (ja) | 1985-10-30 | 1985-10-30 | 音声編集装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS62102296A (ja) |
-
1985
- 1985-10-30 JP JP60243566A patent/JPS62102296A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS62102296A (ja) | 1987-05-12 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH02163819A (ja) | テキスト処理装置 | |
| KR930010852A (ko) | 음성인식장치 | |
| JP3881620B2 (ja) | 話速可変装置及び話速変換方法 | |
| JPS5982608A (ja) | 音声の再生速度制御方式 | |
| JPH0442679B2 (ja) | ||
| JPS597998A (ja) | 連続音声認識装置 | |
| JP4353084B2 (ja) | 映像再生方法及び装置及びプログラム | |
| JPH0442680B2 (ja) | ||
| KR0170659B1 (ko) | 오디오신호 재생장치의 반복재생방법 및 이에 적합한 장치 | |
| JPH0368399B2 (ja) | ||
| JPS613241A (ja) | 音声確認方式 | |
| KR100194659B1 (ko) | 디지탈 녹음기의 음성 녹음방법 | |
| JPS5644175A (en) | Reproduction system | |
| JPH064090A (ja) | テキスト音声変換方法および装置 | |
| JP3201327B2 (ja) | 録音再生装置 | |
| JPH0261847A (ja) | テープデッキ装置 | |
| JPH08202259A (ja) | 学習装置 | |
| JPS6326879Y2 (ja) | ||
| JPH07295465A (ja) | 語学学習装置 | |
| EP0360388B1 (en) | Method and apparatus for automatic address setting for recording and replay | |
| JP2962777B2 (ja) | 音声信号の時間軸伸長圧縮装置 | |
| JPH05344214A (ja) | ガイダンス出力装置 | |
| JPS59167576U (ja) | 音響装置 | |
| JPH0659696A (ja) | 音声応答装置における番号再生方法 | |
| JPH06274099A (ja) | 音声データ出力方式 |