Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JPS6239754B2 - - Google Patents
[go: Go Back, main page]

JPS6239754B2 - - Google Patents

Info

Publication number
JPS6239754B2
JPS6239754B2 JP56115767A JP11576781A JPS6239754B2 JP S6239754 B2 JPS6239754 B2 JP S6239754B2 JP 56115767 A JP56115767 A JP 56115767A JP 11576781 A JP11576781 A JP 11576781A JP S6239754 B2 JPS6239754 B2 JP S6239754B2
Authority
JP
Japan
Prior art keywords
pulse
audio signal
period
pitch
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP56115767A
Other languages
Japanese (ja)
Other versions
JPS5817497A (en
Inventor
Kazuo Kitagawa
Eiji Kira
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co Ltd filed Critical Tokyo Shibaura Electric Co Ltd
Priority to JP56115767A priority Critical patent/JPS5817497A/en
Publication of JPS5817497A publication Critical patent/JPS5817497A/en
Publication of JPS6239754B2 publication Critical patent/JPS6239754B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Analogue/Digital Conversion (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Measuring Fluid Pressure (AREA)

Description

【発明の詳細な説明】 この発明は、音声信号波形のピツチを検出する
装置に関する。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to an apparatus for detecting the pitch of an audio signal waveform.

音声信号波形を低い情報密度で記録、再生した
り、伝送したりする際に必要な処理の一つとし
て、有声音でのピツチ検出がある。このピツチ検
出の方法として、例えばLPC(線型予測)方式の
音声分析合成システムでは、一般に10段程度の白
色化フイルタでスペクトル包絡等の他の必要な音
声パラメータを抽出した後の残差信号をローパス
フイルタを通した後自己相関をとり、また移動平
均処理等をしてピツチ情報を得る方法がとられて
いるが、その計算量は膨大であり、ハードウエア
も大規模なものとなつている。またLPC方式の音
声分析合成システムでは、分析時のピツチ検出エ
ラーが再生音声の品質を損なう要因の一つとなつ
ているが、そのエラー訂正が手作業で行なわれて
いるため、分析コストが非常に高くなつている。
Pitch detection in voiced sounds is one of the necessary processes when recording, reproducing, or transmitting audio signal waveforms at low information density. As a method for pitch detection, for example, in a speech analysis and synthesis system using the LPC (linear prediction) method, the residual signal is generally low-passed after extracting other necessary speech parameters such as the spectral envelope using a whitening filter of about 10 stages. The method used is to take autocorrelation after passing through a filter and perform moving average processing to obtain pitch information, but the amount of calculation required is enormous and the hardware is also large-scale. In addition, in LPC-based speech analysis and synthesis systems, pitch detection errors during analysis are one of the factors that impair the quality of reproduced speech, but since error correction is done manually, analysis costs are extremely high. It's getting expensive.

これに対し、デルタ変調(適応型デルタ変調も
含む、以下同じ)方式により音声信号波形を記
録・再生したり伝送するシステムは、情報密度は
16Kb〜32Kb/sesとさほど低くないが、そのハ
ードウエアの簡単さと実時間性の点でLPC方式よ
り有利である。発明者らはこのようなデルタ変調
方式の記録再生あるいは伝送システムにおいて、
音声信号波形のうち有声音部のくり返し波形を実
時間で例えば4波毎に1波で代表して記録あるい
は伝送することによつて情報密度の低減を図るこ
とを検討している。その場合、有声音部のくり返
しの有無を検出する操作がピツチ検出であるが、
このピツチ検出にLPC方式におけると同様な方法
を用いたのでは構成上非常に無駄があるので、簡
単な構成によりピツチ検出を行なうことが要求さ
れてくる。
On the other hand, systems that record, playback, and transmit audio signal waveforms using delta modulation (including adaptive delta modulation, the same applies hereinafter) have a low information density.
Although it is not very low at 16Kb to 32Kb/ses, it is advantageous over the LPC method in terms of hardware simplicity and real-time performance. In such a delta modulation recording/reproducing or transmission system, the inventors
We are considering reducing the information density by recording or transmitting the repeated waveform of the voiced part of the audio signal waveform in real time, for example, with one wave representing every four waves. In that case, the operation to detect whether voiced parts are repeated is pitch detection.
If a method similar to that used in the LPC method is used for pitch detection, it would be very wasteful in terms of structure, so it is required to perform pitch detection with a simple structure.

この発明は上記の点に鑑みてなされたもので、
その目的は簡単な構成によつて音声信号波形のピ
ツチを正確に検出することができる音声ピツチ検
出装置を提供することにある。
This invention was made in view of the above points,
The object is to provide an audio pitch detection device that can accurately detect the pitch of an audio signal waveform with a simple configuration.

この発明では、音声信号波形の所定時間当りの
平均傾斜を逐次検出し、その傾斜が一定値を越え
た期間に対応するパルスを得る。そして、このパ
ルスの前縁を検出して比較的細いパルスを得、さ
らにこのパルスのうち前回パルスより一定時間以
上経過しした後のパルスのみを抽出して、音声信
号波形のピツチに相当する間隔のパルス列を得
る。
In this invention, the average slope of the audio signal waveform per predetermined time period is sequentially detected, and a pulse corresponding to a period in which the slope exceeds a certain value is obtained. Then, the leading edge of this pulse is detected to obtain a relatively thin pulse, and only those pulses after a certain period of time have elapsed since the previous pulse are extracted, and intervals corresponding to the pitch of the audio signal waveform are extracted. obtain a pulse train of

この発明によれば、LPC方式におけるピツチ検
出に比べ著しく簡単な構成によつて音声のピツチ
を検出することができるばかりでなく、検出誤り
を非常に少なくできる。
According to the present invention, it is possible not only to detect pitches in speech with a significantly simpler configuration than pitch detection in the LPC method, but also to greatly reduce detection errors.

以下、この発明の実施例を図面を参照して説明
する。
Embodiments of the present invention will be described below with reference to the drawings.

第1図はこの発明の一実施例を示したものであ
る。図において、入力端子1に入力される音声信
号は入力フイルタ2を介してデルタ変調方式のエ
ンコーダ3に加えられ、クロツク発振器4からの
クロツク信号に同期した符号化データとなる。そ
して、この符号化データが音声ピツチ検出部5に
入力される。この音声ピツチ検出部5は次のよう
に構成されている。
FIG. 1 shows an embodiment of the present invention. In the figure, an audio signal input to an input terminal 1 is applied to an encoder 3 using a delta modulation system via an input filter 2, and becomes encoded data synchronized with a clock signal from a clock oscillator 4. This encoded data is then input to the audio pitch detection section 5. This audio pitch detection section 5 is constructed as follows.

エンコーダ3の出力データは、ピツチ検出部5
内のシフトレジスタ11に、クロツク発振器4か
らのクロツク信号に従いシリアルに逐次入力され
る。シフトレジスタ11の各段の内容は並列に出
力され、各々ラダー抵抗12を介して加算器13
で加算される。
The output data of the encoder 3 is sent to the pitch detection section 5.
A clock signal from the clock oscillator 4 is serially input to the shift register 11 in the clock oscillator 4. The contents of each stage of the shift register 11 are output in parallel and sent to an adder 13 via a ladder resistor 12.
is added.

第2図は音声信号の音声音部の典型的な波形例
を示したもので、T0はピツチ周期、T1は第1フ
オルマントの周期を表わす。ここでシフトレジス
タ11の段数をN、クロツク信号の周期をτとす
ると、τ・N=Tの時間は第2図のように第1の
フオルマントの周期T1の半分以下の適当な値に
設定される。この時間Tの最適値は発声者の性別
等によつて異なるが、0.5〜2msec程度の範囲内
である。シフトレジスタ11の各段の入力をラダ
ー抵抗12を介して加算器13で加算すること
は、ラダー抵抗12の値がほぼ等しい、つまりシ
フトレジスタ11の各段の出力がほぼ同一ウエイ
トで加算されるとすれば、入力音声信号波形のT
なる単位時間当りの平均傾斜を検出することに相
当する。
FIG. 2 shows a typical waveform example of the audio sound portion of the audio signal, where T 0 represents the pitch period and T 1 represents the period of the first formant. Here, if the number of stages of the shift register 11 is N and the period of the clock signal is τ, then the time τ・N=T is set to an appropriate value less than half of the period T1 of the first formant as shown in Figure 2. be done. The optimum value of this time T varies depending on the gender of the speaker, etc., but is within the range of about 0.5 to 2 msec. Adding the inputs of each stage of the shift register 11 by the adder 13 via the ladder resistor 12 means that the values of the ladder resistor 12 are approximately equal, that is, the outputs of each stage of the shift register 11 are added with approximately the same weight. Then, T of the input audio signal waveform
This corresponds to detecting the average slope per unit time.

例えば、入力端子1への音声信号波形を第3図
aとすると、エンコーダ3においてbのクロツク
信号で符号化したデータはcとなり、そのときの
加算器13の出力波形はdのように示される。す
なわち、シフトレジスタ11は1つのデータが入
るとNビツト前のデータを1つ出し、加算器13
はシフトレジスタ11内のNビツトのデータの
“1”と“0”との差に応じた出力を出すので、
加算器13の出力は、シフトレジスタ11が
“1”が入つたとき“1”を出せば不変で“0”
を出せば1ステツプ上昇し、逆にシフトレジスタ
11が“0”が入つたときは不変または1ステツ
プ減少することになる。
For example, if the audio signal waveform to the input terminal 1 is shown as a in FIG. . That is, when the shift register 11 receives one piece of data, it outputs one piece of data N bits before, and the adder 13
outputs an output according to the difference between "1" and "0" of the N-bit data in the shift register 11, so
The output of the adder 13 remains unchanged as "0" if the shift register 11 outputs "1" when "1" is input.
If "0" is entered in the shift register 11, the shift register 11 will remain unchanged or decrease by one step.

加算器13の出力はコンパレータ14に入力さ
れ、第3図d中にVthで示す一定レベルと比較さ
れる。この結果、コンパレータ14の出力には、
第3図eに示すように加算器13の出力がVthを
越えた期間、換言すれば入力音声信号波形の単位
時間T当りの平均傾斜が一定値を越えた期間に対
応するパルスが得られる。
The output of the adder 13 is input to a comparator 14 and compared with a constant level indicated by Vth in FIG. 3d. As a result, the output of the comparator 14 is
As shown in FIG. 3e, a pulse is obtained that corresponds to a period in which the output of the adder 13 exceeds Vth, in other words, a period in which the average slope per unit time T of the input audio signal waveform exceeds a certain value.

コンパレータ14の出力は、第1の単安定マル
チバイブレータ15に加えられる。このマルチバ
イブレータ15は第3図eに示すコンパレータ1
4の出力パルスの立上り、つまり前縁でトリガさ
れ、同図fに示すような細いパルスを発生する。
この第1の単安定マルチバイブレータ15の出力
は、ANDゲート17の一方の入力端に直接加え
られるとともに、第2の単安定マルチバイブレー
タ16に加えられる。第2の単安定マルチバイブ
レータ16は第1の単安定マルチバイブレータ1
5より十分長い時定数(例えば2.5〜10msec)を
持ち、第3図fに示す第1の単安定マルチバイブ
レータ15の出力パルスの立下り、つまり後縁で
トリガされて同図gに示すようなfのパルスより
十分広いパルス幅のパルスを反転出力として発生
する。そして、第2の単安定マルチバイブレータ
16の出力がANDゲート17の他方の入力端に
加えられる。従つて、ADNゲート17の出力に
は第3図gに示すように、fのパルスP1,P2のう
ちP1に相当するパルスのみが出力される。
The output of comparator 14 is applied to a first monostable multivibrator 15. This multivibrator 15 is connected to the comparator 1 shown in FIG. 3e.
It is triggered at the rising edge of the output pulse No. 4, that is, the leading edge, and generates a thin pulse as shown in the figure f.
The output of the first monostable multivibrator 15 is applied directly to one input terminal of the AND gate 17 and also to the second monostable multivibrator 16 . The second monostable multivibrator 16 is the first monostable multivibrator 1
It has a time constant (for example, 2.5 to 10 msec) sufficiently longer than 5, and is triggered by the falling edge, that is, the trailing edge, of the output pulse of the first monostable multivibrator 15 shown in FIG. A pulse having a width sufficiently wider than that of the pulse f is generated as an inverted output. The output of the second monostable multivibrator 16 is then applied to the other input terminal of the AND gate 17. Therefore, as shown in FIG. 3g, the ADN gate 17 outputs only the pulse corresponding to P 1 of the pulses P 1 and P 2 of f.

すなわち、有声音は駆動源がインパルス的であ
り、このインパルスを喉や口蓋、口唇で形成され
る音響管を通して放射するメカニズムなので、そ
の波形は第2図に示したように励振点から減衰す
る形になるが、第1の単安定マルチバイブレータ
14の出力でみると第3図に示すように入力音声
信号波形の有声音部の第2の山でもピツチが誤つ
て検出されてしまうことがある。これにaddition
errorという。そこで、この発明では第1の単安
定マルチバイブレータ15の出力パルスのうち、
前回のパルスより第2の単安定マルチバイブレー
タ16の出力パルスの幅に相当する一定時間以内
にあるパルスはANDゲート17で禁止して、こ
の一定時間以上経過した後のパルスのみを出力す
る。この結果、ANDゲート17の出力には入力
音声信号波形のピツチ周期に相当する間隔のパル
ス列が得られることになる。
In other words, the driving source of voiced sounds is an impulse, and the mechanism is to radiate this impulse through the acoustic tube formed by the throat, palate, and lips, so the waveform is attenuated from the excitation point as shown in Figure 2. However, when looking at the output of the first monostable multivibrator 14, as shown in FIG. 3, a pitch may be erroneously detected even at the second peak of the voiced part of the input audio signal waveform. addition to this
It's called error. Therefore, in the present invention, among the output pulses of the first monostable multivibrator 15,
The AND gate 17 prohibits pulses within a certain time period corresponding to the width of the output pulse of the second monostable multivibrator 16 from the previous pulse, and outputs only pulses after this certain period of time has elapsed. As a result, a pulse train having an interval corresponding to the pitch period of the input audio signal waveform is obtained at the output of the AND gate 17.

以上のような構成によれば、音声信号波形のピ
ツチを良好に検出することができる。一例を挙げ
ると、クロツク信号周波数1/τを16kHz、シフ
トレジスタ11の段数Nを12、つまりT=0.75
msecとし、コンパレータ14のスレツシヨルド
レベルVthを、シフトレジスタ11内の12ビツ
トのデータのうち8ビツト以上が“1”のときコ
ンパレータ14の出力が反転するように設定し
て、入力端子1に女性が「OYASUMI NO
JIKAN」と発声したときの約1秒間の音声信号
を入力して実際にピツチを検出したところ、語尾
の弱音部を除いた実際の波数244ピツチのうち、
最小3msec、最大4.2msec、平均3.3msecで3
つのオミツトエラーがあつただけで、実に98.75
%という高い正答率が得られた。しかも、このオ
ミツトエラーの生じた位置も低レベルの音韻と音
韻との間の無音とみなしても音質に差のない部分
であつた。
According to the above configuration, the pitch of the audio signal waveform can be detected satisfactorily. For example, the clock signal frequency 1/τ is 16 kHz, and the number of stages N of the shift register 11 is 12, that is, T = 0.75.
msec, and the threshold level Vth of the comparator 14 is set so that when 8 or more bits of the 12-bit data in the shift register 11 are "1", the output of the comparator 14 is inverted, and the output of the comparator 14 is inverted. ``OYASUMI NO''
When we input the audio signal of about 1 second when uttering "JIKAN" and actually detected the pitches, we found that out of the actual pitch of 244 waves excluding the weak part at the end of the word,
3 at minimum 3msec, maximum 4.2msec, average 3.3msec
98.75 with just one omit error.
A high correct answer rate of % was obtained. Moreover, the position where this error occurred was also a part where there was no difference in sound quality even if it was regarded as silence between low-level phonemes.

以上のように、この発明によれば音声のピツチ
を少ない誤り率で正確に検出できる。また、多段
の白色フイルタで他の音声パラメータを抽出した
後の残差信号からピツチ検出を行なう従来のLPC
方式におけるピツチ検出手段と比べて、ハードウ
エアが著しく簡単で済み、この点でデルタ変調方
式の音声記録再生システム等に極めて適してい
る。
As described above, according to the present invention, pitches in speech can be detected accurately with a low error rate. In addition, conventional LPC performs pitch detection from the residual signal after other audio parameters are extracted using a multi-stage white filter.
Compared to the pitch detection means in the system, the hardware is significantly simpler, and in this respect it is extremely suitable for audio recording and reproducing systems using the delta modulation system.

また、第1図の実施例によれば音声信号波形の
ピツチ検出をエンコーダ3の出力データから行な
つているので、回路を全てデイジタル回路で構成
でき、IC化に適している。なお、ピツチ検出部
での処理は、マイクロコンピユータで実行するこ
とも可能である。
Furthermore, according to the embodiment shown in FIG. 1, since the pitch of the audio signal waveform is detected from the output data of the encoder 3, the circuit can be constructed entirely of digital circuits, making it suitable for IC implementation. Note that the processing in the pitch detection section can also be executed by a microcomputer.

次に、この発明の応用例を第4図、第5図を参
照して説明する。第4図は音声記録装置における
自動波形圧縮装置にこの発明を適用した例であ
り、第1図と共通の部分には同一符号を付してあ
る。また、第5図は第4図の各部の波形図であ
る。ピツチ検出部5からは第5図aに示すような
音声信号波形のピツチ周期に相当した間隔のパル
ス列が得られるが、このパルス列はN進カウンタ
41とインターバルカウンタ42に入力される。
N進カウンタ41は例えばN=4とすれば2段の
バイナリカウンタで構成され、ピツチ検出部5か
ら4個パルス入力が与えられる毎に、次の1個の
パルス入力が与えられるまでの1ピツチ期間だけ
ANDゲート43より第5図bのゲート信号を発
生せしめる。ANDゲート44はANDゲート43
よりのゲート信号で指定された期間に対応するエ
ンコーダ3からの1ピツチ分のデータを第5図c
の如く取出して、メモリシステム45へ供給す
る、こうして有声音部の波形については、連続す
るNピツチのうちの1ピツチの波形だけがメモリ
システム45に蓄積されることになる。すなわ
ち、有声音部の波形はI/Nに圧縮されて蓄積さ
れる。
Next, an application example of the present invention will be explained with reference to FIGS. 4 and 5. FIG. 4 shows an example in which the present invention is applied to an automatic waveform compression device for an audio recording device, and parts common to those in FIG. 1 are given the same reference numerals. Moreover, FIG. 5 is a waveform diagram of each part of FIG. 4. A pulse train having an interval corresponding to the pitch period of the audio signal waveform as shown in FIG.
For example, if N = 4, the N-ary counter 41 is composed of a two-stage binary counter, and every time four pulses are inputted from the pitch detection section 5, one pitch is inputted until the next one pulse input is applied. only for a period
The AND gate 43 generates the gate signal shown in FIG. 5b. AND gate 44 is AND gate 43
The data for one pitch from the encoder 3 corresponding to the period specified by the gate signal is shown in Fig. 5c.
With respect to the waveform of the voiced part, which is extracted as shown in FIG. That is, the waveform of the voiced sound part is compressed into I/N and stored.

一方、無声音部や語尾等の、ピツチ検出部5で
ピツチを検出できない部分の波形は、エンコーダ
3の出力データがANDゲート49を通してその
ままメモリシステム45に蓄積される。この操作
は、レベル検出部46で音声信号のレベルを検出
して第5図dに示す有声―無声判別信号を得ると
ともに、インターバルカウンタ42でピツチ検出
部5の出力パルスの間隔を計測しそれが所定の範
囲内に入つているかどうかをウインドウコンパレ
ータ47でチエツクして第5図eに示すオミツト
信号を得、ANDゲート48で第5図fに示すd
とeとの一致信号を検出し、この信号fでAND
ゲート49をコントロールすることによつて実現
できる。
On the other hand, for waveforms of portions where the pitch cannot be detected by the pitch detection section 5, such as unvoiced parts and word endings, the output data of the encoder 3 is stored in the memory system 45 as is through the AND gate 49. In this operation, the level detector 46 detects the level of the audio signal to obtain the voiced/unvoiced discrimination signal shown in FIG. The window comparator 47 checks whether it is within a predetermined range to obtain the limit signal shown in FIG.
Detects a matching signal between and e, and performs AND with this signal f.
This can be achieved by controlling the gate 49.

このような構成で、前述と同様の女性の
「OYASUMI NO JIKAN」とう音声信号波形をメ
モリシステム45に蓄積したところ、エンコーダ
3の出力データを圧縮せずそのまま蓄積した部分
は全体の約3%で、平均的な情報密度は約4Kb/
secにも低減した。また、この場合オミツトされ
る部分は有声音部のレベルが大きくて一定してい
るところを除く語頭または音韻間に限られる傾向
があるので、このオミツトエラーの情報は音韻の
セグメンテーシヨンにも有効と見られる。
With this configuration, when the same voice signal waveform of a woman saying "OYASUMI NO JIKAN" as described above was stored in the memory system 45, the portion of the output data of the encoder 3 that was stored as is without being compressed was approximately 3% of the total. , the average information density is about 4Kb/
It was also reduced to sec. In addition, in this case, the omitted parts tend to be limited to the beginnings of words or between phonemes, except for voiced parts where the level is high and constant, so this omit error information is also effective for phoneme segmentation. Can be seen.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図はこの発明の一実施例に係る音声ピツチ
検出装置の構成を示す図、第2図は音声信号の有
声音部の典型的な波形例を示す図、第3図は第1
図の動作を説明するための各部の波形図、第4図
はこの発明の応用例を示す図、第5図は第4図の
動作を説明するための各部の波形図である。 1……音声信号入力端子、2……入力フイル
タ、3……エンコーダ、4……クロツク発振器、
5……ピツチ検出部、11……シフトレジスタ、
12……ラダー抵抗、13……加算器、14……
コンパレータ、15,16……単安定マルチバイ
ブレータ、17……ANDゲート、41……N進
カンタ、42……インターバルカウンタ、45…
…メモリシステム、46……レベル検出部、47
……ウインドウコンパレータ。
FIG. 1 is a diagram showing the configuration of an audio pitch detection device according to an embodiment of the present invention, FIG. 2 is a diagram showing a typical waveform example of a voiced part of an audio signal, and FIG.
FIG. 4 is a diagram showing an application example of the present invention, and FIG. 5 is a waveform diagram of each part to explain the operation of FIG. 4. 1... Audio signal input terminal, 2... Input filter, 3... Encoder, 4... Clock oscillator,
5... Pitch detection unit, 11... Shift register,
12...Ladder resistor, 13...Adder, 14...
Comparator, 15, 16... Monostable multivibrator, 17... AND gate, 41... N-ary counter, 42... Interval counter, 45...
...Memory system, 46...Level detection section, 47
...window comparator.

Claims (1)

【特許請求の範囲】[Claims] 1 音声信号波形をデルタ変調により符号化した
データ列を一定時間長さ分だけ蓄積するシフトレ
ジスタおよびこのシフトレジスタの各段の出力を
加算する加算器から構成され音声信号波形の所定
時間当りの平均傾斜を逐次検出する第1の手段
と、この第1の手段により検出された平均傾斜が
一定値を越えた期間を検出してその期間に対応し
たパルスを発生するコンパレータからなる第2の
手段と、この第2の手段の出力パルスの前縁を検
出してパルスを発生する第3の手段と、この第3
の手段の出力パルスのうち前回のパルスより一定
時間以上経過した後のパルスのみを抽出して前記
音声信号波形のピツチ周期に相当する間隔のパル
ス列を得る第4の手段とを備えることを特徴とす
る音声ピツチ検出装置。
1 Consists of a shift register that stores a data string obtained by encoding an audio signal waveform by delta modulation for a certain length of time, and an adder that adds the outputs of each stage of this shift register, and calculates the average of the audio signal waveform per predetermined time. a first means for sequentially detecting the slope; and a second means comprising a comparator for detecting a period in which the average slope detected by the first means exceeds a certain value and generating a pulse corresponding to that period. , a third means for generating a pulse by detecting the leading edge of the output pulse of the second means;
It is characterized by comprising a fourth means for extracting only the pulses after a certain period of time has elapsed since the previous pulse from among the output pulses of the means to obtain a pulse train having an interval corresponding to the pitch period of the audio signal waveform. Audio pitch detection device.
JP56115767A 1981-07-23 1981-07-23 Voice pitch detector Granted JPS5817497A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56115767A JPS5817497A (en) 1981-07-23 1981-07-23 Voice pitch detector

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56115767A JPS5817497A (en) 1981-07-23 1981-07-23 Voice pitch detector

Publications (2)

Publication Number Publication Date
JPS5817497A JPS5817497A (en) 1983-02-01
JPS6239754B2 true JPS6239754B2 (en) 1987-08-25

Family

ID=14670540

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56115767A Granted JPS5817497A (en) 1981-07-23 1981-07-23 Voice pitch detector

Country Status (1)

Country Link
JP (1) JPS5817497A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6272671U (en) * 1985-10-25 1987-05-09
JPH0324164U (en) * 1989-07-18 1991-03-13

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6035036A (en) * 1983-08-05 1985-02-22 Agency Of Ind Science & Technol Production of microporous polyethylene material

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6272671U (en) * 1985-10-25 1987-05-09
JPH0324164U (en) * 1989-07-18 1991-03-13

Also Published As

Publication number Publication date
JPS5817497A (en) 1983-02-01

Similar Documents

Publication Publication Date Title
JP3180655B2 (en) Word speech recognition method by pattern matching and apparatus for implementing the method
US4709390A (en) Speech message code modifying arrangement
JPS6035800A (en) Method of determining pitch of voice and voice transmission system
JPS63282795A (en) Multi-pulse voice encoder
JPS6239754B2 (en)
JP3451998B2 (en) Speech encoding / decoding device including non-speech encoding, decoding method, and recording medium recording program
JP3354252B2 (en) Voice recognition device
JP3523382B2 (en) Voice recognition device and voice recognition method
JP2002169579A (en) Device for embedding additional data in audio signal and device for reproducing additional data from audio signal
JPH087597B2 (en) Speech coder
JP2000099099A (en) Data playback device
JPS62102294A (en) Voice coding system
JPS58113992A (en) Voice signal compression system
JPS6267598A (en) Voice section detection system
JPH06337696A (en) Speed conversion control device and speed conversion control method
JPS6187199A (en) Speech analysis and synthesis device
JPS58113993A (en) Voice signal compression system
JPH05224698A (en) Method and apparatus for smoothing pitch cycle waveform
JPH01261700A (en) Voice coding system
JP3475958B2 (en) Speech encoding / decoding apparatus including speechless encoding, decoding method, and recording medium recording program
JP2602641B2 (en) Audio coding method
JPH0640274B2 (en) Voice recognizer
JPS59170894A (en) Voice section starting system
JPS5854399B2 (en) Pitch frequency transmission system for speech analysis and synthesis system
KR950004158A (en) Audio signal recording / playback method and apparatus