JPH0731516B2 - Multi-pulse encoder - Google Patents
Multi-pulse encoderInfo
- Publication number
- JPH0731516B2 JPH0731516B2 JP61295830A JP29583086A JPH0731516B2 JP H0731516 B2 JPH0731516 B2 JP H0731516B2 JP 61295830 A JP61295830 A JP 61295830A JP 29583086 A JP29583086 A JP 29583086A JP H0731516 B2 JPH0731516 B2 JP H0731516B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- unit
- pulse
- input
- pitch
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000001228 spectrum Methods 0.000 claims description 23
- 238000004458 analytical method Methods 0.000 claims description 10
- 238000012986 modification Methods 0.000 claims description 4
- 230000004048 modification Effects 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 3
- 238000012546 transfer Methods 0.000 claims description 3
- 239000011295 pitch Substances 0.000 description 51
- 230000015572 biosynthetic process Effects 0.000 description 14
- 238000003786 synthesis reaction Methods 0.000 description 14
- 238000013139 quantization Methods 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 10
- 238000000034 method Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 6
- 238000007493 shaping process Methods 0.000 description 6
- 230000001131 transforming effect Effects 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 5
- 230000005236 sound signal Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 230000003111 delayed effect Effects 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 230000002194 synthesizing effect Effects 0.000 description 3
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000013016 damping Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
Description
【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、音声信号の帯域幅を圧縮して音声通信の効率
化をはかるマルチパルス符号化装置に関し、特に量子化
雑音整形(ノイズシェーピング)と音声信号のピッチ予
測との間に整合のとれたマルチパルス符号化装置に関す
る。Description: TECHNICAL FIELD The present invention relates to a multi-pulse encoding device that compresses the bandwidth of a voice signal to improve the efficiency of voice communication, and particularly to quantization noise shaping (noise shaping). The present invention relates to a multi-pulse coding apparatus in which the pitch prediction of a speech signal and the pitch prediction of a speech signal are matched.
従来この種の技術は、量子化雑音整形を合理的に適用
し、聴感的に信号対雑音比を向上させ、かつ音声信号か
ら算出された線形予測(LPC)係数を利用して、帯域圧
縮をはかっている。Conventionally, this type of technology rationally applies quantization noise shaping, improves the signal-to-noise ratio perceptually, and uses linear prediction (LPC) coefficients calculated from speech signals to perform band compression. I'm thinking.
一般に音声生成モデルは、声帯の振動などに起因する駆
動音源と、声道の伝送特性から構成される。声道伝送特
性を効果的に表現する方法としてLPC係数を適用する合
成フィルタでのインパルス応答があり、また駆動音源の
表現方法としてはマルチパルスの基本となるピッチが考
えられる。これらの両者からマルチパルス符号化装置に
より帯域圧縮が可能となる。In general, a voice generation model is composed of a driving sound source caused by vibration of vocal cords and a vocal tract transmission characteristic. Impulse response with a synthesis filter that applies LPC coefficients is one of the effective ways to express vocal tract transmission characteristics, and the basic pitch of multipulse is considered as a way to express a driving sound source. Both of these enable band compression by the multi-pulse encoding device.
しかし、従来のマルチパルス符号化に際してはピッチ予
測のためのピッチ予測係数は入力した音声信号から直接
求められており、その結果と量子化雑音整形を前提とす
るマルチパルス符号化とは必ずしもよく整合するもので
はなかった。However, in the conventional multi-pulse coding, the pitch prediction coefficient for pitch prediction is directly obtained from the input speech signal, and the result and the multi-pulse coding premised on the quantization noise shaping do not always match well. It wasn't something to do.
従ってマルチパルス検索は効率のよい方法とする必要が
ある。Therefore, the multi-pulse search needs to be an efficient method.
本発明が解決しようとする問題点は上述のように、ピッ
チ予測係数が音声信号から直接求められているので、量
子化雑音整形を前提とするマルチパルス検索法とは必ら
ずしも整合がとれないという点にある。As described above, the problem to be solved by the present invention is that the pitch prediction coefficient is directly obtained from the speech signal, so that it does not necessarily match with the multi-pulse search method based on the quantization noise shaping. There is a point that cannot be taken.
従って本発明の目的は、上記欠点の解決したマルチパル
ス符号化装置を提供することにある。Therefore, it is an object of the present invention to provide a multi-pulse encoding device which solves the above drawbacks.
本発明のマルチパルス符号化装置は、入力した音声信号
を符号化して符号化信号を出力するマルチパルス符号化
装置において、前記音声信号が入力し伝達関数が次式で
表わされるスペクトル変形フィルタ (ただしPは線形予測係数の次数、αiはi番目の標本
の予測係数、riはi番目の標本の減衰係数である。) によりスペクトルが変形されたスペクトル変形音声信号
を出力するスペクトル変形手段と、前記変形音声信号の
平均振幅差関数処理を行いその極小値に従ってピッチ予
測分析を実施してマルチパルス符号化信号を出力する波
形符号化手段とを備えて構成される。A multi-pulse coding apparatus of the present invention is a multi-pulse coding apparatus that codes an input speech signal and outputs a coded signal, in which the speech signal is input and a transfer function represented by the following formula: (Where P is the order of the linear prediction coefficient, αi is the prediction coefficient of the i-th sample, and ri is the attenuation coefficient of the i-th sample.) And a spectrum modification means for outputting a spectrum modified speech signal whose spectrum is modified by Waveform encoding means for performing an average amplitude difference function process on the modified speech signal, performing pitch prediction analysis according to the minimum value, and outputting a multi-pulse encoded signal.
次に本発明について実施例を示す図面を参照して詳細に
説明する。Next, the present invention will be described in detail with reference to the drawings illustrating an embodiment.
第1図は本発明を含む第一の実施例の構成を示すブロッ
ク図、第2図は本発明を含む第二の実施例の構成を示す
ブロック図、第3図は第一および第二の実施例に使用す
るピッチ予測フィルタ部の構成を示すブロック図、第4
図および第5図はそれぞれ第一および第二の実施例の波
形を示す図表である。FIG. 1 is a block diagram showing a configuration of a first embodiment including the present invention, FIG. 2 is a block diagram showing a configuration of a second embodiment including the present invention, and FIG. 3 is a first and a second. Block diagram showing a configuration of a pitch prediction filter unit used in the embodiment,
FIG. 5 and FIG. 5 are charts showing the waveforms of the first and second embodiments, respectively.
まず、本発明の概要について説明する。First, the outline of the present invention will be described.
本発明では、標本化された入力信号に対して線形予測分
析(LPC)を介して予測係数αiが求めらる。次にあら
かじめ設定された減衰係数ri(i=1,……,Pであって一
般にriは0〜1の間で経験的に定められる)と、この線
形予測係数αiとから で表わされるフィルタで入力音声信号のスペクトル変形
が行われ、スペクトル変形された音声信号が得られる。
さらに、この信号に対し平均振幅差関数(AMDF)処理を
介して、その極小値の時間に対応する間隔からピッチ周
期が求められる。この平均振幅差関数処理では、入力し
た1フレーム分のスペクトル変形された音声信号につい
て各サンプルの間隔づつ遅延した信号が作られ、遅延し
た信号と遅延しない信号との振幅の差の絶対値が算出さ
れ、1フレーム分の平均をとってその極小値を検索す
る。かようにして得られた極小値の間隔に相当する時間
がピッチ周期となる。In the present invention, the prediction coefficient αi is obtained for the sampled input signal through linear prediction analysis (LPC). Next, from the preset damping coefficient ri (i = 1, ..., P, ri is generally empirically determined between 0 and 1) and this linear prediction coefficient αi The input voice signal is spectrally transformed by the filter represented by, and a spectrally transformed voice signal is obtained.
Further, the pitch period is obtained from the interval corresponding to the time of the minimum value of the signal through the average amplitude difference function (AMDF) processing. In this average amplitude difference function processing, a signal delayed by the interval of each sample is created with respect to the input one frame of the spectrum-modified voice signal, and the absolute value of the difference in amplitude between the delayed signal and the undelayed signal is calculated. Then, the average value for one frame is taken and the minimum value is searched. The time corresponding to the interval of the minimum values thus obtained is the pitch period.
次に、1フレームの中で音声信号とインパルス応答信号
との相互相関係数が算出され、その最大振幅の位置と、
上述のピッチ周期ごとに並べられたインパルス応答信号
の遅れ零の位置とを合わせ、さらに両者の振幅を同一と
し、このときの振幅と位置はマルチパルス信号の一部と
して出力される。このあと、前者から後者を差引いた残
りの分について、同様の方法を繰返して従来のマルチパ
ルス検索が実施され、そのときの振幅と位置が振幅の大
きい順に出力される。以上のような方法でマルチパルス
検索を行っている。Next, the cross-correlation coefficient between the voice signal and the impulse response signal is calculated in one frame, and the maximum amplitude position and
The positions of the delay zero of the impulse response signals arranged for each of the above pitch periods are matched, and the amplitudes of the two are made the same, and the amplitude and the position at this time are output as a part of the multi-pulse signal. After that, the same method is repeated for the remaining portion obtained by subtracting the latter from the former, and the conventional multi-pulse search is performed, and the amplitudes and positions at that time are output in descending order of amplitude. The multi-pulse search is performed by the above method.
従ってスペクトル変形された音声より算出したピッチ予
測係数を利用し、このためマルチパルスを決定するとき
に相互相関を自己相関で減じてゆく処理との整合性のよ
いピッチ予測係数をAMDFで算出している。Therefore, the pitch prediction coefficient calculated from the spectrum-modified speech is used.Therefore, the pitch prediction coefficient that is compatible with the process of subtracting the cross-correlation by autocorrelation when determining the multipulse is calculated by AMDF. There is.
かようにしてピッチ信号の冗長性を除き帯域圧縮性を高
めたものである。In this way, the redundancy of the pitch signal is removed and the band compressibility is improved.
次に本発明の第一の実施例についてその構成と作動を中
心に第1図および第4図を参照して説明する。第1図に
見るに本発明を含む第一の実施例はLPC分析部1と、ス
ペクトル変形手段2と、波形符号化手段3とを備えてマ
ルチパルス符号化部分を構成し、波形復合化手段4と、
LPC合成フィルタ部5とを備えてマルチパルス復合化部
分を構成している。以下各構成素子についてその内部構
成の一例を示し、それぞれの説明を行うものとする。Next, a first embodiment of the present invention will be described with reference to FIGS. 1 and 4 focusing on the configuration and operation thereof. As shown in FIG. 1, the first embodiment including the present invention comprises an LPC analysis unit 1, a spectrum modifying unit 2, and a waveform coding unit 3 to form a multi-pulse coding unit, and a waveform decoding unit. 4 and
The LPC synthesizing filter unit 5 is provided to form a multi-pulse decoding unit. Hereinafter, an example of the internal configuration of each of the constituent elements will be shown and the respective elements will be described.
標本化された入力音声信号100は、LPC分析部1とスペク
トル変形手段2に入力され、LPC分析部1では入力音声
信号が分析され、最大次数P次までの部分自己相関係数
信号101が、スペクトル変形手段2のK量子化復合化部5
1に出力される。The sampled input speech signal 100 is input to the LPC analysis section 1 and the spectrum transforming means 2, and the LPC analysis section 1 analyzes the input speech signal to obtain a partial autocorrelation coefficient signal 101 up to the maximum degree P. K quantization / decoding unit 5 of spectrum transforming means 2
Output to 1.
スペクトル変形手段2は、K量子化復合化部51と、K・
α変換部52と、α・r算出部53と、スペクトル変形部54
とを備えている。部分自己相関係数信号101がK量子化
復合化部51に入力され、量子化された部分自己相関係信
号104は波形符号化手段3へ出力されると共に、復合化
されてK・α変換部52へ出力される。The spectrum transforming means 2 includes a K quantizing / decoding unit 51, K ·
α conversion unit 52, α · r calculation unit 53, spectrum transformation unit 54
It has and. The partial autocorrelation coefficient signal 101 is input to the K quantization / decoding unit 51, and the quantized partial self-phase relation signal 104 is output to the waveform coding means 3 and is also decoded and K / α conversion unit. Output to 52.
K・α変換部52では、復合化された部分自己相関係数信
号が入力され、予測係数αiを表わす信号がサンプルご
とに、α・r算出部53とスペクトル変換部54に出力され
る。α・r算出部53では、あらかじめ経験的に選ばれた
聴感重み付け係数riと予測係数αiとの積が算出され、
αi・riを表わす信号すなわちα・r信号103が、スペ
クトル変形部54と波形符号化手段3とに出力される。ス
ペクトル変形部54は、α・r信号103と、線形予測係数
αiとが入力され、伝達関数が で表わされるフィルタを構成する(Zは標本化された入
力音声信号、H(Z)はフィルタの出力を表わす)。In the K / α conversion unit 52, the decoded partial autocorrelation coefficient signal is input, and the signal representing the prediction coefficient αi is output to the α / r calculation unit 53 and the spectrum conversion unit 54 for each sample. The α · r calculation unit 53 calculates the product of the perceptual weighting coefficient ri selected empirically in advance and the prediction coefficient αi,
The signal representing αi · ri, that is, the α · r signal 103 is output to the spectrum modifying section 54 and the waveform coding means 3. The spectrum transformation unit 54 receives the α · r signal 103 and the linear prediction coefficient αi, and the transfer function is (Z is the sampled input audio signal, and H (Z) is the output of the filter).
次に、波形符号化手段3について説明する。波形符号化
手段3は、AMDF演算部55と、極小値検索部56と、インパ
ルス応答部57と、相互相関部58と、自己相関部59と、マ
ルチパルス検索部60と、パルス量子化部61と、多重化合
成部62とを備えている。Next, the waveform encoding means 3 will be described. The waveform encoding means 3 includes an AMDF calculation unit 55, a minimum value search unit 56, an impulse response unit 57, a cross correlation unit 58, an autocorrelation unit 59, a multipulse search unit 60, and a pulse quantization unit 61. And a multiplexing / combining unit 62.
まずスペクトル変形手段2から音声信号102が、AMDF演
算部55と相互相関部58とに入力される。AMDF演算部55で
は、先に述べたように入力された1フレーム分の音声信
号102についてあらかじめ定められた遅延量に従って遅
延した信号が作られ、遅延した標本化列と遅延しない信
号との差の絶対値が標本ごとに算出される。次にこの絶
対値の1フレーム分の平均が求められ、この平均の値と
あらかじめ定められた遅延量とがAMDF出力信号109とな
り、極小値検索部56に遅延量を変えたときの値が順次出
力される。極小値検索部56では、遅延量に対応してAMDF
出力信号109の極小値が検索され、極小値間の遅延量に
相当する時間長をピッチ周期とみなし、ピッチ周期を示
すピッチ信号110が多重化合成部62とマルチパルス検索
部60に出力される。First, the voice signal 102 is input from the spectrum modifying unit 2 to the AMDF calculation unit 55 and the cross-correlation unit 58. The AMDF calculator 55 produces a delayed signal according to a predetermined delay amount for the input one-frame audio signal 102 as described above, and calculates the difference between the delayed sampling sequence and the undelayed signal. The absolute value is calculated for each sample. Next, the average of this absolute value for one frame is obtained, and the average value and the predetermined delay amount become the AMDF output signal 109, and the values when the delay amount is changed to the local minimum value search unit 56 are sequentially obtained. Is output. In the minimum value search unit 56, the AMDF is set according to the delay amount.
The minimum value of the output signal 109 is searched, the time length corresponding to the delay amount between the minimum values is regarded as the pitch cycle, and the pitch signal 110 indicating the pitch cycle is output to the multiplexing synthesis section 62 and the multi-pulse search section 60. .
次に、波形符号化手段3のうち、マルチパルスの発生に
ついて説明する。まず、スペクトル変形手段2から入力
するα・r信号103がインパルス応答部57に入力され
る。インパルス応答部57は、LPC合成フィルタ部57Aとイ
ンパルス発生部57Cとを備え、α・r信号103がLPC合成
フィルタ部57Aに入力し、その係数が満たされる。また
インパルス発生部57Cからインパルス信号(第4図
(a)参照)が例えば1フレーム時間長ごとに出力さ
れ、LPCフィルタ部57Aのインパルス応答信号115(第4
図(b)参照)が求められる。インパルス応答信号115
は相互相関部58と自己相関部59とに印加され、自己相関
部59ではインパルス応答信号の自己相関信号(第4図
(c)参照)が得られ、マルチパルス検索部60へ送られ
る。一方、相互相関部58にはインパルス応答信号115
(第4図(b)参照)と音声信号102(第4図(d)参
照)とが入力され、その結果として相互相関信号(第4
図(e)参照)がマルチパルス検索部60に送られる。Next, the generation of multi-pulses in the waveform encoding means 3 will be described. First, the α · r signal 103 input from the spectrum modifying unit 2 is input to the impulse response unit 57. The impulse response unit 57 includes an LPC synthesis filter unit 57A and an impulse generation unit 57C, and the α · r signal 103 is input to the LPC synthesis filter unit 57A, and the coefficient thereof is satisfied. Further, an impulse signal (see FIG. 4 (a)) is output from the impulse generator 57C for each frame time length, and the impulse response signal 115 (fourth time) of the LPC filter 57A is output.
Figure (b)) is required. Impulse response signal 115
Is applied to the cross-correlation unit 58 and the auto-correlation unit 59. The auto-correlation unit 59 obtains the auto-correlation signal (see FIG. 4 (c)) of the impulse response signal and sends it to the multi-pulse search unit 60. On the other hand, the impulse response signal 115
(See FIG. 4 (b)) and the audio signal 102 (see FIG. 4 (d)) are input, and as a result, the cross-correlation signal (see
The figure (e) is sent to the multi-pulse search unit 60.
マルチパルス検索部60では、相互相関信号(第4図
(e)参照)と自己相関信号115(第4図(c)参照)
とピッチ信号110とが入力されると、まず相互相関信号
の最大値に対応するパルス信号がマルチパルス信号111
の一部となる。このとき、相互相関信号の最大値および
その位置に自己相関信号の最大値およびその位置が同一
となるようになされた自己相関信号が、相互相関信号か
ら差引かれる。これと共に、その自己相関信号の位置を
基準としてピッチ周期ごとに対応する位置に配置された
その自己相関信号が、相互相関信号から差引かれる。こ
の結果として、差引かれた相互相関信号の最大値に対応
するパルス信号が、マルチパルス信号の一部(ここでは
2番目のパルス)となる。以下、上述のように方法でつ
ぎつぎと自己相関信号が差引かれ、あらかじめ定められ
た数のマルチパルスが得られるまで、その方法が続けら
れる。In the multi-pulse search unit 60, the cross-correlation signal (see FIG. 4 (e)) and the autocorrelation signal 115 (see FIG. 4 (c)).
When the pitch signal 110 and the pitch signal 110 are input, the pulse signal corresponding to the maximum value of the cross-correlation signal is the multi-pulse signal 111.
Become part of. At this time, the maximum value of the cross-correlation signal and the auto-correlation signal whose position and the position thereof are the same are subtracted from the cross-correlation signal. At the same time, the autocorrelation signal arranged at a position corresponding to each pitch period with the position of the autocorrelation signal as a reference is subtracted from the cross-correlation signal. As a result, the pulse signal corresponding to the maximum value of the subtracted cross-correlation signal becomes a part (here, the second pulse) of the multi-pulse signal. Thereafter, the method is continued until the autocorrelation signals are successively subtracted by the method as described above and a predetermined number of multipulses are obtained.
かようにして得られたマルチパルス信号111(第4図
(f)参照)が、パルス量子化部61に出力される。The multi-pulse signal 111 (see FIG. 4 (f)) thus obtained is output to the pulse quantizer 61.
パルス量子化部61では、入力したマルチパルス信号111
は量子化され、マルチパルスの位置と振幅とを示すマル
チパルス信号112とマルチパルス信号の振幅の最大値を
示す最大振幅信号113とが、多重化合成部62へ出力され
る。In the pulse quantizer 61, the input multi-pulse signal 111
Is quantized, and a multi-pulse signal 112 indicating the position and amplitude of the multi-pulse and a maximum amplitude signal 113 indicating the maximum value of the amplitude of the multi-pulse are output to the multiplexing / combining unit 62.
多重化合成部62では、部分自己相関係数信号104と、ピ
ッチ信号110と、マルチパルス信号112と、最大振幅信号
113とが入力され、これらの信号を多重化した多重化信
号105が出力され、伝送線を通じて波形復号化手段4の
多重化分離部63に入力される。In the multiplexing and combining unit 62, the partial autocorrelation coefficient signal 104, the pitch signal 110, the multi-pulse signal 112, and the maximum amplitude signal
113 is input, and a multiplexed signal 105 obtained by multiplexing these signals is output and input to the demultiplexing unit 63 of the waveform decoding means 4 through the transmission line.
次に、波形復号化手段4について説明する。波形復号化
手段4は、多重化分離部63と、パルス復号化部64と、ピ
ッチ予測フィルタ部65と、K復号化部66とを備えてい
る。波形符号化手段3の多重化合成部62から多重化信号
105が多重化分離部63に入力されると、多重化分離部63
では部分自己相関係数信号104に対応する部分自己相関
係数信号114と、ピッチ信号110に対応するピッチ信号12
0と、マルチパルス信号112に対応するマルチパルス信号
122と、最大振幅信号113に対応する最大振幅信号123と
がそれぞれ出力される。Next, the waveform decoding means 4 will be described. The waveform decoding means 4 includes a demultiplexing unit 63, a pulse decoding unit 64, a pitch prediction filter unit 65, and a K decoding unit 66. Multiplexed signal from the multiplexing / synthesizing unit 62 of the waveform coding means 3
When 105 is input to the demultiplexing unit 63, the demultiplexing unit 63
Then, a partial autocorrelation coefficient signal 114 corresponding to the partial autocorrelation coefficient signal 104 and a pitch signal 12 corresponding to the pitch signal 110.
0 and a multi-pulse signal corresponding to the multi-pulse signal 112
122 and a maximum amplitude signal 123 corresponding to the maximum amplitude signal 113 are output.
多重化分離部63から出力される部分自己相関係数信号11
4はK復号化部66で復号化された部分自己相関係数信号1
07となりLPC合成フィルタ部5に入力される。同じく多
重分離部63から出力されるマルチパルスの位置と振幅と
を示すマルチパルス信号122とマルチパルスの振幅の最
大値を示す最大振幅信号123は、パルス復号化部64で復
号化されてピッチ予測フィルタ部65に入力される。ま
た、多重化分離部63から出力するピッチ信号120も同様
にピッチ予測フィルタ部65に入力される。ピッチ予測フ
ィルタから復号化されたマルチパルス信号106がLPC合成
フィルタ部5に入力する。LPC合成フィルタ部5ではマ
ルチパルス信号106が入力され、部分自己相関係数信号1
07に従って制御されて出力音声信号108を出力される。Partial autocorrelation coefficient signal 11 output from demultiplexing unit 63
4 is a partial autocorrelation coefficient signal 1 decoded by the K decoding unit 66
It becomes 07 and is input to the LPC synthesis filter unit 5. Similarly, the multi-pulse signal 122 indicating the position and amplitude of the multi-pulse output from the demultiplexing unit 63 and the maximum amplitude signal 123 indicating the maximum value of the multi-pulse amplitude are decoded by the pulse decoding unit 64 and pitch prediction is performed. It is input to the filter unit 65. Further, the pitch signal 120 output from the demultiplexing unit 63 is also input to the pitch prediction filter unit 65. The multi-pulse signal 106 decoded from the pitch prediction filter is input to the LPC synthesis filter unit 5. The LPC synthesis filter unit 5 receives the multi-pulse signal 106 and outputs the partial autocorrelation coefficient signal 1
The output audio signal 108 is output under the control of 07.
次に本発明の第二の実施例についてその構成と作動を中
心に第2〜3図および第5図を参照して説明する。第2
図を見るに本発明を含む第二の実施例はLPC分析部11
と、スペクトル変形手段12と、波形符号化手段13とを備
えてマルチパルス符号化部分を構成し、波形復号化手段
14と、LPC合成フィルタ部15とを備えてマルチパルス復
号化部分を構成している。以下各構成素子についてその
内部構成の一例を示し、それぞれの説明を行う。Next, the second embodiment of the present invention will be described with reference to FIGS. Second
Referring to the figure, the second embodiment including the present invention is the LPC analysis unit 11
, A spectrum transforming means 12 and a waveform coding means 13 to form a multi-pulse coding portion, and a waveform decoding means.
The multi-pulse decoding section is configured by including 14 and the LPC synthesis filter section 15. An example of the internal configuration of each component will be shown below, and each component will be described.
標本化された入力音声信号200が、LPC分析部11とスペク
トル変形手段12に入力されて、LPC分析部11で分析さ
れ、最大次数P次までの部分自己相関係数信号201がス
ペクトル変形手段12に出力される。The sampled input speech signal 200 is input to the LPC analysis unit 11 and the spectrum modification unit 12, is analyzed by the LPC analysis unit 11, and the partial autocorrelation coefficient signal 201 up to the maximum order P is the spectrum modification unit 12. Is output to.
スペクトル変形手段12は、K量子化復号化部71と、K・
α変換部72と、α・r算出部73と、スペクトル変形部74
とを備えている。標本化された入力音声信号200と部分
自己相関係数信号201とがスペクトル変形手段12に入力
され、量子化された部分自己相関係数信号204と、聴感
重み付けを施されスペクトル変形された音声信号202と
が波形符号化手段13へ出力されることは、第一の実施例
の場合と同様である。The spectrum transforming means 12 includes a K quantization decoding unit 71, K.
α conversion unit 72, α · r calculation unit 73, and spectrum transformation unit 74
It has and. The sampled input speech signal 200 and the partial autocorrelation coefficient signal 201 are input to the spectrum transforming means 12, and the quantized partial autocorrelation coefficient signal 204 and the auditory-weighted spectrally transformed speech signal are input. The output of 202 and the waveform coding means 13 is the same as in the case of the first embodiment.
次に波形符号化手段13について説明する。波形符号化手
段13は、AMDF演算部75と、極小値検索部76と、インパル
ス応答部77と、相互相関部78と、自己相関部79と、マル
チパルス検索部80と、パルス量子化部81と、多重化合成
部82とを備えている。Next, the waveform encoding means 13 will be described. The waveform encoding means 13 includes an AMDF calculation unit 75, a minimum value search unit 76, an impulse response unit 77, a cross correlation unit 78, an autocorrelation unit 79, a multipulse search unit 80, and a pulse quantization unit 81. And a multiplexing / combining unit 82.
このうち音声信号202を入力しピッチ信号210を出力する
AMDF演算部75と極小値検索部76の動作と、マルチパルス
信号211が入力されマルチパルスの位置と振幅を示すマ
ルチパルス信号212と最大振幅信号213を出力するパルス
量子化部81の作動と、多重化合成部82の作動も、第一の
実施例と同様である。Of these, the voice signal 202 is input and the pitch signal 210 is output.
The operation of the AMDF calculation unit 75 and the local minimum value search unit 76, and the operation of the pulse quantization unit 81 which receives the multi-pulse signal 211 and outputs the multi-pulse signal 212 indicating the position and amplitude of the multi-pulse and the maximum amplitude signal 213, The operation of the multiplexing / combining unit 82 is similar to that of the first embodiment.
次に波形符号化手段13のうち、マルチパルスの発生につ
いて説明する。まず、スペクトル変形手段から入力する
α・r信号203がインパルス応答部77に入力される。イ
ンパルス応答部77はLPC合成フィルタ部77Aと、ピッチ予
測フィルタ部77Bと、インパルス発生部77Cとを備えてい
る。α・r信号203はLPC合成フィルタ部77Aに入力さ
れ、その係数が決定される。また、インパルス発生部77
Cからのインパルス信号(第5図(a)参照)は、例え
ば1フレーム時間長ごとにピッチ予測フィルタ部77Bに
出力される。Next, the generation of multi-pulses in the waveform coding means 13 will be described. First, the α · r signal 203 input from the spectrum modifying means is input to the impulse response unit 77. The impulse response unit 77 includes an LPC synthesis filter unit 77A, a pitch prediction filter unit 77B, and an impulse generation unit 77C. The α · r signal 203 is input to the LPC synthesis filter unit 77A and its coefficient is determined. Also, the impulse generator 77
The impulse signal from C (see FIG. 5A) is output to the pitch prediction filter unit 77B, for example, every one frame time length.
ピッチ予測フィルタ77Bは第3図を見るに可変遅延素子9
0A〜90Nと加算器91を備えており、縦続された可変遅延
素子90A〜90Nの端部と接続点からの信号が加算器91に出
力されるようにしたものである。また可変遅延素子90A
〜90Nは、ピッチ信号303によって制御され、そのピッチ
の周期間隔と同じ遅延時間を持っている。従って可変遅
延素子90A〜90Nを縦続された片端から入力信号301を入
力すると、入力信号301がピッチ信号303で示されるピッ
チの周期間隔で、入力信号301と同一波形の信号が可変
遅延素子の個数だけ入力信号301に追加された信号が出
力される。(なお、このピッチ予測フィルタは第一およ
び第二の実施例の中の波形復号化手段でも使用されてい
る。) 従ってピッチ信号210がピッチ予測フィルタ部77Bに入力
されると、インパルス発生部77Cから入力されたインパ
ルス信号に対して、ピッチ信号210のピッチ周期間隔ご
とにインパルス状のピッチ信号(第5図(b)参照)が
LPC合成フィルタ部57Aへ出力される。LPC合成フィルタ
部77Aからは、インパルス状のピッチ信号に対するイン
パルス応答信号(第5図(c)参照)が、相互相関部78
と自己相関部79に出力され、自己相関部79では自己相関
信号(第5図(d)参照)が得られ、マルチパルス検索
部80へ送られる。一方、相互相関部78にはインパルス応
答信号(第5図(c)参照)と音声信号202(第5図
(e)参照)とが入力し、その結果として相互相関信号
(第5図(f)参照)がマルチパルス検索部80に送られ
る。The pitch prediction filter 77B has a variable delay element 9 as shown in FIG.
0A to 90N and an adder 91 are provided so that signals from the ends and connection points of the cascaded variable delay elements 90A to 90N are output to the adder 91. Also variable delay element 90A
.About.90N is controlled by the pitch signal 303 and has the same delay time as the pitch interval. Therefore, when the input signal 301 is input from one end where the variable delay elements 90A to 90N are cascaded, a signal having the same waveform as the input signal 301 is input to the variable delay elements at the pitch interval indicated by the pitch signal 303. Only the signal added to the input signal 301 is output. (Note that this pitch prediction filter is also used in the waveform decoding means in the first and second embodiments.) Therefore, when the pitch signal 210 is input to the pitch prediction filter unit 77B, the impulse generation unit 77C An impulse-shaped pitch signal (see FIG. 5 (b)) is generated at every pitch period interval of the pitch signal 210 with respect to the impulse signal input from
It is output to the LPC synthesis filter unit 57A. From the LPC synthesis filter unit 77A, the impulse response signal (see FIG. 5 (c)) for the impulse-shaped pitch signal is output to the cross-correlation unit 78.
Is output to the autocorrelation unit 79, and the autocorrelation unit 79 obtains an autocorrelation signal (see FIG. 5D) and sends it to the multi-pulse search unit 80. On the other hand, the impulse response signal (see FIG. 5C) and the voice signal 202 (see FIG. 5E) are input to the cross-correlation unit 78, and as a result, the cross-correlation signal (see FIG. ) Reference) is sent to the multi-pulse search unit 80.
マルチパルス検索部80では、相互相関信号(第5図
(f)参照)と自己相関信号(第5図(d)参照)が入
力され、相互相関信号の最大値に対応するパルス信号が
マルチパルス信号211(第5図(g)参照)の一部とな
る。このとき、相互相関信号の最大値に自己相関信号の
最大値が同一となるようになされた自己相関信号が相互
相関信号が差引かれる。この結果として、差引かれた相
互相関信号の最大値に対応するパルス信号が、マルチパ
ルス信号の一部(ここでは2番目のパルス)となる。以
下、上述の方法でつぎつぎと自己相互相関信号が差引か
れ、あらかじめ定められた数のマルチパルスが得られる
まで、この方法が続けられる。In the multi-pulse search unit 80, the cross-correlation signal (see FIG. 5 (f)) and the auto-correlation signal (see FIG. 5 (d)) are input, and the pulse signal corresponding to the maximum value of the cross-correlation signal is multi-pulse. It becomes a part of the signal 211 (see FIG. 5 (g)). At this time, the cross-correlation signal is subtracted from the auto-correlation signal whose maximum value is equal to the maximum value of the cross-correlation signal. As a result, the pulse signal corresponding to the maximum value of the subtracted cross-correlation signal becomes a part (here, the second pulse) of the multi-pulse signal. After that, the method is continued until the auto-cross-correlation signals are successively subtracted by the above-mentioned method and a predetermined number of multi-pulses are obtained.
かようにして得られたマルチパルス信号211が、パルス
量子化部81に出力される。The multi-pulse signal 211 thus obtained is output to the pulse quantizer 81.
多重化合成部82では、部分自己相関係数信号204と、ピ
ッチ信号210と、マルチパルス信号212と、最大振幅信号
213とが入力され、これらの信号を多重化した多重化信
号205が出力される。ここで出力された信号が、伝送線
を通して波形復号化手段14の多重化分離部83に入力され
ることは第一の実施例と同様である。The multiplexing / synthesizing unit 82 has a partial autocorrelation coefficient signal 204, a pitch signal 210, a multi-pulse signal 212, and a maximum amplitude signal.
And 213 are input, and a multiplexed signal 205 obtained by multiplexing these signals is output. The signal output here is input to the demultiplexing unit 83 of the waveform decoding means 14 through the transmission line, as in the first embodiment.
次に波形復号化手段14以下について説明する。波形復号
化手段14は、多重化分離部83と、パルス復号化部84と、
ピッチ予測フィルタ部85とを備え、多重化分離部83では
部分自己相関係数信号204に対応する部分自己相関係数
信号214と、ピッチ信号210に対応するピッチ信号220
と、マルチパルス信号212に対応するマルチパルス信号2
22と、最大振幅信号213に対応する最大振幅信号223とが
それぞれ出力される。さらに波形復号化手段14から、マ
ルチパルス信号206と復号化された部分相関係数信号207
とが出力される。これらの信号がさらにLPC合成フィル
タ部15に入力されて、ここから出力音声信号208が出力
される。以上の作動も第一の実施例と同様である。Next, the waveform decoding means 14 and below will be described. The waveform decoding means 14 includes a demultiplexing unit 83, a pulse decoding unit 84,
A pitch prediction filter unit 85 is provided, and the demultiplexing unit 83 has a partial autocorrelation coefficient signal 214 corresponding to the partial autocorrelation coefficient signal 204 and a pitch signal 220 corresponding to the pitch signal 210.
And the multi-pulse signal 2 corresponding to the multi-pulse signal 212
22 and the maximum amplitude signal 223 corresponding to the maximum amplitude signal 213 are output. Further, from the waveform decoding means 14, the multi-pulse signal 206 and the decoded partial correlation coefficient signal 207
And are output. These signals are further input to the LPC synthesis filter unit 15, and the output audio signal 208 is output from here. The above operation is similar to that of the first embodiment.
従って上述のマルチパルス符号化装置の実施例は、標本
化された入力音声信号を符号化するにあたって、マルチ
パルス信号があらかじめ設定された聴感重み付けを行っ
た音声信号から算出されることと、音声信号のピッチ周
波数をAMDF演算結果の極小値の間隔から求めることが特
徴である。Therefore, in the embodiment of the multi-pulse encoding device described above, in encoding the sampled input voice signal, the multi-pulse signal is calculated from the voice signal subjected to the preset perceptual weighting, and the voice signal The feature is that the pitch frequency of is calculated from the interval of the minimum value of the AMDF calculation result.
以上詳細に説明したように本発明のマルチパルス符号化
装置は、入力した音声信号からマルチパルス信号を生成
するに先立って量子化雑音整形処理を行いAMDF演算を行
い、その極小値の間隔からピッチ周波数を求めることに
よりマルチパルス化すべき音声信号のピッチ予測係数を
得ているので、マルチパルス決定の適合性が極めてよく
なるという効果がある。As described in detail above, the multi-pulse encoding device of the present invention performs a quantization noise shaping process to generate a multi-pulse signal from an input speech signal, performs AMDF calculation, and pitches from the interval of the minimum value. Since the pitch prediction coefficient of the speech signal to be multi-pulse is obtained by obtaining the frequency, there is an effect that the adaptability of the multi-pulse decision becomes extremely good.
第1図は本発明を含む第一の実施例の構成を示すブロッ
ク図、第2図は本発明を含む第二の実施例の構成を示す
ブロック図、第3図は第一および第二の実施例に使用す
るピッチ予測フィルタ部の構成を示すブロック図、第4
図および第5図はそれぞれ第一および第二の実施例の波
形を示す図表。 1,11……LPC分析部、2,12……スペクトル変形手段、3,1
3……波形符号化手段、4,14……波形復号化手段、5,15
……LPC合成フィルタ部。FIG. 1 is a block diagram showing a configuration of a first embodiment including the present invention, FIG. 2 is a block diagram showing a configuration of a second embodiment including the present invention, and FIG. 3 is a first and a second. Block diagram showing a configuration of a pitch prediction filter unit used in the embodiment,
FIG. 5 and FIG. 5 are tables showing waveforms of the first and second embodiments, respectively. 1,11 …… LPC analysis unit, 2,12 …… Spectral transformation means, 3,1
3 ... Waveform coding means, 4,14 ... Waveform decoding means, 5,15
...... LPC synthesis filter section.
Claims (1)
を出力するマルチパルス符号化装置において、前記音声
信号が入力し伝達関数が次式で表わされるスペクトル変
形フィルタ (ただしPは線形予測係数の次数、αiはi番目の標本
の予測係数、riはi番目の標本の減衰係数である。) によりスペクトルが変形されたスペクトル変形音声信号
を出力するスペクトル変形手段と、前記変形音声信号の
平均振幅差関数処理を行いその極小値に従ってピッチ予
測分析を実施してマルチパルス符号化信号を出力する波
形符号化手段とを備えてなるマルチパルス符号化装置。1. A multi-pulse encoding device for encoding an input speech signal and outputting the encoded signal, wherein the speech signal is inputted and a transfer function is expressed by the following equation. (Where P is the order of the linear prediction coefficient, αi is the prediction coefficient of the i-th sample, and ri is the attenuation coefficient of the i-th sample.) And a spectrum modification means for outputting a spectrum modified speech signal whose spectrum is modified by , A waveform encoding means for performing average amplitude difference function processing of the modified speech signal, performing pitch prediction analysis according to the minimum value thereof, and outputting a multi-pulse encoded signal.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP61295830A JPH0731516B2 (en) | 1986-12-11 | 1986-12-11 | Multi-pulse encoder |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP61295830A JPH0731516B2 (en) | 1986-12-11 | 1986-12-11 | Multi-pulse encoder |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS63148300A JPS63148300A (en) | 1988-06-21 |
| JPH0731516B2 true JPH0731516B2 (en) | 1995-04-10 |
Family
ID=17825728
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP61295830A Expired - Lifetime JPH0731516B2 (en) | 1986-12-11 | 1986-12-11 | Multi-pulse encoder |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0731516B2 (en) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP1904816A4 (en) * | 2005-07-18 | 2014-12-24 | Diego Giuseppe Tognola | METHOD AND SYSTEM FOR PROCESSING SIGNALS |
-
1986
- 1986-12-11 JP JP61295830A patent/JPH0731516B2/en not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| JPS63148300A (en) | 1988-06-21 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN1154086C (en) | CELP forwarding | |
| US7222069B2 (en) | Voice code conversion apparatus | |
| CN100583241C (en) | Audio encoding device, audio decoding device, audio encoding method and audio decoding method | |
| JP2511871B2 (en) | Multi-pulse excitation linear predictive encoder | |
| KR100304682B1 (en) | Fast Excitation Coding for Speech Coders | |
| US8396706B2 (en) | Speech coding | |
| EP0939394A1 (en) | Apparatus for encoding and apparatus for decoding speech and musical signals | |
| WO1980002211A1 (en) | Residual excited predictive speech coding system | |
| JP3364825B2 (en) | Audio encoding device and audio encoding / decoding device | |
| US5884251A (en) | Voice coding and decoding method and device therefor | |
| CA2006487C (en) | Communication system capable of improving a speech quality by effectively calculating excitation multipulses | |
| JP2903533B2 (en) | Audio coding method | |
| JPH11510274A (en) | Method and apparatus for generating and encoding line spectral square root | |
| JP3144009B2 (en) | Speech codec | |
| KR100499047B1 (en) | Apparatus and method for transcoding between CELP type codecs with a different bandwidths | |
| EP0852375A1 (en) | Speech coder methods and systems | |
| JPH0738118B2 (en) | Multi-pulse encoder | |
| JPH0731516B2 (en) | Multi-pulse encoder | |
| JP2004348120A (en) | Speech encoding device, speech decoding device, and methods thereof | |
| JPH08234795A (en) | Voice encoding device | |
| JPS6162100A (en) | Multipulse type encoder/decoder | |
| JPH08129400A (en) | Speech coding system | |
| JP2832942B2 (en) | Multi-pulse encoder | |
| JPH0738119B2 (en) | Speech waveform coding / decoding device | |
| JP2853126B2 (en) | Multi-pulse encoder |