JP6652469B2 - Decoding device, decoding method, and program - Google Patents
Decoding device, decoding method, and program Download PDFInfo
- Publication number
- JP6652469B2 JP6652469B2 JP2016174266A JP2016174266A JP6652469B2 JP 6652469 B2 JP6652469 B2 JP 6652469B2 JP 2016174266 A JP2016174266 A JP 2016174266A JP 2016174266 A JP2016174266 A JP 2016174266A JP 6652469 B2 JP6652469 B2 JP 6652469B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- frame
- sound signal
- decoded sound
- previous frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
この発明は、音信号等の時系列信号を復号する技術に関する。 The present invention relates to a technique for decoding a time-series signal such as a sound signal.
従来、音信号の符号化と復号の間にある伝送路上でのパケットの損失等によって復号装置に入力されるべき情報に欠落が生じて正しい復号音信号を得られなくなった際の対策として、予め符号化の段階において信号のエネルギー、位相、ピッチ周期といった音信号の分類情報を補助的に付加し、復号装置に入力されるべき情報の欠落が生じる以前に復号装置に入力された補助情報を基に、その補助情報が示す音信号の分類と同種の信号を求めることにより情報が欠落した部分の復号音信号を補間により生成していた(例えば、非特許文献1参照。)。 Conventionally, as a countermeasure when a correct decoded sound signal cannot be obtained due to loss of information to be input to the decoding device due to loss of a packet on a transmission path between the encoding and decoding of the sound signal and the like, At the encoding stage, sound signal classification information such as signal energy, phase, and pitch period is supplementarily added, and based on auxiliary information input to the decoding device before loss of information to be input to the decoding device occurs. Then, by obtaining a signal of the same kind as the classification of the sound signal indicated by the auxiliary information, a decoded sound signal in a portion where information is missing is generated by interpolation (for example, see Non-Patent Document 1).
しかし、上記の技術では、情報欠落時の聴覚的不快感を低減はするものの、通常の信号の復号に必要な情報のほかに追加の情報量が必要であった。また、上記の技術では、1つのパケットに含まれる音信号として20 msec程度の長さのものを想定していることから、欠落した信号の後の情報を用いるための追加の原理遅延が必要であった。 However, in the above technique, although the auditory discomfort at the time of information loss is reduced, an additional amount of information is required in addition to the information necessary for decoding a normal signal. Further, in the above technique, since a sound signal included in one packet has a length of about 20 msec, an additional principle delay for using information after a missing signal is necessary. there were.
この発明は、追加の情報の伝送が必要なく、復号の原理遅延を増やすことなく、欠落した情報を従来技術より聴覚的に良好に補間できる復号装置、復号方法及びプログラムを提供することを目的とする。 An object of the present invention is to provide a decoding device, a decoding method, and a program that can interpolate missing information more audibly than conventional techniques without requiring additional information transmission and without increasing the principle delay of decoding. I do.
この発明の一態様による復号装置は、フレームごとに復号音信号を得る復号装置であって、音信号符号が欠落しているフレームについては、フレームの前フレームの復号音信号のサンプルを時間的に逆に並べた信号と当該信号の極性を反転した信号の中から、前フレームと時間的に連続性が高い信号の候補を選択し、選択した信号の候補である拡張復号音信号と、前フレームから線形予測合成した信号と、に基づいて生成した信号を、フレームの復号音信号とする補間信号生成部を含む。 A decoding device according to one aspect of the present invention is a decoding device that obtains a decoded sound signal for each frame. For a frame in which a sound signal code is missing, a sample of a decoded sound signal of a frame preceding the frame is temporally extracted. A signal candidate having high temporal continuity with the previous frame is selected from the reversely arranged signal and the signal obtained by inverting the polarity of the signal, and the extended decoded sound signal which is a selected signal candidate and the previous frame are selected. And a signal generated on the basis of the signal obtained by linear prediction synthesis from the input signal and a decoded signal of the frame.
この発明の一態様による復号装置は、フレームごとに復号音信号を得る復号装置であって、音信号符号が欠落しているフレームについては、フレームの前フレームの復号音信号のサンプルを時間的に逆に並べた信号又は当該信号の極性を反転した信号である拡張復号音信号と、前フレームから線形予測合成した信号と、に基づいて生成した信号を、フレームの復号音信号とする補間信号生成部を含む。
この発明の一態様による復号装置は、フレームごとに復号音信号を得る復号装置であって、音信号符号が欠落しているフレームについては、フレームの前フレームの復号音信号のサンプルを時間的に逆に並べた信号、当該信号の極性を反転した信号、前フレームの復号音信号及び前フレームの復号音信号の極性を反転した信号の中から、前フレームから線形予測合成した信号と類似性が高い信号の候補を選択し、選択した信号の候補である拡張復号音信号、または、拡張復号音信号と前フレームから線形予測合成した信号とに基づいて生成した信号、をフレームの復号音信号とする補間信号生成部、を備えている。
この発明の一態様による復号装置は、フレームごとに復号音信号を得る復号装置であって、音信号符号が欠落しているフレームについては、フレームの前フレームの復号音信号のサンプルを時間的に逆に並べた信号又は当該信号の極性を反転した信号から前フレームから線形予測合成した信号と類似性が高い信号を選択し、選択した信号である拡張復号音信号、または、拡張復号音信号と前フレームから線形予測合成した信号とに基づいて生成した信号、を、フレームの復号音信号とする補間信号生成部、を備えている。
この発明の一態様による復号装置は、フレームごとに復号音信号を得る復号装置であって、音信号符号が欠落しているフレームについては、フレームの前フレームの復号音信号とパワースペクトルが同じである複数の信号の候補の中から、前フレームと時間的に連続性が高い信号の候補を選択し、選択した信号の候補である拡張復号音信号と、前フレームから線形予測合成した信号と、に基づいて生成した信号を、フレームの復号音信号とする補間信号生成部、を備えている。
この発明の一態様による復号装置は、フレームごとに復号音信号を得る復号装置であって、音信号符号が欠落しているフレームについては、フレームの前フレームの復号音信号とパワースペクトルが同じである複数の信号の候補の中から、前フレームから線形予測合成した信号と類似性が高い信号の候補を選択し、選択した信号の候補である拡張復号音信号、または、拡張復号音信号と前フレームから線形予測合成した信号とに基づいて生成した信号、をフレームの復号音信号とする補間信号生成部、を備えている。
A decoding device according to one aspect of the present invention is a decoding device that obtains a decoded sound signal for each frame. For a frame in which a sound signal code is missing, a sample of a decoded sound signal of a frame preceding the frame is temporally extracted. Interpolation signal generation using a signal generated based on an extended decoded sound signal that is a signal arranged in reverse or a signal whose polarity is inverted and a signal that is linearly predicted and synthesized from the previous frame as a decoded sound signal of a frame Including parts.
A decoding device according to one aspect of the present invention is a decoding device that obtains a decoded sound signal for each frame. For a frame in which a sound signal code is missing, a sample of a decoded sound signal of a frame preceding the frame is temporally extracted. Among the reversely arranged signals, the signal whose polarity is inverted, the decoded sound signal of the previous frame, and the signal whose polarity of the decoded sound signal of the previous frame is inverted, the similarity to the signal obtained by linear predictive synthesis from the previous frame. A candidate for a high signal is selected, and an extended decoded sound signal that is a candidate for the selected signal, or a signal generated based on the extended decoded sound signal and a signal that is linearly predicted and synthesized from the previous frame, and a decoded sound signal of the frame And an interpolation signal generation unit for performing the interpolation.
A decoding device according to one aspect of the present invention is a decoding device that obtains a decoded sound signal for each frame. For a frame in which a sound signal code is missing, a sample of a decoded sound signal of a frame preceding the frame is temporally extracted. A signal having a high similarity to a signal obtained by linear prediction synthesis from the previous frame from a signal arranged in reverse or a signal in which the polarity of the signal is inverted is selected, and the selected decoded signal is an extended decoded sound signal, or an extended decoded sound signal. A signal generated based on a signal subjected to linear prediction synthesis from the previous frame, and an interpolated signal generation unit that uses the signal as a decoded sound signal of the frame.
A decoding device according to one aspect of the present invention is a decoding device that obtains a decoded sound signal for each frame. For a frame in which a sound signal code is missing, the decoded sound signal of the frame preceding the frame has the same power spectrum as the decoded sound signal. From among a plurality of signal candidates, a signal candidate having high temporal continuity with the previous frame is selected, and an extended decoded sound signal that is a candidate of the selected signal, and a signal obtained by linear prediction synthesis from the previous frame, And an interpolation signal generation unit that uses the signal generated based on the above as a decoded sound signal of the frame.
A decoding device according to one aspect of the present invention is a decoding device that obtains a decoded sound signal for each frame. For a frame in which a sound signal code is missing, the decoded sound signal of the frame preceding the frame has the same power spectrum as the decoded sound signal. From among a plurality of signal candidates, a signal candidate having a high similarity to the signal obtained by linear prediction synthesis from the previous frame is selected, and the extended decoded sound signal or the extended decoded sound signal that is the selected signal candidate is selected. An interpolated signal generation unit that uses a signal generated based on a signal obtained by performing linear prediction synthesis from the frame as a decoded sound signal of the frame.
追加の情報の伝送が必要なく、復号の原理遅延を増やすことなく、欠落した情報を従来技術より良好に聴覚的に補間できる。 Missing information can be audibly interpolated better than in the prior art, without the need to transmit additional information and without increasing the decoding delay.
以下、図面を参照して、この発明の実施形態について説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
[第一実施形態から第三実施形態で想定する符号化装置]
後述する第一実施形態から及び第三実施形態で想定する符号化装置の例を図1に示す。想定する符号化装置は、図1に示すように、線形予測分析部11、信号符号化部12及びパケット化部13を例えば備えている。
[Encoding device assumed in first to third embodiments]
FIG. 1 shows an example of an encoding device assumed in a first embodiment to be described later and in a third embodiment. The assumed coding apparatus includes, for example, a linear prediction analysis unit 11, a
第一実施形態から第三実施形態で想定する符号化方法は、符号化装置の各部が、図2及び以下に説明するステップE1からステップE3の処理を行うことにより例えば実現される。 The encoding method assumed in the first to third embodiments is realized, for example, by each unit of the encoding device performing the processing of FIG. 2 and steps E1 to E3 described below.
以下、図1に示す符号化装置の各部について説明する。 Hereinafter, each unit of the encoding device shown in FIG. 1 will be described.
<線形予測分析部11>
線形予測分析部11には、時間領域の音信号が入力される。音信号は、例えば音声信号又は音響信号である。
<Linear prediction analysis unit 11>
A time-domain sound signal is input to the linear prediction analysis unit 11. The sound signal is, for example, an audio signal or an acoustic signal.
線形予測分析部11は、パケットに含める音信号の時間長に対応する所定の時間長のフレーム単位で入力された時間領域の音信号を基に、線形予測係数α1,α2,…,αpを生成する(ステップE1)。また、線形予測分析部11は、生成した線形予測係数α1,α2,…,αpを符号化して線形予測係数符号を得る。線形予測係数符号の例は、線形予測係数α1,α2,…,αpに対応するLSP(Line Spectrum Pairs)パラメータ列の量子化値の列に対応する符号であるLSP符号である。pは2以上の整数である。 The linear prediction analysis unit 11 performs linear prediction coefficients α 1 , α 2 ,..., Α on the basis of a time-domain sound signal input in a frame unit of a predetermined time length corresponding to the time length of the sound signal included in the packet. Generate p (step E1). Further, the linear prediction analysis unit 11 encodes the generated linear prediction coefficients α 1 , α 2 ,..., Α p to obtain a linear prediction coefficient code. Examples of the linear prediction coefficient code, the linear predictive coefficients α 1, α 2, ..., a LSP code is a code corresponding to the column of the quantized value of the LSP (Line Spectrum Pairs) parameter sequence corresponding to alpha p. p is an integer of 2 or more.
線形予測分析部11は、得た線形予測係数符号をパケット化部13に出力する。
The linear prediction analysis unit 11 outputs the obtained linear prediction coefficient code to the
また、線形予測分析部11は、得た線形予測係数符号に対応する線形予測係数である量子化線形予測係数^α1,^α2,…,^αpを得る。なお、「・」を任意の文字として、「^・」という記載は、「・」の上に「^」が付いていることを意味する。 Also, the linear prediction analyzer 11 is a linear prediction coefficient corresponding to the linear prediction coefficient code obtained quantized linear prediction coefficient ^ α 1, ^ α 2, ..., obtaining ^ alpha p. It should be noted that the notation “^” with “•” as an arbitrary character means that “^” is added above “•”.
線形予測分析部11は、得た量子化線形予測係数^α1,^α2,…,^αpを、信号符号化部12に出力する。
Linear prediction analysis unit 11, resulting quantized linear prediction coefficient ^ α 1, ^ α 2, ..., a ^ alpha p, and outputs the
線形予測分析部11は、線形予測分析の処理として、例えば、フレーム単位で入力された音信号に対する自己相関を求めて、求めた自己相関を利用してLevinson-Durbinアルゴリズムを行うことにより線形予測係数を得る方法を用いる。線形予測分析部11による線形予測係数符号の取得は、例えば従来的な符号化技術によって行われる。従来的な符号化技術とは、例えば、線形予測係数そのものに対応する符号を線形予測係数符号とする符号化技術、線形予測係数をLSPパラメータに変換してLSPパラメータに対応する符号を線形予測係数符号とする符号化技術、線形予測係数をPARCOR係数に変換してPARCOR係数に対応する符号を線形予測係数符号とする符号化技術などである。 The linear prediction analysis unit 11 performs a linear prediction analysis process, for example, by obtaining an autocorrelation with respect to a sound signal input in a frame unit and performing a Levinson-Durbin algorithm using the obtained autocorrelation. Is used. The acquisition of the linear prediction coefficient code by the linear prediction analysis unit 11 is performed by, for example, a conventional encoding technique. Conventional coding techniques include, for example, an encoding technique in which a code corresponding to the linear prediction coefficient itself is a linear prediction coefficient code, and a code corresponding to the LSP parameter obtained by converting the linear prediction coefficient into an LSP parameter. There are coding techniques for coding, and coding techniques for converting a linear prediction coefficient into a PARCOR coefficient and setting a code corresponding to the PARCOR coefficient as a linear prediction coefficient code.
<信号符号化部12>
信号符号化部12には、時間領域の音信号と、線形予測分析部11が出力した量子化線形予測係数^α1,^α2,…,^αpとが入力される。
<
The
信号符号化部12は、例えば非特許文献1の符号化装置のように、量子化線形予測係数^α1,^α2,…,^αpの値を用いてフレーム単位で入力された音信号の線形予測を行い、線形予測残差である予測残差信号を得て、得られた予測残差信号を符号化することにより残差信号符号を得る(ステップE2)。信号符号化部12は、得た残差信号符号を、パケット化部13に出力する。
The
<パケット化部13>
パケット化部13には、線形予測分析部11が出力した線形予測係数符号と、信号符号化部12が出力した残差信号符号とが入力される。ここで、入力された線形予測係数符号と残差信号符号は、符号化装置に入力された音信号を表す符号であるので、線形予測係数符号と残差信号符号を合わせたものを音信号符号と呼ぶこととする。
<
The
パケット化部13は、例えば図3に示すように、データ長及びフレーム番号等を示すヘッダと、音信号符号と、パケット全体に誤りが生じているか否かを検出するためのCRC符号などの誤り検出符号とを含む1つのパケットを構成し、このパケットを復号装置に対して出力する(ステップE3)。この例では、音信号符号は、線形予測係数符号及び残差信号符号を含む符号である。
For example, as shown in FIG. 3, the packetizing
音信号符号のデータ長が固定であればヘッダにデータ長を表す情報を含める必要はないが、信号符号化部12で可変長符号化した場合などは音信号符号のデータ長がパケットにより異なることがあるのでヘッダにデータ長を表す情報を含める必要がある。
If the data length of the audio signal code is fixed, it is not necessary to include information indicating the data length in the header, but the data length of the audio signal code differs depending on the packet when the
[第一実施形態の復号装置及び方法]
復号装置に入力されるべき情報であるパケットがパケット消失等によって欠落した場合、聴覚的不快感を低減するために、復号装置はそのパケット(以下、「欠落パケット」との文言を用いる場合もある。)に対応するフレーム(以下、「欠落フレーム」との文言を用いる場合もある。)の復号音信号を消失していないパケットに含まれる情報から生成する、すなわち、補間により生成する。その際、復号の原理遅延を増加させずに欠落フレームの補間を行うためには、復号装置は欠落フレームの欠落パケットよりも時間的に過去のパケットの情報から補間する必要がある。ここで、第一実施形態の復号装置は、欠落フレームの前フレームの復号線形予測係数から予測される信号(以下、「予測信号」との文言を用いる場合もある。)を欠落フレームの補間に用いる。すなわち、第一実施形態の復号装置は、前フレームの復号線形予測係数から予測信号を欠落フレームの復号音信号とすることで、欠落フレームの復号音信号と前フレームの復号音信号との連続性を担保する。
[Decoding device and method according to first embodiment]
When a packet that is information to be input to the decoding device is lost due to packet loss or the like, the decoding device may use the packet (hereinafter, referred to as “missing packet”) in order to reduce auditory discomfort. ) Is generated from the information included in the packet that has not lost the decoded sound signal of the frame (hereinafter, the term “missing frame” may be used in some cases), that is, generated by interpolation. At this time, in order to perform the interpolation of the missing frame without increasing the principle delay of the decoding, the decoding device needs to interpolate from the information of the packet that is earlier in time than the missing packet of the missing frame. Here, the decoding device according to the first embodiment uses a signal predicted from the decoded linear prediction coefficient of the previous frame of the missing frame (hereinafter, sometimes referred to as a “predicted signal”) for interpolation of the missing frame. Used. That is, the decoding device of the first embodiment uses the prediction signal as the decoded sound signal of the missing frame from the decoded linear prediction coefficient of the previous frame, so that the continuity between the decoded sound signal of the missing frame and the decoded sound signal of the previous frame is obtained. To secure.
ただし、この予測信号は時間とともに減衰してしまい、予測信号のみで補間を行った場合は欠落フレームの復号音信号と次フレームの復号音信号とが不連続になってしまうことがある。そこで、第一実施形態の復号装置は、欠落フレームの予測信号と前フレームの復号音信号との重み付和により得られる信号を欠落フレームの補間に用いる。すなわち、第一実施形態の復号装置は、欠落フレームの予測信号と前フレームの復号音信号との重み付和により得られる信号を欠落フレームの復号音信号として得る。この際、第一実施形態の復号装置は、前フレームの復号音信号に代えて、前フレームの復号音信号に対して時間反転による折り返しや極性の反転を行ったものを用いてもよい。第一実施形態の復号装置は、時間反転の有無や極性の反転の有無を前フレームの復号音信号に合わせて適応的に使い分けることで、前フレームの復号音信号とのより連続的な補間を行ってもよい。要するに、第一実施形態の復号装置は、欠落フレームの予測信号と、前フレームの復号音信号とパワースペクトルが同じである信号と、の重み付和により得られる信号を欠落フレームの復号音信号としてもよい。 However, the predicted signal attenuates with time, and if interpolation is performed using only the predicted signal, the decoded sound signal of the missing frame and the decoded sound signal of the next frame may be discontinuous. Therefore, the decoding device of the first embodiment uses a signal obtained by weighted sum of a predicted signal of a missing frame and a decoded sound signal of a previous frame for interpolation of the missing frame. That is, the decoding device of the first embodiment obtains, as a decoded sound signal of the missing frame, a signal obtained by weighting the sum of the predicted signal of the missing frame and the decoded sound signal of the previous frame. At this time, the decoding device of the first embodiment may use a decoded sound signal of the previous frame that has been subjected to time reversal or polarity inversion instead of the decoded sound signal of the previous frame. The decoding device according to the first embodiment uses the presence / absence of time reversal and the presence / absence of polarity reversal adaptively according to the decoded sound signal of the previous frame, thereby performing more continuous interpolation with the decoded sound signal of the previous frame. May go. In short, the decoding device of the first embodiment sets the signal obtained by the weighted sum of the predicted signal of the missing frame and the signal having the same power spectrum as the decoded sound signal of the previous frame as the decoded sound signal of the missing frame. Is also good.
また、第一実施形態の復号装置は、欠落フレームの予測信号と次フレームの復号音信号との不連続を解消するために、次フレームの復号により得られた音信号について、次フレームの復号により得られた音信号と欠落フレームの復号音信号との重み付和を次フレームの復号音信号とすることで、次フレームで欠落フレームと連続する復号音信号を得てもよい。 Further, the decoding apparatus of the first embodiment performs decoding of the next frame on the sound signal obtained by decoding the next frame in order to eliminate discontinuity between the prediction signal of the missing frame and the decoded sound signal of the next frame. By making the weighted sum of the obtained sound signal and the decoded sound signal of the missing frame the decoded sound signal of the next frame, a decoded sound signal continuous with the missing frame in the next frame may be obtained.
第一実施形態の復号装置の構成例を図4に示す。第一実施形態の復号装置は、図4に示すように、非パケット化部21と、線形予測係数復号部22と、信号復号部23と、補間信号生成部24とを例えば備えている。補間信号生成部24は、線形予測係数記憶部241と、復号音信号記憶部242と、線形予測部243と、信号拡張選択部244と、補間信号結合部245とを例えば備えている。
FIG. 4 shows a configuration example of the decoding device of the first embodiment. As shown in FIG. 4, the decoding device according to the first embodiment includes, for example, a
復号方法は、フレームごとに復号音信号を得る復号装置の各部が、図5及び以下に説明するステップD1からステップD6の処理を行うことにより例えば実現される。 The decoding method is realized, for example, by each unit of the decoding device that obtains a decoded sound signal for each frame, performing the processing of FIG. 5 and steps D1 to D6 described below.
以下、図4の復号装置の各部について説明する。 Hereinafter, each unit of the decoding device in FIG. 4 will be described.
<非パケット化部21>
非パケット化部21には、符号化装置から出力されたパケットが入力される。
<
The packet output from the encoding device is input to the
非パケット化部21は、パケット内のCRC符号などの誤り検出符号を基にパケット内に誤りが生じているか否かを検出する。また、非パケット化部21は、パケットのヘッダ内のフレーム番号を基に一連のパケット番号に欠落が生じているか否か、すなわち、連続して存在するはずの複数フレームの音信号符号のうちのあるフレームのパケットがパケット損失等で欠落しているか、も検出する。そして、非パケット化部21は、それらの検出結果から、パケットが欠落しておらずパケット内に誤りがない場合には当該パケットに対応するフレームの音信号符号が欠落していないと判定し、パケットが欠落しているかパケット内に誤りがある場合には当該パケットに対応するフレームの音信号符号が欠落していると判定し、当該パケットに対応するフレームの音信号符号が欠落しているかいないかを示す情報である欠落判定情報を生成する(ステップD1)。
The
非パケット化部21は、欠落判定情報を、線形予測係数記憶部241と、復号音信号記憶部242と、線形予測部243と、信号拡張選択部244と、補間信号結合部245とに出力する。
The
非パケット化部21は、音信号符号が欠落していないフレームについて、パケットからヘッダ内のデータ長を表す情報を基に音信号符号を取り出し、線形予測係数復号部22には音信号符号のうちの少なくとも線形予測係数符号を、信号復号部23には音信号符号のうちの少なくとも残差信号符号を、それぞれ出力する。
The
<線形予測係数復号部22>
線形予測係数復号部22には、音信号符号が欠落していないフレームについての、非パケット化部21が出力した線形予測係数符号が入力される。
<Linear prediction
The linear prediction coefficient code output from the
線形予測係数復号部22は、音信号符号が欠落していないフレームについて、フレーム毎に、入力された線形予測係数符号を例えば従来的な復号技術によって復号して復号線形予測係数^α1,^α2,…,^αpを得て、得た復号線形予測係数^α1,^α2,…,^αpを信号復号部23及び線形予測係数記憶部241に出力する(ステップD2)。
The linear prediction
ここで、従来的な復号技術とは、例えば、線形予測係数符号が量子化された線形予測係数に対応する符号である場合に線形予測係数符号を復号して量子化された線形予測係数と同じ復号線形予測係数を得る技術、線形予測係数符号が量子化されたLSPパラメータに対応する符号である場合に線形予測係数符号を復号して量子化されたLSPパラメータと同じ復号LSPパラメータを得る技術などである。また、線形予測係数とLSPパラメータは互いに変換可能なものであり、入力された線形予測係数符号と後段での処理において必要な情報に応じて、復号線形予測係数と復号LSPパラメータの間での変換処理を行なえばよいのは周知である。以上から、上記の線形予測係数符号の復号処理と必要に応じて行なう上記の変換処理とを包含したものが「従来的な復号技術による復号」ということになる。 Here, the conventional decoding technique is, for example, when the linear prediction coefficient code is a code corresponding to the quantized linear prediction coefficient, the linear prediction coefficient code is the same as the quantized linear prediction coefficient. Technology to obtain decoded linear prediction coefficients, technology to obtain the same decoded LSP parameters as quantized LSP parameters by decoding the linear prediction coefficient codes when the linear prediction coefficient codes are codes corresponding to the quantized LSP parameters It is. Further, the linear prediction coefficient and the LSP parameter are mutually convertible, and the conversion between the decoded linear prediction coefficient and the decoded LSP parameter is performed according to the input linear prediction coefficient code and information necessary for processing in the subsequent stage. It is well known that the processing may be performed. As described above, what includes the decoding processing of the linear prediction coefficient code and the conversion processing performed as necessary is “decoding by the conventional decoding technique”.
なお、線形予測係数復号部22は、音信号符号が欠落したフレームについては、何もしない。
Note that the linear prediction
<信号復号部23>
信号復号部23には、音信号符号が欠落していないフレームについての、非パケット化部21が出力した残差信号符号と、線形予測係数復号部22が出力した復号線形予測係数^α1,^α2,…,^αpとが入力される。
<Signal decoding
The
信号復号部23は、音信号符号が欠落していないフレームについて、フレーム毎に、例えば非特許文献1の復号装置のように、残差信号符号に対応する残差信号を得て、復号線形予測係数^α1,^α2,…,^αpと残差信号と1サンプル前までの復号音信号とを用いて線形予測合成をすることにより復号音信号^x(0),^x(1),…,^x(N-1)を得て、得た復号音信号^x(0),^x(1),…,^x(N-1)を復号音信号記憶部242及び補間信号結合部245に出力する(ステップD3)。Nは所定の正の整数である。
The
なお、信号復号部23は、音信号符号が欠落したフレームについては、何もしない。
Note that the
<線形予測係数記憶部241>
線形予測係数記憶部241には、非パケット化部21が出力した欠落判定情報と、線形予測係数復号部22が出力した復号線形予測係数^α1,^α2,…,^αとが入力される。
<Linear prediction
The linear prediction
線形予測係数記憶部241は、フレーム毎に、当該フレームの欠落判定情報が音信号符号が欠落していないことを示す場合、すなわち、当該フレームの音信号符号が欠落していない場合に、入力された復号線形予測係数^α1,^α2,…,^αpを前フレーム復号線形予測係数^β1,^β2,…,^βpとして記憶する。
The linear prediction
また、線形予測係数記憶部241は、当該フレームの欠落判定情報が音信号符号が欠落していることを示す場合、すなわち、当該フレームの音信号符号が欠落している場合に、記憶している前フレーム復号線形予測係数^β1,^β2,…,^βpを線形予測部243に出力する。
Further, the linear prediction
<復号音信号記憶部242>
復号音信号記憶部242には、非パケット化部21が出力した欠落判定情報と、信号復号部23が出力した復号音信号^x(0),^x(1),…,^x(N-1)とが入力される。
<Decoded sound
The decoded sound
復号音信号記憶部242は、正常に復号された復号音信号を数フレーム分、例えば、2フレーム分記憶する。例えば、復号音信号記憶部242は、当該フレームの欠落判定情報が音信号符号が欠落していないことを示す場合、すなわち、当該フレームの音信号符号が欠落していない場合に、復号音信号記憶部242に記憶されている当該フレームの直前フレーム復号音信号^y(N+1),^y(N+2),…,^y(2N-1)の各サンプル値を、2フレーム前復号音信号^y(0),^y(1),…,^y(N-1)の各サンプル値としてそれぞれ記憶し、入力された復号音信号^x(0),^x(1),…,^x(N-1)の各サンプル値を前フレーム復号音信号^y(N+1),^y(N+2),…,^y(2N-1)の各サンプル値としてそれぞれ記憶する。
The decoded sound
また、復号音信号記憶部242は、当該フレームの欠落判定情報が音信号符号が欠落していることを示す場合、すなわち、当該フレームの音信号符号が欠落している場合に、記憶されている前フレーム復号音信号^y(0),^y(1),…,^y(2N-1)を線形予測部243及び信号拡張選択部244に出力する。
Further, the decoded sound
<線形予測部243>
線形予測部243には、欠落判定情報が音信号符号が欠落していることを示すフレーム、すなわち、当該フレームの音信号符号が欠落しているフレームについての、非パケット化部21が出力した欠落判定情報と、線形予測係数記憶部241が出力した前フレーム復号線形予測係数^β1,^β2,…,^βpと、復号音信号記憶部242が出力した前フレーム復号音信号^y(0),^y(1),…,^y(2N-1)とが入力される。
<
The
線形予測部243は、当該フレームの欠落判定情報が音信号符号が欠落していることを示す場合、すなわち、当該フレームの音信号符号が欠落している場合に、前フレーム復号線形予測係数^β1,^β2,…,^βpの値を基に例えば以下の式(1)のように予測信号predict(0),predict(1),…,predict(N-1)を生成し、生成した予測信号predict(0),predict(1),…,predict(N-1)を補間信号結合部245に出力する(ステップD4)。
すなわち、この予測信号predict(0),predict(1),…,predict(N-1)は、音信号符号が欠落していない前フレームの復号線形予測係数を当該フレームの復号線形予測係数とし、0を当該フレームの残差信号の各サンプル値としたときの、当該フレームの予測信号である。 That is, the predictive signal predict (0), predict (1),..., Predict (N-1) defines the decoded linear prediction coefficient of the previous frame in which the sound signal code is not missing as the decoded linear prediction coefficient of the frame. This is a predicted signal of the frame when 0 is used as each sample value of the residual signal of the frame.
<信号拡張選択部244>
信号拡張選択部244には、欠落判定情報が音信号符号が欠落していることを示すフレーム、すなわち、音信号符号が欠落しているフレームについての、非パケット化部21が出力した欠落判定情報と、復号音信号記憶部242が出力した前フレーム復号音信号^y(0),^y(1),…,^y(2N-1)とが入力される。
<Signal
The signal
後述するが、この前フレーム復号音信号^y(0),^y(1),…,^y(2N-1)を時間的に逆にしたもの及び時間的に逆にして極性を入れ替えたもののそれぞれは、特定の仮定の下では、前フレームの復号音信号のパワースペクトルを保ったまま位相をフレーム長分だけシフトさせたものに等しい。したがって、信号拡張選択部244は、フレーム毎に、当該フレームの欠落判定情報が音信号符号が欠落していることを示す場合、すなわち、当該フレームの音信号符号が欠落している場合に、当該フレームの前フレームの復号音信号から仮定される当該フレーム(以下、「現フレーム」との文言を用いる場合もある。)の復号音信号として適切なものを例えば以下のように選択し、その仮定に則った現フレームの復号音信号である拡張復号音信号extend(0),extend(1),…,extend(2N-1)を生成する(ステップD5)。
As will be described later, the polarity of the preceding frame decoded sound signal ^ y (0), ^ y (1),..., ^ Y (2N-1) is reversed in time and the polarity is reversed in time. Each of them is, under certain assumptions, equal to a phase shifted by the frame length while maintaining the power spectrum of the decoded sound signal of the previous frame. Therefore, the signal
前フレーム復号音信号^y(0),^y(1),…,^y(2N-1)が例えば、N番目及びN+1番目のサンプルの境を中心に偶対称な正弦波の足し合わせで表されるとするのであれば、その信号に続く現フレームの復号音信号は前フレーム復号音信号^y(0),^y(1),…,^y(2N-1)を時間的に逆に並べたものと等しくなる。また、前フレーム復号音信号^y(0), ^y(1),…, ^y(2N-1)が例えば、N番目及びN+1番目のサンプルの境を中心に奇対称な正弦波の足し合わせで表されるとするのであれば、その信号に続く現フレームの復号音信号は前フレーム復号音信号^y(0),^y(1),…,^y(2N-1)を時間的に逆に並べ、極性を反転させたものと等しくなる。 The decoded sound signal of the previous frame ^ y (0), ^ y (1), ..., ^ y (2N-1) is, for example, the addition of a sine wave that is even symmetric about the boundary between the Nth and N + 1th samples. If it is expressed as a combination, the decoded sound signal of the current frame following that signal is the decoded sound signal of the previous frame ^ y (0), ^ y (1), ..., ^ y (2N-1). It becomes equal to what was arranged in reverse. Also, the decoded sound signal of the previous frame ^ y (0), ^ y (1), ..., ^ y (2N-1) is, for example, a sine wave that is oddly symmetric about the boundary between the Nth and N + 1th samples. , The decoded sound signal of the current frame following that signal is the decoded sound signal of the previous frame ^ y (0), ^ y (1), ..., ^ y (2N-1) Are reversed in time, and are equal to those obtained by inverting the polarity.
このことから、まず、信号拡張選択部244は、前フレーム復号音信号^y(0),^y(1),…,^y(2N-1)のN番目及びN+1番目のサンプルの境を中心に対称なサンプル対の和と差のエネルギーeven, oddを以下の式(2),(2')のようにそれぞれ算出し、その値の大小を基に、前フレーム復号音信号^y(0), ^y(1),…, ^y(2N-1)が偶対称的であるか奇対称的であるかを判断する。
そして、信号拡張選択部244は、even≧oddの場合には拡張復号音信号として前フレーム復号音信号の逆順であるextend(n)=^y(2N-1-n)(n=0,1,…,2N-1)を、odd>evenの場合には極性を反転した前フレーム復号音信号の逆順であるextend(n)=-^y(2N-1-n)(n=0,1,…,2N-1)を選択し、選択した拡張復号音信号extend(0),extend(1),…,extend(2N-1)を補間信号結合部245に出力する。
Then, when even ≧ odd, the signal
すなわち、補間信号生成部24は、より詳細には補間信号生成部24の信号拡張選択部244は、前フレームの復号音信号が偶対称的である場合には前フレームの復号音信号のサンプルを時間的に逆に並べた信号を選択し、前フレームの復号音信号が奇対称的である場合には当該信号の極性を反転した信号を選択し、上記選択した信号を当該フレームの拡張復号音信号とする。
That is, the interpolation
このようにして、補間信号生成部24は、より詳細には補間信号生成部24の信号拡張選択部244は、音信号符号が欠落しているフレームについては、当該フレームの前フレームの復号音信号のサンプルを時間的に逆に並べた信号、又は、当該信号の極性を反転した信号を選択し、上記選択した信号を当該フレームの拡張復号音信号とする。
In this way, the interpolation
<補間信号結合部245>
補間信号結合部245には、非パケット化部21が出力した欠落判定情報と、信号復号部23が出力した復号音信号^x(0),^x(1),…,^x(N-1)と、線形予測部243が出力した予測信号predict(0),predict(1),…,predict(N-1)と、信号拡張選択部244が出力した拡張復号音信号extend(0),extend(1),…,extend(2N-1)とが入力される。
<Interpolation
The interpolation
補間信号結合部245は、当該フレームと前フレームの欠落判定情報に応じて、すなわち、当該フレームの音信号符号が欠落しているか否かと前フレームの音信号符号が欠落しているか否かに応じて、例えば以下の3通りの処理を選択的に行う。
The interpolation
補間信号結合部245は、当該フレームの欠落判定情報と前フレームの欠落判定情報の両方が音信号符号が欠落していないことを示す場合、すなわち、当該フレームの音信号符号が欠落しておらず、当該フレームの前フレームの音信号符号も欠落していない場合、復号音信号^x(0),^x(1),…,^x(N-1)を当該フレームの復号音信号^X(0),^X(1),…,^X(N-1)として出力する(ステップD6)。
The interpolation
補間信号結合部245は、当該フレームの欠落判定情報が音信号符号が欠落していることを示す場合、すなわち、当該フレームの音信号符号が欠落している場合、例えば以下の式(3)のように、予測信号predict(0),predict(1),…,predict(N-1)と拡張復号音信号extend(0),extend(1),…,extend (N-1)とを所定の窓関数を用いて線形結合させたものを当該フレームの復号音信号^X(0),^X(1),…,^X(N-1)として出力する(ステップD6)。
ただし、n=0,1,…,N-1であり、w(n)が窓関数を示す。窓関数w(n)として、上記式以外の他の窓関数を用いてもよいが、extend(n)に乗じる窓関数は時間に対して増大する関数、すなわちnの値が大きいほど大きな値となる関数であり、predict(n)に乗じる窓関数は時間に対して減少する関数、すなわちnの値が大きいほど小さな値となる関数であることが望ましい。このように、窓関数を用いて二種類の信号を線形結合することをここではクロスフェードと呼び、extend(n)とpredict(n)のそれぞれに乗じる窓関数をクロスフェードするための関数と呼ぶ。 Here, n = 0, 1,..., N−1, and w (n) indicates a window function. As the window function w (n), a window function other than the above equation may be used.However, the window function by which extend (n) is multiplied with time, that is, the larger the value of n, the larger the value of n. It is desirable that the window function that multiplies predict (n) be a function that decreases with time, that is, a function that becomes smaller as the value of n increases. In this way, the linear combination of two types of signals using a window function is called a crossfade here, and a function for crossfading a window function multiplying each of extend (n) and predict (n) is called here. .
このようにして、補間信号生成部24は、より詳細には補間信号生成部24の補間信号結合部245は、音信号符号が欠落しているフレームについては、当該フレームの前フレームの復号音信号のサンプルを時間的に逆に並べた信号又は当該信号の極性を反転した信号である拡張復号音信号と、前フレームから線形予測合成した信号と、に基づいて生成した信号を、当該フレームの復号音信号とする。
In this way, the interpolation
補間信号結合部245は、当該フレームの欠落判定情報が音信号符号が欠落していないことを示しかつ当該フレームの前フレームの欠落判定情報が音信号符号が欠落していることを示す場合、すなわち、当該フレームの音信号符号が欠落しておらず、当該フレームの前フレームの音信号符号が欠落している場合、例えば以下の式(4)のように、復号音信号^x(0),^x(1),…,^x(N-1)と拡張復号音信号extend(N),extend(N+1),…,extend(2N-1)とをクロスフェードさせたものを当該フレームの復号音信号^X(0),^X(1),…,^X(N-1)として出力する(ステップD6)。
ただし、n=0,1,…,N-1であり、w(n)が上述の窓関数を示す。この操作により、情報の欠落したフレームと現フレームとの連続性を高めることができる。 Here, n = 0, 1,..., N−1, and w (n) indicates the above-described window function. By this operation, continuity between the frame in which information is missing and the current frame can be increased.
<補間信号生成部24>
補間信号生成部24は、上記説明した、線形予測係数記憶部241、復号音信号記憶部242、線形予測部243、信号拡張選択部244の処理及び補間信号結合部245の式(3)を用いた処理により、音信号符号が欠落しているフレームについては、当該フレームの前フレームの復号音信号とパワースペクトルが同じである複数の信号の候補の中から、前フレームと時間的に連続性が高い信号の候補を選択し、選択した信号の候補を当該フレームの復号音信号としていると言える。
<
The interpolation
なお、補間信号生成部24の補間信号結合部245は、フレームの音信号符号が欠落している場合には、信号拡張選択部244が出力した拡張復号音信号を、当該フレームの復号音信号としてもよい。すなわち、補間信号生成部24は、音信号符号が欠落しているフレームについては、当該フレームの前フレームの復号音信号のサンプルを時間的に逆に並べた信号又は当該信号の極性正負を反転逆にした信号を、当該フレームの復号音信号としてもよい。このようにする場合には、補間信号生成部24は、線形予測係数記憶部241及び線形予測部243を動作させないでよく、線形予測係数記憶部241及び線形予測部243を備えないでもよい。
When the sound signal code of the frame is missing, the interpolation
このように、復号装置が、前フレームの情報のみに基づいて、前フレームのパワースペクトルを同じ信号を用いた補間を行うことにより、追加の情報の伝送の必要がなく、通常の復号処理と同じ原理遅延の範囲内での遅延で、従来技術より聴覚的に良好な復号音信号を得ることが可能となる。 In this way, the decoding apparatus performs interpolation using the same signal on the power spectrum of the previous frame based on only the information of the previous frame, so that there is no need to transmit additional information, and the decoding apparatus performs the same processing as normal decoding processing. With a delay within the range of the principle delay, it is possible to obtain a decoded sound signal that is more audibly better than the prior art.
[第二実施形態の復号装置及び方法]
第二実施形態の復号装置及び方法は、信号拡張選択部244における信号の拡張方法の選択において予測信号を用いることにより、連続性の高いクロスフェードを実現するものである。以下、第二実施形態の復号装置及び方法の詳細を示す。
[Decoding device and method according to second embodiment]
The decoding device and method according to the second embodiment realize a highly continuous crossfade by using a prediction signal in selecting a signal expansion method in the signal
第二実施形態の復号装置の例を図6に示す。第二実施形態の復号装置は、第一実施形態と同様に、非パケット化部21と、線形予測係数復号部22と、信号復号部23と、補間信号生成部24とを例えば備えている。補間信号生成部24は、線形予測係数記憶部241と、復号音信号記憶部242と、線形予測部243と、信号拡張選択部244と、補間信号結合部245とを例えば備えている。
FIG. 6 shows an example of the decoding device of the second embodiment. As in the first embodiment, the decoding device of the second embodiment includes, for example, a
以下、第一実施形態と異なる部分である線形予測部243及び信号拡張選択部244について説明する。第一実施形態と同様の部分については重複説明を省略する。
Hereinafter, the
<線形予測部243>
線形予測部243には、非パケット化部21が出力した欠落判定情報と、線形予測係数記憶部241が出力した前フレーム復号線形予測係数^β1,^β2,…,^βpと、復号音信号記憶部242が出力した前フレーム復号音信号^y(0),^y(1),…,^y(2N-1)とが入力される。
<
The
線形予測部243は、音信号符号が欠落している場合に、第一実施形態の線形予測部243と同様に予測信号predict(0),predict(1),…,predict(N-1)を生成する(ステップD4)。
When the sound signal code is missing, the
線形予測部243は、生成した予測信号predict(0),predict(1),…,predict(N-1)を補間信号結合部245及び信号拡張選択部244に出力する。
The
予測信号predict(0),predict(1),…,predict(N-1)が、信号拡張選択部244にも出力される部分が第一実施形態と異なる部分である。
The prediction signal predict (0), predict (1),..., Predict (N-1) is also different from that of the first embodiment in that it is also output to the signal
<信号拡張選択部244>
信号拡張選択部244には、欠落判定情報が音信号符号が欠落していることを示すフレーム、すなわち、音信号符号が欠落しているフレームについての、非パケット化部21が出力した欠落判定情報と、復号音信号記憶部242が出力した前フレーム復号音信号^y(0),^y(1),…,^y(2N-1)と、線形予測部243が出力した予測信号predict(0),predict(1),…,predict(N-1)とが入力される。
<Signal
The signal
信号拡張選択部244は、当該フレームの欠落判定情報が音信号符号が欠落していることを示す場合、すなわち、当該フレームの音信号符号が欠落している場合、例えば以下のように拡張復号音信号extend(0),extend(1),…,extend(2N-1)を選択する(ステップD5)。
The signal
信号拡張選択部244は、拡張復号音信号extend(0),extend(1),…,extend(2N-1)の候補として、例えば以下の4個の候補extend1(n),extend2(n),extend3(n),extend4(n)を用意する。extend1(n)は、前フレーム復号音信号^y(0),^y(1),…,^y(2N-1)を時間的に逆に並べた信号である。extend2(n)は、前フレーム復号音信号^y(0),^y(1),…,^y(2N-1)を時間的に逆に並べた信号の極性を反転させた信号である。extend3(n)は、前フレーム復号音信号^y(0),^y(1),…,^y(2N-1)そのものである。extend4(n)は、前フレーム復号音信号^y(0),^y(1),…,^y(2N-1)の極性を反転させた信号である。
後述のとおり、これらの候補は、特定の仮定の下では、前フレームの復号音信号のパワースペクトルを保ったまま位相をフレーム長分だけシフトさせたものに等しい。信号拡張選択部244は、フレーム毎に、当該フレームの欠落判定情報が音信号符号が欠落していることを示す場合、すなわち、音信号符号が欠落している場合に、当該フレームとして最も適切なものを選択するが、その選択においては前フレームの復号音信号と拡張復号音信号との連続性を基準とする。そして、信号拡張選択部244は、この連続性の基準として予測信号を用いる。予測信号は、線形予測の原理上、前フレームの復号音信号と連続な信号となるので、信号拡張選択部244では予測信号と拡張復号音信号の候補との値の近さを連続性の基準として用いて評価を行う。
As described below, these candidates are equivalent to those obtained by shifting the phase by the frame length while maintaining the power spectrum of the decoded sound signal of the previous frame under a specific assumption. The signal
つまり、信号拡張選択部244は、上記の4個の候補extend1(n),extend2(n),extend3(n),extend4(n)のうち、例えば以下の式(5)に示される予測信号と拡張復号音信号の候補との二乗距離の値が最小となるものを拡張復号音信号extend(0),extend(1),…,extend(2N-1)として選択し、選択した拡張復号音信号extend(0),extend(1),…,extend(2N-1)を補間信号結合部245に出力する。
または、信号拡張選択部244は、上記の4個の候補extend1(n),extend2(n),extend3(n),extend4(n)のうち、例えば下記の式(6)に示される内積値が最大となるものを拡張復号音信号として選択してもよい。
なお、式(5),(6)において、クロスフェードをするための窓関数の値をextendi(n)に対してかけた信号extendi(n)'を、上記式(5),(6)におけるextendi(n)の代わりに用いてもよい。同様にして、式(5),(6)において、クロスフェードをするための窓関数の値をpredict(n)に対してかけた信号predict(n)'を、上記式(5),(6)におけるpredict(n)の代わりに用いてもよい。 In Equations (5) and (6), a signal extend i (n) ′ obtained by multiplying extend i (n) by the value of the window function for crossfading is expressed by Equations (5) and (6). ) May be used instead of extend i (n). Similarly, in formulas (5) and (6), a signal predict (n) ′ obtained by multiplying predict (n) by the value of the window function for performing the crossfading is expressed by the above formulas (5) and (6). ) May be used instead of predict (n).
このようにして、補間信号生成部24は、より詳細には補間信号生成部24の信号拡張選択部244は、当該フレームの前フレームの復号音信号のサンプルを時間的に逆に並べた信号、当該信号の極性を反転した信号、当該フレームの前フレームの復号音信号及び当該フレームの前フレームの復号音信号の極性を反転した信号の中から、上記前フレームから線形予測合成した信号と類似性が高い信号を選択し、選択した信号を拡張復号音信号とする。
In this manner, the interpolation
また、このようにして、補間信号生成部24は、より詳細には補間信号生成部24の信号拡張選択部244は、音信号符号が欠落しているフレームについては、当該フレームの前フレームの復号音信号のサンプルを時間的に逆に並べた信号、当該信号の極性を反転した信号、当該フレームの前フレームの復号音信号及び当該フレームの前フレームの復号音信号の極性を反転した信号の何れかを選択し、選択した信号を拡張復号音信号とする。
Further, in this manner, the interpolation
信号拡張選択部244は、選択して得た拡張復号音信号extend(0),extend(1),…,extend(2N-1)を補間信号結合部245に出力する。
The signal
第一実施形態では、前フレーム復号音信号^y(0),^y(1),…,^y(2N-1)を時間的に逆に並べた信号及び当該信号の極性を反転した信号の2個の信号が拡張復号音信号extend(0),extend(1),…,extend(2N-1)の候補であった。これに対して、上記説明した第二実施形態では、拡張復号音信号extend(0),extend(1),…,extend(2N-1)の候補の数は4個である。拡張復号音信号extend(0),extend(1),…,extend(2N-1)の候補の数を増やすことにより、より精度の高い補間が可能となる。 In the first embodiment, a signal in which the preceding frame decoded sound signal ^ y (0), ^ y (1),..., ^ Y (2N-1) is temporally reversed and a signal in which the polarity of the signal is inverted Are candidates for the extended decoded sound signal extend (0), extend (1),..., Extend (2N-1). On the other hand, in the second embodiment described above, the number of candidates for the extended decoded sound signal extend (0), extend (1),..., Extend (2N−1) is four. By increasing the number of candidates for the extended decoded sound signal extend (0), extend (1),..., Extend (2N−1), more accurate interpolation becomes possible.
なお、第二実施形態においても、第一実施形態と同様に、前フレーム復号音信号^y(0),^y(1),…,^y(2N-1)を時間的に逆に並べた信号及び当該信号の極性を反転した信号の2個の信号を拡張復号音信号extend(0),extend(1),…,extend(2N-1)の候補としてもよい。 Note that also in the second embodiment, similarly to the first embodiment, the decoded sound signals of the previous frame ^ y (0), ^ y (1), ..., ^ y (2N-1) are temporally reversed. , Extend (0), extend (1),..., Extend (2N−1).
この場合、信号拡張選択部244は、例えば以下の式により定義される、前フレームの復号音信号と予測信号を並べた際の境を中心に対称なサンプルの和と差のエネルギーeven, oddをそれぞれ求める。
そして、第一実施形態と同様の理由により、信号拡張選択部244は、even≧oddの場合に拡張復号音信号として前フレーム復号音信号の逆順であるextend(n)=^y(2N-1-n)(n=0,1,…,2N-1)を、odd>evenの場合には極性を反転した前フレーム復号音信号の逆順であるextend(n)=-^y(2N-1-n)(n=0,1,…,2N-1)を選択し、選択した拡張復号音信号extend(0),extend(1),…,extend(2N-1)を補間信号結合部245に出力する。
Then, for the same reason as in the first embodiment, the signal
[第三実施形態の復号装置及び方法]
第三実施形態の復号装置及び方法は、情報の欠落が生じたフレーム以前のフレームの復号音信号を基に線形予測係数を推定するものである。これにより、復号装置が想定する符号化装置が線形予測分析部11を備えておらず、復号装置に入力されるパケットに線形予測係数符号が含まれていない場合であっても、復号装置は、線形予測を用いた信号の補間を行うことができる。または、復号装置は、線形予測分析の次数を、符号化で用いた次数よりも高く求めることにより、更に高い精度の予測を行うことができる。
[Decoding device and method according to third embodiment]
The decoding device and method of the third embodiment are for estimating a linear prediction coefficient based on a decoded sound signal of a frame before a frame in which information is lost. Thereby, even when the encoding device assumed by the decoding device does not include the linear prediction analysis unit 11 and the packet input to the decoding device does not include the linear prediction coefficient code, Signal interpolation using linear prediction can be performed. Alternatively, the decoding device can perform higher-precision prediction by obtaining the order of the linear prediction analysis higher than the order used in the encoding.
第三実施形態の復号装置の例を図7に示す。第三実施形態の復号装置は、非パケット化部21と、線形予測係数復号部22と、信号復号部23と、補間信号生成部24とを例えば備えている。補間信号生成部24は、復号音信号記憶部242と、線形予測部243と、信号拡張選択部244と、補間信号結合部245と、線形予測係数推定部246とを例えば備えている。
FIG. 7 shows an example of a decoding device according to the third embodiment. The decoding device according to the third embodiment includes, for example, a
以下、第一実施形態又は第二実施形態と異なる部分である、非パケット化部21、線形予測係数復号部22、復号音信号記憶部242、線形予測部243及び線形予測係数推定部246について説明する。第一実施形態又は第二実施形態と同様の部分については重複説明を省略する。
Hereinafter, a description will be given of the
<非パケット化部21>
非パケット化部21は、第一実施形態又は第二実施形態と同様の処理により、欠落判定情報を生成し、生成した欠落判定情報を、復号音信号記憶部242、信号拡張選択部244、及び補間信号結合部245のみならず、線形予測係数推定部246にも出力する(ステップD1)。
<
The
非パケット化部21の他の処理は、第一実施形態又は第二実施形態と同様である。
Other processes of the
<線形予測係数復号部22>
線形予測係数復号部22は、第一実施形態又は第二実施形態と同様の処理により、音信号符号が欠落していないフレームについて、フレーム毎に、復号線形予測係数^α1,^α2,…,^αpを得て、得た復号線形予測係数^α1,^α2,…,^αpを信号復号部23に出力する(ステップD2)。
<Linear prediction
The linear prediction
線形予測係数復号部22の他の処理は、第一実施形態又は第二実施形態と同様である。
Other processes of the linear prediction
<復号音信号記憶部242>
当該フレームの欠落判定情報が音信号符号が欠落していることを示す場合、すなわち、当該フレームの音信号符号が欠落している場合に、復号音信号記憶部242は、記憶している前フレーム復号音信号^y(0),^y(1),…,^y(2N-1)を線形予測部243及び信号拡張選択部244のみならず、線形予測係数推定部246にも出力する。
<Decoded sound
If the missing signal determination information of the frame indicates that the sound signal code is missing, that is, if the sound signal code of the frame is missing, the decoded sound
復号音信号記憶部242の他の処理は、第一実施形態又は第二実施形態と同様である。
Other processes of the decoded sound
<線形予測係数推定部246>
線形予測係数推定部246には、非パケット化部21が出力した欠落判定情報と、復号音信号記憶部242が出力した前フレーム復号音信号^y(0),^y(1),…,^y(2N-1)とが入力される。
<Linear prediction
The linear prediction
線形予測係数推定部246は、当該フレームの欠落判定情報が音信号符号が欠落していることを示す場合、すなわち、当該フレームの音信号符号が欠落している場合に、前フレーム復号音信号^y(0),^y(1),…,^y(2N-1)を基に、図1における線形予測分析部11で用いる線形予測分析と同様の処理により推定線形予測係数^γ1,^γ2,…,^γpを生成する(ステップD7)。
The linear prediction
線形予測係数推定部246は、生成した推定線形予測係数^γ1,^γ2,…,^γpを線形予測部243に出力する。
Linear
<線形予測部243>
線形予測部243には、非パケット化部21が出力した欠落判定情報と、線形予測係数推定部246が出力した推定線形予測係数^γ1,^γ2,…,^γpと、復号音信号記憶部242が出力した前フレーム復号音信号^y(0),^y(1),…,^y(2N-1)とが入力される。
<
The
線形予測部243は、フレーム毎に、当該フレームの欠落判定情報が音信号符号が欠落していることを示す場合、すなわち、当該フレームの音信号符号が欠落している場合に、推定線形予測係数^γ1,^γ2,…,^γpの値を基に例えば以下の式(1')のように予測信号predict(0), predict(1),…,predict(N-1)を生成し、生成した予測信号predict(0),predict(1),…,predict (N-1)を補間信号結合部245に出力する。
ただし、n=1,2,…,Nである。この予測信号predict(0),predict(1),…,predict(N-1)は、推定線形予測係数^γ1,^γ2,…,^γpを当該フレームの復号線形予測係数とし、0を当該フレームの残差信号の各サンプル値としたときの、当該フレームの予測信号である。 Here, n = 1, 2,..., N. The prediction signal predict (0), predict (1 ), ..., predict (N-1) is estimated linear prediction coefficient ^ γ 1, ^ γ 2, ..., a ^ gamma p is the decoded linear prediction coefficients of the frame, This is a predicted signal of the frame when 0 is used as each sample value of the residual signal of the frame.
[技術背景]
上記の実施形態では、2種類の信号の少なくとも一方を用いて情報の欠落したフレームの補間を行っている。
[Technical background]
In the above embodiment, interpolation of a frame with missing information is performed using at least one of the two types of signals.
2種類の信号の1つ目は予測信号predict(0),predict(1),…,predict(N-1)である。予測信号predict(0),predict(1),…,predict(N-1)は、前フレームの復号線形予測係数^β1,^β2,…,^βpを用いて上記式(1)で例えば求められる。この予測信号predict(0),predict(1),…,predict(N-1)を用いると、その性質上、前フレームとの連続性が担保されるが、予測次数pがフレーム長Nに対して短い場合には予測信号のエネルギーは徐々に減少してゆき、フレームの後半で予測信号の値が0になる。したがって、予測信号のみを用いて情報の欠落したフレームの補間を行うと、次フレームとの不連続性が生じてしまうことがある。 The first of the two types of signals is a prediction signal predict (0), predict (1),..., Predict (N-1). Prediction signal predict (0), predict (1 ), ..., predict (N-1) is decoded linear prediction coefficients of the previous frame ^ β 1, ^ β 2, ..., the formula using the ^ β p (1) For example, it is required. When the prediction signals predict (0), predict (1),..., Predict (N−1) are used, continuity with the previous frame is ensured due to its property. If it is short, the energy of the prediction signal gradually decreases, and the value of the prediction signal becomes 0 in the latter half of the frame. Therefore, if interpolation of a frame with missing information is performed using only the prediction signal, discontinuity with the next frame may occur.
復号線形予測係数^β1,^β2,…,^βpは、第一実施形態及び第二実施形態のように、符号化側において符号化されたものを復号側で復号することにより得ることができる。 The decoded linear prediction coefficients ^ β 1 , ^ β 2 , ..., ^ β p are obtained by decoding on the decoding side what has been encoded on the encoding side, as in the first and second embodiments. be able to.
なお、復号線形予測係数^β1,^β2,…,^βpの代わりに、第三実施形態のように、過去に復号された波形から線形予測分析で求めた推定線形予測係数^γ1,^γ2,…,^γpを用いて、予測信号predict(0),predict(1),…,predict(N-1)を求めることもできる。この場合pを例えばNと同等まで大きくすることができ、これにより多くのサンプル数まで予測信号predict(0),predict(1),…,predict(N-1)のエネルギーを保つことができる。しかし、次数の大きな線形予測係数を求めるために、長い過去のサンプル(複数フレーム)を保持する必要があり、分析の演算量も極端に大きくなってしまう。 Note that, instead of the decoded linear prediction coefficients ^ β 1 , ^ β 2 ,..., ^ Β p , the estimated linear prediction coefficients ^ γ obtained by linear prediction analysis from previously decoded waveforms as in the third embodiment. 1, ^ γ 2, ..., with ^ gamma p, the prediction signal predict (0), predict (1 ), ..., can also be determined predict (N-1). In this case, p can be made as large as, for example, N, so that the energy of the prediction signal predict (0), predict (1),..., Predict (N-1) can be maintained up to a large number of samples. However, in order to obtain a linear prediction coefficient of a large order, it is necessary to hold a long past sample (a plurality of frames), and the amount of calculation for analysis becomes extremely large.
演算量の増加を防ぎつつ、フレーム内の信号の欠落を防ぐために、上記2種類の信号の2つ目の信号である拡張復号音信号を用いる。この拡張復号音信号extend(0),extend(1),…,extend(2N-1)には、前フレームの復号音信号^y(0),^y(1),…,^y(2N-1)のパワースペクトルを保った信号を例えば用いる。この拡張復号音信号extend(0),extend(1),…,extend(2N-1)と予測信号predict(0),predict(1),…,predict(N-1)とを例えば上記式(3)のようにクロスフェードさせた信号を欠落したフレームの復号音信号とすることにより、欠落したフレームの前後フレームとの時間的及び周波数的連続性を担保したまま、補間した信号のエネルギーを保つことができる。 The extended decoded sound signal, which is the second of the above two types of signals, is used to prevent loss of signals in the frame while preventing an increase in the amount of calculation. The extended decoded sound signal extend (0), extend (1),..., Extend (2N-1) includes the decoded sound signal ^ y (0), ^ y (1),. For example, a signal having the power spectrum of -1) is used. The extended decoded sound signal extend (0), extend (1),..., Extend (2N-1) and the prediction signals predict (0), predict (1),. By making the cross-fade signal as the decoded sound signal of the missing frame as in 3), the energy of the interpolated signal is maintained while maintaining the temporal and frequency continuity with the frames before and after the missing frame. be able to.
以下、拡張復号音信号extend(0),extend(1),…,extend(2N-1)の選択の例について説明する。 Hereinafter, an example of selection of the extended decoded sound signal extend (0), extend (1),..., Extend (2N-1) will be described.
信号の周波数を考慮する際、その信号を正弦波で分解することは広く用いられているが、その分解において用いられる正弦波には様々な種類がある。例えば図8に示すように、ある信号をn=0,1,…,N-1において以下の式に則りcos波で分解した場合を考える。
周波数スペクトルa(0),a(1),…,a(N-1)を保ったまま信号をn+N=N,…,2N-1に拡張すると以下の式のように表すことができる。
つまり、信号を時間的に逆にしたものが、信号のパワースペクトルを保ったまま位相をフレーム長分だけシフトさせたものと等しくなる。 That is, a signal obtained by reversing the signal in time is equivalent to a signal obtained by shifting the phase by the frame length while maintaining the power spectrum of the signal.
同様に、ある信号をn=0,1,…,N-1において以下の式に則りsin波で分解した場合は、以下の式のようにn+N=N,…,2N-1に拡張できる。
つまり、信号を時間的に逆にして極性を反転させたものが、信号のパワースペクトルを保ったまま位相をフレーム長分だけシフトさせたものと等しくなる。 In other words, a signal obtained by inverting the signal in time and inverting the polarity is equivalent to a signal obtained by shifting the phase by the frame length while maintaining the power spectrum of the signal.
上記の信号の拡張により、信号がcos波で構成されていると仮定するならば信号を時間的に逆にしたものが、信号がsin波で構成されていると仮定するならば信号を時間的に逆にして極性を反転させたものが得られることがわかる。したがって、第一実施形態では信号の偶対称性と奇対称性のいずれが強いかを比較し、偶対称性が強ければ偶対称性なcos波で構成されているとみなし、奇対称性が強ければ奇対称性なsin波で構成されているとみなして拡張信号を選択しているのである。 Due to the above signal extension, if the signal is assumed to be composed of a cosine wave, the signal is inverted in time, whereas if the signal is assumed to be composed of a sine wave, the signal is temporally reversed. It can be seen that a polarity-reversed one is obtained. Therefore, in the first embodiment, it is compared whether the even symmetry or the odd symmetry of the signal is stronger. If the even symmetry is stronger, it is considered that the signal is composed of an even-symmetry cos wave, and the odd symmetry is stronger. In this case, the extension signal is selected on the assumption that the signal is composed of sine waves having odd symmetry.
なお、信号を複素正弦波で分解した場合は、n+N=N,…,2N-1に拡張した信号は以下の式のように求めることができる。
これらは、それぞれ、そのままの信号及び極性を反転した信号である。上記4種の拡張方法が、第二実施形態の信号拡張選択部244における拡張復号音信号の候補extend1(n),extend2(n),extend3(n),extend4(n)に対応する。
These are a signal as it is and a signal whose polarity is inverted, respectively. The above four extension methods correspond to extended decoded sound signal candidates extend 1 (n), extend 2 (n), extend 3 (n), and extend 4 (n) in the signal
[プログラム及び記録媒体]
復号装置の各部における処理をコンピュータによって実現する場合、復号装置の各部がが有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、その各部の処理がコンピュータ上で実現される。
[Program and recording medium]
When the processing in each unit of the decoding device is realized by a computer, the processing content of the function that each unit of the decoding device should have is described by a program. By executing this program on a computer, the processing of each unit is realized on the computer.
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。 A program describing this processing content can be recorded on a computer-readable recording medium. As a computer-readable recording medium, for example, any recording medium such as a magnetic recording device, an optical disk, a magneto-optical recording medium, and a semiconductor memory may be used.
また、各部の処理は、コンピュータ上で所定のプログラムを実行させることにより構成することにしてもよいし、これらの処理の少なくとも一部をハードウェア的に実現することとしてもよい。 Further, the processing of each unit may be configured by executing a predetermined program on a computer, or at least a part of these processing may be realized by hardware.
[変形例]
その他、この発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
[Modification]
In addition, it goes without saying that changes can be made as appropriate without departing from the spirit of the present invention.
Claims (14)
音信号符号が欠落しているフレームについては、上記フレームの前フレームの復号音信号のサンプルを時間的に逆に並べた信号と当該信号の極性を反転した信号の中から、上記前フレームと時間的に連続性が高い信号の候補を選択し、上記選択した信号の候補である拡張復号音信号と、上記前フレームから線形予測合成した信号と、に基づいて生成した信号を、上記フレームの復号音信号とする補間信号生成部、
を含む復号装置。 A decoding device for obtaining a decoded sound signal for each frame,
For a frame in which the sound signal code is missing, the signal obtained by arranging samples of the decoded sound signal of the previous frame of the frame in reverse time and the signal in which the polarity of the signal is inverted are selected from the time of the previous frame. A signal generated based on an extended decoded sound signal that is a candidate for the selected signal and a signal that is linearly predicted and synthesized from the previous frame, and decodes the frame. An interpolated signal generation unit to be a sound signal,
A decoding device including:
音信号符号が欠落しているフレームについては、上記フレームの前フレームの復号音信号のサンプルを時間的に逆に並べた信号又は当該信号の極性を反転した信号である拡張復号音信号と、上記前フレームから線形予測合成した信号と、に基づいて生成した信号を、上記フレームの復号音信号とする補間信号生成部、
を含む復号装置。 A decoding device for obtaining a decoded sound signal for each frame,
For a frame in which the sound signal code is missing, an extended decoded sound signal that is a signal obtained by arranging samples of the decoded sound signal of the previous frame of the above frame in time or a signal obtained by inverting the polarity of the signal, A signal generated based on a signal subjected to linear prediction synthesis from the previous frame, and an interpolation signal generation unit that serves as a decoded sound signal of the frame;
A decoding device including:
音信号符号が欠落しているフレームについては、上記フレームの前フレームの復号音信号のサンプルを時間的に逆に並べた信号、当該信号の極性を反転した信号、上記前フレームの復号音信号及び上記前フレームの復号音信号の極性を反転した信号の中から、上記前フレームから線形予測合成した信号と類似性が高い信号の候補を選択し、上記選択した信号の候補である拡張復号音信号、または、上記拡張復号音信号と上記前フレームから線形予測合成した信号とに基づいて生成した信号、を上記フレームの復号音信号とする補間信号生成部、
を含む復号装置。 A decoding device for obtaining a decoded sound signal for each frame,
For a frame in which the sound signal code is missing, a signal in which samples of the decoded sound signal of the previous frame of the frame are arranged in time reverse, a signal in which the polarity of the signal is inverted, the decoded sound signal of the previous frame, and From among the signals obtained by inverting the polarity of the decoded sound signal of the previous frame, a signal candidate having a high similarity to the signal obtained by linearly predicting and synthesizing the previous frame is selected, and the extended decoded sound signal which is the selected signal candidate is selected. Or, a signal generated based on the extended decoded sound signal and a signal obtained by performing linear prediction synthesis from the previous frame, and an interpolation signal generation unit that sets the decoded sound signal of the frame as a decoded sound signal.
A decoding device including:
音信号符号が欠落しているフレームについては、上記フレームの前フレームの復号音信号のサンプルを時間的に逆に並べた信号又は当該信号の極性を反転した信号から上記前フレームから線形予測合成した信号と類似性が高い信号を選択し、選択した信号である拡張復号音信号、または、上記拡張復号音信号と上記前フレームから線形予測合成した信号とに基づいて生成した信号、を、上記フレームの復号音信号とする補間信号生成部、
を含む復号装置。 A decoding device for obtaining a decoded sound signal for each frame,
For a frame in which the sound signal code is missing, linear prediction synthesis was performed from the previous frame from a signal in which samples of the decoded sound signal of the previous frame of the frame were arranged in time reverse or a signal in which the polarity of the signal was inverted. A signal having a high similarity to the signal is selected, and an extended decoded sound signal that is the selected signal, or a signal generated based on the extended decoded sound signal and a signal that is linearly predicted and synthesized from the previous frame, An interpolated signal generation unit for the decoded sound signal of
A decoding device including:
音信号符号が欠落しているフレームについては、上記フレームの前フレームの復号音信号とパワースペクトルが同じである複数の信号の候補の中から、上記前フレームと時間的に連続性が高い信号の候補を選択し、上記選択した信号の候補である拡張復号音信号と、上記前フレームから線形予測合成した信号と、に基づいて生成した信号を、上記フレームの復号音信号とする補間信号生成部、
を含む復号装置。 A decoding device for obtaining a decoded sound signal for each frame,
For a frame in which the sound signal code is missing, from among a plurality of signal candidates having the same power spectrum as the decoded sound signal of the previous frame of the frame, a signal having a high temporal continuity with the previous frame is selected. An interpolation signal generation unit that selects a candidate, and sets a signal generated based on an extended decoded sound signal that is a candidate for the selected signal and a signal that is linearly predicted and synthesized from the previous frame as a decoded sound signal of the frame; ,
A decoding device including:
音信号符号が欠落しているフレームについては、上記フレームの前フレームの復号音信号とパワースペクトルが同じである複数の信号の候補の中から、上記前フレームから線形予測合成した信号と類似性が高い信号の候補を選択し、上記選択した信号の候補である拡張復号音信号、または、上記拡張復号音信号と上記前フレームから線形予測合成した信号とに基づいて生成した信号、を上記フレームの復号音信号とする補間信号生成部、
を含む復号装置。 A decoding device for obtaining a decoded sound signal for each frame,
For a frame in which the sound signal code is missing, among a plurality of signal candidates having the same power spectrum as the decoded sound signal of the previous frame of the frame, the similarity to the signal obtained by linear prediction synthesis from the previous frame is similar. A candidate for a high signal is selected, and an extended decoded sound signal that is a candidate for the selected signal, or a signal generated based on the extended decoded sound signal and a signal that is linearly predicted and synthesized from the previous frame, An interpolated signal generator for decoding sound signals,
A decoding device including:
上記補間信号生成部は、上記前フレームの復号音信号が偶対称的である場合には上記前フレームの復号音信号のサンプルを時間的に逆に並べた信号を選択し、上記前フレームの復号音信号が奇対称的である場合には上記極性を反転した信号を選択し、上記選択した信号を上記フレームの復号音信号又は上記拡張復号音信号とする、
復号装置。 The decoding device according to any one of claims 1 , 2 , and 4 ,
When the decoded sound signal of the previous frame is even symmetric, the interpolation signal generation unit selects a signal in which samples of the decoded sound signal of the previous frame are arranged in reverse time, and decodes the previous frame. If the sound signal is oddly symmetric, select the signal whose polarity is inverted, and use the selected signal as the decoded sound signal of the frame or the extended decoded sound signal,
Decoding device.
音信号符号が欠落しているフレームについては、上記フレームの前フレームの復号音信号のサンプルを時間的に逆に並べた信号と当該信号の極性を反転した信号の中から、上記前フレームと時間的に連続性が高い信号の候補を選択し、上記選択した信号の候補である拡張復号音信号と、上記前フレームから線形予測合成した信号と、に基づいて生成した信号を、上記フレームの復号音信号とする補間信号生成ステップ、
を含む復号方法。 A decoding method for obtaining a decoded sound signal for each frame,
For a frame in which the sound signal code is missing, the signal obtained by arranging samples of the decoded sound signal of the previous frame of the frame in reverse time and the signal in which the polarity of the signal is inverted are selected from the time of the previous frame. A signal generated based on an extended decoded sound signal that is a candidate for the selected signal and a signal that is linearly predicted and synthesized from the previous frame, and decodes the frame. Generating an interpolation signal as a sound signal,
A decoding method including:
音信号符号が欠落しているフレームについては、上記フレームの前フレームの復号音信号のサンプルを時間的に逆に並べた信号又は当該信号の極性を反転した信号である拡張復号音信号と、上記前フレームから線形予測合成した信号と、に基づいて生成した信号を、上記フレームの復号音信号とする補間信号生成ステップ、
を含む復号方法。 A decoding method for obtaining a decoded sound signal for each frame,
For a frame in which the sound signal code is missing, an extended decoded sound signal that is a signal obtained by arranging samples of the decoded sound signal of the previous frame of the above frame in time or a signal obtained by inverting the polarity of the signal, A signal generated based on a signal obtained by linear prediction synthesis from the previous frame, and an interpolation signal generation step of setting a signal generated as a decoded sound signal of the frame,
A decoding method including:
音信号符号が欠落しているフレームについては、上記フレームの前フレームの復号音信号のサンプルを時間的に逆に並べた信号、当該信号の極性を反転した信号、上記前フレームの復号音信号及び上記前フレームの復号音信号の極性を反転した信号の中から、上記前フレームから線形予測合成した信号と類似性が高い信号の候補を選択し、上記選択した信号の候補である拡張復号音信号、または、上記拡張復号音信号と上記前フレームから線形予測合成した信号とに基づいて生成した信号、を上記フレームの復号音信号とする補間信号生成ステップ、
を含む復号方法。 A decoding method for obtaining a decoded sound signal for each frame,
For a frame in which the sound signal code is missing, a signal in which samples of the decoded sound signal of the previous frame of the frame are arranged in time reverse, a signal in which the polarity of the signal is inverted, the decoded sound signal of the previous frame, and From among the signals obtained by inverting the polarity of the decoded sound signal of the previous frame, a signal candidate having a high similarity to the signal obtained by linearly predicting and synthesizing the previous frame is selected, and the extended decoded sound signal which is a candidate of the selected signal is selected. Or, a signal generated based on the extended decoded sound signal and a signal obtained by linear prediction synthesis from the previous frame, and an interpolation signal generation step of setting the decoded sound signal of the frame as a decoded sound signal;
A decoding method including:
音信号符号が欠落しているフレームについては、上記フレームの前フレームの復号音信号のサンプルを時間的に逆に並べた信号又は当該信号の極性を反転した信号から上記前フレームから線形予測合成した信号と類似性が高い信号を選択し、選択した信号である拡張復号音信号、または、上記拡張復号音信号と上記前フレームから線形予測合成した信号とに基づいて生成した信号、を、上記フレームの復号音信号とする補間信号生成ステップ、
を含む復号方法。 A decoding method for obtaining a decoded sound signal for each frame,
For a frame in which the sound signal code is missing, linear prediction synthesis was performed from the previous frame from a signal in which samples of the decoded sound signal of the previous frame of the frame were arranged in time reverse or a signal in which the polarity of the signal was inverted. A signal having a high similarity to the signal is selected, and an extended decoded sound signal that is the selected signal, or a signal generated based on the extended decoded sound signal and a signal that is linearly predicted and synthesized from the previous frame, An interpolation signal generation step as a decoded sound signal of
A decoding method including:
音信号符号が欠落しているフレームについては、上記フレームの前フレームの復号音信号とパワースペクトルが同じである複数の信号の候補の中から、上記前フレームと時間的に連続性が高い信号の候補を選択し、上記選択した信号の候補である拡張復号音信号と、上記前フレームから線形予測合成した信号と、に基づいて生成した信号を、上記フレームの復号音信号とする補間信号生成ステップ、
を含む復号方法。 A decoding method for obtaining a decoded sound signal for each frame,
For a frame in which the sound signal code is missing, from among a plurality of signal candidates having the same power spectrum as the decoded sound signal of the previous frame of the frame, a signal having a high temporal continuity with the previous frame is selected. An interpolation signal generating step of selecting a candidate, and setting a signal generated based on the extended decoded sound signal that is a candidate for the selected signal and a signal obtained by linear prediction synthesis from the previous frame as a decoded sound signal of the frame ,
A decoding method including:
音信号符号が欠落しているフレームについては、上記フレームの前フレームの復号音信号とパワースペクトルが同じである複数の信号の候補の中から、上記前フレームから線形予測合成した信号と類似性が高い信号の候補を選択し、上記選択した信号の候補である拡張復号音信号、または、上記拡張復号音信号と上記前フレームから線形予測合成した信号とに基づいて生成した信号、を上記フレームの復号音信号とする補間信号生成ステップ、
を含む復号方法。 A decoding method for obtaining a decoded sound signal for each frame,
For a frame in which the sound signal code is missing, among a plurality of signal candidates having the same power spectrum as the decoded sound signal of the previous frame of the frame, the similarity to the signal obtained by linear prediction synthesis from the previous frame is similar. A candidate for a high signal is selected, and an extended decoded sound signal that is a candidate for the selected signal, or a signal generated based on the extended decoded sound signal and a signal that is linearly predicted and synthesized from the previous frame, An interpolation signal generating step to be a decoded sound signal,
A decoding method including:
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2016174266A JP6652469B2 (en) | 2016-09-07 | 2016-09-07 | Decoding device, decoding method, and program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2016174266A JP6652469B2 (en) | 2016-09-07 | 2016-09-07 | Decoding device, decoding method, and program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2018040917A JP2018040917A (en) | 2018-03-15 |
| JP6652469B2 true JP6652469B2 (en) | 2020-02-26 |
Family
ID=61625771
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2016174266A Active JP6652469B2 (en) | 2016-09-07 | 2016-09-07 | Decoding device, decoding method, and program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP6652469B2 (en) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| ES3017157T3 (en) | 2019-06-13 | 2025-05-12 | Ericsson Telefon Ab L M | Time reversed audio subframe error concealment |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP1846921B1 (en) * | 2005-01-31 | 2017-10-04 | Skype | Method for concatenating frames in communication system |
| JP2007072819A (en) * | 2005-09-08 | 2007-03-22 | Tcm Corp | Mobility management device |
-
2016
- 2016-09-07 JP JP2016174266A patent/JP6652469B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| JP2018040917A (en) | 2018-03-15 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5530454B2 (en) | Audio encoding apparatus, decoding apparatus, method, circuit, and program | |
| JP6158214B2 (en) | Speech coding apparatus, speech coding method, speech coding program, speech decoding apparatus, speech decoding method, and speech decoding program | |
| JP6422813B2 (en) | Encoding device, decoding device, method and program thereof | |
| JPH08328588A (en) | System for evaluation of pitch lag, voice coding device, method for evaluation of pitch lag and voice coding method | |
| KR100647290B1 (en) | Speech encoding / decoding apparatus and method for selecting quantization / dequantization using synthesized speech characteristics | |
| CN103348597A (en) | Low Bit Rate Signal Encoder and Decoder | |
| JP6650540B2 (en) | Frequency domain parameter string generation method, frequency domain parameter string generation device, and program | |
| KR20170127533A (en) | Linear Predictive Coding Apparatus, Linear Predictive Decoding Apparatus, Method, Program and Recording Medium Thereof | |
| CN108885875A (en) | Device and method for improving the conversion from the concealing audio signal section of audio signal to subsequent audio signal parts | |
| KR20220104049A (en) | Encoder, decoder, encoding method and decoding method for frequency domain long-term prediction of tonal signals for audio coding | |
| JP2019215587A (en) | Encoder, decoder, encoding method, decoding method, encoding program, decoding program, and recording medium | |
| JP6652469B2 (en) | Decoding device, decoding method, and program | |
| JP2002366195A (en) | Method and device for encoding voice and parameter | |
| JP3435310B2 (en) | Voice coding method and apparatus | |
| KR102569784B1 (en) | System and method for long-term prediction of audio codec | |
| JP3559485B2 (en) | Post-processing method and device for audio signal and recording medium recording program | |
| US6856955B1 (en) | Voice encoding/decoding device | |
| US8762136B2 (en) | System and method of speech compression using an inter frame parameter correlation | |
| JP2001142499A (en) | Speech encoding device and speech decoding device | |
| JPH0573097A (en) | Low delay code driving type linear encoding method | |
| JP4438654B2 (en) | Encoding device, decoding device, encoding method, and decoding method | |
| JP3471542B2 (en) | Audio coding device | |
| Muin et al. | Performance analysis of IEEE 1857.2 lossless audio compression linear predictor algorithm | |
| JP3576805B2 (en) | Voice encoding method and system, and voice decoding method and system | |
| JPH08211895A (en) | System and method for evaluation of pitch lag as well as apparatus and method for coding of sound |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180202 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190128 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190212 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190325 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190730 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190827 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200121 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200123 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6652469 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |