JP4567412B2 - Audio playback device and audio playback method - Google Patents
Audio playback device and audio playback method Download PDFInfo
- Publication number
- JP4567412B2 JP4567412B2 JP2004309597A JP2004309597A JP4567412B2 JP 4567412 B2 JP4567412 B2 JP 4567412B2 JP 2004309597 A JP2004309597 A JP 2004309597A JP 2004309597 A JP2004309597 A JP 2004309597A JP 4567412 B2 JP4567412 B2 JP 4567412B2
- Authority
- JP
- Japan
- Prior art keywords
- frequency
- audio
- compressed
- reproduction
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Signal Processing For Digital Recording And Reproducing (AREA)
Description
本発明は、音声再生機および音声再生方法に係り、特に、圧縮音声を再生するのに好適な音声再生機および音声再生方法に関する。 The present invention relates to an audio reproducing device and an audio reproducing method, and more particularly to an audio reproducing device and an audio reproducing method suitable for reproducing compressed audio.
従来から、音声再生機においては、MP3やWMA等のいわゆる圧縮アルゴリズムを用いることによって、アナログの音声信号に対する圧縮・符号化を行ってデジタルの音声信号である圧縮音声を得るようになっていた。 Conventionally, in an audio player, a compressed audio, which is a digital audio signal, is obtained by compressing and encoding an analog audio signal by using a so-called compression algorithm such as MP3 or WMA.
そして、圧縮・符号化によって得られた圧縮音声は、所望の再生サンプリング周波数の下で伸長・復号化されて再生されるようになっていた。 The compressed audio obtained by compression / encoding is expanded and decoded under a desired reproduction sampling frequency and reproduced.
ここで、図8は、一般的な非圧縮音声(原曲)のデジタル符号化フォーマットを、図9は、当該非圧縮音声のスペクトラムをそれぞれ示したものであり、これら図8、図9に示すように、デジタル化された音声データの記録可能な周波数の上限は、自信号のサンプリング周波数の約1/2であることが知られている。 Here, FIG. 8 shows a digital encoding format of a general uncompressed sound (original music), and FIG. 9 shows a spectrum of the uncompressed sound, and these are shown in FIGS. Thus, it is known that the upper limit of the recordable frequency of the digitized audio data is about ½ of the sampling frequency of the own signal.
例えば、CDの場合は、符号化の際のサンプリング周波数が44.1kHzであるのに対し、実際にCDに記録可能な音楽の周波数の上限は22.05kHzとなる。 For example, in the case of a CD, the sampling frequency at the time of encoding is 44.1 kHz, whereas the upper limit of the frequency of music that can be actually recorded on a CD is 22.05 kHz.
しかしながら、MP3等の圧縮音声においては、特に低ビットレートで符号化された場合には、符号化の際のサンプリング周波数は、図8の場合と同一であっても、図10、図11に示すように、周波数帯域の上限がカットされてしまうことがあった。 However, for compressed audio such as MP3, particularly when encoded at a low bit rate, the sampling frequency at the time of encoding is the same as in FIG. As described above, the upper limit of the frequency band may be cut.
この結果、圧縮音声は、例えば44.1kHzの再生サンプリング周波数の下で再生される場合においても、実際には、サンプリング周波数22.05kHzや32kHz程度の周波数帯域しか含まれていなかった。 As a result, even when the compressed audio is reproduced under a reproduction sampling frequency of 44.1 kHz, for example, only the frequency band of about sampling frequency 22.05 kHz or 32 kHz is actually included.
すなわち、従来は、MP3等による符号化によって高音域の信号が失われてしまう結果、原音に近い音声を再現することができないといった問題が生じていた。 In other words, conventionally, as a result of loss of a high-frequency signal due to encoding by MP3 or the like, there has been a problem that it is impossible to reproduce sound close to the original sound.
そこで、本発明は、このような問題に鑑みなされたものであり、圧縮によって失われた音域を復元することができ、原音に近い音声を再現することができる音声再生機および音声再生方法を提供することを目的とするものである。 Therefore, the present invention has been made in view of such a problem, and provides an audio playback device and an audio playback method capable of restoring a sound range lost by compression and reproducing sound close to the original sound. It is intended to do.
前述した目的を達成するため、本発明に係る音声再生機の特徴は、所定の圧縮フォーマットにしたがって圧縮・符号化された圧縮音声を、所望の再生サンプリング周波数の下で伸長・復号化して再生する音声再生機において、前記圧縮音声の周波数帯域の上限周波数が、前記再生サンプリング周波数の下での再生に適する所定の判定周波数に満たないか否かを判定する判定装置と、この判定装置の判定結果に基づき、周波数帯域の上限周波数が前記判定周波数に満たない圧縮音声に対して低域通過フィルタ処理後にダウンサンプリング処理を施すダウンサンプリング処理装置と、このダウンサンプリング処理装置によって前記ダウンサンプリング処理が施された圧縮音声に対して、前記圧縮の際に失われた周波数帯域を補間する補間処理をともなうアップサンプリング処理を施すアップサンプリング処理装置とを備えた点にある。 In order to achieve the above-mentioned object, the audio player according to the present invention is characterized in that compressed audio that has been compressed and encoded according to a predetermined compression format is expanded and decoded under a desired reproduction sampling frequency and reproduced. In the audio player, a determination device that determines whether or not an upper limit frequency of the frequency band of the compressed sound is less than a predetermined determination frequency suitable for reproduction under the reproduction sampling frequency, and a determination result of the determination device based on a down-sampling processing apparatus for performing the down-sampling process after the low-pass filtering, the down-sampling processing by the down-sampling processing unit is subjected to compressed audio that is an upper limit frequency of the frequency band less than the determination frequency Interpolation processing for interpolating the frequency band lost during the compression is applied to the compressed audio. It lies in having an up-sampling processing apparatus for performing the Nau upsampling process.
そして、このような構成によれば、周波数帯域の上限周波数が判定周波数に満たない圧縮音声に対してダウンサンプリング処理装置によって低域通過フィルタ処理後にダウンサンプリング処理を施した後、さらに、アップサンプリング処理装置によって補間処理をともなうアップサンプリング処理を施すことによって、圧縮の際に失われた周波数帯域が補間された圧縮音声を得ることができ、この圧縮音声を再生サンプリング周波数の下で伸長・復号化して再生することが可能となる。 According to such a configuration, after the downsampling processing is performed after the low-pass filter processing by the downsampling processing device on the compressed audio whose upper limit frequency of the frequency band is less than the determination frequency, the upsampling processing is further performed. By performing upsampling processing with interpolation processing by the device, it is possible to obtain compressed audio in which the frequency band lost during compression is interpolated, and decompressing and decoding this compressed audio under the reproduction sampling frequency It can be played back.
また、本発明に係る音声再生機の特徴は、判定周波数が、再生サンプリング周波数の1/2の周波数である点にある。 In addition, the audio player according to the present invention is characterized in that the determination frequency is a half of the reproduction sampling frequency.
そして、このような構成によれば、周波数帯域の上限周波数が再生サンプリング周波数の1/2に満たない圧縮音声に対してダウンサンプリング処理装置によって低域通過フィルタ処理後にダウンサンプリング処理を施した後、さらに、アップサンプリング処理装置によって補間処理をともなうアップサンプリング処理を施すことによって、圧縮の際に失われた周波数帯域が補間された圧縮音声を得ることができ、この圧縮音声を再生サンプリング周波数の下で伸長・復号化して再生することが可能となる。 According to such a configuration, after the downsampling processing is performed after the low-pass filter processing by the downsampling processing device for the compressed audio whose upper limit frequency of the frequency band is less than 1/2 of the reproduction sampling frequency, Furthermore, by performing an upsampling process accompanied by an interpolation process by an upsampling processing device, it is possible to obtain a compressed sound in which the frequency band lost during the compression is interpolated. It is possible to reproduce by decompressing and decoding.
さらに、本発明に係る音声再生機の特徴は、判定装置は、圧縮音声のビットレートが所定の条件を満足するか否かを判定するように形成され、ダウンサンプリング処置装置は、周波数帯域の上限周波数が判定周波数に満たない圧縮音声であって、前記ビットレートが前記所定の条件を満足する圧縮音声に対して、低域通過フィルタ処理後のダウンサンプリング処理を施すように形成されている点にある。 Further, the sound reproducing apparatus according to the present invention is characterized in that the determination device is formed so as to determine whether or not the bit rate of the compressed sound satisfies a predetermined condition, and the downsampling treatment device has an upper limit of the frequency band. It is configured to perform a downsampling process after a low-pass filter process on a compressed sound whose frequency is less than the determination frequency and the bit rate satisfies the predetermined condition. is there.
そして、このような構成によれば、圧縮音声の周波数帯域の上限周波数と、当該圧縮音声のビットレートとに応じて、低域通過フィルタ処理後のダウンサンプリング処理およびその後の補間処理をともなうアップサンプリング処理を施すか否かを選択することが可能となる。 According to such a configuration, the upsampling with the downsampling process after the low-pass filter process and the subsequent interpolation process is performed according to the upper limit frequency of the frequency band of the compressed sound and the bit rate of the compressed sound. It is possible to select whether or not to perform processing.
さらにまた、本発明に係る音声再生機の特徴は、判定装置が、再生サンプリング周波数に応じて異なる所定の条件を満足するビットレートのデータを、当該ビットレートに対応する再生サンプリング周波数のデータと互いに対応関係をもたせた状態で格納したテーブルを備え、圧縮音声が前記所定の条件を満足するか否かを前記テーブルを参照して判定するように形成されている点にある。 Still further, the sound reproducing apparatus according to the present invention is characterized in that the determination device allows the bit rate data satisfying a predetermined condition that differs depending on the reproduction sampling frequency to be mutually shared with the reproduction sampling frequency data corresponding to the bit rate. A table stored in a state of correspondence is provided, and the table is configured to determine whether or not the compressed audio satisfies the predetermined condition with reference to the table.
そして、このような構成によれば、判定装置により、ビットレートが所定の条件を満足するか否かをテーブルを参照することによって簡易かつ迅速に判定することが可能となる。 According to such a configuration, the determination device can easily and quickly determine whether or not the bit rate satisfies a predetermined condition by referring to the table.
また、本発明に係る音声再生機の特徴は、アップサンプリング処理装置が、補間処理としてフラクタル補間処理を行う点にある。 Further, the audio player according to the present invention is characterized in that the upsampling processing apparatus performs fractal interpolation processing as interpolation processing.
そして、このような構成によれば、フラクタル補間処理を施すことによって、圧縮の際に失われた周波数帯域をさらに適切に補間することが可能となる。 And according to such a structure, it becomes possible to interpolate the frequency band lost in the compression more appropriately by performing the fractal interpolation process.
さらに、本発明に係る音声再生方法の特徴は、所定の圧縮フォーマットにしたがって圧縮・符号化された圧縮音声を、所望の再生サンプリング周波数の下で伸長・復号化して再生する音声再生方法において、前記圧縮音声の周波数帯域の上限周波数が、前記再生サンプリング周波数の下での再生に適する所定の判定周波数に満たない場合には、当該圧縮音声に対して低域通過フィルタ処理後にダウンサンプリング処理を施し、次いで、前記ダウンサンプリング処理を施した圧縮音声に対して、前記圧縮の際に失われた周波数帯域を補間する補間処理をともなうアップサンプリング処理を施し、これらのダウンサンプリング処理および補間処理をともなうアップサンプリング処理を施した圧縮音声を前記再生サンプリング周波数の下で伸長・復号化して再生する点にある。 Further, the audio reproduction method according to the present invention is characterized in that in the audio reproduction method for reproducing the compressed audio compressed and encoded according to a predetermined compression format under a desired reproduction sampling frequency, the audio is reproduced. When the upper limit frequency of the frequency band of the compressed audio is less than a predetermined determination frequency suitable for reproduction under the reproduction sampling frequency, the compressed audio is subjected to down-sampling processing after low-pass filter processing , Next, the compressed audio subjected to the downsampling process is subjected to an upsampling process with an interpolation process for interpolating a frequency band lost during the compression, and the upsampling with the downsampling process and the interpolation process is performed. The processed compressed audio is decompressed and decompressed under the playback sampling frequency. It turned into and lies in the fact that to play.
そして、このような方法によれば、周波数帯域の上限周波数が判定周波数に満たない圧縮音声に対する低域通過フィルタ処理後のダウンサンプリング処理および補間処理をともなうアップサンプリング処理を施すことによって、圧縮の際に失われた周波数帯域が補間された圧縮音声を得ることができ、この圧縮音声を再生サンプリング周波数の下で伸長・復号化して再生することが可能となる。 According to such a method, by performing the upsampling process with the downsampling process and the interpolation process after the low-pass filter process for the compressed sound whose upper limit frequency of the frequency band is less than the determination frequency, Therefore, it is possible to obtain a compressed sound obtained by interpolating the lost frequency band, and to decompress and decode the compressed sound at a reproduction sampling frequency.
さらにまた、本発明に係る音声再生方法の特徴は、判定周波数を、再生サンプリング周波数の1/2の周波数とする点にある。 Furthermore, the sound reproduction method according to the present invention is characterized in that the determination frequency is set to a half of the reproduction sampling frequency.
そして、このような方法によれば、周波数帯域の上限周波数が再生サンプリング周波数の1/2に満たない圧縮音声に対する低域通過フィルタ処理後のダウンサンプリング処理および補間処理をともなうアップサンプリング処理を施すことによって、圧縮の際に失われた周波数帯域が補間された圧縮音声を得ることができ、この圧縮音声を再生サンプリング周波数の下で伸長・復号化して再生することが可能となる。 According to such a method, the upsampling process with the downsampling process and the interpolation process after the low-pass filter process is performed on the compressed sound whose upper limit frequency of the frequency band is less than 1/2 of the reproduction sampling frequency. Thus, it is possible to obtain compressed audio in which the frequency band lost during compression is interpolated, and it is possible to reproduce the compressed audio by decompressing and decoding it under the reproduction sampling frequency.
また、本発明に係る音声再生方法の特徴は、圧縮音声のビットレートが所定の条件を満足するか否かを判定し、周波数帯域の上限周波数が判定周波数に満たない圧縮音声であって、前記ビットレートが前記所定の条件を満足する圧縮音声に対して、低域通過フィルタ処理後のダウンサンプリング処理を施す点にある。 Further, the audio reproduction method according to the present invention is characterized in that it is determined whether or not the bit rate of the compressed audio satisfies a predetermined condition, and the compressed audio whose upper limit frequency of the frequency band does not satisfy the determination frequency, The downsampling process after the low-pass filter process is performed on the compressed sound whose bit rate satisfies the predetermined condition.
そして、このような方法によれば、圧縮音声の周波数帯域の上限周波数と、当該圧縮音声のビットレートとに応じて、低域通過フィルタ処理後のダウンサンプリング処理およびその後の補間処理をともなうアップサンプリング処理を施すか否かを選択することが可能となる。 According to such a method, according to the upper limit frequency of the frequency band of the compressed audio and the bit rate of the compressed audio, the upsampling with the downsampling process after the low-pass filter process and the subsequent interpolation process is performed. It is possible to select whether or not to perform processing.
さらに、本発明に係る音声再生方法の特徴は、前記再生サンプリング周波数に応じて異なる前記所定の条件を満足するビットレートのデータを、当該ビットレートに対応する再生サンプリング周波数のデータと互いに対応関係をもたせた状態で格納したテーブルを用意し、前記圧縮音声が前記所定の条件を満足するか否かを前記テーブルを参照して判定する点にある。 Furthermore, the audio reproduction method according to the present invention is characterized in that data of a bit rate satisfying the predetermined condition that differs depending on the reproduction sampling frequency is correlated with the data of the reproduction sampling frequency corresponding to the bit rate. A table stored in a laid state is prepared, and it is determined with reference to the table whether or not the compressed sound satisfies the predetermined condition.
そして、このような方法によれば、ビットレートが所定の条件を満足するか否かをテーブルを参照することによって簡易かつ迅速に判定することが可能となる。 According to such a method, it is possible to easily and quickly determine whether or not the bit rate satisfies a predetermined condition by referring to the table.
さらにまた、本発明に係る音声再生方法の特徴は、補間処理としてフラクタル補間処理を施す点にある。 Furthermore, the sound reproduction method according to the present invention is characterized in that fractal interpolation processing is performed as interpolation processing.
そして、このような方法によれば、フラクタル補間処理を施すことによって、圧縮の際に失われた周波数帯域をさらに適切に補間することが可能となる。 And according to such a method, it becomes possible to interpolate the frequency band lost at the time of compression more appropriately by performing fractal interpolation processing.
本発明に係る音声再生機によれば、周波数帯域の上限周波数が判定周波数に満たない圧縮音声に対してダウンサンプリング処理装置によって低域通過フィルタ処理後にダウンサンプリング処理を施した後、さらに、アップサンプリング処理装置によって補間処理をともなうアップサンプリング処理を施すことによって、圧縮の際に失われた周波数帯域が補間された圧縮音声を得ることができ、この圧縮音声を再生サンプリング周波数の下で伸長・復号化して再生することができる結果、圧縮によって失われた音域を復元することができ、原音に近い音声を再現することができる。 According to the sound reproducing device of the present invention, after the downsampling processing is performed after the low-pass filter processing by the downsampling processing device on the compressed sound whose upper limit frequency of the frequency band is less than the determination frequency, the upsampling is further performed. By performing upsampling processing with interpolation processing by the processing device, it is possible to obtain compressed audio in which the frequency band lost during compression is interpolated, and decompressing and decoding this compressed audio under the reproduction sampling frequency As a result, the sound range lost by the compression can be restored, and the sound close to the original sound can be reproduced.
また、本発明に係る音声再生機によれば、周波数帯域の上限周波数が再生サンプリング周波数の1/2に満たない圧縮音声に対してダウンサンプリング処理装置によって低域通過フィルタ処理後にダウンサンプリング処理を施した後、さらに、アップサンプリング処理装置によって補間処理をともなうアップサンプリング処理を施すことによって、圧縮の際に失われた周波数帯域が補間された圧縮音声を得ることができ、この圧縮音声を再生サンプリング周波数の下で伸長・復号化して再生することができる結果、圧縮によって失われた音域を復元することができ、原音に近い音声を再現することができる。 In addition, according to the sound reproducing device of the present invention, the downsampling processing is performed after the low-pass filter processing by the downsampling processing device for the compressed sound whose upper limit frequency of the frequency band is less than 1/2 of the reproduction sampling frequency. After that, by performing an upsampling process accompanied by an interpolation process by the upsampling processing device, a compressed sound in which the frequency band lost during the compression is interpolated can be obtained. As a result, the range lost by compression can be restored, and the sound close to the original sound can be reproduced.
さらに、本発明に係る音声再生機によれば、圧縮音声の周波数帯域の上限周波数と、当該圧縮音声のビットレートとに応じて、低域通過フィルタ処理後のダウンサンプリング処理およびその後の補間処理をともなうアップサンプリング処理を施すか否かを選択することができる結果、圧縮によって失われた音域をさらに良好に復元することができ、より原音に近い音声を再現することができる。 Furthermore, according to the audio player according to the present invention, the downsampling process after the low-pass filter process and the subsequent interpolation process are performed according to the upper limit frequency of the frequency band of the compressed audio and the bit rate of the compressed audio. As a result of being able to select whether or not to perform the upsampling process, the sound range lost by the compression can be restored more satisfactorily, and the sound closer to the original sound can be reproduced.
さらにまた、本発明に係る音声再生機によれば、判定装置により、ビットレートが所定の条件を満足するか否かをテーブルを参照することによって簡易かつ迅速に判定することができる結果、圧縮によって失われた音域をさらに安価にかつ効率的に復元することができる。 Furthermore, according to the sound reproducing device of the present invention, the determination device can easily and quickly determine whether or not the bit rate satisfies the predetermined condition by referring to the table. The lost sound range can be restored more inexpensively and efficiently.
また、本発明に係る音声再生機によれば、フラクタル補間処理を施すことによって、圧縮の際に失われた周波数帯域をさらに適切に補間することができる結果、圧縮によって失われた音域をさらに高精度に復元することができ、より原音に近い音声を再現することができる。 Further, according to the sound reproducing device of the present invention, by performing the fractal interpolation process, the frequency band lost during the compression can be more appropriately interpolated, and as a result, the sound range lost by the compression can be further increased. The sound can be restored to accuracy, and the sound closer to the original sound can be reproduced.
さらに、本発明に係る音声再生方法によれば、周波数帯域の上限周波数が判定周波数に満たない圧縮音声に対する低域通過フィルタ処理後のダウンサンプリング処理および補間処理をともなうアップサンプリング処理を施すことによって、圧縮の際に失われた周波数帯域が補間された圧縮音声を得ることができ、この圧縮音声を再生サンプリング周波数の下で伸長・復号化して再生することができる結果、圧縮によって失われた音域を復元することができ、原音に近い音声を再現することができる。 Furthermore, according to the sound reproduction method according to the present invention, by performing the upsampling process with the downsampling process and the interpolation process after the low-pass filter process for the compressed sound whose upper limit frequency of the frequency band is less than the determination frequency, It is possible to obtain compressed audio in which the frequency band lost during compression is interpolated, and this compressed audio can be decompressed and decoded under the reproduction sampling frequency. The sound can be restored and the sound close to the original sound can be reproduced.
さらにまた、本発明に係る音声再生方法によれば、周波数帯域の上限周波数が再生サンプリング周波数の1/2に満たない圧縮音声に対する低域通過フィルタ処理後のダウンサンプリング処理および補間処理をともなうアップサンプリング処理を施すことによって、圧縮の際に失われた周波数帯域が補間された圧縮音声を得ることができ、この圧縮音声を再生サンプリング周波数の下で伸長・復号化して再生することができる結果、圧縮によって失われた音域を復元することができ、原音に近い音声を再現することができる。 Furthermore, according to the audio reproduction method of the present invention, the upsampling with the downsampling process and the interpolation process after the low-pass filter process for the compressed audio whose upper limit frequency of the frequency band is less than 1/2 of the reproduction sampling frequency. By applying the processing, it is possible to obtain compressed audio in which the frequency band lost during compression is interpolated, and this compressed audio can be decompressed and decoded under the reproduction sampling frequency, resulting in compression. Can restore the lost sound range and reproduce the sound close to the original sound.
また、本発明に係る音声再生方法によれば、圧縮音声の周波数帯域の上限周波数と、当該圧縮音声のビットレートとに応じて、低域通過フィルタ処理後のダウンサンプリング処理およびその後の補間処理をともなうアップサンプリング処理を施すか否かを選択することができる結果、圧縮によって失われた音域をさらに良好に復元することができ、より原音に近い音声を再現することができる。 Further, according to the audio reproduction method of the present invention, the downsampling process after the low-pass filter process and the subsequent interpolation process are performed according to the upper limit frequency of the frequency band of the compressed audio and the bit rate of the compressed audio. As a result of being able to select whether or not to perform the upsampling process, the sound range lost by the compression can be restored more satisfactorily, and the sound closer to the original sound can be reproduced.
さらに、本発明に係る音声再生方法によれば、ビットレートが所定の条件を満足するか否かをテーブルを参照することによって簡易かつ迅速に判定することができる結果、圧縮によって失われた音域をさらに安価にかつ効率的に復元することができる。 Furthermore, according to the audio reproduction method of the present invention, it is possible to easily and quickly determine whether or not the bit rate satisfies a predetermined condition by referring to the table. Further, it can be restored at low cost and efficiently.
さらにまた、本発明に係る音声再生方法によれば、フラクタル補間処理を施すことによって、圧縮の際に失われた周波数帯域をさらに適切に補間することができる結果、圧縮によって失われた音域をさらに高精度に復元することができ、より原音に近い音声を再現することができる。 Furthermore, according to the audio reproduction method of the present invention, the frequency band lost during the compression can be more appropriately interpolated by performing the fractal interpolation process. It can be restored with high accuracy, and sound closer to the original sound can be reproduced.
以下、本発明に係る音声再生機の実施形態について、図1乃至図7を参照して説明する。 Hereinafter, embodiments of an audio playback device according to the present invention will be described with reference to FIGS.
図1に示すように、本実施形態における音声再生機1は、判定装置としての圧縮音声判定部2を有しており、この圧縮音声判定部2には、CD、放送、通信などを通じて楽音等の圧縮音声が入力されるようになっている。
As shown in FIG. 1, the
そして、圧縮音声判定部2は、入力された圧縮音声の圧縮フォーマットに基づいて、圧縮音声の周波数帯域の上限周波数が、所定の再生サンプリング周波数の下での再生に適する判定周波数としての再生サンプリング周波数の1/2の周波数に満たないか否かを判定するようになっている。
Based on the compression format of the input compressed audio, the compressed
さらに、圧縮音声判定部2は、入力された圧縮音声のビットレート(bps)に基づいて、当該ビットレートの値が、再生サンプリング周波数に応じて異なる所定の条件を満足するか否かを判定するようになっている。
Further, the compressed
なお、前記所定の条件は、前記再生サンプリング波数との関係において好適な値を選択すればよい。例えば、前記再生サンプリング周波数が44.1kHzの場合には、前記所定の条件は、96kbps以下であることとしてもよい。 For the predetermined condition, a suitable value may be selected in relation to the reproduction sampling wave number. For example, when the reproduction sampling frequency is 44.1 kHz, the predetermined condition may be 96 kbps or less.
また、圧縮音声判定部2に、以下の表1に示すようなテーブルを用意し、このテーブル内に、前記再生サンプリング周波数に応じて異なる前記所定の条件を満足する複数のビットレートのデータを、各ビットレートに対応する再生サンプリング周波数のデータと互いに対応関係をもたせた状態で格納しておくようにしてもよい。
Further, a table as shown in Table 1 below is prepared in the compressed
また、表1においては、再生サンプリング周波数が48.0kHzの場合における所定の条件を満足するビットレートは、表1の左欄に示すように、32kbps、64kbpsおよび96kbpsとなっている。圧縮音声がこれらのビットレートの値をとる場合には、表1の右欄に示すように、前記信号の値が1となり、圧縮音声に対してFIFアップサンプリング処理(表1右欄におけるFIF処理)が施されるようになっている。一方、表1において、128kbps、160kbps等のビットレートは、再生サンプリング周波数が48.0kHzの下での所定の条件を満足しないものとなり、この場合には、前記信号の値が0となり、FIFアップサンプリング処理は施されないことになる。 In Table 1, as shown in the left column of Table 1, the bit rates that satisfy the predetermined condition when the reproduction sampling frequency is 48.0 kHz are 32 kbps, 64 kbps, and 96 kbps. When the compressed audio takes these bit rate values, as shown in the right column of Table 1, the value of the signal becomes 1, and the IF upsampling processing (FIF processing in the right column of Table 1) is applied to the compressed audio. ) Is given. On the other hand, in Table 1, bit rates such as 128 kbps and 160 kbps do not satisfy the predetermined condition when the reproduction sampling frequency is 48.0 kHz. In this case, the value of the signal is 0, and the FIFO is increased. Sampling processing is not performed.
このようにすれば、入力された圧縮音声のビットレートが前記所定の条件を満足するか否かをテーブルを参照することによって簡易かつ迅速に判定することが可能となる。 In this way, it is possible to easily and quickly determine whether or not the bit rate of the input compressed audio satisfies the predetermined condition by referring to the table.
圧縮音声判定部2の出力側には、ダウンサンプリング処理装置としてのダウンサンプリング処理部3が接続されている。
A
このダウンサンプリング処理部3には、圧縮音声判定部2から、図2に示すような周波数帯域の上限周波数が再生サンプリング周波数Fsの1/2に満たないフォーマットの圧縮音声であって、かつ、ビットレートが前記所定の条件を満足する圧縮音声であって、ダウンサンプリング処理を要する圧縮音声(以下、「該当圧縮音声」と称する)が入力されるようになっている。
The
そして、ダウンサンプリング処理部3は、入力された該当圧縮音声に対して、低域通過フィルタ処理およびその後のダウンサンプリング処理(以下、単にダウンサンプリング処理と略称する)を施し、このダウンサンプリング処理を施した該当圧縮音声を出力するようになっている。
The down-
なお、ダウンサンプリング処理は、例えば、図3に示すようにダウンサンプリング処理後のサンプリング周波数Fs’が再生サンプリング周波数Fsの半分1/2Fsになるようにしてもよい。 In the downsampling process, for example, as shown in FIG. 3, the sampling frequency Fs ′ after the downsampling process may be half Fs ′ of the reproduction sampling frequency Fs.
ダウンサンプリング処理部3の出力側には、アップサンプリング処理装置としてのFIF(Fractal Interpolation Functions)アップサンプリング処理部4が接続されている。
An FIF (Fractal Interpolation Functions)
このFIFアップサンプリング処理部4には、ダウンサンプリング処理部3から出力されたダウンサンプリング処理後の該当圧縮音声が入力されるようになっている。
The FIF
そして、FIFアップサンプリング処理部4は、入力されたダウンサンプリング処理後の該当圧縮音声に対して、図4、図5に示すようなフラクタル補間処理をともなうアップサンプリング処理(以下、「FIFアップサンプリング処理」と称する)を施すことによって圧縮の際に失われた周波数帯域を補間するようになっている。
Then, the FIFO
フラクタル補間処理は、圧縮音声を例えば図5に示すような波形を有する図形としてとらえ、この圧縮音声の図形が、自己相似性をもつ図形すなわちある単一の線分を適宜縮小、拡大あるいは回転させたものをつなぎ合わせることによって構成されている図形とみなし、当該線分を援用することによって失われた周波数帯域を補間する処理である。このようなフラクタル補間処理は、原音に近い音声を高精度に再現するのに極めて好適な手法である。 In the fractal interpolation processing, the compressed speech is regarded as a figure having a waveform as shown in FIG. 5, for example, and the figure of the compressed voice is reduced, enlarged or rotated as appropriate by a self-similar figure, that is, a single line segment. This is a process of interpolating the frequency band lost by using the line segment, assuming that the figure is configured by connecting the objects together. Such a fractal interpolation process is a very suitable technique for reproducing a sound close to the original sound with high accuracy.
したがって、本実施形態においては、圧縮音声に対してダウンサンプリング処理部3によってダウンサンプリング処理を施した後、さらに、FIFアップサンプリング処理部4によってFIFアップサンプリング処理を施すことによって、圧縮の際に失われた周波数帯域を適切に補間することができる。
Therefore, in the present embodiment, after downsampling processing is performed on the compressed audio by the
なお、FIFアップサンプリング処理部4には、圧縮音声判定部2から直ちに該当圧縮音声以外のフォーマットの圧縮音声が入力されるようになっている。この圧縮音声としては、例えば、再生サンプリング周波数が44.1kHzであるのに対して、22.05kHzのサンプリング周波数で圧縮された圧縮音声のように、周波数帯域の上限周波数が再生サンプリング周波数Fsの1/2に満たないフォーマットの圧縮音声であり、かつ、ダウンサンプリング処理を要しない圧縮音声が該当する。
The FIF
そして、FIFアップサンプリング処理部4は、圧縮音声判定部2から直に入力された圧縮音声に対しても、FIFアップサンプリング処理を施し、このFIFアップサンプリング処理を施した圧縮音声を出力するようになっている。
Then, the IF
FIFアップサンプリング処理部4の出力側には、イコライザ(EQ)やTCR等からなるポストプロセシング部5が接続されており、このポストプロセシング部5には、FIFアップサンプリング処理部4から出力されたFIFアップサンプリング処理後の圧縮音声が入力されるようになっている。
A
そして、ポストプロセシング部5は、入力された圧縮音声に対して、音質や発音タイミング等を調整するポストプロセシング処理(後処理)を施した後に出力するようになっている。
The
ポストプロセシング部5から出力された圧縮音声は、D/A等を介して伸長・復号化されてスピーカ(図示せず)から音声出力されるようになっている。
The compressed sound output from the
なお、ポストプロセシング部5には、圧縮音声判定部2から直ちに圧縮音声が入力される場合がある。この場合の圧縮音声としては、例えば、圧縮の際に音域がほとんどカットされなかったロスレス圧縮オーディオ等の周波数帯域の上限周波数が再生サンプリング周波数Fsの1/2に達しているとみなすことができる圧縮音声が該当する。
In some cases, the compressed speech is immediately input from the compressed
次に、本発明に係る音声再生方法の実施形態について、図6および図7を参照して説明する。 Next, an embodiment of a sound reproduction method according to the present invention will be described with reference to FIGS.
本実施形態における音声再生方法は、前述した音声再生機1を一手段として用いることによって実行することができる。
The sound reproducing method in the present embodiment can be executed by using the
すなわち、まず、図6のステップ1(ST1)において、圧縮音声判定部2は、CD、放送、通信等を通じて圧縮音声を取得する。
That is, first, in step 1 (ST1) of FIG. 6, the compressed
次いで、ステップ2(ST2)において、圧縮音声判定部2により、ステップ1(ST1)において取得した圧縮音声の周波数帯域の上限周波数が再生サンプリング周波数Fsの1/2に満たないか否かを判定する。
Next, in step 2 (ST2), the compressed
さらに、ステップ2(ST2)において、圧縮音声判定部2により、ステップ1(ST1)において取得した圧縮音声のビットレートが、再生サンプリング周波数との関係において所定の条件を満足するか否かを判定する。
Further, in step 2 (ST2), the compressed
そして、ステップ2(ST2)において、圧縮音声の周波数帯域の上限周波数が再生サンプリング周波数Fsの1/2に満たない場合であって、ビットレートが前記所定の条件を満足する場合には、ステップ3(ST3)に進み、そうでない場合にはステップ6(ST6)に進む。
In step 2 (ST2), when the upper limit frequency of the frequency band of the compressed audio is less than ½ of the reproduction sampling frequency Fs and the bit rate satisfies the predetermined condition,
ステップ3(ST3)においては、圧縮音声判定部2により、圧縮音声の周波数帯域の上限周波数が再生サンプリング周波数Fsの1/2に満たない圧縮音声で、かつ、ビットレートが前記所定の条件を満足する圧縮音声が、ダウンサンプリング処理を要する圧縮音声であるか否かを判定する。
In step 3 (ST3), the compressed
そして、ステップ3(ST3)において、圧縮音声が、ダウンサンプリング処理を要する圧縮音声(該当圧縮音声)である場合にはステップ4(ST4)に進み、ダウンサンプリング処理を要しない圧縮音声である場合にはステップ5(ST5)に進む。 In step 3 (ST3), if the compressed audio is compressed audio that requires downsampling processing (corresponding compressed audio), the process proceeds to step 4 (ST4), and if the compressed audio is compressed audio that does not require downsampling processing. Advances to step 5 (ST5).
ステップ4(ST4)においては、ダウンサンプリング処理部3により、圧縮音声に対してダウンサンプリング処理を施した後にステップ5(ST5)に進む。
In step 4 (ST4), the
次いで、ステップ5(ST5)においては、FIFアップサンプリング処理部4によって、圧縮音声に対してFIFアップサンプリング処理を施す。
Next, in step 5 (ST5), the FIFO
これによって、図7に示すように、圧縮の際に失われた周波数帯域が適切に補間された圧縮音声が得られる。なお、FIFアップサンプリング処理によって補間される周波数帯域には、高音域は勿論のこと、大きな信号の近傍で削除されてしまった微小信号に対応する音域も含まれている。さらに、図7のように、原曲にはない高音域を生成することもできる。 As a result, as shown in FIG. 7, a compressed sound in which the frequency band lost during the compression is appropriately interpolated can be obtained. Note that the frequency band interpolated by the FIF upsampling process includes not only a high sound range but also a sound range corresponding to a minute signal that has been deleted in the vicinity of a large signal. Furthermore, as shown in FIG. 7, it is also possible to generate a high frequency range that is not found in the original music.
最後に、ステップ6(ST6)においては、圧縮音声を伸長・復号化して再生する。 Finally, in step 6 (ST6), the compressed sound is decompressed and decoded and reproduced.
以上述べたように、本実施形態によれば、圧縮音声に対してFIFアップサンプリング処理を施すことによって圧縮の際に失われた周波数帯域が補間された圧縮音声を得ることができる結果、圧縮によって失われた音域を高精度に復元することができ、圧縮前の原音に近い高音質の音声を再現することができる。 As described above, according to the present embodiment, it is possible to obtain a compressed sound obtained by interpolating the frequency band lost in the compression by performing the IF upsampling process on the compressed sound. The lost sound range can be restored with high accuracy, and high-quality sound close to the original sound before compression can be reproduced.
なお、本発明は、前述した実施の形態に限定されるものではなく、必要に応じて種々の変更が可能である。 In addition, this invention is not limited to embodiment mentioned above, A various change is possible as needed.
例えば、フラクタル補間処理以外の手法によって、圧縮の際に失われた周波数帯域を補間する補間処理を施すようにしてもよい。 For example, interpolation processing for interpolating a frequency band lost during compression may be performed by a method other than fractal interpolation processing.
また、前記FIFアップサンプリング処理をCD等の非圧縮ソースに応用し、原曲にはない高音域を生成することによって、DVDオーディオ並の高音質化を実現することも可能である。 Further, by applying the above-described FIF upsampling processing to an uncompressed source such as a CD and generating a high sound range that is not included in the original music, it is possible to achieve high sound quality equivalent to that of DVD audio.
1 音声再生機
2 圧縮音声判定部
3 ダウンサンプリング処理部
4 FIFアップサンプリング処理部
DESCRIPTION OF
Claims (10)
前記圧縮音声の周波数帯域の上限周波数が、前記再生サンプリング周波数の下での再生に適する所定の判定周波数に満たないか否かを判定する判定装置と、
この判定装置の判定結果に基づき、周波数帯域の上限周波数が前記判定周波数に満たない圧縮音声に対して低域通過フィルタ処理後にダウンサンプリング処理を施すダウンサンプリング処理装置と、
このダウンサンプリング処理装置によって前記ダウンサンプリング処理が施された圧縮音声に対して、前記圧縮の際に失われた周波数帯域を補間する補間処理をともなうアップサンプリング処理を施すアップサンプリング処理装置と
を備えたことを特徴とする音声再生機。 In an audio reproducing apparatus that reproduces compressed audio that has been compressed and encoded according to a predetermined compression format by decompressing and decoding it under a desired reproduction sampling frequency.
A determination device for determining whether an upper limit frequency of the frequency band of the compressed audio is less than a predetermined determination frequency suitable for reproduction under the reproduction sampling frequency;
Based on the determination result of this determination device, a downsampling processing device that performs downsampling processing after low-pass filter processing for compressed speech whose upper limit frequency of the frequency band is less than the determination frequency;
The compressed audio, wherein the down-sampling process is performed by the down-sampling processing unit, and a up-sampling processing unit that performs up-sampling processing with the interpolation process of interpolating a frequency band that may have been lost during the compression An audio player characterized by that.
前記ダウンサンプリング処置装置は、前記周波数帯域の上限周波数が前記判定周波数に満たない圧縮音声であって、前記ビットレートが前記所定の条件を満足する圧縮音声に対して、前記ダウンサンプリング処理を施すように形成されていること
を特徴とする請求項1または請求項2に記載の音声再生機。 The determination device is configured to determine whether or not a bit rate of the compressed audio satisfies a predetermined condition,
The down-sampling treatment apparatus performs the down-sampling process on compressed audio whose upper limit frequency of the frequency band is less than the determination frequency and whose bit rate satisfies the predetermined condition. The sound reproducing device according to claim 1 or 2, wherein the sound reproducing device is formed as follows.
前記圧縮音声の周波数帯域の上限周波数が、前記再生サンプリング周波数の下での再生に適する所定の判定周波数に満たない場合には、当該圧縮音声に対して低域通過フィルタ処理後にダウンサンプリング処理を施し、
次いで、前記ダウンサンプリング処理を施した圧縮音声に対して、前記圧縮の際に失われた周波数帯域を補間する補間処理をともなうアップサンプリング処理を施し、
これらのダウンサンプリング処理および補間処理をともなうアップサンプリング処理を施した圧縮音声を前記再生サンプリング周波数の下で伸長・復号化して再生すること
を特徴とする音声再生方法。 In an audio reproduction method for reproducing compressed audio that has been compressed and encoded in accordance with a predetermined compression format, decompressed and decoded under a desired reproduction sampling frequency,
When the upper limit frequency of the frequency band of the compressed audio does not reach a predetermined determination frequency suitable for reproduction under the reproduction sampling frequency, downsampling processing is performed on the compressed audio after low-pass filter processing. ,
Next, the compressed audio subjected to the downsampling process is subjected to an upsampling process with an interpolation process for interpolating a frequency band lost during the compression,
An audio reproduction method characterized in that the compressed audio subjected to the upsampling process accompanied with the downsampling process and the interpolation process is decompressed and decoded under the reproduction sampling frequency.
前記周波数帯域の上限周波数が前記判定周波数に満たない圧縮音声であって、前記ビットレートが前記所定の条件を満足する圧縮音声に対して、前記ダウンサンプリング処理を施すこと
を特徴とする請求項6または請求項7に記載の音声再生方法。 Determining whether the bit rate of the compressed audio satisfies a predetermined condition;
7. The downsampling process is performed on compressed audio in which the upper limit frequency of the frequency band is less than the determination frequency and the bit rate satisfies the predetermined condition. Or the audio | voice reproduction method of Claim 7.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2004309597A JP4567412B2 (en) | 2004-10-25 | 2004-10-25 | Audio playback device and audio playback method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2004309597A JP4567412B2 (en) | 2004-10-25 | 2004-10-25 | Audio playback device and audio playback method |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2006119524A JP2006119524A (en) | 2006-05-11 |
| JP4567412B2 true JP4567412B2 (en) | 2010-10-20 |
Family
ID=36537440
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2004309597A Expired - Fee Related JP4567412B2 (en) | 2004-10-25 | 2004-10-25 | Audio playback device and audio playback method |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4567412B2 (en) |
Families Citing this family (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2010145426A (en) * | 2007-04-03 | 2010-07-01 | Panasonic Corp | Audio band extension device |
| DE102008015702B4 (en) * | 2008-01-31 | 2010-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for bandwidth expansion of an audio signal |
| JP5008596B2 (en) * | 2008-03-19 | 2012-08-22 | アルパイン株式会社 | Sampling rate converter and conversion method thereof |
| JP2010085877A (en) * | 2008-10-02 | 2010-04-15 | Clarion Co Ltd | Acoustic compensation apparatus |
| JP5443724B2 (en) * | 2008-10-10 | 2014-03-19 | セミコンダクター・コンポーネンツ・インダストリーズ・リミテッド・ライアビリティ・カンパニー | Audio signal processing circuit |
| JP5629429B2 (en) * | 2008-11-21 | 2014-11-19 | パナソニック株式会社 | Audio playback apparatus and audio playback method |
| JP2017152067A (en) * | 2016-02-24 | 2017-08-31 | アルパイン株式会社 | Audio device |
| JP6621709B2 (en) | 2016-05-26 | 2019-12-18 | アルパイン株式会社 | Audio processing apparatus, audio processing method, and computer program |
| CN112037781B (en) * | 2020-08-07 | 2024-01-19 | 北京百度网讯科技有限公司 | Voice data acquisition method and device |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3122540B2 (en) * | 1992-08-25 | 2001-01-09 | シャープ株式会社 | Pitch detection device |
| KR20040066835A (en) * | 2001-11-23 | 2004-07-27 | 코닌클리즈케 필립스 일렉트로닉스 엔.브이. | Audio signal bandwidth extension |
| JP2005084370A (en) * | 2003-09-09 | 2005-03-31 | Alpine Electronics Inc | Sampling rate conversion method using fif |
-
2004
- 2004-10-25 JP JP2004309597A patent/JP4567412B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2006119524A (en) | 2006-05-11 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5092580B2 (en) | Digital signal processing apparatus, digital signal processing method, and digital signal processing program | |
| JP4567412B2 (en) | Audio playback device and audio playback method | |
| WO2016199596A1 (en) | Signal processing device, signal processing method, and program | |
| JP2006243041A (en) | High-frequency interpolating device and reproducing device | |
| JP4882383B2 (en) | Audio signal bandwidth expansion device | |
| US11107485B2 (en) | Converting a single-bit audio stream to a stream of symbols with a constant edge rate | |
| KR100372904B1 (en) | Signal processor | |
| JP2010145426A (en) | Audio band extension device | |
| JP4760278B2 (en) | Interpolation device, audio playback device, interpolation method, and interpolation program | |
| WO2005057550A1 (en) | Audio compression/decompression device | |
| JP2006243043A (en) | High-frequency interpolating device and reproducing device | |
| JP5197278B2 (en) | High range complementer | |
| WO2018198788A1 (en) | Signal processing device, signal processing method and program | |
| JP5034228B2 (en) | Interpolation device, sound reproduction device, interpolation method and interpolation program | |
| JP4516805B2 (en) | Audio equipment | |
| JP4882382B2 (en) | Audio signal bandwidth expansion device | |
| JP2006350132A (en) | Audio playback apparatus, audio playback method, and audio playback program | |
| JP4815986B2 (en) | Interpolation device, audio playback device, interpolation method, and interpolation program | |
| JP4715385B2 (en) | Interpolation device, audio playback device, interpolation method, and interpolation program | |
| JP3947191B2 (en) | Prediction coefficient generation device and prediction coefficient generation method | |
| JP4617786B2 (en) | Information processing apparatus and method, and program | |
| JP4765460B2 (en) | Speech coding apparatus and speech coding method | |
| JP2006243042A (en) | High-frequency interpolating device and reproducing device | |
| JP2002093055A (en) | Signal processing device, signal processing method, and optical disk reproducing device | |
| JP2009020922A (en) | Reproducing device, program, and reproduction method |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070227 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100119 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100202 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100325 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100803 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100805 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130813 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130813 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140813 Year of fee payment: 4 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| LAPS | Cancellation because of no payment of annual fees |