Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP5355387B2 - 符号化装置および符号化方法 - Google Patents
[go: Go Back, main page]

JP5355387B2 - 符号化装置および符号化方法 - Google Patents

符号化装置および符号化方法 Download PDF

Info

Publication number
JP5355387B2
JP5355387B2 JP2009508902A JP2009508902A JP5355387B2 JP 5355387 B2 JP5355387 B2 JP 5355387B2 JP 2009508902 A JP2009508902 A JP 2009508902A JP 2009508902 A JP2009508902 A JP 2009508902A JP 5355387 B2 JP5355387 B2 JP 5355387B2
Authority
JP
Japan
Prior art keywords
channel
signal
frequency coefficient
encoding
residual signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009508902A
Other languages
English (en)
Other versions
JPWO2008126382A1 (ja
Inventor
ジオン チョウ
コクセン チョン
幸司 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2009508902A priority Critical patent/JP5355387B2/ja
Publication of JPWO2008126382A1 publication Critical patent/JPWO2008126382A1/ja
Application granted granted Critical
Publication of JP5355387B2 publication Critical patent/JP5355387B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Error Detection And Correction (AREA)

Description

本発明は、移動体通信システムまたはインターネットプロトコル(IP:Internet Protocol)を用いたパケット通信システム等において、ステレオ音声信号やステレオ・オーディオ信号の符号化を行う際に用いられる符号化装置および符号化方法に関する。
移動体通信システムまたはIPを用いたパケット通信システム等において、DSP(Digital Signal Processor)によるディジタル信号処理速度と帯域幅の制限は徐々に緩和されつつある。伝送レートのさらなる高ビットレート化が進めば、複数チャネルを伝送するだけの帯域を確保できるようになるため、現在はモノラル方式が主流となる音声通信においても、ステレオ方式による通信(ステレオ通信)が普及することが期待される。
現在の携帯電話は既に、ステレオ機能を有するマルチメディアプレイヤやFMラジオの機能を搭載することができる。従って、第4世代の携帯電話およびIP電話等にステレオ・オーディオ信号だけでなく、ステレオ音声による音声通信やステレオ音声信号の録音、再生等の機能を追加するのは自然なことである。
ステレオ音声信号を符号化する1つの一般的な方法は、モノラル音声コーデックに基づく信号予測手法を使用することによる。すなわち、基本チャネル信号を公知のモノラル音声コーデックを使用して送信し、この基本チャネル信号から、追加の情報およびパラメータを使用して左チャネルまたは右チャネルを予測する。多くのアプリケーションでは、基本チャネル信号として、ミックスされたモノラル信号が選択される。
従来、ステレオ信号を符号化する方法としてISC(Intensity Stereo Coding:強度ステレオ符号化)、BCC(Binaural Cue Coding:バイノーラル・キュー符号化)、およびICP(Inter-Channel Prediction:チャネル間予測)などがある。これらのパラメトリックなステレオ符号化方式は、それぞれ異なる長所および短所を持ち、それぞれ異なる音源(source materials)の符号化に適している。
非特許文献1には、これらの符号化方法を用いて、モノラルコーデックに基づきステレオ信号を予測する技術が開示されている。具体的には、ステレオ信号を構成するチャネル信号、例えば、左チャネル信号と右チャネル信号とを用いた合成によりモノラル信号を生成し、得られるモノラル信号を公知の音声コーデックを使用して符号化/復号し、さらに予測パラメータを用いてモノラル信号から左チャネルと右チャネルの差信号(サイド信号(side signal))を予測する。このような符号化方法において、符号化側は、モノラル信号とサイド信号との関係を時間依存性の適応フィルタを使用してモデル化し、フレーム毎に算出されたフィルタ係数を復号側に送信する。復号側では、モノラルコーデックによって送信された高品質なモノラル信号をフィルタリングすることによって、差信号を再生成し、再生成した差信号とモノラル信号から、左チャネル信号および右チャネル信号を算出する。
また、非特許文献2には、チャネル間相関キャンセラー(Cross-Channel Correlation Canceller)と呼ばれる符号化方法が開示されており、ICP方式の符号化方法においてチャネル間相関キャンセラーの技術を適用する場合、一方のチャネルから他方のチャネルを予測することができる。
また、近年、オーディオ圧縮技術が急速に発展し、その中で、変形離散コサイン変換(
MDCT)方式が、高品質のオーディオ符号化における主要な手法となっている(非特許文献3、非特許文献4参照)。
MDCTでは、エネルギを集中させる能力に加えて、クリティカルサンプリング(critical sampling)と、ブロック効果(block effect)低減と、柔軟な窓切り替えとが同時に達成され得る。MDCTでは、時間領域エイリアス除去(TDAC:time domain alias cancellation)と、周波数領域エイリアス除去(frequency domain alias cancellation)というコンセプトを使用する。MDCTは、完全な再生成が達成されるように設計されている。
MDCTは、オーディオ符号化のパラダイムにおいて幅広く使用されている。適切な窓ウィンドウ(例:正弦窓)が使用される場合、MDCTは、聴覚上大きな問題が生じることなくオーディオ圧縮に適用されてきた。最近では、MDCTは、マルチモード変換予測符号化(multimode transform predictive coding)のパラダイムにおいて重要な役割を果たしている。
マルチモード変換予測符号化とは、音声符号化の原理とオーディオ符号化の原理とをひとつの符号化体系としてまとめるものである(非特許文献4)。ただし、非特許文献4における、MDCTに基づく符号化構造およびその適用は、1つのチャネルの信号のみを符号化するように設計され、異なる周波数領域におけるMDCT係数を、異なる量子化方式を使用して量子化している。
Extended AMR Wideband Speech Codec (AMR-WB+): Transcoding functions, 3GPP TS 26.290. S. Minami and O. Okada, "Stereophonic ADPCM voice coding method," in Proc. ICASSP’90, Apr. 1990. Ye Wang and Miikka Vilermo, "The modified discrete cosine transform: its implications for audio coding and error concealment," in AES 22ndInternational Conference on Virtual, Synthetic and Entertainment, 2002. Sean A. Ramprashad, "The multimode transform predictive coding paradigm," IEEE Tran. Speech and Audio Processing, vol. 11, pp. 117 - 129, Mar. 2003.
非特許文献2において使用されている符号化方式の場合、2つのチャネル間の相関が高いときには、ICPのパフォーマンスは十分なものである。しかしながら、相関が低いときには、より高い次数の適応フィルタ係数が必要であり、場合によっては、予測利得を高めるためのコストがかかりすぎる。フィルタ次数を増やさないと、予測誤差のエネルギレベルが基準信号のエネルギレベルと変わらないことがあり、そのような状況ではICPは有用ではない。
音声信号の品質にとっては、周波数帯域の低帯域部分が本質的に重要である。復号化した音声の低帯域部分におけるわずかな誤りによって、音声全体の品質が大きく損なわれる。音声符号化におけるICPの予測性能の限界のため、2つのチャネル間の相関が高くないときには、低帯域部分について満足なパフォーマンスを達成することが難しく、別の符号化方式を採用した方が望ましい。
非特許文献1では、時間領域において高帯域部分の信号に対してのみICPを適用している。これは、上記の問題に対する1つの解決策である。しかしながら、非特許文献1では、符号器におけるICP予測に、入力モノラル信号を使用している。好ましくは、復号
されたモノラル信号を使用すべきである。なぜなら、復号器側において、再生成されたステレオ信号はICP合成フィルタによって得られ、このICP合成フィルタは、モノラル復号器によって復号されたモノラル信号を使用するためである。しかしながら、モノラル符号器が、特に広帯域(7kHz以上)オーディオ符号化に幅広く使用されているMDCT変換符号化などの変換符号化タイプの符号器である場合、符号器側において時間領域で復号されたモノラル信号を取得するためには、何らかの追加のアルゴリズム遅延が発生する。
本発明の目的は、MDCTおよびICPを使用してスケーラブルなステレオ音声符号化を実行する場合において、符号化・復号の高効率化と復号音声の高品質化の両方を実現することができる符号化装置および符号化方法を提供することである。
本発明の符号化装置は、ステレオ信号の第1チャネル信号および第2チャネル信号に対する線形予測残差信号である第1チャネル残差信号および第2チャネル残差信号を取得する残差信号取得手段と、前記第1チャネル残差信号および前記第2チャネル残差信号をそれぞれ周波数領域に変換し、第1チャネル周波数係数および第2チャネル周波数係数を得る周波数領域変換手段と、相対的に高い精度の符号化方法を用いて、前記第1チャネル周波数係数および第2チャネル周波数係数の閾値周波数未満の帯域部分に対して符号化を行う第1符号化手段と、相対的に低い精度の符号化方法を用いて、前記第1チャネル周波数係数および第2チャネル周波数係数の前記閾値周波数以上の帯域部分に対して符号化を行う第2符号化手段と、を具備する構成を採る。
本発明の符号化方法は、ステレオ信号の第1チャネル信号および第2チャネル信号に対する線形予測残差信号である第1チャネル残差信号および第2チャネル残差信号を取得する残差信号取得ステップと、前記第1チャネル残差信号および前記第2チャネル残差信号をそれぞれ周波数領域に変換し、第1チャネル周波数係数および第2チャネル周波数係数を得る周波数領域変換ステップと、相対的に高い精度の符号化方法を用いて、前記第1チャネル周波数係数および第2チャネル周波数係数の閾値周波数未満の帯域部分に対して符号化を行う第1符号化ステップと、相対的に低い精度の符号化方法を用いて、前記第1チャネル周波数係数および第2チャネル周波数係数の前記閾値周波数以上の帯域部分に対して符号化を行う第2符号化ステップと、を有する方法を採る。
本発明によれば、聴感上、重要度が相対的に高い低帯域部分に対して高い量子化精度の符号化方法を用い、重要度が相対的に低い高帯域部分に対してICPを用いた効率の高い符号化方法を用いることにより、符号化・復号の高効率化と復号音声の高品質化の両方を実現することができる。
また、MDCT変換符号化器によってMDCT領域で復号されたモノラル信号をICPプロセスに使用することにより、ICPがMDCT領域において直接実行されるため、アルゴリズムに起因する追加の遅延が発生しない。
(実施の形態1)
以下、本発明の実施の形態1について、図面を用いて説明する。なお、以下の説明において、左チャネル信号、右チャネル信号、モノラル信号、およびそれらの再生成信号を、それぞれ、L、R、M、L’、R’、M’として表す。また、以下の説明では、各フレームの長さをN、モノラル、左、右の各信号に対するMDCT領域信号(周波数係数と称する)を、それぞれ、m(f)、l(f)、r(f)として表す。なお、信号名と記号との対応関係は、上記記載に限定されるものではない。
図1は、本実施の形態に係る符号化装置の構成を示すブロック図である。図1に示す符号化装置100には、PCM(Pulse Code Modulation)形式における左チャネル信号と右チャネル信号とからなるステレオ信号がフレーム毎に入力される。
モノラル信号合成部101は、左チャネル信号L、右チャネル信号Rを以下の式(1)により合成し、モノラル音声信号Mを生成する。モノラル信号合成部101は、左チャネル信号Lおよび右チャネル信号RをLP(Linear Prediction:線形予測)分析・量子化部102およびLP逆フィルタ103に出力し、モノラル音声信号Mをモノラル符号化部104に出力する。
Figure 0005355387
この式(1)において、nは、フレームにおける時間インデックス(time index)である。なお、モノラル信号を生成するためのミックス方法は、式(1)に限定されない。例えば、適応的に重み付けしてミックスする方法等、他の方法を使用して、モノラル信号を生成することもできる。
LP分析・量子化部102は、左チャネル信号Lおよび右チャネル信号Rに対してLP分析(線形予測分析)によるLPパラメータの算出および算出LPパラメータの量子化を行い、得られたLPパラメータの符号化データを多重部120に出力し、LP係数A/AをLP逆フィルタ103に出力する。
LP逆フィルタ103は、LP係数A/Aを用いて、左チャネル信号Lおよび右チャネル信号Rに対してLP逆フィルタリングを行い、得られた左チャネル/右チャネルの残差信号Lres/Rresをピッチ分析・量子化部105およびピッチ逆フィルタ106に出力する。
モノラル符号化部104は、モノラル信号Mを符号化し、得られた符号化データを多重部120に出力する。一方、モノラル符号化部104は、モノラル残差信号Mresをピッチ分析部107およびピッチ逆フィルタ108に出力する。なお、残差信号は励振信号ともいう。この残差信号は、ほとんどのモノラル音声符号化装置(例:CELPベースの符号化装置)において、あるいは、LP残差信号またはローカルに復号化される残差信号を生成するプロセスが含まれるタイプの符号化装置において取り出すことが可能である。
ピッチ分析・量子化部105は、左チャネル/右チャネルの残差信号Lres/Rresに対してピッチ分析および量子化を行い、得られた左チャネル/右チャネル残差信号のピッチパラメータ(ピッチ周期P/Pおよびピッチ利得G/G)をピッチ逆フィルタ106に出力し、ピッチパラメータの符号化データを多重部120に出力する。
ピッチ逆フィルタ106は、ピッチパラメータを用いて、左チャネル/右チャネルの残差信号Lres/Rresに対してピッチ逆フィルタリングを行い、ピッチ周期成分を除去した左チャネル/右チャネルの残差信号exc/excを窓掛け部109に出力する。
ピッチ分析部107は、モノラル残差信号Mresに対してピッチ分析を行い、モノラル残差信号のピッチ周期Pをピッチ逆フィルタ108に出力する。ピッチ逆フィルタ108は、ピッチ周期Pを用いて、モノラル残差信号Mresに対してピッチ逆フィルタリングを行い、ピッチ周期成分を除去したモノラル残差信号excを窓掛け部110に出力する。
窓掛け部109は、左チャネル/右チャネルの残差信号exc/excに対して窓掛け処理(windowing)を行い、MDCT変換部111に出力する。窓掛け部110は、モノラル残差信号excに対して窓掛け処理を行い、MDCT変換部112に出力する。窓掛け部109および窓掛け部110の窓かけ処理に必要な正弦窓h(k)は、先行技術において幅広く使用されており、以下の式(2)によって計算される。
Figure 0005355387
MDCT変換部111は、窓掛け処理後の左チャネル/右チャネルの残差信号exc/excに対してMDCT変換を実行し、得られた左チャネル/右チャネル残差信号の周波数係数l(f)/r(f)を相関計算部113およびスペクトル分割部115に出力する。MDCT変換部112は、窓掛け処理後のモノラル残差信号excに対してMDCT変換を実行し、得られたモノラル残差信号の周波数係数m(f)を相関計算部113およびスペクトル分割部116に出力する。なお、MDCT変換により得られた周波数係数は、一般に「MDCT係数」と呼ばれる。
MDCT変換部111におけるMDCT変換により得られる左チャネル残差信号の周波数係数l(f)は、以下の式(3)によって算出される。なお、この式(3)において、s(k)は長さ2Nの窓掛けされた残差信号である。なお、右チャネル残差信号の周波数係数r(f)も同様に算出される。
Figure 0005355387
相関計算部113は、左チャネル残差信号の周波数係数l(f)とモノラル残差信号の周波数係数m(f)との相関値c、右チャネル残差信号の周波数係数r(f)とモノラル残差信号の周波数係数m(f)との相関値cをそれぞれ計算し、相関値の絶対値をICP次数割り当て部114に出力する。そして、相関計算部113は、計算結果を使用して、以下の式(4)により、分割周波数FTHを決定し、分割周波数を示す情報をスペクトル分割部115およびスペクトル分割部116に出力する。なお、式(4)により、相関が高いほど分割周波数FTHは低くなる。また、以下の説明で、分割周波数FTHより低い周波数帯域を低帯域部分、分割周波数FTH以上の周波数帯域を高帯域部分という。
Figure 0005355387
式(4)において、Fsはサンプリング周波数を表す。サンプリング周波数は、16kHz、24kHz、32kHz、または48kHzとすることができる。なお、式(4)における定数「1k」および「32」は一例であり、本実施の形態では、これらの値を任意に設定することができる。
なお、分割周波数FTHは、ビットレートに基づいて計算することもできる。例えば、所定のビットレートで符号化するために、左チャネル残差信号の周波数係数l(f)および右チャネル残差信号の周波数係数r(f)の低帯域部分について符号化できるMDCT係数の合計がX個のみであるとする。モノラル周波数係数m(f)との相関が高い方のチャネルは、符号化に必要なMDCT係数の数が少なくて済む。相関計算部113は、左チャネル残差信号の周波数係数l(f)の低帯域部分の周波数係数の数を、X×c/(c+c)によって計算し、右チャネル残差信号の残差信号の周波数係数r(f)の低帯域部分の周波数係数の数を、X×c/(c+c)によって計算する。
左右のチャネルのICPの次数の合計は、通常では一定である。ICP次数割り当て部114は、相関が高いほどICP次数が小さくなるように、相関値に基づいて左チャネルに割り当てるICPの次数を計算する。ICPの次数の合計をICPorとすれば、ICP次数割り当て部114は、左チャネルのICPの次数を、ICPor×c/(c+c)によって計算する。なお、右チャネルのICPの次数は、ICPor×c/(c+c)によって計算することができる。ICP次数割り当て部114は、左チャネルのICP次数を示す情報を、ICP分析部117および多重部120に出力する。
スペクトル分割部115は、分割周波数FTHを境として左チャネル/右チャネル残差信号の周波数係数l(f)/r(f)の帯域を分割し、その低帯域部分の周波数係数l(f)/r(f)を低帯域符号化部119に出力し、その高帯域部分の周波数係数l(f)/r(f)をICP分析部117に出力する。また、スペクトル分割部115は、低帯域符号化部119において符号化するMDCT係数の数を示す分割フラグを量子化し、多重部120に出力する。
スペクトル分割部116は、分割周波数FTHを境としてモノラル残差信号の周波数係数m(f)の帯域を分割し、その高帯域部分の周波数係数m(f)をICP分析部117に出力する。
ICP分析部117は、適応フィルタからなり、左チャネル残差信号の高帯域部分の周波数係数l(f)とモノラル残差信号の高帯域部分の周波数係数m(f)との相関関係を用いてICP分析を行い、左チャネル残差信号のICPパラメータを生成する。同様に、ICP分析部117は、右チャネル残差信号の高帯域部分の周波数係数r(f)とモノラル残差信号の高帯域部分の周波数係数m(f)との相関関係を用いてICP分析を行い、右チャネル残差信号のICPパラメータを生成する。なお、各ICPパラメータの次数は、ICP次数割り当て部114で計算されたものとなる。ICP分析部117は、各ICPパラメータをICPパラメータ量子化部118に出力する。
ICPパラメータ量子化部118は、ICP分析部117から出力された各ICPパラメータを量子化し、多重部120に出力する。なお、ICPパラメータ量子化部118においてICPパラメータの量子化に使用されるビットの数も、モノラルと各チャネルとの相関によって調整することができる。この場合、相関が高いほど、ICPビット数を少なくする。総ビット数をBITと表すと、左チャネル残差信号のICPパラメータ量子化のビット数は、BIT×c/(c+c)によって計算することができる。同様に、右チャネル残差信号のICPパラメータ量子化のビット数は、BIT×c/(c+c
)によって計算することができる。
低帯域符号化部119は、左チャネル/右チャネル残差信号の低帯域部分の周波数係数l(f)/r(f)を符号化し、得られた符号化データを多重部120に出力する。
多重部120は、LP分析・量子化部102から出力されたLPパラメータの符号化データ、モノラル符号化部104から出力されたモノラル信号の符号化データ、ピッチ分析・量子化部105から出力されたピッチパラメータの符号化データ、ICP次数割り当て部114から出力された左チャネル残差信号のICP次数を示す情報、スペクトル分割部115から出力された量子化分割フラグ、ICPパラメータ量子化部118から出力された量子化ICPパラメータ、および低帯域符号化部119から出力された左チャネル/右チャネル残差信号の低帯域部分の周波数係数の符号化データを多重し、得られたビットストリームを出力する。
図2は、ICP分析部117を構成する適応フィルタの構成および動作を説明するための図である。この図において、H(z)は、H(z)=b+b(z−1)+b(z−2)+…+b(z−k)であり、適応フィルタ、例えばFIR(Finite Impulse Response)フィルタのモデル(伝達関数)を示す。ここで、kは適応フィルタ係数の次数を示し、b=[b,b,…,b]は適応フィルタ係数を示す。x(n)は適応フィルタの入力信号、y’(n)は適応フィルタの出力信号(予測信号)、y(n)は適応フィルタの基準信号を示す。ICP分析部117において、x(n)はm(f)に相当し、y(n)はl(f)またはr(f)に相当する。
適応フィルタは、下記の式(5)に従って、予測信号と基準信号との平均二乗誤差(MSE)が最小となるような、適応フィルタパラメータb=[b,b,…,b]を求めて出力する。なお、式(5)において、Eは統計的期待演算子(statistical expectation operator)を表し、E{.}はアンサンブル平均演算(ensemble average operation)、Kはフィルタ次数、e(n)は予測誤差を示す。
Figure 0005355387
なお、図2におけるH(z)には、多数の別の構造が存在する。図3は、そのうちの1つを示している。図3に示したフィルタ構造は、従来のFIRフィルタである。
図4は、本実施の形態に係る復号装置の構成を示すブロック図である。図1に示した符号化装置100から送信されたビットストリームは、図4に示す復号装置400に受信される。
分離部401は、復号装置400に受信されたビットストリームを分離し、LPパラメータの符号化データをLPパラメータ復号部417に出力し、ピッチパラメータの符号化データをピッチパラメータ復号部415に出力し、量子化ICPパラメータをICPパラメータ復号部403に出力し、モノラル信号の符号化データをモノラル復号部402に出力し、左チャネル残差信号のICP次数を示す情報をICP合成部409に出力し、量子化分割フラグをスペクトル分割部408に出力し、左チャネル/右チャネル残差信号の低帯域部分の周波数係数の符号化データを低帯域復号部410に出力する。
モノラル復号部402は、モノラル信号の符号化データを復号してモノラル信号M’お
よびモノラル残差信号M'resを得る。モノラル復号部402は、得られたモノラル残差信号M'resをピッチ分析部404およびピッチ逆フィルタ405に出力する。
ICPパラメータ復号部403は、量子化ICPパラメータを復号し、得られた左チャネル/右チャネルICPパラメータをICP合成部409に出力する。
ピッチ分析部404は、モノラル残差信号M'resに対してピッチ分析を行い、モノラル残差信号のピッチ周期P'をピッチ逆フィルタ405に出力する。ピッチ逆フィルタ405は、ピッチ周期P'を用いて、モノラル残差信号M'resに対してピッチ逆フィルタリングを行い、ピッチ周期成分を除去したモノラル残差信号exc'を窓掛け部406に出力する。
窓掛け部406は、モノラル残差信号exc'に対して窓掛け処理を行い、MDCT変換部407に出力する。なお、窓掛け部406の窓掛け処理における窓関数は上記式(2)によって与えられる。
MDCT変換部407は、窓掛け処理後のモノラル残差信号exc'に対してMDCT変換を実行し、得られたモノラル残差信号の周波数係数m'(f)をスペクトル分割部408に出力する。なお、MDCT変換部407におけるMDCT変換の計算は上記式(3)によって与えられる。
スペクトル分割部408は、分割周波数FTHを境として全帯域を分割した後、モノラル残差信号の高帯域部分の周波数係数m'(f)をICP合成部409に出力する。
ICP合成部409は、適応フィルタからなり、左チャネルのICPパラメータを用いてモノラル残差信号の高帯域部分の周波数係数m'(f)をフィルタリングすることにより、左チャネル残差信号の高帯域部分の周波数係数l'(f)を計算する。同様に、ICP合成部409は、右チャネルのICPパラメータを用いてモノラル残差信号の高帯域部分の周波数係数m'(f)をフィルタリングすることにより、右チャネル残差信号の高帯域部分の周波数係数r'(f)を計算する。ICP合成部409は、左チャネル/右チャネル残差信号の高帯域部分の周波数係数l'(f)/r'(f)を加算部411に出力する。
なお、左チャネル残差信号の高帯域部分の周波数係数l'(f)は、以下の式(6)によって計算することができる。なお、式(6)において、b は、左チャネルの再生成されたICPパラメータの第i次の要素である。Kは、左チャネルのICP次数を示す情報によって得られる。なお、右チャネル残差信号の高帯域部分の周波数係数r'(f)も同様に計算することができる。
Figure 0005355387
低帯域復号部410は、左チャネル/右チャネル残差信号の低帯域部分の周波数係数の符号化データを復号し、得られた左チャネル/右チャネル残差信号の低帯域部分の周波数係数l'(f)/r'(f)を加算部411に出力する。
加算部411は、左チャネル/右チャネル残差信号の低帯域部分の周波数係数l'(f)/r'(f)と左チャネル/右チャネル残差信号の高帯域部分の周波数係数l'(f)/r'(f)とを結合し、得られた左チャネル/右チャネル残差信号の周波数係数
l'(f)/r'(f)をIMDCT変換部412に出力する。
IMDCT変換部412は、左チャネル/右チャネル残差信号の周波数係数l'(f)/r'(f)に対してIMDCT変換を実行する。左チャネル残差信号の周波数係数l'(f)に対するIMDCT変換の計算は、以下の式(7)によって行われる。ここで、式(7)において、s(k)は、時間領域エイリアシングを含んでいるIMDCT係数である。なお、右チャネル残差信号の周波数係数r'(f)に対するIMDCT変換の計算も同様に行われる。
Figure 0005355387
左チャネル/右チャネル残差信号を再生成するため、窓掛け部413が、IMDCT変換部412の出力信号に対して窓掛け処理を行い、重ね合わせ加算部414が、窓掛け部413の出力信号に対して重ね合わせ加算(overlap and add)を行い、左チャネル/右チャネルの残差信号exc'/exc'を得る。再生成された左チャネル/右チャネルの残差信号exc'/exc'は、ピッチ合成部416に出力される。
ピッチパラメータ復号部415は、ピッチパラメータの符号化データを復号し、得られた左チャネル/右チャネル残差信号のピッチパラメータ(ピッチ周期P/Pおよびピッチ利得G/G)をピッチ合成部416に出力する。
ピッチ合成部416は、左チャネル/右チャネルの残差信号exc'/exc'に対して、ピッチ周期P/Pおよびピッチ利得G/Gを用いてピッチ合成フィルタリングを行い、得られた左チャネル/右チャネル残差信号L'res/R'resをLP合成フィルタ418に出力する。
LPパラメータ復号部417は、LPパラメータの符号化データを復号し、得られたLP係数A/AをLP合成フィルタ418に出力する。
LP合成フィルタ418は、左チャネル/右チャネル残差信号L'res/R'resに対して、LP係数A/Aを用いてLP合成フィルタリングを行い、左チャネル信号L'および右チャネル信号R'を得る。
このように、図4の復号装置400は、受信した図1の符号化装置100の信号に対して復号処理を行うことにより、モノラル信号M’とステレオ音声信号L'/R'の両方を得ることができる。
以上のように、本実施の形態によれば、聴感上、重要度が相対的に高い低帯域部分に対して高い量子化精度の符号化方法を用い、重要度が相対的に低い高帯域部分に対してICPを用いた効率の高い符号化方法を用いることにより、符号化・復号の高効率化と復号音声の高品質化の両方を実現することができる。
また、本実施の形態によれば、MDCT変換符号化器によってMDCT領域で復号されたモノラル信号をICPプロセスに使用することにより、ICPがMDCT領域において直接実行されるため、アルゴリズムに起因する追加の遅延が発生しない。
(その他の実施の形態)
本発明は、実施の形態1において、ピッチ分析およびピッチフィルタリングに関連する
図1のブロック105、106、107、108、図4のブロック404、405、415、416を省いても、依然として使用することができる。
また、実施の形態1において、スペクトル分割部115、116で使用される適応的な周波数分割器を、分割周波数が固定のものに変更することができる。この場合、分割周波数を、例えば1kHz等、任意に設定する。
また、実施の形態1において、ICP次数割り当て部114における適応的なICP次数の計算、ICPパラメータ量子化部118におけるICPパラメータの適応的なビット割り当てを、それぞれ、固定のICP次数、固定のビット割り当てに変更することができる。
また、実施の形態1において、モノラル符号器がMDCT変換符号化などの変換符号化である場合、MDCT領域における復号モノラル信号(または復号モノラル残差信号)を、符号器側においてはモノラル符号器から、復号器側においてはモノラル復号器から、直接得ることができる。すなわち、実施の形態1において、符号器側では、図1のブロック107、108、110、112を省略し、MDCT変換部112からの出力であるモノラル残差信号の周波数係数m(f)の代わりに、モノラル符号化部104から復号モノラル残差信号の周波数係数を直接得るようにすることができる。また、復号器側では、図4のブロック404、405、406、407を省略し、MDCT変換部407からの出力であるモノラル残差信号の周波数係数m'(f)の代わりに、モノラル復号部402から復号モノラル残差信号の周波数係数を直接得るようにすることができる。
また、上述したように、本発明は、PCM形式の音声信号に適用することができる。そして、本発明は、LPフィルタリングおよびピッチフィルタリングを省いても、依然として使用することができる。この場合、窓掛けされたモノラルおよび左/右チャネルの音声信号をMDCT領域に変換する。MDCT係数の高帯域部分をICPによって符号化する。低帯域部分は、高精度の符号器によって符号化する。復号器側において、伝送された低帯域部分と、ICP合成により再生成された高帯域部分とを結合して、左/右のチャネルの音声信号のMDCT係数を再生成する。その後、IMDCT、窓掛け、重ね合わせ加算することにより、合成された音声信号を得ることができる。
また、上記実施の形態1において説明した符号化方式は、モノラル残差信号を使用して左/右のチャネルの残差信号を再生成する方式であり、この方式をM−LR符号化方式と呼ぶことができる。本発明は、これとは別のM−S符号化方式と呼ばれる符号化方式を採用することができる。この代替方式においては、モノラル残差信号を使用してサイド残差信号を再生成することができる。この場合の符号器側の構成は、実施の形態1におけるM−LR符号化方式の符号器側ブロック図1とほぼ同じであるが、左右のチャンネル信号に対する処理ブロックである102、103、105、106、109、111、115、119を、サイドチャンネル信号用の処理に置き換えたものになる。また、サイド音声信号S(n)は、モノラル信号合成部101において、以下の式(8)によって計算することによって算出する。なお、式(8)において、nは長さNのフレームにおける時間インデックスである。また、復号器側の構成は、実施の形態1における図4とほぼ同じであるが、左右のチャンネル信号に対する処理ブロックである409、410、411、412、413、415、416、417、418を、サイドチャンネル信号用の処理に置き換えたものになる。
Figure 0005355387
さらに、復号器において、左右のチャネルの合成された音声信号(L’およびR’)は、再生成されたサイド信号S’と、再生成されたモノラル信号M’とを使用することによって、以下の式(9)によって算出される。
Figure 0005355387
また、本発明は、MDCT計算によって得られた全帯域の周波数係数すべてに対して、共通な1つのICPプロセスを適用することができる。この場合、ICP予測誤差信号(特に低帯域部分における予測誤差信号)を符号化して送信することが望ましい。
また、本発明は、MDCT計算の後、周波数係数をk(>2)個のサブ帯域に分割し、サブ帯域それぞれに対してICP分析を個々に行うことができる。各サブ帯域に対するICPパラメータ数(ICP次数)は異なっていてよい。この数は、相関値やサブ帯域の位置に依存する。一般的には、高い周波数サブ帯域ほど、ICPパラメータ数を少なくする。あるいは、本発明は、各サブ帯域のビット割り当てを適応的に制御するようにしてもよい。
また、上記実施の形態1では、ICPの計算を上記式(5)によって行い、フィルタの構造として図3に示したものを使用している。本発明は、これに代えて、この片側ICPを両側ICPに変更し、式(5)における予測信号y’(n)の計算を、以下の式(10)に置き換えることができる。この場合、ICP次数はN+Nとなる(N1、N2はいずれも正の定数)。
Figure 0005355387
また、上記本実施の形態では、MDCT変換を用いて周波数領域への変換を行う場合について説明したが、本発明はこれに限られず、MDCT変換の代わりに、高速フーリエ変換(FFT)等の他の周波数変換方式を用いて周波数領域への変換を行っても良い。
また、本発明では、ICP分析部117において使用するICP計算において誤差重み付けを適用して、心理音響(Psychoacoustic)を考慮することができる。これは、上記式(5)においてE[e(f)]の代わりにE[e(f)×w(f)]を最小化することで実現することができる。ここで、w(f)は心理音響モデルから導かれる重み付け係数である。この重み付け係数は、エネルギの高い周波数(または帯域)に対しては小さい重み、エネルギの低い周波数(または帯域)に対しては大きい重みを乗ずることによって、予測誤差を調整するように使用する。例えば、w(f)は、m(f)のエネルギに反比例する重み付け係数とすることができる。従って、w(f)の1つの可能な形式は、以下の式(11)である(α,βは調整パラメータ)。
Figure 0005355387
なお、上記各実施の形態に係る復号装置は、上記各実施の形態に係る符号化装置が送信したビットストリームを受信して処理を行う場合を例にとって説明したが、本発明はこれに限定されず、上記各実施の形態に係る復号装置が受信して処理するビットストリームは
、この復号装置で処理可能なビットストリームを生成可能な符号化装置が送信したものであれば良い。
なお、以上の説明は本発明の好適な実施の形態の例証であり、本発明の範囲はこれに限定されることはない。本発明は、符号化装置、復号装置を有するシステムであればどのような場合にも適用することができる。
また、本発明に係る符号化装置および復号装置は、移動体通信システムにおける通信端末装置および基地局装置に搭載することが可能であり、これにより上記と同様の作用効果を有する通信端末装置、基地局装置、および移動体通信システムを提供することができる。
また、ここでは、本発明をハードウェアで構成する場合を例にとって説明したが、本発明をソフトウェアで実現することも可能である。例えば、本発明に係るアルゴリズムをプログラミング言語によって記述し、このプログラムをメモリに記憶しておいて情報処理手段によって実行させることにより、本発明に係る符号化装置と同様の機能を実現することができる。
また、上記実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されても良いし、一部または全てを含むように1チップ化されても良い。
また、ここではLSIとしたが、集積度の違いによって、IC、システムLSI、スーパーLSI、ウルトラLSI等と呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現しても良い。LSI製造後に、プログラム化することが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続もしくは設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
さらに、半導体技術の進歩または派生する別技術により、LSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行っても良い。バイオ技術の適用等が可能性としてあり得る。
2007年3月30日出願の特願2007−092751の日本出願に含まれる明細書、図面および要約書の開示内容は、すべて本願に援用される。
本発明に係る符号化装置および符号化方法は、携帯電話、IP電話、テレビ会議等に用いるに好適である。
本発明の実施の形態1に係る符号化装置の構成を示すブロック図 本発明の実施の形態1に係るICP符号化部の内部の主要な構成を示すブロック図 ICP分析およびICP合成において使用する適応FIRフィルタの構造の一例を示す図 本発明の実施の形態1に係る復号装置の構成を示すブロック図

Claims (5)

  1. ステレオ信号の第1チャネル信号および第2チャネル信号に対する線形予測残差信号である第1チャネル残差信号および第2チャネル残差信号を取得する残差信号取得手段と、
    前記第1チャネル残差信号および前記第2チャネル残差信号をそれぞれ周波数領域に変換し、第1チャネル周波数係数および第2チャネル周波数係数を得る周波数領域変換手段と、
    第1の符号化方法を用いて、前記第1チャネル周波数係数および第2チャネル周波数係数の閾値周波数未満の帯域部分に対して符号化を行う第1符号化手段と、
    チャネル間予測分析および前記第1の符号化方法より効率の高い第2の符号化方法を用いて、前記第1チャネル周波数係数および第2チャネル周波数係数の前記閾値周波数以上の帯域部分に対して符号化を行う第2符号化手段と、
    を具備する符号化装置。
  2. 前記ステレオ信号から生成されるモノラル信号に対する線形予測残差信号を周波数領域に変換し、モノラル周波数係数を得る第2周波数領域変換手段を更に具備し、
    前記第2符号化手段は、前記第1チャネル周波数係数と前記モノラル周波数係数との相関関係および前記第2チャネル周波数係数と前記モノラル周波数係数との相関関係に基づいて前記チャネル間予測分析を行い、前記チャネル間予測分析によって得られた前記第1チャネルおよび前記第2チャネルの予測パラメータを量子化する、
    請求項1記載の符号化装置。
  3. 前記第2符号化手段は、前記第1チャネル周波数係数と前記モノラル周波数係数との第1相関値および前記第2チャネル周波数係数と前記モノラル周波数係数との第2相関値に基づいて前記閾値周波数を設定する閾値周波数設定手段を具備する、
    請求項2記載の符号化装置。
  4. 前記第1チャネル周波数係数と前記モノラル周波数係数との第1相関値および前記第2チャネル周波数係数と前記モノラル周波数係数との第2相関値に基づいて前記第1チャネルおよび前記第2チャネルの予測符号化パラメータの次数を割り当てる次数割り当て手段を更に具備する、
    請求項2記載の符号化装置。
  5. ステレオ信号の第1チャネル信号および第2チャネル信号に対する線形予測残差信号である第1チャネル残差信号および第2チャネル残差信号を取得する残差信号取得ステップと、
    前記第1チャネル残差信号および前記第2チャネル残差信号をそれぞれ周波数領域に変換し、第1チャネル周波数係数および第2チャネル周波数係数を得る周波数領域変換ステップと、
    第1の符号化方法を用いて、前記第1チャネル周波数係数および第2チャネル周波数係数の閾値周波数未満の帯域部分に対して符号化を行う第1符号化ステップと、
    チャネル間予測分析および前記第1の符号化方法より効率の高い第2の符号化方法を用いて、前記第1チャネル周波数係数および第2チャネル周波数係数の前記閾値周波数以上の帯域部分に対して符号化を行う第2符号化ステップと、
    を有する符号化方法。
JP2009508902A 2007-03-30 2008-03-28 符号化装置および符号化方法 Expired - Fee Related JP5355387B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009508902A JP5355387B2 (ja) 2007-03-30 2008-03-28 符号化装置および符号化方法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2007092751 2007-03-30
JP2007092751 2007-03-30
JP2009508902A JP5355387B2 (ja) 2007-03-30 2008-03-28 符号化装置および符号化方法
PCT/JP2008/000808 WO2008126382A1 (ja) 2007-03-30 2008-03-28 符号化装置および符号化方法

Publications (2)

Publication Number Publication Date
JPWO2008126382A1 JPWO2008126382A1 (ja) 2010-07-22
JP5355387B2 true JP5355387B2 (ja) 2013-11-27

Family

ID=39863542

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009508902A Expired - Fee Related JP5355387B2 (ja) 2007-03-30 2008-03-28 符号化装置および符号化方法

Country Status (6)

Country Link
US (1) US8983830B2 (ja)
EP (1) EP2133872B1 (ja)
JP (1) JP5355387B2 (ja)
AT (1) ATE547786T1 (ja)
BR (1) BRPI0809940A2 (ja)
WO (1) WO2008126382A1 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5355387B2 (ja) * 2007-03-30 2013-11-27 パナソニック株式会社 符号化装置および符号化方法
US8473288B2 (en) * 2008-06-19 2013-06-25 Panasonic Corporation Quantizer, encoder, and the methods thereof
WO2010134332A1 (ja) * 2009-05-20 2010-11-25 パナソニック株式会社 符号化装置、復号装置、およびこれらの方法
EP2609592B1 (en) * 2010-08-24 2014-11-05 Dolby International AB Concealment of intermittent mono reception of fm stereo radio receivers
CN102208188B (zh) 2011-07-13 2013-04-17 华为技术有限公司 音频信号编解码方法和设备
CN102522092B (zh) * 2011-12-16 2013-06-19 大连理工大学 一种基于g.711.1的语音带宽扩展的装置和方法
WO2013183928A1 (ko) * 2012-06-04 2013-12-12 삼성전자 주식회사 오디오 부호화방법 및 장치, 오디오 복호화방법 및 장치, 및 이를 채용하는 멀티미디어 기기
US10217468B2 (en) * 2017-01-19 2019-02-26 Qualcomm Incorporated Coding of multiple audio signals
EP3610481B1 (en) * 2017-04-10 2022-03-16 Nokia Technologies Oy Audio coding
US10431231B2 (en) * 2017-06-29 2019-10-01 Qualcomm Incorporated High-band residual prediction with time-domain inter-channel bandwidth extension
CN115346540B (zh) * 2022-08-18 2025-02-14 北京百瑞互联技术股份有限公司 一种联合立体声音频编解码方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0787033A (ja) * 1993-09-17 1995-03-31 Sharp Corp ステレオ音声信号符号化装置
JPH0865169A (ja) * 1994-06-13 1996-03-08 Sony Corp 符号化方法及び装置、復号化装置、並びに記録媒体

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3276651D1 (en) * 1982-11-26 1987-07-30 Ibm Speech signal coding method and apparatus
US5172415A (en) * 1990-06-08 1992-12-15 Fosgate James W Surround processor
DE4320990B4 (de) 1993-06-05 2004-04-29 Robert Bosch Gmbh Verfahren zur Redundanzreduktion
EP0688113A2 (en) 1994-06-13 1995-12-20 Sony Corporation Method and apparatus for encoding and decoding digital audio signals and apparatus for recording digital audio
AU5663296A (en) * 1995-04-10 1996-10-30 Corporate Computer Systems, Inc. System for compression and decompression of audio signals fo r digital transmission
US5774837A (en) * 1995-09-13 1998-06-30 Voxware, Inc. Speech coding system and method using voicing probability determination
US5812971A (en) 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
DE19730130C2 (de) * 1997-07-14 2002-02-28 Fraunhofer Ges Forschung Verfahren zum Codieren eines Audiosignals
KR100361883B1 (ko) * 1997-10-03 2003-01-24 마츠시타 덴끼 산교 가부시키가이샤 오디오신호압축방법,오디오신호압축장치,음성신호압축방법,음성신호압축장치,음성인식방법및음성인식장치
GB9811019D0 (en) * 1998-05-21 1998-07-22 Univ Surrey Speech coders
SE519552C2 (sv) 1998-09-30 2003-03-11 Ericsson Telefon Ab L M Flerkanalig signalkodning och -avkodning
FR2791167B1 (fr) * 1999-03-17 2003-01-10 Matra Nortel Communications Procedes de codage, de decodage et de transcodage audio
US6446037B1 (en) * 1999-08-09 2002-09-03 Dolby Laboratories Licensing Corporation Scalable coding method for high quality audio
JP2002052798A (ja) 2000-08-08 2002-02-19 Riso Kagaku Corp 孔版印刷装置
US6937978B2 (en) * 2001-10-30 2005-08-30 Chungwa Telecom Co., Ltd. Suppression system of background noise of speech signals and the method thereof
EP1500085B1 (en) * 2002-04-10 2013-02-20 Koninklijke Philips Electronics N.V. Coding of stereo signals
US7191136B2 (en) * 2002-10-01 2007-03-13 Ibiquity Digital Corporation Efficient coding of high frequency signal information in a signal using a linear/non-linear prediction model based on a low pass baseband
US7809579B2 (en) * 2003-12-19 2010-10-05 Telefonaktiebolaget Lm Ericsson (Publ) Fidelity-optimized variable frame length encoding
US20050159942A1 (en) * 2004-01-15 2005-07-21 Manoj Singhal Classification of speech and music using linear predictive coding coefficients
DE102004009954B4 (de) * 2004-03-01 2005-12-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Multikanalsignals
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
SE0402651D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods for interpolation and parameter signalling
BRPI0607303A2 (pt) 2005-01-26 2009-08-25 Matsushita Electric Industrial Co Ltd dispositivo de codificação de voz e método de codificar voz
WO2006091139A1 (en) 2005-02-23 2006-08-31 Telefonaktiebolaget Lm Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding
CN101147191B (zh) 2005-03-25 2011-07-13 松下电器产业株式会社 语音编码装置和语音编码方法
EP1876586B1 (en) 2005-04-28 2010-01-06 Panasonic Corporation Audio encoding device and audio encoding method
CN101167124B (zh) 2005-04-28 2011-09-21 松下电器产业株式会社 语音编码装置和语音编码方法
US20070055510A1 (en) * 2005-07-19 2007-03-08 Johannes Hilpert Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
CA2620627C (en) * 2005-08-30 2011-03-15 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US7523602B2 (en) 2005-09-27 2009-04-28 United Technologies Corporation Turbine exhaust catalyst
WO2007052612A1 (ja) * 2005-10-31 2007-05-10 Matsushita Electric Industrial Co., Ltd. ステレオ符号化装置およびステレオ信号予測方法
KR100902899B1 (ko) * 2006-02-07 2009-06-15 엘지전자 주식회사 부호화/복호화 장치 및 방법
JP5173795B2 (ja) 2006-03-17 2013-04-03 パナソニック株式会社 スケーラブル符号化装置およびスケーラブル符号化方法
JP5355387B2 (ja) * 2007-03-30 2013-11-27 パナソニック株式会社 符号化装置および符号化方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0787033A (ja) * 1993-09-17 1995-03-31 Sharp Corp ステレオ音声信号符号化装置
JPH0865169A (ja) * 1994-06-13 1996-03-08 Sony Corp 符号化方法及び装置、復号化装置、並びに記録媒体

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG200501445001; 鎌本 優: 'チャネル間相関を用いた多チャネル信号の可逆圧縮符号化' 情報処理学会論文誌 第46巻 第5号 , 2005, 社団法人情報処理学会 *
JPN6013018257; 鎌本 優: 'チャネル間相関を用いた多チャネル信号の可逆圧縮符号化' 情報処理学会論文誌 第46巻 第5号 , 2005, 社団法人情報処理学会 *

Also Published As

Publication number Publication date
EP2133872A4 (en) 2010-12-22
WO2008126382A1 (ja) 2008-10-23
BRPI0809940A2 (pt) 2014-10-07
EP2133872B1 (en) 2012-02-29
US8983830B2 (en) 2015-03-17
ATE547786T1 (de) 2012-03-15
US20100106493A1 (en) 2010-04-29
JPWO2008126382A1 (ja) 2010-07-22
EP2133872A1 (en) 2009-12-16

Similar Documents

Publication Publication Date Title
JP5355387B2 (ja) 符号化装置および符号化方法
JP5413839B2 (ja) 符号化装置および復号装置
JP6691093B2 (ja) オーディオエンコーダ、符号化方法およびコンピュータプログラム
JP5171256B2 (ja) ステレオ符号化装置、ステレオ復号装置、及びステレオ符号化方法
CN105702258B (zh) 用于对音频信号进行编码和解码的方法及设备
JP6170520B2 (ja) オーディオ及び/またはスピーチ信号符号化及び/または復号化方法及び装置
CN101432802B (zh) 使用有损编码的数据流和无损扩展数据流对源信号进行无损编码的方法以及设备
JP5117407B2 (ja) オーディオ符号化/復号化で知覚的に重み付けするための装置
CN100481734C (zh) 用于从音频数据码流中解码重建多声道音频信号的解码器
JP5404412B2 (ja) 符号化装置、復号装置およびこれらの方法
CN105957532A (zh) 对音频/语音信号进行编码和解码的方法和设备
JP2010500631A (ja) サイド情報なしの時間的ノイズエンベロープの自由な整形
US20100121632A1 (en) Stereo audio encoding device, stereo audio decoding device, and their method
WO2006041055A1 (ja) スケーラブル符号化装置、スケーラブル復号装置及びスケーラブル符号化方法
JPWO2008132826A1 (ja) ステレオ音声符号化装置およびステレオ音声符号化方法
Herre et al. Perceptual audio coding of speech signals

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130423

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130620

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130806

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130827

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees