JP5355387B2 - 符号化装置および符号化方法 - Google Patents
符号化装置および符号化方法 Download PDFInfo
- Publication number
- JP5355387B2 JP5355387B2 JP2009508902A JP2009508902A JP5355387B2 JP 5355387 B2 JP5355387 B2 JP 5355387B2 JP 2009508902 A JP2009508902 A JP 2009508902A JP 2009508902 A JP2009508902 A JP 2009508902A JP 5355387 B2 JP5355387 B2 JP 5355387B2
- Authority
- JP
- Japan
- Prior art keywords
- channel
- signal
- frequency coefficient
- encoding
- residual signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Mathematical Physics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Error Detection And Correction (AREA)
Description
MDCT)方式が、高品質のオーディオ符号化における主要な手法となっている(非特許文献3、非特許文献4参照)。
Extended AMR Wideband Speech Codec (AMR-WB+): Transcoding functions, 3GPP TS 26.290. S. Minami and O. Okada, "Stereophonic ADPCM voice coding method," in Proc. ICASSP’90, Apr. 1990. Ye Wang and Miikka Vilermo, "The modified discrete cosine transform: its implications for audio coding and error concealment," in AES 22ndInternational Conference on Virtual, Synthetic and Entertainment, 2002. Sean A. Ramprashad, "The multimode transform predictive coding paradigm," IEEE Tran. Speech and Audio Processing, vol. 11, pp. 117 - 129, Mar. 2003.
されたモノラル信号を使用すべきである。なぜなら、復号器側において、再生成されたステレオ信号はICP合成フィルタによって得られ、このICP合成フィルタは、モノラル復号器によって復号されたモノラル信号を使用するためである。しかしながら、モノラル符号器が、特に広帯域(7kHz以上)オーディオ符号化に幅広く使用されているMDCT変換符号化などの変換符号化タイプの符号器である場合、符号器側において時間領域で復号されたモノラル信号を取得するためには、何らかの追加のアルゴリズム遅延が発生する。
以下、本発明の実施の形態1について、図面を用いて説明する。なお、以下の説明において、左チャネル信号、右チャネル信号、モノラル信号、およびそれらの再生成信号を、それぞれ、L、R、M、L’、R’、M’として表す。また、以下の説明では、各フレームの長さをN、モノラル、左、右の各信号に対するMDCT領域信号(周波数係数と称する)を、それぞれ、m(f)、l(f)、r(f)として表す。なお、信号名と記号との対応関係は、上記記載に限定されるものではない。
)によって計算することができる。
よびモノラル残差信号M'resを得る。モノラル復号部402は、得られたモノラル残差信号M'resをピッチ分析部404およびピッチ逆フィルタ405に出力する。
l'(f)/r'(f)をIMDCT変換部412に出力する。
本発明は、実施の形態1において、ピッチ分析およびピッチフィルタリングに関連する
図1のブロック105、106、107、108、図4のブロック404、405、415、416を省いても、依然として使用することができる。
、この復号装置で処理可能なビットストリームを生成可能な符号化装置が送信したものであれば良い。
Claims (5)
- ステレオ信号の第1チャネル信号および第2チャネル信号に対する線形予測残差信号である第1チャネル残差信号および第2チャネル残差信号を取得する残差信号取得手段と、
前記第1チャネル残差信号および前記第2チャネル残差信号をそれぞれ周波数領域に変換し、第1チャネル周波数係数および第2チャネル周波数係数を得る周波数領域変換手段と、
第1の符号化方法を用いて、前記第1チャネル周波数係数および第2チャネル周波数係数の閾値周波数未満の帯域部分に対して符号化を行う第1符号化手段と、
チャネル間予測分析および前記第1の符号化方法より効率の高い第2の符号化方法を用いて、前記第1チャネル周波数係数および第2チャネル周波数係数の前記閾値周波数以上の帯域部分に対して符号化を行う第2符号化手段と、
を具備する符号化装置。 - 前記ステレオ信号から生成されるモノラル信号に対する線形予測残差信号を周波数領域に変換し、モノラル周波数係数を得る第2周波数領域変換手段を更に具備し、
前記第2符号化手段は、前記第1チャネル周波数係数と前記モノラル周波数係数との相関関係および前記第2チャネル周波数係数と前記モノラル周波数係数との相関関係に基づいて前記チャネル間予測分析を行い、前記チャネル間予測分析によって得られた前記第1チャネルおよび前記第2チャネルの予測パラメータを量子化する、
請求項1記載の符号化装置。 - 前記第2符号化手段は、前記第1チャネル周波数係数と前記モノラル周波数係数との第1相関値および前記第2チャネル周波数係数と前記モノラル周波数係数との第2相関値に基づいて前記閾値周波数を設定する閾値周波数設定手段を具備する、
請求項2記載の符号化装置。 - 前記第1チャネル周波数係数と前記モノラル周波数係数との第1相関値および前記第2チャネル周波数係数と前記モノラル周波数係数との第2相関値に基づいて前記第1チャネルおよび前記第2チャネルの予測符号化パラメータの次数を割り当てる次数割り当て手段を更に具備する、
請求項2記載の符号化装置。 - ステレオ信号の第1チャネル信号および第2チャネル信号に対する線形予測残差信号である第1チャネル残差信号および第2チャネル残差信号を取得する残差信号取得ステップと、
前記第1チャネル残差信号および前記第2チャネル残差信号をそれぞれ周波数領域に変換し、第1チャネル周波数係数および第2チャネル周波数係数を得る周波数領域変換ステップと、
第1の符号化方法を用いて、前記第1チャネル周波数係数および第2チャネル周波数係数の閾値周波数未満の帯域部分に対して符号化を行う第1符号化ステップと、
チャネル間予測分析および前記第1の符号化方法より効率の高い第2の符号化方法を用いて、前記第1チャネル周波数係数および第2チャネル周波数係数の前記閾値周波数以上の帯域部分に対して符号化を行う第2符号化ステップと、
を有する符号化方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2009508902A JP5355387B2 (ja) | 2007-03-30 | 2008-03-28 | 符号化装置および符号化方法 |
Applications Claiming Priority (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2007092751 | 2007-03-30 | ||
| JP2007092751 | 2007-03-30 | ||
| JP2009508902A JP5355387B2 (ja) | 2007-03-30 | 2008-03-28 | 符号化装置および符号化方法 |
| PCT/JP2008/000808 WO2008126382A1 (ja) | 2007-03-30 | 2008-03-28 | 符号化装置および符号化方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPWO2008126382A1 JPWO2008126382A1 (ja) | 2010-07-22 |
| JP5355387B2 true JP5355387B2 (ja) | 2013-11-27 |
Family
ID=39863542
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2009508902A Expired - Fee Related JP5355387B2 (ja) | 2007-03-30 | 2008-03-28 | 符号化装置および符号化方法 |
Country Status (6)
| Country | Link |
|---|---|
| US (1) | US8983830B2 (ja) |
| EP (1) | EP2133872B1 (ja) |
| JP (1) | JP5355387B2 (ja) |
| AT (1) | ATE547786T1 (ja) |
| BR (1) | BRPI0809940A2 (ja) |
| WO (1) | WO2008126382A1 (ja) |
Families Citing this family (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP5355387B2 (ja) * | 2007-03-30 | 2013-11-27 | パナソニック株式会社 | 符号化装置および符号化方法 |
| US8473288B2 (en) * | 2008-06-19 | 2013-06-25 | Panasonic Corporation | Quantizer, encoder, and the methods thereof |
| WO2010134332A1 (ja) * | 2009-05-20 | 2010-11-25 | パナソニック株式会社 | 符号化装置、復号装置、およびこれらの方法 |
| EP2609592B1 (en) * | 2010-08-24 | 2014-11-05 | Dolby International AB | Concealment of intermittent mono reception of fm stereo radio receivers |
| CN102208188B (zh) | 2011-07-13 | 2013-04-17 | 华为技术有限公司 | 音频信号编解码方法和设备 |
| CN102522092B (zh) * | 2011-12-16 | 2013-06-19 | 大连理工大学 | 一种基于g.711.1的语音带宽扩展的装置和方法 |
| WO2013183928A1 (ko) * | 2012-06-04 | 2013-12-12 | 삼성전자 주식회사 | 오디오 부호화방법 및 장치, 오디오 복호화방법 및 장치, 및 이를 채용하는 멀티미디어 기기 |
| US10217468B2 (en) * | 2017-01-19 | 2019-02-26 | Qualcomm Incorporated | Coding of multiple audio signals |
| EP3610481B1 (en) * | 2017-04-10 | 2022-03-16 | Nokia Technologies Oy | Audio coding |
| US10431231B2 (en) * | 2017-06-29 | 2019-10-01 | Qualcomm Incorporated | High-band residual prediction with time-domain inter-channel bandwidth extension |
| CN115346540B (zh) * | 2022-08-18 | 2025-02-14 | 北京百瑞互联技术股份有限公司 | 一种联合立体声音频编解码方法及装置 |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0787033A (ja) * | 1993-09-17 | 1995-03-31 | Sharp Corp | ステレオ音声信号符号化装置 |
| JPH0865169A (ja) * | 1994-06-13 | 1996-03-08 | Sony Corp | 符号化方法及び装置、復号化装置、並びに記録媒体 |
Family Cites Families (35)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE3276651D1 (en) * | 1982-11-26 | 1987-07-30 | Ibm | Speech signal coding method and apparatus |
| US5172415A (en) * | 1990-06-08 | 1992-12-15 | Fosgate James W | Surround processor |
| DE4320990B4 (de) | 1993-06-05 | 2004-04-29 | Robert Bosch Gmbh | Verfahren zur Redundanzreduktion |
| EP0688113A2 (en) | 1994-06-13 | 1995-12-20 | Sony Corporation | Method and apparatus for encoding and decoding digital audio signals and apparatus for recording digital audio |
| AU5663296A (en) * | 1995-04-10 | 1996-10-30 | Corporate Computer Systems, Inc. | System for compression and decompression of audio signals fo r digital transmission |
| US5774837A (en) * | 1995-09-13 | 1998-06-30 | Voxware, Inc. | Speech coding system and method using voicing probability determination |
| US5812971A (en) | 1996-03-22 | 1998-09-22 | Lucent Technologies Inc. | Enhanced joint stereo coding method using temporal envelope shaping |
| SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
| DE19730130C2 (de) * | 1997-07-14 | 2002-02-28 | Fraunhofer Ges Forschung | Verfahren zum Codieren eines Audiosignals |
| KR100361883B1 (ko) * | 1997-10-03 | 2003-01-24 | 마츠시타 덴끼 산교 가부시키가이샤 | 오디오신호압축방법,오디오신호압축장치,음성신호압축방법,음성신호압축장치,음성인식방법및음성인식장치 |
| GB9811019D0 (en) * | 1998-05-21 | 1998-07-22 | Univ Surrey | Speech coders |
| SE519552C2 (sv) | 1998-09-30 | 2003-03-11 | Ericsson Telefon Ab L M | Flerkanalig signalkodning och -avkodning |
| FR2791167B1 (fr) * | 1999-03-17 | 2003-01-10 | Matra Nortel Communications | Procedes de codage, de decodage et de transcodage audio |
| US6446037B1 (en) * | 1999-08-09 | 2002-09-03 | Dolby Laboratories Licensing Corporation | Scalable coding method for high quality audio |
| JP2002052798A (ja) | 2000-08-08 | 2002-02-19 | Riso Kagaku Corp | 孔版印刷装置 |
| US6937978B2 (en) * | 2001-10-30 | 2005-08-30 | Chungwa Telecom Co., Ltd. | Suppression system of background noise of speech signals and the method thereof |
| EP1500085B1 (en) * | 2002-04-10 | 2013-02-20 | Koninklijke Philips Electronics N.V. | Coding of stereo signals |
| US7191136B2 (en) * | 2002-10-01 | 2007-03-13 | Ibiquity Digital Corporation | Efficient coding of high frequency signal information in a signal using a linear/non-linear prediction model based on a low pass baseband |
| US7809579B2 (en) * | 2003-12-19 | 2010-10-05 | Telefonaktiebolaget Lm Ericsson (Publ) | Fidelity-optimized variable frame length encoding |
| US20050159942A1 (en) * | 2004-01-15 | 2005-07-21 | Manoj Singhal | Classification of speech and music using linear predictive coding coefficients |
| DE102004009954B4 (de) * | 2004-03-01 | 2005-12-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Verarbeiten eines Multikanalsignals |
| US8204261B2 (en) * | 2004-10-20 | 2012-06-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Diffuse sound shaping for BCC schemes and the like |
| SE0402651D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Advanced methods for interpolation and parameter signalling |
| BRPI0607303A2 (pt) | 2005-01-26 | 2009-08-25 | Matsushita Electric Industrial Co Ltd | dispositivo de codificação de voz e método de codificar voz |
| WO2006091139A1 (en) | 2005-02-23 | 2006-08-31 | Telefonaktiebolaget Lm Ericsson (Publ) | Adaptive bit allocation for multi-channel audio encoding |
| CN101147191B (zh) | 2005-03-25 | 2011-07-13 | 松下电器产业株式会社 | 语音编码装置和语音编码方法 |
| EP1876586B1 (en) | 2005-04-28 | 2010-01-06 | Panasonic Corporation | Audio encoding device and audio encoding method |
| CN101167124B (zh) | 2005-04-28 | 2011-09-21 | 松下电器产业株式会社 | 语音编码装置和语音编码方法 |
| US20070055510A1 (en) * | 2005-07-19 | 2007-03-08 | Johannes Hilpert | Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding |
| CA2620627C (en) * | 2005-08-30 | 2011-03-15 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
| US7523602B2 (en) | 2005-09-27 | 2009-04-28 | United Technologies Corporation | Turbine exhaust catalyst |
| WO2007052612A1 (ja) * | 2005-10-31 | 2007-05-10 | Matsushita Electric Industrial Co., Ltd. | ステレオ符号化装置およびステレオ信号予測方法 |
| KR100902899B1 (ko) * | 2006-02-07 | 2009-06-15 | 엘지전자 주식회사 | 부호화/복호화 장치 및 방법 |
| JP5173795B2 (ja) | 2006-03-17 | 2013-04-03 | パナソニック株式会社 | スケーラブル符号化装置およびスケーラブル符号化方法 |
| JP5355387B2 (ja) * | 2007-03-30 | 2013-11-27 | パナソニック株式会社 | 符号化装置および符号化方法 |
-
2008
- 2008-03-28 JP JP2009508902A patent/JP5355387B2/ja not_active Expired - Fee Related
- 2008-03-28 EP EP08720675A patent/EP2133872B1/en not_active Not-in-force
- 2008-03-28 AT AT08720675T patent/ATE547786T1/de active
- 2008-03-28 WO PCT/JP2008/000808 patent/WO2008126382A1/ja not_active Ceased
- 2008-03-28 BR BRPI0809940-5A2A patent/BRPI0809940A2/pt not_active Application Discontinuation
- 2008-03-28 US US12/593,033 patent/US8983830B2/en not_active Expired - Fee Related
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0787033A (ja) * | 1993-09-17 | 1995-03-31 | Sharp Corp | ステレオ音声信号符号化装置 |
| JPH0865169A (ja) * | 1994-06-13 | 1996-03-08 | Sony Corp | 符号化方法及び装置、復号化装置、並びに記録媒体 |
Non-Patent Citations (2)
| Title |
|---|
| CSNG200501445001; 鎌本 優: 'チャネル間相関を用いた多チャネル信号の可逆圧縮符号化' 情報処理学会論文誌 第46巻 第5号 , 2005, 社団法人情報処理学会 * |
| JPN6013018257; 鎌本 優: 'チャネル間相関を用いた多チャネル信号の可逆圧縮符号化' 情報処理学会論文誌 第46巻 第5号 , 2005, 社団法人情報処理学会 * |
Also Published As
| Publication number | Publication date |
|---|---|
| EP2133872A4 (en) | 2010-12-22 |
| WO2008126382A1 (ja) | 2008-10-23 |
| BRPI0809940A2 (pt) | 2014-10-07 |
| EP2133872B1 (en) | 2012-02-29 |
| US8983830B2 (en) | 2015-03-17 |
| ATE547786T1 (de) | 2012-03-15 |
| US20100106493A1 (en) | 2010-04-29 |
| JPWO2008126382A1 (ja) | 2010-07-22 |
| EP2133872A1 (en) | 2009-12-16 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5355387B2 (ja) | 符号化装置および符号化方法 | |
| JP5413839B2 (ja) | 符号化装置および復号装置 | |
| JP6691093B2 (ja) | オーディオエンコーダ、符号化方法およびコンピュータプログラム | |
| JP5171256B2 (ja) | ステレオ符号化装置、ステレオ復号装置、及びステレオ符号化方法 | |
| CN105702258B (zh) | 用于对音频信号进行编码和解码的方法及设备 | |
| JP6170520B2 (ja) | オーディオ及び/またはスピーチ信号符号化及び/または復号化方法及び装置 | |
| CN101432802B (zh) | 使用有损编码的数据流和无损扩展数据流对源信号进行无损编码的方法以及设备 | |
| JP5117407B2 (ja) | オーディオ符号化/復号化で知覚的に重み付けするための装置 | |
| CN100481734C (zh) | 用于从音频数据码流中解码重建多声道音频信号的解码器 | |
| JP5404412B2 (ja) | 符号化装置、復号装置およびこれらの方法 | |
| CN105957532A (zh) | 对音频/语音信号进行编码和解码的方法和设备 | |
| JP2010500631A (ja) | サイド情報なしの時間的ノイズエンベロープの自由な整形 | |
| US20100121632A1 (en) | Stereo audio encoding device, stereo audio decoding device, and their method | |
| WO2006041055A1 (ja) | スケーラブル符号化装置、スケーラブル復号装置及びスケーラブル符号化方法 | |
| JPWO2008132826A1 (ja) | ステレオ音声符号化装置およびステレオ音声符号化方法 | |
| Herre et al. | Perceptual audio coding of speech signals |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130423 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130620 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130806 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130827 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| LAPS | Cancellation because of no payment of annual fees |