JP5243661B2 - オーディオ信号符号器、オーディオ信号復号器、オーディオコンテンツの符号化表現を供給するための方法、オーディオコンテンツの復号化表現を供給するための方法、および低遅延アプリケーションにおける使用のためのコンピュータ・プログラム - Google Patents
オーディオ信号符号器、オーディオ信号復号器、オーディオコンテンツの符号化表現を供給するための方法、オーディオコンテンツの復号化表現を供給するための方法、および低遅延アプリケーションにおける使用のためのコンピュータ・プログラム Download PDFInfo
- Publication number
- JP5243661B2 JP5243661B2 JP2012534674A JP2012534674A JP5243661B2 JP 5243661 B2 JP5243661 B2 JP 5243661B2 JP 2012534674 A JP2012534674 A JP 2012534674A JP 2012534674 A JP2012534674 A JP 2012534674A JP 5243661 B2 JP5243661 B2 JP 5243661B2
- Authority
- JP
- Japan
- Prior art keywords
- audio content
- encoded
- mode
- window
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims description 137
- 238000000034 method Methods 0.000 title claims description 56
- 238000004590 computer program Methods 0.000 title claims description 16
- 230000007704 transition Effects 0.000 claims description 198
- 230000003595 spectral effect Effects 0.000 claims description 162
- 239000002131 composite material Substances 0.000 claims description 54
- 230000005284 excitation Effects 0.000 claims description 51
- 238000007493 shaping process Methods 0.000 claims description 33
- 230000002123 temporal effect Effects 0.000 claims description 27
- 230000009466 transformation Effects 0.000 claims description 21
- 230000004044 response Effects 0.000 claims description 13
- 239000000203 mixture Substances 0.000 claims description 12
- 230000007423 decrease Effects 0.000 claims description 6
- 238000001228 spectrum Methods 0.000 claims description 5
- 230000015572 biosynthetic process Effects 0.000 description 58
- 238000003786 synthesis reaction Methods 0.000 description 58
- 238000013139 quantization Methods 0.000 description 26
- 238000012545 processing Methods 0.000 description 25
- 238000010586 diagram Methods 0.000 description 17
- 238000004364 calculation method Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 15
- 238000006243 chemical reaction Methods 0.000 description 12
- 238000001914 filtration Methods 0.000 description 11
- 238000009432 framing Methods 0.000 description 7
- 238000011914 asymmetric synthesis Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 238000012805 post-processing Methods 0.000 description 6
- 230000009467 reduction Effects 0.000 description 6
- 238000005070 sampling Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 230000000903 blocking effect Effects 0.000 description 3
- 230000001934 delay Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000008030 elimination Effects 0.000 description 3
- 238000003379 elimination reaction Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000000873 masking effect Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000013215 result calculation Methods 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 239000000969 carrier Substances 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
以下に、本発明の一実施形態によるオーディオ信号符号器100は、この種のオーディオ信号符号器100のブロック略図を示す図1を参照して説明される。オーディオ信号符号器100は、オーディオコンテンツの入力表現110を受けて、それに基づいて、オーディオコンテンツの符号化表現112を供給するように構成される。オーディオ信号符号器100は、変換領域モードで符号化されるオーディオコンテンツの部分(例えば、フレームまたはサブフレーム)の時間領域表現122を受けて、変換領域モードで符号化されるオーディオコンテンツの部分の時間領域表現122に基づいて、(符号化された形で供給されうる)スペクトル係数のセット124とノイズシェーピング情報126を得るように構成された変換領域パス120を含む。変換パス120は、スペクトル係数がオーディオコンテンツのノイズシェーピングされたバージョンのスペクトルを示すように、スペクトル係数124を供給するように構成される。
1.1.1.図2aに記載の変換領域パス
図2aは、変換領域パス120に代わることができ、周波数領域パスとみなすことができる変換領域パス200のブロック略図を示す。
図2bは、変換領域パス120に代わることができる変換領域パス230のブロック略図を示す。
図2cは、いくつかの実施形態において変換領域パス120に代わることができ、変換符号励振線形予測領域パスとみなされるうる変換領域パス260のブロック略図を示す。
以下に、代数符号励振線形予測領域パス140に関するいくつかの詳細が、説明される。
以下に、エイリアシング除去情報164を供給するために使用されるエイリアシング除去情報供給160に関するいくつかの詳細について説明する。
以下に、オーディオ信号符号器100によって供給された符号化されたオーディオ表現112を受けて、オーディオコンテンツの前記符号化表現を復号するように構成されるオーディオ信号復号器について説明する。図3は、本発明の一実施形態によるこの種のオーディオ信号復号器300のブロック略図を示す。
以下に、変換領域パス320に関する詳細が与えられる。この目的のために、変換パス320の実施態様の例について説明する。
図4aは、本発明によるいくつかの実施形態の変換領域パス320に代わることができ、周波数領域パスとしてみなされうる変換領域パス400のブロック略図に示す。
図4bは、変換領域パスであって、変換領域パス320と代わることができる、変換符号励振線形予測領域パス430のブロック略図を示す。
図4cは、本発明によるいくつかの実施形態の変換領域パス320に代わることができる、変換領域パス460のブロック略図を示す。
以下に、ACELPパス340に関するいくつかの詳細は、説明される。
以下に、エイリアシング除去信号供給器360に関するいくつかの詳細について説明される。エイリアシング除去信号供給器360は、復号化エイリアシング除去情報370aを得るために、エイリアシング除去情報362を受けて、エイリアシング除去情報362の復号化370を実行するように構成される。エイリアシング除去信号供給器360はまた、復号化エイリアシング除去情報370aに基づいて、エイリアシング除去信号364の再構成372を実行するようにも構成される。
以下に、オーディオ信号符号器100およびオーディオ信号復号器300において適用されうる窓掛けおよびエイリアシング除去の構想に関する詳細について、詳しく説明する。
図5は、サイン窓(点線で示される)およびG.718分析窓(実線で示される)の比較を示す。サイン窓およびG.718分析窓の窓値のグラフ表現を示す図5を参照すると、横座標510が、0と400との間にサンプルインデックスを有する時間領域サンプルに関する時間を示し、縦座標512が、例えば、正規化窓値でありうる窓値を示す点に留意する必要がある。
図10は、サイン窓(実線)およびACELP(正方形という特徴がある線)のシーケンスのグラフ表現を示す。図に示すように、第1の変換領域フレーム1012は、サンプル0〜399に及び、第2の変換領域オーディオフレーム1022は、サンプル200〜599に及び、サンプル500と700の間のゼロ以外の値を有する、第1のACELPオーディオフレーム1032は、サンプル400〜799に及び、ンプル700と900間のゼロ以外の値を有する、第2のACELPオーディオフレーム1042は、サンプル600からサンプル999まで及び、第3の変換領域オーディオフレーム1052は、サンプル800からサンプル1199まで及び、第4の変換領域オーディオフレーム1062は、サンプル1000からサンプル1399まで及ぶ。図に示すように、第2の変換領域オーディオフレーム1022および第1のACELPオーディオフレーム1032のゼロ以外の部分の間(サンプル500および600との間)に時間的オーバーラップがある。同様に、第2のACELPオーディオフレーム1042のゼロ以外の部分および第3の変換領域オーディオフレーム1052の間(サンプル800および900との間)にオーバーラップがある。
以下に、変換領域モードで符号化されたオーディオフレームおよびACELPモードで符号化されたオーディオフレーム間の遷移のための第1のオプションは、図11および図12を参照して説明される。
以下に、様々なモードで符号化されたオーディオフレーム間の遷移の修正された窓掛けについて説明する。
両方のオプション(すなわち図11および図12によるオプションと、図13および図14によるオプション)が、低遅延統合音声音響符号化の開発において、現在考えられる。(図11および図12による)第1のオプションは、より良い周波数応答を有する同じ窓が変換符号化の全てのブロックに使用されるという利点がある。しかし、不利な点は、追加データ(例えば前方向エイリアシング除去情報)がFAC部分のために符号化されなければならないということである。
以下に、他のオプションについて述べる。第3のオプションは、ACELPへの変換コーダの遷移にも長方形窓を使用することである。しかし、変換コーダおよびACELP間の決定が、1フレーム前に知られていなければならないので、この第3のオプションによって付加的な遅延が生じる。このように、このオプションは、低遅延統合音声音響符号化には最適でない。にもかかわらず、第3のオプションは、遅延がそれほど関連がないいくつかの実施形態において使用されることができる。
4.1.概要
以下に、低遅延を有する統合音声音響符号化(USAC)のための他の新しい符号化方式について説明する。具体的には、それは、周波数領域符復号化AAC―ELDと時間領域符復号化AMR−WBまたはAMR−WB+との間の切り替えに基づきうる。システム(または、本発明による実施形態)は、オーディオ符復号器およびオーディオ符復号化との間の内容に依存した切り替えの効果を維持し、その一方で、遅延を通信応用のために十分に低く保つ。AAC―ELDにおいて使用された低遅延フィルタバンク(LD―MDCT)は、遷移窓によって利用されて、訂正される。そして、それは、AAC―ELDと比較していかなる付加的な遅延も生じさせずに、時間領域符復号化へ/からクロスフェードを可能にする。
いわゆるUSAC符復号化は、音楽モードおよび音声モードとの間に切り替えを可能にする。音楽モードにおいて、先進的音響符号化(AAC)と同様のMDCTベースのコーデックが利用される。音声モードにおいて、アダプティブ・マルチ・レート・ワイドバンド+(AMR−WB+)と同様の符復号化が利用され、それは、USAC符復号化の「LPD−モード」と呼ばれている。以下で説明するように、2つのモード間で滑らかで効率的な遷移を可能にするためには特別な注意が払われる。
超低遅延AAC(AAC―ELD)いわゆる「超低遅延AAC」(更に短く言えば「AAC―ELD」、または「超低遅延先進的音響符号化」と表される)符復号化は、「LD―MDCT」とも呼ばれている、変形離散コサイン変換(MDCT)の特別な低遅延特色に基づく。LD―MDCTにおいて、MDCTのための2のファクターの代わりに、オーバーラップは、4のファクターまで拡張される。これは、オーバーラップが非対称方法で付け加えられ、それが過去からサンプルを利用するだけであるので、付加的な遅延なしで達成される。一方では、将来に対する先読み(look−ahead)は、分析窓の右側のいくつかのゼロ値によって低減される。分析および合成窓は、図17および図18において示される。図17は、AAC―ELDのLD―MDCTの分析窓のグラフ表現を示し、図18は、AAC―ELDのLD―MDCTの合成窓のグラフ表現を示す。図17において、横座標1710は、オーディオサンプルに関する時間を示し、縦座標1712は、窓値を示す。線1720は、分析窓の窓値を示す。図18において、横座標1810は、オーディオサンプルに関する時間を示し、縦座標1812は、窓値を示し、線1820は、合成窓を示す。
以下に、セクション4.2および4.3において説明された参考例に関する短い議論が提供される。
以下に、AAC―ELDおよび時間領域符復号化との間に効率的なおよび遅延のない切り替えを可能にする本発明の実施形態によるアプローチについて説明する。
以下に、遷移の長さの他の設計について、説明する。
以下に、時間領域信号の別の窓掛け、および別のフレーミングについて説明する。
以下に、時間領域コーデックにTDA信号を進めて、臨界サンプリングを達成する変形例について説明する。
以下に、符号化および復号化の改良のために使用できるいくつかの更なる変形例について説明する。
上記の実施形態に関して、多くの修正が適用されることができる点に留意する必要がある。特に、異なる窓長は、要求事項に依存して選択されうる。また、窓のスケーリングは、修正されうる。当然、窓間のスケーリングは変換領域ブランチにあてはまった、そして、ACELPブランチにおいて適用される窓掛けは変わることができる。また、いくつかの前処理ステップおよび/または後処理ステップは、本発明の一般の構想を修正せずに、上記の処理ブロックの入力で、更に、上記の処理ブロックとの間に、生じさせられうる。当然、他の修正もまた、なされうる。
いくつかの態様が、装置に関連して説明されたが、これらの態様はまた、対応する方法の記載を示すことが明らかである。ここで、ブロックまたはデバイスは、方法ステップまたは方法ステップの機能に対応する。類似して、方法ステップに関連して説明された態様もまた、対応するブロックまたは項目の記載または対応する装置の機能を示す。方法ステップの部分または全ては、(例えば、マイクロプロセッサ、プログラミング可能なコンピュータまたは電子回路のような)ハードウェア装置によって(または使用して)実行されうる。いくつかの実施形態では、最も重要な方法ステップの1つまたはそれ以上は、この種の装置によって実行されうる。
Claims (27)
- オーディオコンテンツの入力表現(110)に基づいて、前記オーディオコンテンツの符号化表現(112)を供給するためのオーディオ信号符号器(100)であって、前記オーディオ信号符号器は、
変換領域モードで符号化される前記オーディオコンテンツの部分の時間領域表現(122)に基づいて、スペクトル係数のセット(124)及びノイズシェーピング情報(126)を得るように構成され、
その結果、前記スペクトル係数(124)が、前記オーディオコンテンツのノイズシェーピングされたバージョン(223a;262a;285a)のスペクトルを示す変換領域パス(120)であって、
前記変換領域パス(120;200;230;260)は、前記オーディオコンテンツの時間領域表現(220a;280a)、またはその前処理されたバージョン(262a)に窓を掛けて、前記オーディオコンテンツの窓を掛けた表現(221a;263a;283a)を得て、前記オーディオコンテンツの前記窓を掛けた時間領域表現からスペクトル係数のセット(222a;264a;284a)を得るために、時間領域−周波数領域変換を適用するように構成された時間領域−周波数領域変換器(130;222;264;284)を含むことを特徴とする前記変換領域パス(120)と、
符号励振線形予測領域モード(CELPモード)で符号化される前記オーディオコンテンツの部分に基づいて、符号励振情報(144)および線形予測領域パラメータ情報(146)を得るように構成された符号励振線形予測領域パス(CELPパス)(140)とを含み、
前記時間領域−周波数領域変換器(130;221,222;263,264;283,284)は、前記オーディオコンテンツの現在の部分(1132;1332)の後に、前記変換領域モードで符号化される前記オーディオコンテンツの次の部分(1142;1342)が続く場合、および、前記オーディオコンテンツの前記現在の部分の後に、前記CELPモードで符号化される前記オーディオコンテンツの次の部分が続く場合の両方の場合に、前記変換領域モードで符号化され、前記変換領域モードで符号化された前記オーディオコンテンツの部分(1122;1322)の後に続く前記オーディオコンテンツの前記現在の部分の窓掛けのための既定の非対称の分析窓(520;1130;1330)を適用するように構成されること、および、
前記オーディオ信号符号器は、前記オーディオコンテンツの前記現在の部分(1132;1332)の後に、前記CELPモードで符号化される前記オーディオコンテンツの次の部分(1142;1342)が続く場合、前記オーディオコンテンツの前記次の部分(1142;1342)の変換領域モード表現によって示されるエイリアシング除去信号成分を示すエイリアシング除去情報(164)を選択的に供給するように構成されることを特徴とするオーディオ信号符号器。 - 前記時間領域−周波数領域変換器(130;222;264;284)は、前記オーディオコンテンツの現在の部分(1132;1332)の後に、前記変換領域モードで符号化される前記オーディオコンテンツの次の部分(1142;1342)が続く場合、および、前記オーディオコンテンツの前記現在の部分の後に、前記CELPモードで符号化される前記オーディオコンテンツの次の部分が続く場合の両方の場合に、前記変換領域モードで符号化され、前記変換領域モードで符号化された前記オーディオコンテンツの前の部分(1122;1322)の後に続く前記オーディオコンテンツの前記現在の部分の窓掛けのための同じ窓(520,1130,1330)を適用するように構成されることを特徴とする請求項1に記載のオーディオ信号符号器(100)。
- 前記既定の非対称の分析窓(520,1130,1330)は、左窓半分と右窓半分を含み、
前記左窓半分は、窓値が単調にゼロから窓中心値まで増加する左側の遷移スロープ(522)と、窓値が前記窓中心値より大きく、前記窓が最大値(524a)を含むオーバーシュート部分(524)とを含み、
前記右窓半分は、窓値が単調に前記窓中心値からゼロまで減少する右側の遷移スロープ(528)と、右側のゼロ部分(530)を含むことを特徴とする請求項1または請求項2に記載のオーディオ信号符号器(100)。 - 前記左窓半分は、ゼロ窓値のわずか1パーセントしか含まず、
前記右側のゼロ部分(530)は、前記右窓半分の窓値の少なくとも20%の範囲を含むことを特徴とする請求項3に記載のオーディオ信号符号器(100)。 - 前記既定の非対称の分析窓(520)の前記右窓半分の窓値は、前記窓中心値より小さく、その結果、オーバーシュート部分が、前記既定の非対称の分析窓の前記右窓半分にないことを特徴とする請求項3または請求項4に記載のオーディオ信号符号器(100)。
- 前記既定の非対称の分析窓(520)のゼロ以外の部分がフレーム長より少なくとも10%短いことを特徴とする請求項1〜請求項5のいずれか一項に記載のオーディオ信号符号器(100)。
- 前記オーディオ信号符号器は、前記変換領域モードで符号化される前記オーディオコンテンツの引き続く部分(1122,1132,1162,1172;1322,1332,1362,1372)が、少なくとも40%の時間的オーバーラップを含むように構成されること、および、
前記オーディオ信号符号器は、前記変換領域モードで符号化される前記オーディオコンテンツの現在の部分(1132;1332)および前記符号励振線形予測領域モードで符号化される前記オーディオコンテンツの次の部分(1142;1342)が、時間的オーバーラップを含むように構成されること、および、
前記オーディオ信号符号器は、前記エイリアシング除去情報が、オーディオ信号復号器(300)において、前記変換領域モードで符号化された前記オーディオコンテンツの部分(1232)から前記CELPモードで符号化された前記オーディオコンテンツの部分(1242)への遷移でのエイリアシングアーチファクトを除去するためのエイリアシング除去信号(364)の供給を可能にするように、選択的に前記エイリアシング除去情報(164)を供給するように構成されることを特徴とする請求項1〜請求項6のいずれか一項に記載のオーディオ信号符号器(100)。 - 前記オーディオ信号符号器は、前記オーディオコンテンツの現在の部分と時間的にオーバーラップする前記オーディオコンテンツの次の部分(1142;1342)の符号化に使用されるモードから独立して、前記オーディオコンテンツの前記現在の部分(1132;1332)の窓掛けのための窓(1130;1330)を選択し、その結果、前記オーディオコンテンツの次の部分が前記CELPモードで符号化される場合であっても、前記オーディオコンテンツの前記現在の部分の前記窓を掛けた表現(221a;263a;283a)が前記オーディオコンテンツの前記次の部分(1142;1342)とオーバーラップするように構成されること、および、
前記オーディオ信号符号器は、前記オーディオコンテンツの前記次の部分(1142;1342)がCELPモードで符号化されることの検出に応答して、前記オーディオコンテンツの前記次の部分(1142;1342)の変換領域モード表現によって示されるエイリアシング除去信号成分を示すエイリアシング除去情報(164)を供給するように構成されることを特徴とする請求項1〜請求項7のいずれか一項に記載のオーディオ信号符号器(100)。 - 前記時間領域−周波数領域変換器(130;221,222;263,264;283,284)は、前記変換領域モードで符号化され、前記CELPモードで符号化された前記オーディオコンテンツの部分(1152)の後に続く前記オーディオコンテンツの現在の部分(1162)の窓掛けのための前記既定の非対称の分析窓(520;1160)を適用し、その結果、前記変換領域モードで符号化される前記オーディオコンテンツの前記現在の部分(1162)の窓を掛けた表現(221a;263a;283a)が、前記CELPモードで符号化された前記オーディオコンテンツの前記前の部分(1152)と時間的にオーバーラップするように、そして、
前記変換領域モードで符号化される前記オーディオコンテンツの部分(1122,1132,1162,1172)が、前記オーディオコンテンツの前の部分が符号化されるモードから独立して、そして、前記オーディオコンテンツの次の部分が符号化されるモードから独立して、同じ既定の非対称の分析窓(520,1120,1130,1160,1170)を使用して、窓を掛けられるように構成されることを特徴とする請求項1〜請求項8のいずれか一項に記載の前記オーディオ信号符号器(100)。 - 前記オーディオ信号符号器は、前記オーディオコンテンツの前記現在の部分(1162)が、前記CELPモードで符号化された前記オーディオコンテンツの前の部分(1152)の後に続く場合、エイリアシング除去情報(164)を選択的に供給するように構成されることを特徴とする請求項9に記載のオーディオ信号符号器(100)。
- 前記時間領域−周波数領域変換器(130;221,222;263,264;283,284)は、前記変換領域モードで符号化され、前記CELPモードで符号化された前記オーディオコンテンツの部分(1352)の後に続く前記オーディオコンテンツの現在の部分(1362)の窓掛けのための、前記既定の非対称の分析窓(520;1320,1330,1370)とは異なる専用の非対称の遷移分析窓(1360)を適用するように構成されることを特徴とする請求項1〜請求項8のいずれか一項に記載のオーディオ信号符号器(100)。
- 前記符号励振線形予測領域パス(CELPパス)(140)は、代数符号励振線形予測領域モード(CELPモード)で符号化される前記オーディオコンテンツの部分に基づいて、代数符号励振情報(144)および線形予測領域パラメータ情報(146)を得るように構成された代数符号励振線形予測領域パスであることを特徴とする請求項1〜請求項11のいずれか一項に記載のオーディオ信号符号器。
- オーディオコンテンツの符号化表現(310)に基づいて、前記オーディオコンテンツの復号化表現(312)を供給するためのオーディオ信号復号器(300)であって、前記オーディオ信号復号器は、
スペクトル係数のセット(322;412,442,472)およびノイズシェーピング情報(324;414;444;474)に基づいて、前記変換領域モードで符号化された前記オーディオコンテンツの部分(1222,1232,1262,1272;1422,1432,1462,1472)の時間領域表現(326;416;446;476)を得るように構成された変換領域パス(320;400;430;460)であって、
前記変換領域パスは、スペクトル係数の前記セットから、または、その前処理されたバージョンから、前記オーディオコンテンツの窓を掛けた時間領域表現(424a;452a;485a)を得るために、周波数領域−時間領域変換(423;451;484)および窓掛け(424;452;485)を適用するように構成された周波数領域−時間領域変換器(330;423,424;451,452;484,485)を含むことを特徴とする前記変換領域パスと、
符号励振情報(342)および線形予測領域パラメータ情報(344)に基づいて、符号励振線形予測領域モード(CELPモード)で符号化された前記オーディオコンテンツの時間領域表現(346)を得るように構成された符号励振線形予測領域パス(340)とを含み、
前記周波数領域−時間領域変換器は、前記オーディオコンテンツの現在の部分(1232;1432)の後に、前記変換領域モードで符号化された前記オーディオコンテンツの次の部分(1242;1442)が続く場合、および、前記オーディオコンテンツの前記現在の部分の後に、前記CELPモードで符号化された前記オーディオコンテンツの次の部分が続く場合の両方の場合に、前記変換領域モードで符号化され、前記変換領域モードで符号化された前記オーディオコンテンツの前の部分(1222;1422)の後に続く前記オーディオコンテンツの前記現在の部分の窓掛けのための既定の非対称の合成窓(620;1230;1430)を適用するように構成されること、および、
前記オーディオ信号復号器(300)は、前記変換領域モードで符号化された前記オーディオコンテンツの前記現在の部分の後に、前記CELPモードで符号化された前記オーディオコンテンツの次の部分が続く場合、前記オーディオコンテンツの符号化表現(310)に含まれ、前記オーディオコンテンツの前記次の部分(1142;1342)の変換領域モード表現によって示されるエイリアシング除去信号成分を示すエイリアシング除去情報(362)に基づいて、エイリアシング除去信号(364)を選択的に供給するように構成されることを特徴とする前記オーディオ信号復号器。 - 前記周波数領域−時間領域変換器(330;423,424;451,452;484,485)は、前記オーディオコンテンツの現在の部分(1242;1442)の後に、前記変換領域モードで符号化された前記オーディオコンテンツの次の部分(1242;1442)が続く場合、および、前記オーディオコンテンツの前記現在の部分の後に、前記CELPモードで符号化された前記オーディオコンテンツの次の部分が続く場合の両方の場合に、前記変換領域モードで符号化され、前記変換領域モードで符号化された前記オーディオコンテンツの前の部分(1222;1422)の後に続く前記オーディオコンテンツの前記現在の部分の窓掛けのための同じ窓(620;1230;1430)を適用するように構成されることを特徴とする請求項13に記載のオーディオ信号復号器(300)。
- 前記既定の非対称の合成窓(620;1230;1430)は、左窓半分および右窓半分を含み、
前記左窓半分は、左側のゼロ部分(622)と、窓値がゼロから窓中心値まで単調に増加する左側の遷移スロープ(624)とを含み、
前記右窓半分は、窓値が前記窓中心値より大きく、前記窓が最大値(628a)を含むオーバーシュート部分(628)と、窓値が前記窓中心値からゼロに単調に減少する右側の遷移スロープ(630)を含むことを特徴とする請求項13または請求項14に記載のオーディオ信号復号器(300)。 - 前記左側のゼロ部分(622)は、前記左窓半分の窓値の少なくとも20%の範囲を含み、
前記右窓半分は、ゼロ窓値のわずか1パーセントしか含まないことを特徴とする請求項15に記載のオーディオ信号復号器(300)。 - 前記既定の非対称の合成窓(620;1220,1230,1260;1420,1430,1470)の前記左窓半分の窓値は、前記既定の非対称の合成窓の前記左窓半分にオーバーシュート部分がないように、前記窓中心値より小さいことを特徴とする請求項15または請求項16に記載のオーディオ信号復号器(300)。
- 前記既定の非対称の合成窓(620;1220,1230,1260;1420,1430,1470)のゼロ以外の部分は、フレーム長より少なくとも10%短いことを特徴とする請求項13〜請求項17のいずれか一項に記載のオーディオ信号復号器。
- 前記オーディオ信号復号器は、前記変換領域モードで符号化された前記オーディオコンテンツの引き続く部分(1222、1232、1262、1272;1422、1432、1462、1472)が、少なくとも40%の時間的オーバーラップを含むように構成されること、および、
前記オーディオ信号復号器は、前記変換領域モードで符号化された前記オーディオコンテンツの現在の部分(1232;1432)および前記符号励振線形予測領域モードで符号化された前記オーディオコンテンツの次の部分(1242;1442)が、時間的オーバーラップを含むように構成されること、および、
前記オーディオ信号復号器は、前記エイリアシング除去情報(362)に基づいて、エイリアシング除去信号(364)を選択的に供給し、その結果、前記エイリアシング除去信号が、前記変換領域モードで符号化された前記オーディオコンテンツの前記現在の部分から、前記CELPモードで符号化された前記オーディオコンテンツの次の部分への遷移でのエイリアシングアーチファクトを減少させるまたは除去するように構成されることを特徴とする請求項13〜請求項18のいずれか一項に記載のオーディオ信号復号器(300)。 - 前記オーディオ信号復号器は、前記オーディオコンテンツの現在の部分(1232;1432)と時間的にオーバーラップする、前記オーディオコンテンツの次の部分(1242;1442)の符号化のために使用されるモードから独立して、前記オーディオコンテンツの前記現在の部分(1232;1432)の窓掛けのための窓(1230;1430)を選択し、その結果、前記オーディオコンテンツの前記次の部分が前記CELPモードで符号化される場合であっても、前記オーディオコンテンツの前記現在の部分の前記窓を掛けた表現(424a;452a;485a)が、前記オーディオコンテンツの前記次の部分と時間的にオーバーラップするように構成されること、および、
前記オーディオ信号復号器(300)は、前記オーディオコンテンツの前記次の部分が前記CELPモードで符号化されることの検出に応答して、前記変換領域モードで符号化された前記オーディオコンテンツの前記現在の部分(1232;1432)から前記CELPモードで符号化された前記オーディオコンテンツの前記次の部分(1242;1442)への遷移でのエイリアシングアーチファクトを減少させるまたは除去するために、エイリアシング除去信号(364)を供給するように構成されることを特徴とする請求項13〜請求項19のいずれか一項に記載のオーディオ信号復号器(300)。 - 前記周波数領域−時間領域変換器(330;423,424;451,452;484,485)は、前記変換領域モードで符号化され、前記CELPモードで符号化された前記オーディオコンテンツの前の部分(1252;1452)の後に続く前記オーディオコンテンツの現在の部分(1262;1462)の窓掛けのための前記既定の非対称の合成窓(620;1230;1430)を適用し、その結果、前記変換領域モードで符号化された前記オーディオコンテンツの部分(1222;1232;1262;1272)が、前記オーディオコンテンツの前の部分が符号化されるモードから独立し、前記オーディオコンテンツの次の部分が符号化されるモードから独立して、同じ既定の非対称の合成窓(620;1220,1230,1260,1270)を使用して窓を掛けられるように、そして、
前記変換領域モードで符号化された前記オーディオコンテンツの前記現在の部分の窓を掛けた時間領域表現(424a;452a;485a)は、前記CELPモードで符号化された前記オーディオコンテンツの前記前の部分(1252;1452)と時間的にオーバーラップするように、構成されることを特徴とする請求項13〜請求項20のいずれか一項に記載のオーディオ信号復号器(300)。 - 前記オーディオ信号復号器は、前記オーディオコンテンツの前記現在の部分(1262)が、前記CELPモードで符号化された前記オーディオコンテンツの前の部分(1252)に続く場合、エイリアシング除去情報(362)に基づいて、エイリアシング除去信号(364)を選択的に供給するように構成されることを特徴とする請求項21に記載のオーディオ信号復号器(300)。
- 前記周波数領域−時間領域変換器(330;423,424;451,452;484,485)は、前記変換領域モードで符号化され、前記CELPモードで符号化された前記オーディオコンテンツの部分(1452)の後に続く前記オーディオコンテンツの現在の部分(1462)の窓掛けのための、前記既定の非対称の合成窓(620;1230;1430)とは異なる専用の非対称の遷移合成窓(1460)を適用するように構成されることを特徴とする請求項13〜請求項20のいずれか一項に記載のオーディオ信号復号器(300)。
- 前記符号励振線形予測領域パス(340)は、代数符号励振情報(342)および線形予測領域パラメータ情報(344)に基づいて、代数符号励振線形予測領域モード(CELPモード)で符号化された前記オーディオコンテンツの時間領域表現(346)を得るように構成された代数符号励振線形予測領域パスであることを特徴とする請求項13〜請求項23のいずれか一項に記載のオーディオ信号復号器。
- オーディオコンテンツの入力表現に基づいて前記オーディオコンテンツの符号化表現を供給するための方法であって、前記方法は、
前記スペクトル係数が、前記オーディオコンテンツの範囲のノイズシェーピングされたバージョンのスペクトルを示すように、前記変換領域モードで符号化される前記オーディオコンテンツの部分の時間領域表現に基づいて、前記スペクトル係数のセットおよびノイズシェーピング情報を得るステップであって、
前記変換領域モードで符号化される前記オーディオコンテンツの時間領域表現、またはその前処理されたバージョンは、窓を掛けられ、時間領域−周波数領域変換は、前記オーディオコンテンツの前記窓を掛けた時間領域表現からスペクトル係数のセットを得るために適用されることを特徴とする前記ステップと、
符号励振線形予測領域モード(CELPモード)で符号化される前記オーディオコンテンツの部分に基づいて、符号励振情報および線形予測領域情報を得るステップとを含み、
既定の非対称の分析窓は、前記オーディオコンテンツの前記現在の部分の後に、前記変換領域モードで符号化される前記オーディオコンテンツの次の部分が続く場合、および、前記オーディオコンテンツの前記現在の部分の後に、前記CELPモードで符号化される前記オーディオコンテンツの次の部分が続く場合の両方の場合に、前記変換領域モードで符号化され、前記変換領域モードで符号化された前記オーディオコンテンツの部分の後に続く前記オーディオコンテンツの現在の部分の前記窓掛けのための適用されること、および、
前記オーディオコンテンツの前記現在の部分の後に、前記CELPモードで符号化される前記オーディオコンテンツの次の部分が続く場合、前記オーディオコンテンツの前記次の部分(1142;1342)の変換領域モード表現によって示されるエイリアシング除去信号成分を示すエイリアシング除去情報は、選択的に供給されることを特徴とする前記方法。 - オーディオコンテンツの符号化表現に基づいて前記オーディオコンテンツの復号化表現を供給するための方法であって、前記方法は、
スペクトル係数のセットおよびノイズシェーピング情報に基づいて、変換領域モードで符号化された前記オーディオコンテンツの部分の時間領域表現を得るステップであって、
周波数領域−時間領域変換および窓掛けが、スペクトル係数の前記セットから、または、その前処理されたバージョンから、前記オーディオコンテンツの窓を掛けた時間領域表現を得るために適用されることを特徴とする前記ステップと、
符号励振情報および線形予測領域パラメータ情報に基づいて、符号励振線形予測領域モードで符号化された前記オーディオコンテンツの時間領域表現を得るステップとを含み、
既定の非対称の合成窓は、前記オーディオコンテンツの現在の部分の後に、前記変換領域モードで符号化された前記オーディオコンテンツの次の部分が続く場合、および、前記オーディオコンテンツの前記現在の部分の後に、前記CELPモードで符号化された前記オーディオコンテンツの次の部分が続く場合の両方の場合に、前記変換領域モードで符号化され、前記変換領域モードで符号化された前記オーディオコンテンツの前の部分の後に続く前記オーディオコンテンツの前記現在の部分の窓掛けのために適用されること、および、
エイリアシング除去信号は、前記オーディオコンテンツの前記現在の部分の後に、前記CELPモードで符号化された前記オーディオコンテンツの次の部分が続く場合、前記オーディオコンテンツの符号化表現(310)に含まれ、前記オーディオコンテンツの前記次の部分(1142;1342)の変換領域モード表現によって示されるエイリアシング除去信号成分を示すエイリアシング除去情報に基づいて、選択的に供給されることを特徴とする前記方法。 - コンピュータ・プログラムがコンピュータ上で動作するときに、請求項25または請求項26に記載の方法を実行するためのコンピュータ・プログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US25345009P | 2009-10-20 | 2009-10-20 | |
US61/253,450 | 2009-10-20 | ||
PCT/EP2010/065753 WO2011048118A1 (en) | 2009-10-20 | 2010-10-19 | Audio signal encoder, audio signal decoder, method for providing an encoded representation of an audio content, method for providing a decoded representation of an audio content and computer program for use in low delay applications |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013508766A JP2013508766A (ja) | 2013-03-07 |
JP5243661B2 true JP5243661B2 (ja) | 2013-07-24 |
Family
ID=43447915
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012534674A Active JP5243661B2 (ja) | 2009-10-20 | 2010-10-19 | オーディオ信号符号器、オーディオ信号復号器、オーディオコンテンツの符号化表現を供給するための方法、オーディオコンテンツの復号化表現を供給するための方法、および低遅延アプリケーションにおける使用のためのコンピュータ・プログラム |
Country Status (17)
Country | Link |
---|---|
US (1) | US8630862B2 (ja) |
EP (1) | EP2473995B9 (ja) |
JP (1) | JP5243661B2 (ja) |
KR (1) | KR101414305B1 (ja) |
CN (1) | CN102859588B (ja) |
AR (1) | AR078702A1 (ja) |
BR (3) | BR112012009032B1 (ja) |
CA (1) | CA2778373C (ja) |
ES (1) | ES2533098T3 (ja) |
HK (1) | HK1172992A1 (ja) |
MX (1) | MX2012004518A (ja) |
MY (1) | MY162251A (ja) |
PL (1) | PL2473995T3 (ja) |
RU (1) | RU2596594C2 (ja) |
TW (1) | TWI435317B (ja) |
WO (1) | WO2011048118A1 (ja) |
ZA (1) | ZA201203611B (ja) |
Families Citing this family (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MX2011000375A (es) * | 2008-07-11 | 2011-05-19 | Fraunhofer Ges Forschung | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada. |
MY181247A (en) * | 2008-07-11 | 2020-12-21 | Frauenhofer Ges Zur Forderung Der Angenwandten Forschung E V | Audio encoder and decoder for encoding and decoding audio samples |
ES2558229T3 (es) * | 2008-07-11 | 2016-02-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador y decodificador de audio para codificar tramas de señales de audio muestreadas |
US20130311174A1 (en) * | 2010-12-20 | 2013-11-21 | Nikon Corporation | Audio control device and imaging device |
ES2534972T3 (es) | 2011-02-14 | 2015-04-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Predicción lineal basada en esquema de codificación utilizando conformación de ruido de dominio espectral |
TWI488176B (zh) | 2011-02-14 | 2015-06-11 | Fraunhofer Ges Forschung | 音訊信號音軌脈衝位置之編碼與解碼技術 |
PL2676267T3 (pl) | 2011-02-14 | 2017-12-29 | Fraunhofergesellschaft Zur Förderung Der Angewandten Forschung E V | Kodowanie i dekodowanie pozycji impulsów ścieżek sygnału audio |
WO2012110448A1 (en) | 2011-02-14 | 2012-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result |
JP5712288B2 (ja) | 2011-02-14 | 2015-05-07 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 重複変換を使用した情報信号表記 |
AU2012217269B2 (en) | 2011-02-14 | 2015-10-22 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for processing a decoded audio signal in a spectral domain |
JP5849106B2 (ja) | 2011-02-14 | 2016-01-27 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 低遅延の統合されたスピーチ及びオーディオ符号化におけるエラー隠しのための装置及び方法 |
TWI480857B (zh) | 2011-02-14 | 2015-04-11 | Fraunhofer Ges Forschung | 在不活動階段期間利用雜訊合成之音訊編解碼器 |
MX2013009306A (es) * | 2011-02-14 | 2013-09-26 | Fraunhofer Ges Forschung | Aparato y metodo para codificar y decodificar una señal de audio utilizando una porcion alineada anticipada. |
TWI591621B (zh) * | 2011-04-21 | 2017-07-11 | 三星電子股份有限公司 | 線性預測編碼係數的量子化方法、聲音編碼方法、線性預測編碼係數的去量子化方法、聲音解碼方法以及記錄媒體 |
CA2833868C (en) * | 2011-04-21 | 2019-08-20 | Samsung Electronics Co., Ltd. | Apparatus for quantizing linear predictive coding coefficients, sound encoding apparatus, apparatus for de-quantizing linear predictive coding coefficients, sound decoding apparatus, and electronic device therefor |
EP2772914A4 (en) * | 2011-10-28 | 2015-07-15 | Panasonic Corp | DECODER FOR HYBRID SOUND SIGNALS, COORDINATORS FOR HYBRID SOUND SIGNALS, DECODING PROCEDURE FOR SOUND SIGNALS AND CODING SIGNALING PROCESSES |
CN103548080B (zh) * | 2012-05-11 | 2017-03-08 | 松下电器产业株式会社 | 声音信号混合编码器、声音信号混合解码器、声音信号编码方法以及声音信号解码方法 |
WO2014001182A1 (en) * | 2012-06-28 | 2014-01-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Linear prediction based audio coding using improved probability distribution estimation |
US9129600B2 (en) * | 2012-09-26 | 2015-09-08 | Google Technology Holdings LLC | Method and apparatus for encoding an audio signal |
CN105229736B (zh) | 2013-01-29 | 2019-07-19 | 弗劳恩霍夫应用研究促进协会 | 用于选择第一编码算法与第二编码算法中的一个的装置及方法 |
MY175355A (en) * | 2013-08-23 | 2020-06-22 | Fraunhofer Ges Forschung | Apparatus and method for processing an audio signal an aliasing erro signal |
CN104681034A (zh) | 2013-11-27 | 2015-06-03 | 杜比实验室特许公司 | 音频信号处理 |
CN105336336B (zh) * | 2014-06-12 | 2016-12-28 | 华为技术有限公司 | 一种音频信号的时域包络处理方法及装置、编码器 |
EP2980797A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition |
EP3067887A1 (en) * | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
EP3107096A1 (en) | 2015-06-16 | 2016-12-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Downscaled decoding |
US10008214B2 (en) * | 2015-09-11 | 2018-06-26 | Electronics And Telecommunications Research Institute | USAC audio signal encoding/decoding apparatus and method for digital radio services |
US10146500B2 (en) * | 2016-08-31 | 2018-12-04 | Dts, Inc. | Transform-based audio codec and method with subband energy smoothing |
EP3382700A1 (en) * | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for post-processing an audio signal using a transient location detection |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
EP3483883A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
WO2019091573A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
EP3719799A1 (en) * | 2019-04-04 | 2020-10-07 | FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. | A multi-channel audio encoder, decoder, methods and computer program for switching between a parametric multi-channel operation and an individual channel operation |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6134518A (en) * | 1997-03-04 | 2000-10-17 | International Business Machines Corporation | Digital audio signal coding using a CELP coder and a transform coder |
RU2256293C2 (ru) * | 1997-06-10 | 2005-07-10 | Коудинг Технолоджиз Аб | Усовершенствование исходного кодирования с использованием дублирования спектральной полосы |
US7315815B1 (en) * | 1999-09-22 | 2008-01-01 | Microsoft Corporation | LPC-harmonic vocoder with superframe structure |
US7020605B2 (en) * | 2000-09-15 | 2006-03-28 | Mindspeed Technologies, Inc. | Speech coding system with time-domain noise attenuation |
CN1157076C (zh) * | 2001-04-19 | 2004-07-07 | 北京邮电大学 | 移动通信系统性能的仿真方法 |
US6658383B2 (en) * | 2001-06-26 | 2003-12-02 | Microsoft Corporation | Method for coding speech and music signals |
US6785645B2 (en) * | 2001-11-29 | 2004-08-31 | Microsoft Corporation | Real-time speech and music classifier |
CN1485849A (zh) * | 2002-09-23 | 2004-03-31 | 上海乐金广电电子有限公司 | 数字音频编码器及解码方法 |
US7876966B2 (en) * | 2003-03-11 | 2011-01-25 | Spyder Navigations L.L.C. | Switching between coding schemes |
CA2457988A1 (en) * | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
FI118835B (fi) * | 2004-02-23 | 2008-03-31 | Nokia Corp | Koodausmallin valinta |
EP1747555B1 (en) * | 2004-05-17 | 2007-08-29 | Nokia Corporation | Audio encoding with different coding models |
US7739120B2 (en) * | 2004-05-17 | 2010-06-15 | Nokia Corporation | Selection of coding models for encoding an audio signal |
US7596486B2 (en) * | 2004-05-19 | 2009-09-29 | Nokia Corporation | Encoding an audio signal using different audio coder modes |
US7386445B2 (en) * | 2005-01-18 | 2008-06-10 | Nokia Corporation | Compensation of transient effects in transform coding |
PL1869671T3 (pl) * | 2005-04-28 | 2009-12-31 | Siemens Ag | Sposób i urządzenie do tłumienia szumów |
US7490036B2 (en) * | 2005-10-20 | 2009-02-10 | Motorola, Inc. | Adaptive equalizer for a coded speech signal |
US7987089B2 (en) * | 2006-07-31 | 2011-07-26 | Qualcomm Incorporated | Systems and methods for modifying a zero pad region of a windowed frame of an audio signal |
ATE547898T1 (de) * | 2006-12-12 | 2012-03-15 | Fraunhofer Ges Forschung | Kodierer, dekodierer und verfahren zur kodierung und dekodierung von datensegmenten zur darstellung eines zeitdomänen-datenstroms |
EP2269188B1 (en) * | 2008-03-14 | 2014-06-11 | Dolby Laboratories Licensing Corporation | Multimode coding of speech-like and non-speech-like signals |
RU2481650C2 (ru) * | 2008-09-17 | 2013-05-10 | Франс Телеком | Ослабление опережающих эхо-сигналов в цифровом звуковом сигнале |
EP2446539B1 (en) * | 2009-06-23 | 2018-04-11 | Voiceage Corporation | Forward time-domain aliasing cancellation with application in weighted or original signal domain |
-
2010
- 2010-10-19 EP EP10768928.3A patent/EP2473995B9/en active Active
- 2010-10-19 CN CN201080047598.XA patent/CN102859588B/zh active Active
- 2010-10-19 ES ES10768928.3T patent/ES2533098T3/es active Active
- 2010-10-19 TW TW099135557A patent/TWI435317B/zh active
- 2010-10-19 BR BR112012009032-1A patent/BR112012009032B1/pt active IP Right Grant
- 2010-10-19 KR KR1020127010336A patent/KR101414305B1/ko active IP Right Grant
- 2010-10-19 PL PL10768928T patent/PL2473995T3/pl unknown
- 2010-10-19 MY MYPI2012001633A patent/MY162251A/en unknown
- 2010-10-19 BR BR122020024236-1A patent/BR122020024236B1/pt active IP Right Grant
- 2010-10-19 CA CA2778373A patent/CA2778373C/en active Active
- 2010-10-19 JP JP2012534674A patent/JP5243661B2/ja active Active
- 2010-10-19 WO PCT/EP2010/065753 patent/WO2011048118A1/en active Application Filing
- 2010-10-19 BR BR122020024243-4A patent/BR122020024243B1/pt active IP Right Grant
- 2010-10-19 RU RU2012118782/08A patent/RU2596594C2/ru not_active Application Discontinuation
- 2010-10-19 MX MX2012004518A patent/MX2012004518A/es active IP Right Grant
- 2010-10-20 AR ARP100103829A patent/AR078702A1/es active IP Right Grant
-
2012
- 2012-04-19 US US13/450,792 patent/US8630862B2/en active Active
- 2012-05-17 ZA ZA2012/03611A patent/ZA201203611B/en unknown
-
2013
- 2013-01-02 HK HK13100001.2A patent/HK1172992A1/xx unknown
Also Published As
Publication number | Publication date |
---|---|
AR078702A1 (es) | 2011-11-30 |
ES2533098T3 (es) | 2015-04-07 |
PL2473995T3 (pl) | 2015-06-30 |
TW201137861A (en) | 2011-11-01 |
ZA201203611B (en) | 2013-02-27 |
RU2012118782A (ru) | 2013-11-10 |
BR112012009032B1 (pt) | 2021-09-21 |
WO2011048118A1 (en) | 2011-04-28 |
BR122020024236B1 (pt) | 2021-09-14 |
JP2013508766A (ja) | 2013-03-07 |
EP2473995B1 (en) | 2014-12-17 |
EP2473995B9 (en) | 2016-12-21 |
US8630862B2 (en) | 2014-01-14 |
EP2473995A1 (en) | 2012-07-11 |
KR20120063527A (ko) | 2012-06-15 |
HK1172992A1 (en) | 2013-05-03 |
CA2778373C (en) | 2015-12-01 |
MX2012004518A (es) | 2012-05-29 |
MY162251A (en) | 2017-05-31 |
CN102859588A (zh) | 2013-01-02 |
CN102859588B (zh) | 2014-09-10 |
RU2596594C2 (ru) | 2016-09-10 |
BR112012009032A2 (pt) | 2020-08-18 |
US20120265541A1 (en) | 2012-10-18 |
BR122020024243B1 (pt) | 2022-02-01 |
KR101414305B1 (ko) | 2014-07-02 |
TWI435317B (zh) | 2014-04-21 |
AU2010309839A1 (en) | 2012-05-17 |
CA2778373A1 (en) | 2011-04-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5243661B2 (ja) | オーディオ信号符号器、オーディオ信号復号器、オーディオコンテンツの符号化表現を供給するための方法、オーディオコンテンツの復号化表現を供給するための方法、および低遅延アプリケーションにおける使用のためのコンピュータ・プログラム | |
JP5555707B2 (ja) | マルチ分解能切替型のオーディオ符号化及び復号化スキーム | |
CA2871372C (en) | Audio encoder and decoder for encoding and decoding audio samples | |
CN102884574B (zh) | 音频信号编码器、音频信号解码器、使用混迭抵消来将音频信号编码或解码的方法 | |
CN103503062B (zh) | 用于使用对齐的前瞻部分将音频信号编码及解码的装置与方法 | |
EP3175453B1 (en) | Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition | |
AU2013200679B2 (en) | Audio encoder and decoder for encoding and decoding audio samples | |
AU2010309839B2 (en) | Audio signal encoder, audio signal decoder, method for providing an encoded representation of an audio content, method for providing a decoded representation of an audio content and computer program for use in low delay applications |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130312 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130404 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160412 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5243661 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |