JP6148810B2 - 第1の符号化アルゴリズム及び第2の符号化アルゴリズムのうちの1つを選択するための装置及び方法 - Google Patents
第1の符号化アルゴリズム及び第2の符号化アルゴリズムのうちの1つを選択するための装置及び方法 Download PDFInfo
- Publication number
- JP6148810B2 JP6148810B2 JP2015554187A JP2015554187A JP6148810B2 JP 6148810 B2 JP6148810 B2 JP 6148810B2 JP 2015554187 A JP2015554187 A JP 2015554187A JP 2015554187 A JP2015554187 A JP 2015554187A JP 6148810 B2 JP6148810 B2 JP 6148810B2
- Authority
- JP
- Japan
- Prior art keywords
- estimated
- speech signal
- encoding
- adaptive codebook
- encoding algorithm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/125—Pitch excitation, e.g. pitch synchronous innovation CELP [PSI-CELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
前記第1の符号化アルゴリズムを用いて前記音声信号の部分を実際に符号化及び復号することなく前記第1の符号化アルゴリズムに関連付けられた前記音声信号の部分についての第1の品質測定値を推定するための第1推定部と、
前記第2の符号化アルゴリズムを用いて前記音声信号の部分を実際に符号化及び復号することなく前記第2の符号化アルゴリズムに関連付けられた前記音声信号の部分についての第2の品質測定値を推定するための第2推定部と、
前記第1の品質測定値及び前記第2の品質測定値の比較に基づいて前記第1の符号化アルゴリズム又は前記第2の符号化アルゴリズムを選択するための制御部と、を備える装置を提供する。
前記第1の符号化アルゴリズムを用いて前記音声信号の部分を実際に符号化及び復号することなく前記第1の符号化アルゴリズムに関連付けられた前記音声信号の部分についての第1の品質測定値を推定するステップと、
前記第2の符号化アルゴリズムを用いて前記音声信号の部分を実際に符号化及び復号することなく前記第2の符号化アルゴリズムに関連付けられた前記音声信号の部分についての第2の品質測定値を推定するステップと、
前記第1の品質測定値及び前記第2の品質測定値の比較に基づいて前記第1の符号化アルゴリズム又は前記第2の符号化アルゴリズムを選択するステップと、を備える方法を提供する。
第1の(TCX)推定部は、音声信号40(入力信号)、重み付きLPC係数42及び重み付き音声信号44を入力として受け取る。
まず、ゲイン推定で用いられる変数を以下のように初期化する。
次に、以下の動作ブロックをNITER回(例えば、ここではNITER=10)だけ実行する。
2.オフセット=オフセット−fac
3.ener=0
4.i(0<=i<L/4)につき以下を行う。
5.ener>目標であれば、オフセット=オフセット+fac
繰り返しの結果がオフセット値である。繰り返しの後、グローバルゲインは、G=10^(オフセット/20)と推定される。
第2の推定部14は、前処理部22で既に計算された、重み付き音声信号44及び1組のピッチラグ48を受け取る。
xw(n−T),n=0,…,N
で近似され、ここでxwは、重み付き音声信号であり、Tは、対応のサブフレームのピッチラグであり、Nは、サブフレーム長である。従って、適応コードブックは、サブフレームをTだけ過去へずらしたものを用いることで近似される。このように、本発明の実施例においては、適応コードブックは極めて単純な態様で近似される。
Claims (23)
- 音声信号(40)の部分を符号化するための第1の特性を有する第1の符号化アルゴリズム及び第2の特性を有する第2の符号化アルゴリズムのうちの1つを選択することによって前記音声信号(40)の部分を符号化したものを得るための装置(10)であって、
前記第1の符号化アルゴリズムを用いて前記音声信号の部分を実際に符号化及び復号することなく、前記音声信号の部分についての第1の品質測定値であって、前記第1の符号化アルゴリズムに関連付けられた第1の品質測定値を推定するための第1推定部(12)と、
前記第2の符号化アルゴリズムを用いて前記音声信号の部分を実際に符号化及び復号することなく、前記音声信号の部分についての第2の品質測定値であって、前記第2の符号化アルゴリズムに関連付けられた第2の品質測定値を推定するための第2推定部(14)と、
前記第1の品質測定値及び前記第2の品質測定値の比較に基づいて前記第1の符号化アルゴリズム又は前記第2の符号化アルゴリズムを選択するための制御部(16)と、を備え、
前記第1の品質測定値及び前記第2の品質測定値は、前記音声信号を重み付けしたものの対応する部分のSNR(信号対ノイズ比)又はセグメントSNRである、装置。 - 請求項1に記載の装置(10)であって、前記第1の符号化アルゴリズムは、変換符号化アルゴリズム、MDCT(修正離散余弦変換)ベースの符号化アルゴリズム又はTCX(変換符号化励振)符号化アルゴリズムであり、前記第2の符号化アルゴリズムは、CELP(コード励振線形予測)符号化アルゴリズム又はACELP(代数符号励振線形予測)符号化アルゴリズムである、装置。
- 請求項1又は請求項2に記載の装置(10)であって、前記第1の推定部(12)は、前記音声信号の部分を量子化した際に前記第1の符号化アルゴリズムにおいて用いられる量子化器が導入するであろう推定量子化器歪みを決定し、前記音声信号を重み付けしたものの部分のエネルギー及び前記推定量子化器歪みに基づいて前記第1の品質測定値を推定するように構成される、装置。
- 請求項3に記載の装置(10)であって、前記第1の推定部(12)は、前記第1の符号化アルゴリズムにおいて用いられる量子化器及びエントロピーコーダで符号化された際に前記音声信号の部分が所与の目標ビットレートをもたらすように前記音声信号の部分についてのグローバルゲインを推定するように構成され、第1の推定部(12)は更に、前記推定グローバルゲインのパワーに基づいて前記推定量子化器歪みを決定するように構成され、前記第1の符号化アルゴリズムにおいて用いられる量子化器は、一様スカラ量子化器であり、前記第1の推定部(12)は、D=G * G/12の式を用いて前記推定量子化器歪みを決定するように構成され、ここで、Dは、推定量子化器歪みであり、Gは、推定グローバルゲインである、装置。
- 請求項3又は請求項4のうちの1つに記載の装置(10)であって、前記第1の品質測定値は、前記重み付き音声信号の部分のセグメントSNRであり、前記第1の推定部(12)は、前記重み付き音声信号の部分における複数のサブ部分の各々に関連付けられた推定SNRを、前記重み付き音声信号における対応のサブ部分のエネルギー及び前記推定量子化器歪みに基づいて算出し、前記重み付き音声信号の部分のサブ部分に関連付けられたSNRの平均値を算出することによって前記セグメントSNRを推定して前記重み付き音声信号の部分についての推定セグメントSNRを得るように構成される、装置。
- 請求項1から請求項5のうちの1つに記載の装置(10)であって、前記第2の推定部(14)は、適応コードブックを用いて前記音声信号の部分を符号化した際に前記第2の符号化アルゴリズムにおいて用いられる前記適応コードブックが導入するであろう推定適応コードブック歪みを決定するように構成され、前記第2の推定部(14)は、前記音声信号を重み付けしたものの部分のエネルギー及び前記推定適応コードブック歪みに基づいて前記第2の品質測定値を推定するように構成され、前記音声信号の部分における複数のサブ部分の各々について、前記第2の推定部(14)は、前記重み付き音声信号のサブ部分を、前処理段階で決定されたピッチラグだけ過去へずらしたものに基づいて前記適応コードブックを近似し、前記重み付き音声信号の部分のサブ部分と近似適応コードブックとの誤差が最小になるように適応コードブックゲインを推定し、前記重み付き音声信号の部分のサブ部分と、前記適応コードブックゲインによってスケーリングされた近似適応コードブックとの誤差のエネルギーに基づいて前記推定適応コードブック歪みを決定するように構成される、装置。
- 請求項6に記載の装置(10)であって、前記第2の推定部(14)は、更に、前記音声信号の部分における各々のサブ部分について決定された推定適応コードブック歪みを、一定の因数だけ減少させるように構成される、装置。
- 請求項6又は請求項7に記載の装置(10)であって、前記第2の品質測定値は、前記重み付き音声信号の部分のセグメントSNRであり、前記第2の推定部(14)は、各々のサブ部分に関連付けられた推定SNRを、前記重み付き音声信号における対応のサブ部分のエネルギー及び前記推定適応コードブック歪みに基づいて算出し、前記サブ部分に関連付けられたSNRの平均値を算出することによって前記セグメントSNRを推定して前記重み付き音声信号の部分についての推定セグメントSNRを得るように構成される、装置。
- 請求項6に記載の装置(10)であって、前記第2の推定部(14)は、前記重み付き音声信号の部分を、前処理段階で決定されたピッチラグだけ過去へずらしたものに基づいて前記適応コードブックを近似し、前記重み付き音声信号の部分と近似適応コードブックとの誤差が最小になるように適応コードブックゲインを推定し、前記重み付き音声信号の部分と、前記適応コードブックゲインによってスケーリングされた近似適応コードブックとの誤差のエネルギーに基づいて前記推定適応コードブック歪みを決定するように構成される、装置。
- 請求項1から請求項9のうちの1つに記載の装置(10)であって、前記制御部(16)は、前記推定品質測定値同士を比較する際にヒステリシスを利用するように構成される、装置。
- 音声信号の部分を符号化するための装置(20)であって、請求項1から請求項10のうちの1つに記載の装置(10)と、前記第1の符号化アルゴリズムを実行するための第1のエンコーダステージ(26)と、前記第2の符号化アルゴリズムを実行するための第2のエンコーダステージ(28)と、を備え、前記符号化するための装置(20)は、前記制御部(16)による選択に応じて前記第1の符号化アルゴリズム又は前記第2の符号化アルゴリズムを用いて前記音声信号の部分を符号化するように構成される、符号化するための装置。
- 符号化及び復号するためのシステムであって、請求項11に記載の符号化するための装置(20)と、デコーダと、を備え、前記デコーダは、前記音声信号の部分を符号化したものと、アルゴリズムであって、それを用いて前記音声信号の部分を符号化し且つ前記音声信号の部分を符号化したものを復号するために用いられるアルゴリズムの指示とを受け取るように構成される、システム。
- 音声信号の部分を符号化するための第1の特性を有する第1の符号化アルゴリズム及び第2の特性を有する第2の符号化アルゴリズムのうちの1つを選択することによって前記音声信号の部分を符号化したものを得るための方法であって、
前記第1の符号化アルゴリズムを用いて前記音声信号の部分を実際に符号化及び復号することなく、前記音声信号の部分についての第1の品質測定値であって、前記第1の符号化アルゴリズムに関連付けられた第1の品質測定値を推定するステップと、
前記第2の符号化アルゴリズムを用いて前記音声信号の部分を実際に符号化及び復号することなく、前記音声信号の部分についての第2の品質測定値であって、前記第2の符号化アルゴリズムに関連付けられた第2の品質測定値を推定するステップと、
前記第1の品質測定値及び前記第2の品質測定値の比較に基づいて前記第1の符号化アルゴリズム又は前記第2の符号化アルゴリズムを選択するステップと、を備え、
前記第1の品質測定値及び前記第2の品質測定値は、前記音声信号を重み付けしたものの対応する部分のSNR(信号対ノイズ比)又はセグメントSNRである、方法。 - 請求項13に記載の方法であって、前記第1の符号化アルゴリズムは、変換符号化アルゴリズム、MDCT(修正離散余弦変換)ベースの符号化アルゴリズム又はTCX(変換符号化励振)符号化アルゴリズムであり、前記第2の符号化アルゴリズムは、CELP(符号励振線形予測)符号化アルゴリズム又はACELP(代数符号励振線形予測)符号化アルゴリズムである、方法。
- 請求項13又は請求項14のうちの1つに記載の方法であって、前記音声信号の部分を量子化した際に前記第1の符号化アルゴリズムにおいて用いられる量子化器が導入するであろう推定量子化器歪みを決定するステップ(108)と、前記音声信号を重み付けしたものの部分のエネルギー及び前記推定量子化器歪みに基づいて前記品質測定値を推定するステップと、を備える、方法。
- 請求項15に記載の方法であって、前記第1の符号化アルゴリズムにおいて用いられる量子化器及びエントロピーコーダで符号化された際に前記音声信号の部分が所与の目標ビットレートをもたらすように前記音声信号の部分についてのグローバルゲインを推定するステップ(106)と、前記推定グローバルゲインのパワーに基づいて前記推定量子化器歪みを決定するステップ(108)と、を備え、前記量子化器は、一様スカラ量子化器であり、前記推定量子化器歪みは、D=G * G/12の式を用いて決定され、ここで、Dは、推定量子化器歪みであり、Gは、推定グローバルゲインである、方法。
- 請求項15又は請求項16のうちの1つに記載の方法であって、前記第1の品質測定値は、前記重み付き音声信号の部分のLPCフィルタリングしたもののセグメントSNRであり、前記方法は、前記重み付き音声信号の部分における複数のサブ部分の各々に関連付けられた推定SNRを、前記重み付き音声信号における対応のサブ部分のエネルギー及び前記推定量子化器歪みに基づいて算出し、前記重み付き音声信号の部分のサブ部分に関連付けられたSNRの平均値を算出することによって第1のセグメントSNRを推定して前記重み付き音声信号の部分についての推定セグメントSNRを得るステップを備える、方法。
- 請求項13から請求項17のうちの1つに記載の方法であって、適応コードブックを用いて前記音声信号の部分を符号化した際に前記第2の符号化アルゴリズムにおいて用いられる適応コードブックが導入するであろう推定適応コードブック歪みを決定するステップ(116)と、前記音声信号を重み付けしたものの部分のエネルギー及び前記推定適応コードブック歪みに基づいて前記第2の品質測定値を推定するステップと、
前記音声信号の部分における複数のサブ部分の各々について、前記重み付き音声信号のサブ部分を、前処理段階で決定されたピッチラグだけ過去へずらしたものに基づいて前記適応コードブックを近似するステップ(112)と、前記重み付き音声信号の部分のサブ部分と近似適応コードブックとの誤差が最小になるように適応コードブックゲインを推定するステップ(114)と、前記重み付き音声信号の部分のサブ部分と、前記適応コードブックゲインによってスケーリングされた近似適応コードブックとの誤差のエネルギーに基づいて前記推定適応コードブック歪みを決定するステップ(116)と、を備える、方法。 - 請求項18に記載の方法であって、前記音声信号の部分における各々のサブ部分について決定された推定適応コードブック歪みを、一定の因数だけ減少させるステップ(118)を備える、方法。
- 請求項18又は請求項19に記載の方法であって、前記第2の品質測定値は、前記重み付き音声信号の部分のセグメントSNRであり、前記方法は、各々のサブ部分に関連付けられた推定SNRを、前記重み付き音声信号における対応のサブ部分のエネルギー及び前記推定適応コードブック歪みに基づいて推定し、前記サブ部分に関連付けられたSNRの平均値を算出することによって前記セグメントSNRを推定して前記重み付き音声信号の部分についての推定セグメントSNRを得るステップを備える、方法。
- 請求項18に記載の方法であって、前記重み付き音声信号の部分を、前処理段階で決定されたピッチラグだけ過去へずらしたものに基づいて前記適応コードブックを近似するステップと、前記重み付き音声信号の部分と近似適応コードブックとの誤差が最小になるように適応コードブックゲインを推定するステップと、前記重み付き音声信号の部分と、前記適応コードブックゲインによってスケーリングされた近似適応コードブックとの誤差のエネルギーに基づいて前記推定適応コードブック歪みを決定するステップと、を備える、方法。
- 請求項13から請求項21のうちの1つに記載の方法であって、前記推定品質測定値同士を比較する際にヒステリシスを利用するステップを備える、方法。
- コンピュータにおいて実行された際に請求項13から請求項22のうちの1つに記載の方法を実行するためのプログラムコードを有するコンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361758100P | 2013-01-29 | 2013-01-29 | |
US61/758,100 | 2013-01-29 | ||
PCT/EP2014/051557 WO2014118136A1 (en) | 2013-01-29 | 2014-01-28 | Apparatus and method for selecting one of a first audio encoding algorithm and a second audio encoding algorithm |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016505902A JP2016505902A (ja) | 2016-02-25 |
JP6148810B2 true JP6148810B2 (ja) | 2017-06-14 |
Family
ID=50033499
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015554187A Active JP6148810B2 (ja) | 2013-01-29 | 2014-01-28 | 第1の符号化アルゴリズム及び第2の符号化アルゴリズムのうちの1つを選択するための装置及び方法 |
Country Status (18)
Country | Link |
---|---|
US (4) | US20150332698A1 (ja) |
EP (1) | EP2951820B1 (ja) |
JP (1) | JP6148810B2 (ja) |
KR (1) | KR101701081B1 (ja) |
CN (2) | CN105229736B (ja) |
AR (1) | AR094676A1 (ja) |
AU (1) | AU2014211583B2 (ja) |
BR (1) | BR112015018021B1 (ja) |
CA (1) | CA2899013C (ja) |
ES (1) | ES2616434T3 (ja) |
MX (1) | MX347410B (ja) |
MY (1) | MY189267A (ja) |
PL (1) | PL2951820T3 (ja) |
PT (1) | PT2951820T (ja) |
RU (1) | RU2618848C2 (ja) |
SG (1) | SG11201505947XA (ja) |
TW (1) | TWI549120B (ja) |
WO (1) | WO2014118136A1 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2618848C2 (ru) * | 2013-01-29 | 2017-05-12 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство и способ для выбора одного из первого алгоритма кодирования аудио и второго алгоритма кодирования аудио |
EP2830051A3 (en) | 2013-07-22 | 2015-03-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals |
CN107452391B (zh) | 2014-04-29 | 2020-08-25 | 华为技术有限公司 | 音频编码方法及相关装置 |
PL3000110T3 (pl) | 2014-07-28 | 2017-05-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Wybór jednego spośród pierwszego algorytmu kodowania i drugiego algorytmu kodowania z zastosowaniem redukcji harmonicznych |
JP2016218345A (ja) * | 2015-05-25 | 2016-12-22 | ヤマハ株式会社 | 音素材処理装置および音素材処理プログラム |
WO2017050398A1 (en) * | 2015-09-25 | 2017-03-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder, decoder and methods for signal-adaptive switching of the overlap ratio in audio transform coding |
US10225730B2 (en) * | 2016-06-24 | 2019-03-05 | The Nielsen Company (Us), Llc | Methods and apparatus to perform audio sensor selection in an audience measurement device |
CN112105902B (zh) * | 2018-04-11 | 2022-07-22 | 杜比实验室特许公司 | 基于机器学习的用于音频编码和解码的基于感知的损失函数 |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1408146A (zh) | 2000-11-03 | 2003-04-02 | 皇家菲利浦电子有限公司 | 音频信号的参数编码 |
US6934676B2 (en) * | 2001-05-11 | 2005-08-23 | Nokia Mobile Phones Ltd. | Method and system for inter-channel signal redundancy removal in perceptual audio coding |
DE10124420C1 (de) * | 2001-05-18 | 2002-11-28 | Siemens Ag | Verfahren zur Codierung und zur Übertragung von Sprachsignalen |
DE102004007200B3 (de) | 2004-02-13 | 2005-08-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiocodierung |
CA2457988A1 (en) * | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
FI118835B (fi) | 2004-02-23 | 2008-03-31 | Nokia Corp | Koodausmallin valinta |
FI119533B (fi) * | 2004-04-15 | 2008-12-15 | Nokia Corp | Audiosignaalien koodaus |
US7739120B2 (en) | 2004-05-17 | 2010-06-15 | Nokia Corporation | Selection of coding models for encoding an audio signal |
MXPA06012617A (es) | 2004-05-17 | 2006-12-15 | Nokia Corp | Codificacion de audio con diferentes longitudes de cuadro de codificacion. |
JP5154934B2 (ja) * | 2004-09-17 | 2013-02-27 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 知覚的歪みを最小化する結合オーディオ符号化 |
JP2008519308A (ja) * | 2004-11-05 | 2008-06-05 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 信号特性を用いた効率的なオーディオ符号化 |
DE602006002739D1 (de) * | 2006-06-30 | 2008-10-23 | Fraunhofer Ges Forschung | Audiokodierer, Audiodekodierer und Audioprozessor mit einer dynamisch variablen Warp-Charakteristik |
US7873511B2 (en) * | 2006-06-30 | 2011-01-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
US7953595B2 (en) | 2006-10-18 | 2011-05-31 | Polycom, Inc. | Dual-transform coding of audio signals |
JP4984983B2 (ja) * | 2007-03-09 | 2012-07-25 | 富士通株式会社 | 符号化装置および符号化方法 |
US8527265B2 (en) * | 2007-10-22 | 2013-09-03 | Qualcomm Incorporated | Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs |
EP2144230A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
EP2146344B1 (en) | 2008-07-17 | 2016-07-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding/decoding scheme having a switchable bypass |
KR101649376B1 (ko) * | 2008-10-13 | 2016-08-31 | 한국전자통신연구원 | Mdct 기반 음성/오디오 통합 부호화기의 lpc 잔차신호 부호화/복호화 장치 |
BR112012009032B1 (pt) * | 2009-10-20 | 2021-09-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. | Codificador de sinal de áudio, decodificador de sinal de áudio, método para prover uma representação codificada de um conteúdo de áudio, método para prover uma representação decodificada de um conteúdo de áudio para uso em aplicações de baixo retardamento |
US9361892B2 (en) * | 2010-09-10 | 2016-06-07 | Panasonic Intellectual Property Corporation Of America | Encoder apparatus and method that perform preliminary signal selection for transform coding before main signal selection for transform coding |
KR101525185B1 (ko) * | 2011-02-14 | 2015-06-02 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 트랜지언트 검출 및 품질 결과를 사용하여 일부분의 오디오 신호를 코딩하기 위한 장치 및 방법 |
RU2618848C2 (ru) * | 2013-01-29 | 2017-05-12 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство и способ для выбора одного из первого алгоритма кодирования аудио и второго алгоритма кодирования аудио |
PL3000110T3 (pl) * | 2014-07-28 | 2017-05-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Wybór jednego spośród pierwszego algorytmu kodowania i drugiego algorytmu kodowania z zastosowaniem redukcji harmonicznych |
-
2014
- 2014-01-28 RU RU2015136467A patent/RU2618848C2/ru active
- 2014-01-28 AU AU2014211583A patent/AU2014211583B2/en active Active
- 2014-01-28 SG SG11201505947XA patent/SG11201505947XA/en unknown
- 2014-01-28 WO PCT/EP2014/051557 patent/WO2014118136A1/en active Application Filing
- 2014-01-28 BR BR112015018021-3A patent/BR112015018021B1/pt active IP Right Grant
- 2014-01-28 MY MYPI2015001901A patent/MY189267A/en unknown
- 2014-01-28 MX MX2015009745A patent/MX347410B/es active IP Right Grant
- 2014-01-28 PL PL14702505T patent/PL2951820T3/pl unknown
- 2014-01-28 CN CN201480019093.0A patent/CN105229736B/zh active Active
- 2014-01-28 CN CN201910556401.8A patent/CN110517700B/zh active Active
- 2014-01-28 PT PT147025050T patent/PT2951820T/pt unknown
- 2014-01-28 EP EP14702505.0A patent/EP2951820B1/en active Active
- 2014-01-28 JP JP2015554187A patent/JP6148810B2/ja active Active
- 2014-01-28 KR KR1020157020596A patent/KR101701081B1/ko active Active
- 2014-01-28 CA CA2899013A patent/CA2899013C/en active Active
- 2014-01-28 ES ES14702505.0T patent/ES2616434T3/es active Active
- 2014-01-29 AR ARP140100292A patent/AR094676A1/es active IP Right Grant
- 2014-01-29 TW TW103103528A patent/TWI549120B/zh active
-
2015
- 2015-07-29 US US14/812,138 patent/US20150332698A1/en not_active Abandoned
-
2018
- 2018-10-01 US US16/148,993 patent/US10622000B2/en active Active
-
2020
- 2020-03-31 US US16/836,857 patent/US11521631B2/en active Active
-
2022
- 2022-11-23 US US18/058,389 patent/US11908485B2/en active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6148810B2 (ja) | 第1の符号化アルゴリズム及び第2の符号化アルゴリズムのうちの1つを選択するための装置及び方法 | |
US10706865B2 (en) | Apparatus and method for selecting one of a first encoding algorithm and a second encoding algorithm using harmonics reduction | |
CA2910878C (en) | Apparatus and method for selecting one of a first encoding algorithm and a second encoding algorithm using harmonics reduction | |
HK1218461B (en) | Apparatus and method for selecting one of a first audio encoding algorithm and a second audio encoding algorithm | |
HK1222943B (en) | Selection of one of a first encoding algorithm and a second encoding algorithm using harmonics reduction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161128 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161201 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170425 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170520 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6148810 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |