JP2021099497A - 周波数ドメインプロセッサ、時間ドメインプロセッサ及び連続的な初期化のためのクロスプロセッサを使用するオーディオ符号器及び復号器 - Google Patents
周波数ドメインプロセッサ、時間ドメインプロセッサ及び連続的な初期化のためのクロスプロセッサを使用するオーディオ符号器及び復号器 Download PDFInfo
- Publication number
- JP2021099497A JP2021099497A JP2021019424A JP2021019424A JP2021099497A JP 2021099497 A JP2021099497 A JP 2021099497A JP 2021019424 A JP2021019424 A JP 2021019424A JP 2021019424 A JP2021019424 A JP 2021019424A JP 2021099497 A JP2021099497 A JP 2021099497A
- Authority
- JP
- Japan
- Prior art keywords
- audio signal
- signal portion
- frequency
- spectral
- processor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/083—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
−波形復号化に対する後処理部としてのSBR(非特許文献1〜3)
−MPEG−D USAC コア切換え(非特許文献4)
−MPEG−H 3D IGF(特許文献1)
入力SR=8kHz,ACELP(時間ドメイン) SR=12.8kHz.
入力SR=16kHz,ACELP SR=12.8kHz.
入力SR=16kHz,ACELP SR=16.0kHz
入力SR=32.0kHz,ACELP SR=16.0kHz
入力SR=48kHz,ACELP SR=16kHz
TCX SRは、ACELP SRよりも低い(8kHz対12.8kHz)、又は、TCXとACELPが両方とも16.0kHzで作動し、如何なるギャップ充填も使用されない。
Fs_eff=subbandsamplerate*num_subbands
−備考−
[請求項1]
オーディオ信号を符号化するオーディオ符号器において、
第1オーディオ信号部分を周波数ドメインで符号化する第1符号化プロセッサ(600)であって、前記第1オーディオ信号部分をこの第1オーディオ信号部分の最大周波数までスペクトルラインを有する周波数ドメイン表現へと変換する時間−周波数変換部(602)と、前記周波数ドメイン表現を符号化するスペクトル符号器(606)と、を有する第1符号化プロセッサ(600)と、
第2の異なるオーディオ信号部分を時間ドメインで符号化する第2符号化プロセッサ(610)と、
前記オーディオ信号内で前記第1オーディオ信号部分に時間的に直後に後続する前記第2オーディオ信号部分の符号化のために前記第2符号化処理(610)が初期化されるように、前記第1オーディオ信号部分の符号化済みスペクトル表現から前記第2符号化プロセッサ(610)の初期化データを計算するクロスプロセッサ(700)と、
前記オーディオ信号を分析し、前記オーディオ信号のどの部分が周波数ドメインで符号化される前記第1オーディオ信号部分であるか、及び前記オーディオ信号のどの部分が時間ドメインで符号化される前記第2オーディオ信号部分であるかを決定する、コントローラ(620)と、
前記第1オーディオ信号部分についての第1符号化済み信号部分と前記第2オーディオ信号部分についての第2符号化済み信号部分とを有する、符号化済みオーディオ信号を形成する符号化済み信号形成部(630)と、
を含むオーディオ符号器。
[請求項2]
請求項1に記載のオーディオ符号器において、
入力信号は高帯域と低帯域とを含み、
前記第2符号化プロセッサ(610)は、
前記第2オーディオ信号部分を低サンプリングレートの表現へと変換するサンプリングレート変換部(900)であって、前記低サンプリングレートは前記オーディオ信号のサンプリングレートよりも低く、前記低サンプリングレートの表現は前記入力信号の前記高帯域を含まない、サンプリングレート変換部(900)と、
前記低サンプリングレートの表現を時間ドメイン符号化する時間ドメイン低帯域符号器(910)と、
前記高帯域をパラメトリックに符号化する時間ドメイン帯域幅拡張符号器(920)と、
を含むオーディオ符号器。
[請求項3]
請求項1又は2に記載のオーディオ符号器において、
前記第1オーディオ信号部分及び前記第2オーディオ信号部分を前処理するよう構成された前処理部(1000)を更に含み、
前記前処理部は予測係数を決定する予測分析部(1002)を含み、
前記符号化済み信号形成部(630)は前記予測係数の符号化済みバージョンを前記符号化済みオーディオ信号の中に導入するよう構成されている、オーディオ符号器。
[請求項4]
請求項1乃至3のいずれか一項に記載のオーディオ符号器において、
前処理部(1000)は、前記オーディオ信号を前記第2符号化プロセッサのサンプリングレートへとリサンプリングするリサンプラ(1004)を含み、かつ
予測分析部は、リサンプリングされたオーディオ信号を使用して予測係数を決定するよう構成されており、又は、
前記前処理部(1000)は、前記第1オーディオ信号部分について1つ以上の長期予測パラメータを決定する長期予測分析ステージ(1006)を更に含む、オーディオ符号器。
[請求項5]
請求項1乃至4のいずれか一項に記載のオーディオ符号器において、前記クロスプロセッサ(700)は、
前記第1符号化済み信号部分の復号化済みバージョンを計算する、スペクトル復号器(701)、
初期化のために、前記復号化済みバージョンの遅延済みバージョンを前記第2符号化プロセッサのデエンファシスステージ(617)へと供給する、遅延ステージ(707)、
初期化のために、フィルタ出力を前記第2符号化プロセッサ(610)の符号帳決定部(613)へと供給する、重み付き予測係数分析フィルタリングブロック(708)、
前記復号化済みバージョン又はプリエンファシス(709)済みバージョンをフィルタリングし、初期化のためにフィルタ残差を前記第2符号化プロセッサの適応型符号帳決定部(612)へと供給する、分析フィルタリングステージ(706)、又は
前記復号化済みバージョンをフィルタリングし、初期化のために遅延済み又はプリエンファシス済みバージョンを前記第2符号化プロセッサ(610)の合成フィルタリングステージ(616)へと供給する、プリエンファシスフィルタ(709)、を含む、オーディオ符号器。
[請求項6]
請求項1乃至5のいずれか一項に記載のオーディオ符号器において、
前記第1符号化プロセッサ(600)は、前記第1オーディオ信号部分から導出された予測係数(1002,1010)を使用して前記周波数ドメイン表現のスペクトル値の整形(606a)を実行し、更に、第1スペクトル領域の整形済みスペクトル値の量子化及びエントロピー符号化操作(606b)を実行するよう構成されている、オーディオ符号器。
[請求項7]
請求項1乃至6のいずれか一項に記載のオーディオ符号器において、前記クロスプロセッサ(700)は、
前記第1オーディオ信号部分から導出されたLPC係数(1010)を使用して前記周波数ドメイン表現の量子化済みスペクトル値を整形する、ノイズ整形部(703)と、
前記周波数ドメイン表現のスペクトル的に整形されたスペクトル部分を高スペクトル分解能で復号化して復号化済みスペクトル表現を取得する、スペクトル復号器(704,705)と、
前記スペクトル表現を時間ドメインへと変換して復号化済み第1オーディオ信号部分を取得する周波数−時間変換部(702)であって、前記復号化済み第1オーディオ信号部分に関連するサンプリングレートは前記オーディオ信号のサンプリングレートとは異なり、前記周波数−時間変換部(702)の出力信号に関連するサンプリングレートは前記周波数−時間変換部(602)に入力されたオーディオ信号に関連するサンプリングレートとは異なる、周波数−時間変換部(702)と、
を含む、オーディオ符号器。
[請求項8]
請求項1乃至7のいずれか一項に記載のオーディオ符号器において、
前記第2符号化プロセッサが以下のブロック群の少なくとも1つのブロックを含む、オーディオ符号器:
予測分析フィルタ(611);
適応型符号帳ステージ(612);
革新的符号帳ステージ(614);
革新的符号帳エントリを推定する推定部(613);
ACELP/ゲイン符号化ステージ(615);
予測合成フィルタリングステージ(616);
デエンファシス・ステージ(617);
低音ポストフィルタ分析ステージ(618)。
[請求項9]
請求項1乃至8のいずれか一項に記載のオーディオ符号器において、
前記時間ドメイン符号化プロセッサは、関連する第2サンプリングレートを有し、
前記周波数ドメイン符号化プロセッサは、前記第2サンプリングレートとは異なる関連する第1サンプリングレートを有し、
前記クロスプロセッサは、時間ドメイン信号を前記第2サンプリングレートで生成する周波数−時間変換部(702)を有し、
前記周波数−時間変換部(702)が、
前記第1サンプリングレートと前記第2サンプリングレートとの比に従って、前記周波数−時間変換部に入力されたスペクトルの一部分を選択する選択部(726)と、
前記時間−周波数変換部(602)の変換長とは異なる変換長を有する変換プロセッサ(720)と、
前記時間−周波数変換部(602)により使用された窓とは異なる個数の窓係数を有する窓を使用して窓掛けする合成窓掛け部(712)と、を含む、
オーディオ符号器。
[請求項10]
符号化済みオーディオ信号を復号化するオーディオ復号器において、
第1の符号化済みオーディオ信号部分を周波数ドメインで復号化する第1復号化プロセッサ(1120)であって、復号化済みスペクトル表現を時間ドメインへと変換して復号化済み第1オーディオ信号部分を取得する周波数−時間変換部(1120)を有する、第1復号化プロセッサ(1120)と、
第2の符号化済みオーディオ信号部分を時間ドメインで復号化して復号化済み第2オーディオ信号部分を取得する第2復号化プロセッサ(1140)と、
前記符号化済みオーディオ信号内で前記第1オーディオ信号部分に時間的に後続する前記符号化済み第2オーディオ信号部分の復号化のために前記第2復号化プロセッサ(1140)が初期化されるように、前記第1の符号化済みオーディオ信号部分の前記復号化済みスペクトル表現から前記第2復号化プロセッサ(1140)の初期化データを計算するクロスプロセッサ(1170)と、
前記復号化済み第1スペクトル部分と前記復号化済み第2スペクトル部分とを結合して復号化済みオーディオ信号を取得する結合部(1160)と、
を含み、
前記クロスプロセッサは、
前記第1復号化プロセッサ(1120)の前記周波数−時間変換部(1124)と関連する第2の有効サンプリングレートとは異なる第1の有効サンプリングレートで作動して、時間ドメインで追加的な復号化済み第1信号部分を得る、追加的周波数−時間変換部(1171)であって、前記追加的周波数−時間変換部(1171)により出力される信号が、前記第1復号化プロセッサの前記周波数−時間変換部(1124)の出力と関連する第1サンプリングレートとは異なる第2サンプリングレートを有し、前記追加的周波数−時間変換部(1171)に入力されたスペクトルの一部分を前記第1サンプリングレートと前記第2サンプリングレートとの比に従って選択する選択部(726)を含む、前記追加的周波数−時間変換部(1171)と、
前記第1復号化プロセッサ(1120)の前記時間−周波数変換部(1124)の変換長(710)とは異なる変換長を有する変換プロセッサ(720)と、
前記第1復号化プロセッサ(1120)の前記周波数−時間変換部(1124)により使用された窓とは異なる個数の係数を有する窓を使用する合成窓掛け部(722)と、を更に含む、
オーディオ復号器。
[請求項11]
請求項10に記載のオーディオ復号器において、前記第2復号化プロセッサが、
低帯域時間ドメイン信号を復号化する時間ドメイン低帯域復号器(1200)と、
前記低帯域時間ドメイン信号をリサンプリングするリサンプラ(1210)と、
時間ドメイン出力信号の高帯域を合成する時間ドメイン帯域幅拡張復号器(1220)と、
前記時間ドメイン信号の合成された高帯域とリサンプリングされた低帯域時間ドメイン信号とをミキシングするミキサ(1230)と、
を含む、オーディオ復号器。
[請求項12]
請求項10又は11に記載のオーディオ復号器において、
前記第1復号化プロセッサ(1120)は、前記第1復号化済み第1信号部分をポストフィルタリングする適応型長期予測ポストフィルタ(1420)を含み、前記フィルタ(1420)が前記符号化済みオーディオ信号の中に含まれた1つ以上の長期予測パラメータにより制御される、オーディオ復号器。
[請求項13]
請求項10乃至12のいずれか一項に記載のオーディオ復号器において、
前記クロスプロセッサ(1170)が、
初期化のために、前記追加的な復号化済み第1信号部分を遅延しかつ前記復号化済み第1信号部分の遅延されたバージョンを前記第2復号化プロセッサのデエンファシスステージ(1144)へと供給する、遅延ステージ(1172)、
初期化のために、前記追加的な復号化済み第1信号部分をフィルタリング及び遅延し、かつ遅延ステージ出力を前記第2復号化プロセッサの予測合成フィルタ(1143)へと供給する、プリエンファシスフィルタ(1173)及び遅延ステージ(1175)、
前記追加的な復号化済み第1信号部分又はプリエンファシス(1173)された追加的な復号化済み第1信号部分から、予測残差信号を生成し、かつ予測残差信号を前記第2復号化プロセッサ(1200)の符号帳合成部(1141)へと供給する、予測分析フィルタ(1174)、又は、
初期化のために、前記追加的な復号化済み第1信号部分を前記第2復号化プロセッサのリサンプラ(1210)の分析ステージ(1471)へと供給する、スイッチ(1480)、を含む、
オーディオ復号器。
[請求項14]
請求項10乃至13のいずれか一項に記載のオーディオ復号器において、
前記第2復号化プロセッサ(1200)が以下のブロック群の少なくとも1つのブロックを含む、オーディオ復号器:
ACELPゲイン及び革新的符号帳を復号化するステージ;
適応型符号帳合成ステージ(1141);
ACELP後処理部(1142);
予測合成フィルタ(1143);
デエンファシス・ステージ(1144)。
[請求項15]
オーディオ信号を符号化する方法において、
第1オーディオ信号部分を周波数ドメインで符号化(600)するステップであって、前記第1オーディオ信号部分をこの第1オーディオ信号部分の最大周波数までスペクトルラインを有する周波数ドメイン表現へと変換(602)するサブステップと、前記周波数ドメイン表現を符号化(606)するサブステップとを含む、ステップと、
第2の異なるオーディオ信号部分を時間ドメインで符号化(610)するステップと、
前記オーディオ信号内で前記第1オーディオ信号部分に時間的に直後に後続する前記第2オーディオ信号部分の符号化のために前記第2オーディオ信号部分を符号化するステップが初期化されるように、前記第1オーディオ信号部分の符号化済みスペクトル表現から前記第2の異なるオーディオ信号部分を符号化するステップのための初期化データを計算するステップ(700)と、
前記オーディオ信号を分析(620)し、前記オーディオ信号のどの部分が周波数ドメインで符号化される前記第1オーディオ信号部分であるか、及び前記オーディオ信号のどの部分が時間ドメインで符号化される前記第2オーディオ信号部分であるかを決定するステップと、
前記第1オーディオ信号部分についての第1符号化済み信号部分と前記第2オーディオ信号部分についての第2符号化済み信号部分とを有する、符号化済みオーディオ信号を形成(630)するステップと、
を含む方法。
[請求項16]
符号化済みオーディオ信号を復号化する方法において、
第1の符号化済みオーディオ信号部分を周波数ドメインで第1復号化プロセッサにより復号化(1120)するステップであって、周波数−時間変換部(1124)により復号化済みスペクトル表現を時間ドメインへと変換して復号化済み第1オーディオ信号部分を取得するサブステップを有する、ステップと、
第2の符号化済みオーディオ信号部分を時間ドメインで復号化(1140)して復号化済み第2オーディオ信号部分を取得するステップと、
前記符号化済みオーディオ信号内で前記第1オーディオ信号部分に時間的に後続する前記第2の符号化済みオーディオ信号部分の復号化のために前記第2の符号化済みオーディオ信号部分の復号化ステップが初期化されるように、前記第1の符号化済みオーディオ信号部分の前記復号化済みスペクトル表現から前記第2の符号化済みオーディオ信号部分を復号化(1140)するステップの初期化データを計算(1170)するステップと、
前記復号化済み第1スペクトル部分と前記復号化済み第2スペクトル部分とを結合(1160)して復号化済みオーディオ信号を取得するステップと、
を含み、
前記計算(1170)するステップが、時間ドメインの追加的な復号化済み第1信号部分を得るために、前記第1復号化プロセッサ(1120)の前記周波数−時間変換部(1124)と関連する第2の有効サンプリングレートとは異なる第1の有効サンプリングレートで作動する、追加的周波数−時間変換部(1171)を使用するサブステップであって、前記追加的周波数−時間変換部(1171)により出力される信号が、前記第1復号化プロセッサの前記周波数−時間変換部(1124)の出力と関連する第1サンプリングレートとは異なる第2サンプリングレートを有する、サブステップを含み、
前記追加的周波数−時間変換部(1171)を使用するサブステップが、
前記追加的周波数−時間変換部(1171)に入力されたスペクトルの一部分を、前記第1サンプリングレートと前記第2サンプリングレートとの比に従って選択(726)すること、
前記第1復号化プロセッサ(1120)の前記時間−周波数変換部(1124)の変換長(710)とは異なる変換長を有する変換プロセッサ(720)を使用すること、及び
前記第1復号化プロセッサ(1120)の前記周波数−時間変換部(1124)により使用される窓とは異なる個数の係数を有する窓を用いる合成窓掛け部(722)を使用すること、を含む、
方法。
[請求項17]
コンピュータ又はプロセッサ上で作動するときに、請求項15又は請求項16に記載の方法を実行するコンピュータプログラム。
Claims (18)
- 高帯域と低帯域とを含むオーディオ信号を符号化するオーディオ符号器において、
第1オーディオ信号部分を周波数ドメインで符号化する第1符号化プロセッサ(600)であって、前記第1オーディオ信号部分はそれと関連する第1サンプリングレートを有し、
前記第1オーディオ信号部分をこの第1オーディオ信号部分の最大周波数までスペクトルラインを有する周波数ドメイン表現へと変換する時間−周波数変換部(602)、及び
前記周波数ドメイン表現を符号化して、第1符号化済み信号部分である前記第1オーディオ信号部分の符号化済みスペクトル表現を取得するスペクトル符号器(606)、
を有する第1符号化プロセッサ(600)と、
第2オーディオ信号部分を時間ドメインで符号化して、第2符号化済み信号部分を取得する第2符号化プロセッサ(610)であって、前記第2オーディオ信号部分は前記第1オーディオ信号部分とは異なる、第2符号化プロセッサ(610)と、
前記オーディオ信号内で前記第1オーディオ信号部分に時間的に直後に後続する前記第2オーディオ信号部分の符号化のために前記第2符号化プロセッサ(610)が初期化されるように、前記第1オーディオ信号部分の符号化済みスペクトル表現から前記第2符号化プロセッサ(610)の初期化データを計算するクロスプロセッサ(700)であって、前記第2符号化プロセッサ(610)の初期化データを取得するために、前記周波数ドメイン表現の低帯域部分および低減された変換サイズを選択することを使用して、前記第1サンプリングレートから前記第2サンプリングレートへのダウンサンプリングを追加的に実行する周波数−時間変換を使用するように構成された、前記クロスプロセッサ(700)と、
前記オーディオ信号を分析し、前記オーディオ信号のどの部分が前記第1符号化プロセッサ(600)によって符号化される前記第1オーディオ信号部分であるか、及び前記オーディオ信号のどの部分が前記第2符号化プロセッサ(610)によって符号化される前記第2オーディオ信号部分であるかを決定する、コントローラ(620)と、
前記第1オーディオ信号部分についての第1符号化済み信号部分と前記第2オーディオ信号部分についての第2符号化済み信号部分とを有する、符号化済みオーディオ信号を形成する符号化済み信号形成部(630)と、
を含むオーディオ符号器。 - 請求項1に記載のオーディオ符号器において、
前記スペクトル符号器(606)は、高いスペクトル分解能で符号化されるべき第1スペクトル部分の第1セット、及び低いスペクトル分解能でパラメトリックに符号化されるべき第2スペクトル部分の第2セットを発見するために前記オーディオ信号を分析し、前記第1スペクトル部分の第1セットを前記高いスペクトル分解能で波形保存方式で符号化し、前記第2スペクトル部分の第2セットを前記低いスペクトル分解能でパラメトリックに符号化するよう構成される、
オーディオ符号器。 - 請求項1又は2に記載のオーディオ符号器において、
前記第1オーディオ信号部分及び前記第2オーディオ信号部分を前処理するよう構成された前処理部(1000)を更に含み、
前記前処理部(1000)は予測係数を決定する予測分析部(1002)を含み、
前記符号化済み信号形成部(630)は前記予測係数の符号化済みバージョンを前記符号化済みオーディオ信号の中に導入するよう構成されている、オーディオ符号器。 - 請求項1又は2に記載のオーディオ符号器において、
前記オーディオ信号を前処理する前処理部(1000)をさらに含み、
前記前処理部(1000)は、前記オーディオ信号を前記第2符号化プロセッサ(610)の第2サンプリングレートへとリサンプリングして、リサンプリングされたオーディオ信号を取得するリサンプラ(1004)を含み、
前記前処理部(1000)は、前記リサンプリングされたオーディオ信号を使用して予測係数を決定するよう構成されている予測分析部(1002b)を含むか、又は、
前記前処理部(1000)は、前記第1オーディオ信号部分について1つ以上の長期予測パラメータを決定する長期予測分析ステージ(1006)を含む、オーディオ符号器。 - 請求項1乃至4のいずれか一項に記載のオーディオ符号器において、前記クロスプロセッサ(700)は、
前記第1符号化済み信号部分の復号化済みバージョンを計算する、スペクトル復号器(701)と、
前記第1符号化済み信号部分の復号化済みバージョンを遅延させてその遅延されたバージョンを取得し、初期化のために、前記遅延されたバージョンを前記第2符号化プロセッサ(610)のデエンファシスステージ(617)へと供給する、遅延ステージ(707)、
前記第1符号化済み信号部分の復号化済みバージョンをフィルタリングしてフィルタ出力を取得し、初期化のために、前記フィルタ出力を前記第2符号化プロセッサ(610)の革新的符号帳決定部(613)へと供給する、重み付き予測係数分析フィルタリングブロック(708)、
前記第1符号化済み信号部分の復号化済みバージョン又は前記第1符号化済み信号部分の復号化済みバージョンからプリエンファシスステージ(709)によって導出されたプリエンファシス済みバージョンをフィルタリングしてフィルタ残差信号を取得し、初期化のために前記フィルタ残差信号を前記第2符号化プロセッサ(610)の適応型符号帳決定部(612)へと供給する、分析フィルタリングステージ(706)、又は
前記第1符号化済み信号部分の復号化済みバージョンをフィルタリングしてプリエンファシス済みバージョンを取得し、初期化のために前記プリエンファシス済みバージョン又は遅延されたプリエンファシス済みバージョンを前記第2符号化プロセッサ(610)の合成フィルタリングステージ(616)へと供給する、プリエンファシスフィルタ(709)、を含む、
オーディオ符号器。 - 請求項1乃至5のいずれか一項に記載のオーディオ符号器において、
前記第1符号化プロセッサ(600)は、前記第1オーディオ信号部分から導出された予測係数(1002,1010)を使用して前記周波数ドメイン表現のスペクトル値の整形(606a)を実行して、整形済みスペクトル値を取得し、更に、前記第1符号化プロセッサ(600)は、前記周波数ドメイン表現の前記整形済みスペクトル値の量子化及びエントロピー符号化操作(606b)を実行するよう構成されている、オーディオ符号器。 - 請求項1乃至6のいずれか一項に記載のオーディオ符号器において、前記クロスプロセッサ(700)は、
前記第1オーディオ信号部分から導出されたLPC係数(1010)を使用して前記周波数ドメイン表現の量子化済みスペクトル値を整形する、ノイズ整形部(703)と、
前記周波数ドメイン表現のスペクトル的に整形されたスペクトル部分を高スペクトル分解能で復号化して復号化済みスペクトル表現を取得する、スペクトル復号器(704,705)と、
前記復号化済みスペクトル表現に対し周波数−時間変換を実行して復号化済み第1オーディオ信号部分を取得する周波数−時間変換部(702)であって、前記第2サンプリングレートは前記復号化済み第1オーディオ信号部分と関連している、周波数−時間変換部(702)と、
を含む、オーディオ符号器。 - 請求項1乃至7のいずれか一項に記載のオーディオ符号器において、
前記第2符号化プロセッサ(610)が以下のブロック群の少なくとも1つのブロックを含む、オーディオ符号器:
予測分析フィルタ(611);
適応型符号帳ステージ(612);
革新的符号帳ステージ(614);
革新的符号帳エントリを推定する推定部(613);
ACELP/ゲイン符号化ステージ(615);
予測合成フィルタリングステージ(616);
デエンファシス・ステージ(617);
低音ポストフィルタ分析ステージ(618)。 - 請求項1乃至8のいずれか一項に記載のオーディオ符号器において、
前記クロスプロセッサ(700)は、前記復号化済みスペクトル表現に対し周波数−時間変換を実行して、時間ドメイン信号を前記第2サンプリングレートで生成する周波数−時間変換部(702)を有し、
前記周波数−時間変換部(702)が、
前記第1サンプリングレートと前記第2サンプリングレートとの比に従って、前記低帯域部分を選択する選択部(726)と、
前記低減された変換サイズを有する変換プロセッサ(720)と、
前記時間−周波数変換部(602)により使用された窓とは異なる個数の窓係数を有する窓を使用して窓掛けする合成窓掛け部(712)と、を含む、
オーディオ符号器。 - 符号化済みオーディオ信号を復号化するオーディオ復号器において、
第1の符号化済みオーディオ信号部分を周波数ドメインで復号化して復号化済みスペクトル表現を取得する第1復号化プロセッサ(1120)であって、前記復号化済みスペクトル表現を時間ドメインへと変換して復号化済み第1オーディオ信号部分を取得する周波数−時間変換部(1124)を有し、前記復号化済みスペクトル表現はそれと関連する第1サンプリングレートを有する、第1復号化プロセッサ(1120)と、
第2の符号化済みオーディオ信号部分を時間ドメインで復号化して復号化済み第2オーディオ信号部分を取得する第2復号化プロセッサ(1140)であって、前記復号化済み第2オーディオ信号部分はそれと関連する第2サンプリングレートを有する前記第2復号化プロセッサ(1140)と、
前記符号化済みオーディオ信号内で前記第1の符号化済みオーディオ信号部分に時間的に後続する前記第2の符号化済みオーディオ信号部分の復号化のために前記第2復号化プロセッサ(1140)が初期化されるよう、前記復号化済みスペクトル表現から前記第2復号化プロセッサ(1140)の初期化データを計算するクロスプロセッサ(1170)であって、前記第2復号化プロセッサ(1140)の初期化データを取得するために、前記復号化済みスペクトル表現の低帯域部分および低減された変換サイズを選択することを使用して、前記第1サンプリングレートから前記第2サンプリングレートへのダウンサンプリングを追加的に実行する周波数−時間変換を使用するように構成された、クロスプロセッサ(1170)と、
前記復号化済み第1オーディオ信号部分と前記復号化済み第2オーディオ信号部分とを結合して復号化済みオーディオ信号を取得する結合部(1160)と、
を含むオーディオ復号器。 - 請求項10に記載のオーディオ復号器において、
前記第1復号化プロセッサ(1120)は、第1スペクトル部分の第1セットを波形保存方式で再構成してギャップを有するスペクトルを生成するよう構成され、前記スペクトルにおけるギャップは、パラメトリックデータを適用する周波数再生成を使用する一方で、第1スペクトル部分の第1セットの再構成された第1スペクトル部分を使用することを含む、インテリジェント・ギャップ充填(IGF)技術を用いて充填される、
オーディオ復号器。 - 請求項10又は11に記載のオーディオ復号器において、
前記第1復号化プロセッサ(1120)は、前記復号化済み第1オーディオ信号部分をポストフィルタリングする適応型長期予測ポストフィルタ(1420)を含み、前記適応型長期予測ポストフィルタ(1420)が前記符号化済みオーディオ信号の中に含まれた1つ以上の長期予測パラメータにより制御される、オーディオ復号器。 - 請求項10乃至12のいずれか一項に記載のオーディオ復号器において、
前記クロスプロセッサ(1170)は、
前記復号化済みスペクトル表現に対し前記周波数−時間変換を実行する追加的周波数−時間変換部(1171)であって、前記第1復号化プロセッサ(1120)の前記周波数−時間変換部(1124)と関連する前記第1サンプリングレートとは異なる第2サンプリングレートで作動し、時間ドメインで追加的な復号化済み第1オーディオ信号部分を得る、追加的周波数−時間変換部(1171)をさらに備え、
前記追加的な復号化済み第1オーディオ信号部分は、前記復号化済み第1オーディオ信号部分と関連する第1サンプリングレートとは異なる第2サンプリングレートを有し、
前記追加的周波数−時間変換部(1171)は、
前記第1サンプリングレートと前記第2サンプリングレートとの比に従って、前記復号化済みスペクトル表現の低帯域部分を選択する選択部(726)と、
前記周波数−時間変換部(1124)の変換サイズ(710)とは異なる前記低減された変換サイズを有する変換プロセッサ(720)と、
前記周波数−時間変換部(1124)により使用された窓と比較して異なる個数の係数を有する窓を使用する合成窓掛け部(722)と、を含む、
オーディオ復号器 - 請求項10乃至13のいずれか一項に記載のオーディオ復号器において、
前記クロスプロセッサ(1170)は、
初期化のために、前記追加的な復号化済み第1オーディオ信号部分を遅延しかつ前記追加的な復号化済み第1オーディオ信号部分の遅延されたバージョンを前記第2復号化プロセッサ(1140)のデエンファシスステージ(1144)へと供給する、遅延ステージ(1172)、
初期化のために、前記追加的な復号化済み第1オーディオ信号部分をフィルタリング及び遅延し、かつ遅延ステージ出力を前記第2復号化プロセッサ(1140)の予測合成フィルタ(1143)へと供給する、プリエンファシスフィルタ(1173)及び遅延ステージ(1175)、
前記追加的な復号化済み第1オーディオ信号部分又はプリエンファシス(1173)された追加的な復号化済み第1オーディオ信号部分から、予測残差信号を生成し、かつ前記予測残差信号を前記第2復号化プロセッサ(1140)の符号帳合成部(1141)へと供給する、予測分析フィルタ(1174)、又は、
初期化のために、前記追加的な復号化済み第1オーディオ信号部分を前記第2復号化プロセッサ(1140)のリサンプラ(1210)の分析ステージ(1471)へと供給する、スイッチ(1480)、を含む、
オーディオ復号器。 - 請求項10乃至14のいずれか一項に記載のオーディオ復号器において、
前記第2復号化プロセッサ(1140)が以下のブロック群の少なくとも1つのブロックを含む、オーディオ復号器:
ACELPゲイン及び革新的符号帳を復号化するステージ(1149);
適応型符号帳合成ステージ(1141);
ACELP後処理部(1142);
予測合成フィルタ(1143);
デエンファシス・ステージ(1144)。 - 高帯域と低帯域とを含むオーディオ信号を符号化する方法において、
第1オーディオ信号部分を周波数ドメインで符号化(600)するステップであって、前記第1オーディオ信号部分はそれと関連する第1サンプリングレートを有し、
前記第1オーディオ信号部分をこの第1オーディオ信号部分の最大周波数までスペクトルラインを有する周波数ドメイン表現へと変換(602)するサブステップ、及び
前記周波数ドメイン表現を符号化(606)して、第1符号化済み信号部分である前記第1オーディオ信号部分の符号化済みスペクトル表現を取得するサブステップ、
を含む、ステップ(600)と、
第2オーディオ信号部分を時間ドメインで符号化して、第2符号化済み信号部分を取得するステップ(610)であって、前記第2オーディオ信号部分は前記第1オーディオ信号部分とは異なる、ステップ(610)と、
前記オーディオ信号内で前記第1オーディオ信号部分に時間的に直後に後続する前記第2オーディオ信号部分の符号化のために前記第2オーディオ信号部分を符号化するステップ(610)が初期化されるように、前記第1オーディオ信号部分の符号化済みスペクトル表現から前記第2オーディオ信号部分を符号化するステップ(610)のための初期化データを計算するステップ(700)であって、前記第2オーディオ信号部分を符号化するステップ(610)の初期化データを取得するために、前記周波数ドメイン表現の低帯域部分および低減された変換サイズを選択することを使用して、前記第1サンプリングレートから前記第2サンプリングレートへのダウンサンプリングを追加的に実行する周波数−時間変換を使用することを含む、ステップ(700)と、
前記オーディオ信号を分析し、前記オーディオ信号のどの部分が周波数ドメインで符号化される前記第1オーディオ信号部分であるか、及び前記オーディオ信号のどの部分が時間ドメインで符号化される前記第2オーディオ信号部分であるかを決定するステップ(620)と、
前記第1オーディオ信号部分についての第1符号化済み信号部分と前記第2オーディオ信号部分についての第2符号化済み信号部分とを有する、符号化済みオーディオ信号を形成するステップ(630)と、
を含む方法。 - 符号化済みオーディオ信号を復号化する方法において、
第1の符号化済みオーディオ信号部分を周波数ドメインで復号化して復号化済みスペクトル表現を取得するステップ(1120)であって、前記第1の符号化済みオーディオ信号部分を復号化するステップ(1120)は、前記復号化済みスペクトル表現を時間ドメインへと変換して復号化済み第1オーディオ信号部分を取得するサブステップを有し、前記復号化済みスペクトル表現はそれと関連する第1サンプリングレートを有する、ステップ(1120)と、
第2の符号化済みオーディオ信号部分を時間ドメインで復号化して復号化済み第2オーディオ信号部分を取得するステップ(1140)であって、前記復号化済み第2オーディオ信号部分はそれと関連する第2サンプリングレートを有するステップ(1140)と、
前記符号化済みオーディオ信号内で前記第1の符号化済みオーディオ信号部分に時間的に後続する前記第2の符号化済みオーディオ信号部分の復号化のために前記第2の符号化済みオーディオ信号部分の復号化ステップ(1140)が初期化されるように、前記第1の符号化済みオーディオ信号部分の前記復号化済みスペクトル表現から前記第2の符号化済みオーディオ信号部分を復号化するステップ(1140)の初期化データを計算するステップ(1170)であって、前記第2の符号化済みオーディオ信号部分を復号化するステップ(1140)の初期化データを取得するために、前記復号化済みスペクトル表現の低帯域部分および低減された変換サイズを選択することを使用して、前記第1サンプリングレートから前記第2サンプリングレートへのダウンサンプリングを追加的に実行する周波数−時間変換を使用することを含む、ステップ(1170)と、
前記復号化済み第1オーディオ信号部分と前記復号化済み第2オーディオ信号部分とを結合して復号化済みオーディオ信号を取得するステップ(1160)と、
を含む方法。 - コンピュータ又はプロセッサ上で作動するときに、請求項16又は請求項17に記載の方法を実行するコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022137531A JP7507207B2 (ja) | 2014-07-28 | 2022-08-31 | 周波数ドメインプロセッサ、時間ドメインプロセッサ及び連続的な初期化のためのクロスプロセッサを使用するオーディオ符号器及び復号器 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP14178819.0 | 2014-07-28 | ||
EP14178819.0A EP2980795A1 (en) | 2014-07-28 | 2014-07-28 | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
JP2019024181A JP6838091B2 (ja) | 2014-07-28 | 2019-02-14 | 周波数ドメインプロセッサ、時間ドメインプロセッサ及び連続的な初期化のためのクロスプロセッサを使用するオーディオ符号器及び復号器 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019024181A Division JP6838091B2 (ja) | 2014-07-28 | 2019-02-14 | 周波数ドメインプロセッサ、時間ドメインプロセッサ及び連続的な初期化のためのクロスプロセッサを使用するオーディオ符号器及び復号器 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022137531A Division JP7507207B2 (ja) | 2014-07-28 | 2022-08-31 | 周波数ドメインプロセッサ、時間ドメインプロセッサ及び連続的な初期化のためのクロスプロセッサを使用するオーディオ符号器及び復号器 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021099497A true JP2021099497A (ja) | 2021-07-01 |
JP7135132B2 JP7135132B2 (ja) | 2022-09-12 |
Family
ID=51224877
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017504786A Active JP6483805B2 (ja) | 2014-07-28 | 2015-07-24 | 周波数ドメインプロセッサ、時間ドメインプロセッサ及び連続的な初期化のためのクロスプロセッサを使用するオーディオ符号器及び復号器 |
JP2019024181A Active JP6838091B2 (ja) | 2014-07-28 | 2019-02-14 | 周波数ドメインプロセッサ、時間ドメインプロセッサ及び連続的な初期化のためのクロスプロセッサを使用するオーディオ符号器及び復号器 |
JP2021019424A Active JP7135132B2 (ja) | 2014-07-28 | 2021-02-10 | 周波数ドメインプロセッサ、時間ドメインプロセッサ及び連続的な初期化のためのクロスプロセッサを使用するオーディオ符号器及び復号器 |
JP2022137531A Active JP7507207B2 (ja) | 2014-07-28 | 2022-08-31 | 周波数ドメインプロセッサ、時間ドメインプロセッサ及び連続的な初期化のためのクロスプロセッサを使用するオーディオ符号器及び復号器 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017504786A Active JP6483805B2 (ja) | 2014-07-28 | 2015-07-24 | 周波数ドメインプロセッサ、時間ドメインプロセッサ及び連続的な初期化のためのクロスプロセッサを使用するオーディオ符号器及び復号器 |
JP2019024181A Active JP6838091B2 (ja) | 2014-07-28 | 2019-02-14 | 周波数ドメインプロセッサ、時間ドメインプロセッサ及び連続的な初期化のためのクロスプロセッサを使用するオーディオ符号器及び復号器 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022137531A Active JP7507207B2 (ja) | 2014-07-28 | 2022-08-31 | 周波数ドメインプロセッサ、時間ドメインプロセッサ及び連続的な初期化のためのクロスプロセッサを使用するオーディオ符号器及び復号器 |
Country Status (18)
Country | Link |
---|---|
US (5) | US10236007B2 (ja) |
EP (4) | EP2980795A1 (ja) |
JP (4) | JP6483805B2 (ja) |
KR (1) | KR102010260B1 (ja) |
CN (2) | CN112786063B (ja) |
AR (1) | AR101343A1 (ja) |
AU (1) | AU2015295606B2 (ja) |
CA (1) | CA2952150C (ja) |
ES (3) | ES2994302T3 (ja) |
MX (1) | MX360558B (ja) |
MY (1) | MY192540A (ja) |
PL (3) | PL3175451T3 (ja) |
PT (2) | PT3175451T (ja) |
RU (1) | RU2668397C2 (ja) |
SG (1) | SG11201700645VA (ja) |
TR (1) | TR201909548T4 (ja) |
TW (1) | TWI581251B (ja) |
WO (1) | WO2016016124A1 (ja) |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2830059A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Noise filling energy adjustment |
EP2980795A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
EP2980794A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
EP3107096A1 (en) | 2015-06-16 | 2016-12-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Downscaled decoding |
EP3182411A1 (en) | 2015-12-14 | 2017-06-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an encoded audio signal |
WO2017125563A1 (en) | 2016-01-22 | 2017-07-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for estimating an inter-channel time difference |
EP3288031A1 (en) | 2016-08-23 | 2018-02-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding an audio signal using a compensation value |
CN107886960B (zh) * | 2016-09-30 | 2020-12-01 | 华为技术有限公司 | 一种音频信号重建方法及装置 |
US10354669B2 (en) | 2017-03-22 | 2019-07-16 | Immersion Networks, Inc. | System and method for processing audio data |
EP3382703A1 (en) | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and methods for processing an audio signal |
JP7257975B2 (ja) | 2017-07-03 | 2023-04-14 | ドルビー・インターナショナル・アーベー | 密集性の過渡事象の検出及び符号化の複雑さの低減 |
EP4243453B1 (en) * | 2017-07-28 | 2025-05-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus for decoding an encoded multichannel signal using a filling signal generated by a broad band filter |
JP7214726B2 (ja) * | 2017-10-27 | 2023-01-30 | フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | ニューラルネットワークプロセッサを用いた帯域幅が拡張されたオーディオ信号を生成するための装置、方法またはコンピュータプログラム |
US10332543B1 (en) * | 2018-03-12 | 2019-06-25 | Cypress Semiconductor Corporation | Systems and methods for capturing noise for pattern recognition processing |
CN109360585A (zh) * | 2018-12-19 | 2019-02-19 | 晶晨半导体(上海)股份有限公司 | 一种语音激活检测方法 |
CN111383646B (zh) | 2018-12-28 | 2020-12-08 | 广州市百果园信息技术有限公司 | 一种语音信号变换方法、装置、设备和存储介质 |
US11647241B2 (en) * | 2019-02-19 | 2023-05-09 | Sony Interactive Entertainment LLC | Error de-emphasis in live streaming |
US11380343B2 (en) * | 2019-09-12 | 2022-07-05 | Immersion Networks, Inc. | Systems and methods for processing high frequency audio signal |
CA3163373A1 (en) * | 2020-02-03 | 2021-08-12 | Vaclav Eksler | Switching between stereo coding modes in a multichannel sound codec |
CN111554312A (zh) * | 2020-05-15 | 2020-08-18 | 西安万像电子科技有限公司 | 控制音频编码类型的方法、装置和系统 |
CN114299967A (zh) * | 2020-09-22 | 2022-04-08 | 华为技术有限公司 | 音频编解码方法和装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010210680A (ja) * | 2009-03-06 | 2010-09-24 | Ntt Docomo Inc | 音信号符号化方法、音信号復号方法、符号化装置、復号装置、音信号処理システム、音信号符号化プログラム、及び、音信号復号プログラム |
JP2012242785A (ja) * | 2011-05-24 | 2012-12-10 | Sony Corp | 信号処理装置、信号処理方法、およびプログラム |
US20130030798A1 (en) * | 2011-07-26 | 2013-01-31 | Motorola Mobility, Inc. | Method and apparatus for audio coding and decoding |
Family Cites Families (142)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3336617B2 (ja) | 1993-05-31 | 2002-10-21 | ソニー株式会社 | 信号符号化又は復号化装置,及び信号符号化又は復号化方法,並びに記録媒体 |
JP3465697B2 (ja) | 1993-05-31 | 2003-11-10 | ソニー株式会社 | 信号記録媒体 |
IT1268195B1 (it) * | 1994-12-23 | 1997-02-21 | Sip | Decodificatore per segnali audio appartenenti a sequenze audiovisive compresse e codificate. |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
JP3364825B2 (ja) * | 1996-05-29 | 2003-01-08 | 三菱電機株式会社 | 音声符号化装置および音声符号化復号化装置 |
US6134518A (en) * | 1997-03-04 | 2000-10-17 | International Business Machines Corporation | Digital audio signal coding using a CELP coder and a transform coder |
WO1999010719A1 (en) | 1997-08-29 | 1999-03-04 | The Regents Of The University Of California | Method and apparatus for hybrid coding of speech at 4kbps |
US6691084B2 (en) * | 1998-12-21 | 2004-02-10 | Qualcomm Incorporated | Multiple mode variable rate speech coding |
US6446041B1 (en) * | 1999-10-27 | 2002-09-03 | Microsoft Corporation | Method and system for providing audio playback of a multi-source document |
US6968564B1 (en) * | 2000-04-06 | 2005-11-22 | Nielsen Media Research, Inc. | Multi-band spectral audio encoding |
US6996198B2 (en) | 2000-10-27 | 2006-02-07 | At&T Corp. | Nonuniform oversampled filter banks for audio signal processing |
US6384773B1 (en) * | 2000-12-15 | 2002-05-07 | Harris Corporation | Adaptive fragmentation and frequency translation of continuous spectrum waveform to make use of discontinuous unoccupied segments of communication bandwidth |
DE10102155C2 (de) * | 2001-01-18 | 2003-01-09 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Erzeugen eines skalierbaren Datenstroms und Verfahren und Vorrichtung zum Decodieren eines skalierbaren Datenstroms |
FI110729B (fi) * | 2001-04-11 | 2003-03-14 | Nokia Corp | Menetelmä pakatun audiosignaalin purkamiseksi |
US6988066B2 (en) | 2001-10-04 | 2006-01-17 | At&T Corp. | Method of bandwidth extension for narrow-band speech |
US7447631B2 (en) | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
JP3876781B2 (ja) | 2002-07-16 | 2007-02-07 | ソニー株式会社 | 受信装置および受信方法、記録媒体、並びにプログラム |
EP1595243A2 (en) * | 2003-02-12 | 2005-11-16 | Koninklijke Philips Electronics N.V. | Audio reproduction apparatus, method, computer program |
KR100547113B1 (ko) | 2003-02-15 | 2006-01-26 | 삼성전자주식회사 | 오디오 데이터 인코딩 장치 및 방법 |
US20050004793A1 (en) | 2003-07-03 | 2005-01-06 | Pasi Ojala | Signal adaptation for higher band coding in a codec utilizing band split coding |
WO2005022756A1 (ja) | 2003-08-28 | 2005-03-10 | Sony Corporation | 復号装置および方法、プログラム記録媒体、並びにプログラム |
JP4679049B2 (ja) * | 2003-09-30 | 2011-04-27 | パナソニック株式会社 | スケーラブル復号化装置 |
CA2457988A1 (en) | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
KR100561869B1 (ko) | 2004-03-10 | 2006-03-17 | 삼성전자주식회사 | 무손실 오디오 부호화/복호화 방법 및 장치 |
US7739120B2 (en) * | 2004-05-17 | 2010-06-15 | Nokia Corporation | Selection of coding models for encoding an audio signal |
MXPA06012617A (es) * | 2004-05-17 | 2006-12-15 | Nokia Corp | Codificacion de audio con diferentes longitudes de cuadro de codificacion. |
US7596486B2 (en) * | 2004-05-19 | 2009-09-29 | Nokia Corporation | Encoding an audio signal using different audio coder modes |
EP1750397A4 (en) * | 2004-05-26 | 2007-10-31 | Nippon Telegraph & Telephone | SOUND PACKET PLAY PROCESS, SOUND PACKET PLAYER, SOUNDPACK PLAYBACK PROGRAM AND RECORDING MEDIUM |
KR100707186B1 (ko) | 2005-03-24 | 2007-04-13 | 삼성전자주식회사 | 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체 |
EP1866915B1 (en) * | 2005-04-01 | 2010-12-15 | Qualcomm Incorporated | Method and apparatus for anti-sparseness filtering of a bandwidth extended speech prediction excitation signal |
US7548853B2 (en) * | 2005-06-17 | 2009-06-16 | Shmunk Dmitry V | Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding |
US8050334B2 (en) | 2005-07-07 | 2011-11-01 | Nippon Telegraph And Telephone Corporation | Signal encoder, signal decoder, signal encoding method, signal decoding method, program, recording medium and signal codec method |
US8271274B2 (en) * | 2006-02-22 | 2012-09-18 | France Telecom | Coding/decoding of a digital audio signal, in CELP technique |
FR2897977A1 (fr) * | 2006-02-28 | 2007-08-31 | France Telecom | Procede de limitation de gain d'excitation adaptative dans un decodeur audio |
DE102006022346B4 (de) * | 2006-05-12 | 2008-02-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Informationssignalcodierung |
JP2008033269A (ja) | 2006-06-26 | 2008-02-14 | Sony Corp | デジタル信号処理装置、デジタル信号処理方法およびデジタル信号の再生装置 |
DE602006002739D1 (de) * | 2006-06-30 | 2008-10-23 | Fraunhofer Ges Forschung | Audiokodierer, Audiodekodierer und Audioprozessor mit einer dynamisch variablen Warp-Charakteristik |
US7873511B2 (en) * | 2006-06-30 | 2011-01-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
JP5205373B2 (ja) | 2006-06-30 | 2013-06-05 | フラウンホーファーゲゼルシャフト・ツア・フェルデルング・デア・アンゲバンテン・フォルシュング・エー・ファウ | 動的可変ワーピング特性を有するオーディオエンコーダ、オーディオデコーダ及びオーディオプロセッサ |
US8655652B2 (en) | 2006-10-20 | 2014-02-18 | Dolby International Ab | Apparatus and method for encoding an information signal |
US8688437B2 (en) * | 2006-12-26 | 2014-04-01 | Huawei Technologies Co., Ltd. | Packet loss concealment for speech coding |
CN101025918B (zh) * | 2007-01-19 | 2011-06-29 | 清华大学 | 一种语音/音乐双模编解码无缝切换方法 |
KR101261524B1 (ko) | 2007-03-14 | 2013-05-06 | 삼성전자주식회사 | 노이즈를 포함하는 오디오 신호를 저비트율로부호화/복호화하는 방법 및 이를 위한 장치 |
KR101411900B1 (ko) | 2007-05-08 | 2014-06-26 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 장치 |
MX2009013519A (es) * | 2007-06-11 | 2010-01-18 | Fraunhofer Ges Forschung | Codificador de audio para codificar una señal de audio que tiene una porcion similar a un impulso y una porcion estacionaria, metodos de codificacion, decodificador, metodo de decodificacion, y señal de audio codificada. |
EP2015293A1 (en) | 2007-06-14 | 2009-01-14 | Deutsche Thomson OHG | Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain |
US20090048828A1 (en) * | 2007-08-15 | 2009-02-19 | University Of Washington | Gap interpolation in acoustic signals using coherent demodulation |
BRPI0815972B1 (pt) | 2007-08-27 | 2020-02-04 | Ericsson Telefon Ab L M | método para recuperação de espectro em decodificação espectral de um sinal de áudio, método para uso em codificação espectral de um sinal de áudio, decodificador, e, codificador |
US8515767B2 (en) * | 2007-11-04 | 2013-08-20 | Qualcomm Incorporated | Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs |
CN101221766B (zh) * | 2008-01-23 | 2011-01-05 | 清华大学 | 音频编码器切换的方法 |
WO2009114656A1 (en) * | 2008-03-14 | 2009-09-17 | Dolby Laboratories Licensing Corporation | Multimode coding of speech-like and non-speech-like signals |
EP2144171B1 (en) * | 2008-07-11 | 2018-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder for encoding and decoding frames of a sampled audio signal |
PL2346030T3 (pl) * | 2008-07-11 | 2015-03-31 | Fraunhofer Ges Forschung | Koder audio, sposób kodowania sygnału audio oraz program komputerowy |
AU2013200680B2 (en) * | 2008-07-11 | 2015-01-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder and decoder for encoding and decoding audio samples |
BRPI0910512B1 (pt) * | 2008-07-11 | 2020-10-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | codificador e decodificador de áudio para codificar e decodificar amostras de áudio |
US8880410B2 (en) * | 2008-07-11 | 2014-11-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating a bandwidth extended signal |
CA2836862C (en) | 2008-07-11 | 2016-09-13 | Stefan Bayer | Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs |
RU2512090C2 (ru) * | 2008-07-11 | 2014-04-10 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство и способ генерирования сигнала с расширенной полосой пропускания |
EP2144230A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
MX2011000369A (es) * | 2008-07-11 | 2011-07-29 | Ten Forschung Ev Fraunhofer | Codificador y decodificador de audio para codificar marcos de señales de audio muestreadas. |
KR20100007738A (ko) * | 2008-07-14 | 2010-01-22 | 한국전자통신연구원 | 음성/오디오 통합 신호의 부호화/복호화 장치 |
EP2146344B1 (en) | 2008-07-17 | 2016-07-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding/decoding scheme having a switchable bypass |
TWI520128B (zh) * | 2008-10-08 | 2016-02-01 | 弗勞恩霍夫爾協會 | 多解析度切換音訊編碼/解碼方案(一) |
US8364471B2 (en) | 2008-11-04 | 2013-01-29 | Lg Electronics Inc. | Apparatus and method for processing a time domain audio signal with a noise filling flag |
EP4145446B1 (en) | 2009-01-16 | 2023-11-22 | Dolby International AB | Cross product enhanced harmonic transposition |
ES2639716T3 (es) * | 2009-01-28 | 2017-10-30 | Dolby International Ab | Transposición armónica mejorada |
US8457975B2 (en) | 2009-01-28 | 2013-06-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program |
PL3751570T3 (pl) * | 2009-01-28 | 2022-03-07 | Dolby International Ab | Ulepszona transpozycja harmonicznych |
KR101622950B1 (ko) | 2009-01-28 | 2016-05-23 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 그 장치 |
TWI662788B (zh) | 2009-02-18 | 2019-06-11 | 瑞典商杜比國際公司 | 用於高頻重建或參數立體聲之複指數調變濾波器組 |
PL2234103T3 (pl) * | 2009-03-26 | 2012-02-29 | Fraunhofer Ges Forschung | Urządzenie i sposób manipulacji sygnałem audio |
RU2452044C1 (ru) * | 2009-04-02 | 2012-05-27 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот |
EP2237266A1 (en) * | 2009-04-03 | 2010-10-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for determining a plurality of local center of gravity frequencies of a spectrum of an audio signal |
US8391212B2 (en) * | 2009-05-05 | 2013-03-05 | Huawei Technologies Co., Ltd. | System and method for frequency domain audio post-processing based on perceptual masking |
US8228046B2 (en) * | 2009-06-16 | 2012-07-24 | American Power Conversion Corporation | Apparatus and method for operating an uninterruptible power supply |
KR20100136890A (ko) | 2009-06-19 | 2010-12-29 | 삼성전자주식회사 | 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법 |
EP2273493B1 (en) | 2009-06-29 | 2012-12-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Bandwidth extension encoding and decoding |
WO2011013983A2 (en) | 2009-07-27 | 2011-02-03 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
GB2473266A (en) | 2009-09-07 | 2011-03-09 | Nokia Corp | An improved filter bank |
GB2473267A (en) | 2009-09-07 | 2011-03-09 | Nokia Corp | Processing audio signals to reduce noise |
MY163358A (en) * | 2009-10-08 | 2017-09-15 | Fraunhofer-Gesellschaft Zur Förderung Der Angenwandten Forschung E V | Multi-mode audio signal decoder,multi-mode audio signal encoder,methods and computer program using a linear-prediction-coding based noise shaping |
KR101137652B1 (ko) * | 2009-10-14 | 2012-04-23 | 광운대학교 산학협력단 | 천이 구간에 기초하여 윈도우의 오버랩 영역을 조절하는 통합 음성/오디오 부호화/복호화 장치 및 방법 |
ES2797525T3 (es) * | 2009-10-15 | 2020-12-02 | Voiceage Corp | Conformación simultánea de ruido en el dominio del tiempo y el dominio de la frecuencia para transformaciones TDAC |
ES2453098T3 (es) * | 2009-10-20 | 2014-04-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Códec multimodo de audio |
KR101411759B1 (ko) * | 2009-10-20 | 2014-06-25 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 오디오 신호 인코더, 오디오 신호 디코더, 앨리어싱-소거를 이용하여 오디오 신호를 인코딩 또는 디코딩하는 방법 |
US8484020B2 (en) | 2009-10-23 | 2013-07-09 | Qualcomm Incorporated | Determining an upperband signal from a narrowband signal |
WO2011059254A2 (en) * | 2009-11-12 | 2011-05-19 | Lg Electronics Inc. | An apparatus for processing a signal and method thereof |
US9048865B2 (en) * | 2009-12-16 | 2015-06-02 | Syntropy Systems, Llc | Conversion of a discrete time quantized signal into a continuous time, continuously variable signal |
US8428959B2 (en) * | 2010-01-29 | 2013-04-23 | Polycom, Inc. | Audio packet loss concealment by transform interpolation |
CN101800050B (zh) * | 2010-02-03 | 2012-10-10 | 武汉大学 | 基于感知自适应比特分配的音频精细分级编码方法及系统 |
US8423355B2 (en) | 2010-03-05 | 2013-04-16 | Motorola Mobility Llc | Encoder for audio signal including generic audio and speech frames |
KR101414736B1 (ko) | 2010-03-09 | 2014-08-06 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 캐스케이드 필터뱅크들을 이용한 입력 오디오 신호를 처리하는 장치 및 방법 |
EP2375409A1 (en) | 2010-04-09 | 2011-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction |
SG184537A1 (en) | 2010-04-13 | 2012-11-29 | Fraunhofer Ges Forschung | Audio or video encoder, audio or video decoder and related methods for processing multi-channel audio or video signals using a variable prediction direction |
US8886523B2 (en) | 2010-04-14 | 2014-11-11 | Huawei Technologies Co., Ltd. | Audio decoding based on audio class with control code for post-processing modes |
US8600737B2 (en) * | 2010-06-01 | 2013-12-03 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for wideband speech coding |
WO2011156905A2 (en) | 2010-06-17 | 2011-12-22 | Voiceage Corporation | Multi-rate algebraic vector quantization with supplemental coding of missing spectrum sub-bands |
EP4398248A3 (en) | 2010-07-08 | 2024-07-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder using forward aliasing cancellation |
US9047875B2 (en) | 2010-07-19 | 2015-06-02 | Futurewei Technologies, Inc. | Spectrum flatness control for bandwidth extension |
US8560330B2 (en) | 2010-07-19 | 2013-10-15 | Futurewei Technologies, Inc. | Energy envelope perceptual correction for high band coding |
BR112012024360B1 (pt) | 2010-07-19 | 2020-11-03 | Dolby International Ab | sistema configurado para gerar uma pluralidade de sinais de áudio de sub-banda de alta frequência, decodificador de áudio, codificador, método para gerar uma pluralidade de sinais de sub-banda de alta frequência, método para decodificar um fluxo de bits, método para gerar dados de controle a partir de um sinal de áudio e meio de armazenamento |
BE1019445A3 (fr) * | 2010-08-11 | 2012-07-03 | Reza Yves | Procede d'extraction d'information audio. |
JP5749462B2 (ja) * | 2010-08-13 | 2015-07-15 | 株式会社Nttドコモ | オーディオ復号装置、オーディオ復号方法、オーディオ復号プログラム、オーディオ符号化装置、オーディオ符号化方法、及び、オーディオ符号化プログラム |
KR101826331B1 (ko) | 2010-09-15 | 2018-03-22 | 삼성전자주식회사 | 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법 |
PL2625688T3 (pl) * | 2010-10-06 | 2015-05-29 | Fraunhofer Ges Forschung | Urządzenie i sposób do przetwarzania sygnału audio i do dostarczania wyższej granulacji czasowej dla połączonego kodeka mowy i audio (USAC) |
EP2619758B1 (en) | 2010-10-15 | 2015-08-19 | Huawei Technologies Co., Ltd. | Audio signal transformer and inverse transformer, methods for audio signal analysis and synthesis |
US20130173275A1 (en) * | 2010-10-18 | 2013-07-04 | Panasonic Corporation | Audio encoding device and audio decoding device |
US20130253917A1 (en) * | 2010-12-09 | 2013-09-26 | Dolby International Ab | Psychoacoustic filter design for rational resamplers |
FR2969805A1 (fr) | 2010-12-23 | 2012-06-29 | France Telecom | Codage bas retard alternant codage predictif et codage par transformee |
CA2981539C (en) * | 2010-12-29 | 2020-08-25 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding/decoding for high-frequency bandwidth extension |
RU2571388C2 (ru) * | 2011-03-18 | 2015-12-20 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Передача длины элемента кадра при кодировании аудио |
EP2707873B1 (en) * | 2011-05-09 | 2015-04-08 | Dolby International AB | Method and encoder for processing a digital stereo audio signal |
JP2013015598A (ja) * | 2011-06-30 | 2013-01-24 | Zte Corp | オーディオ符号化/復号化方法、システム及びノイズレベルの推定方法 |
EP3279895B1 (en) * | 2011-11-02 | 2019-07-10 | Telefonaktiebolaget LM Ericsson (publ) | Audio encoding based on an efficient representation of auto-regressive coefficients |
US9043201B2 (en) * | 2012-01-03 | 2015-05-26 | Google Technology Holdings LLC | Method and apparatus for processing audio frames to transition between different codecs |
CN103428819A (zh) * | 2012-05-24 | 2013-12-04 | 富士通株式会社 | 一种载波频点搜索方法和装置 |
GB201210373D0 (en) * | 2012-06-12 | 2012-07-25 | Meridian Audio Ltd | Doubly compatible lossless audio sandwidth extension |
EP2862168B1 (en) | 2012-06-14 | 2017-08-09 | Dolby International AB | Smooth configuration switching for multichannel audio |
US9236053B2 (en) * | 2012-07-05 | 2016-01-12 | Panasonic Intellectual Property Management Co., Ltd. | Encoding and decoding system, decoding apparatus, encoding apparatus, encoding and decoding method |
US9053699B2 (en) * | 2012-07-10 | 2015-06-09 | Google Technology Holdings LLC | Apparatus and method for audio frame loss recovery |
US9830920B2 (en) * | 2012-08-19 | 2017-11-28 | The Regents Of The University Of California | Method and apparatus for polyphonic audio signal prediction in coding and networking systems |
US9589570B2 (en) | 2012-09-18 | 2017-03-07 | Huawei Technologies Co., Ltd. | Audio classification based on perceptual quality for low or medium bit rates |
CN105190749B (zh) * | 2013-01-29 | 2019-06-11 | 弗劳恩霍夫应用研究促进协会 | 噪声填充技术 |
MX348506B (es) * | 2013-02-20 | 2017-06-14 | Fraunhofer Ges Forschung | Aparato y metodo para codificar o decodificar una señal de audio utilizando una superposicion dependiente de la ubicacion de un transitorio. |
US9489959B2 (en) | 2013-06-11 | 2016-11-08 | Panasonic Intellectual Property Corporation Of America | Device and method for bandwidth extension for audio signals |
EP2830059A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Noise filling energy adjustment |
CN104517610B (zh) | 2013-09-26 | 2018-03-06 | 华为技术有限公司 | 频带扩展的方法及装置 |
FR3011408A1 (fr) | 2013-09-30 | 2015-04-03 | Orange | Re-echantillonnage d'un signal audio pour un codage/decodage a bas retard |
BR122022008602B1 (pt) | 2013-10-31 | 2023-01-10 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Decodificador de áudio e método para fornecer uma informação de áudio decodificada utilizando uma dissimulação de erro que modifica um sinal de excitação no domínio de tempo |
FR3013496A1 (fr) * | 2013-11-15 | 2015-05-22 | Orange | Transition d'un codage/decodage par transformee vers un codage/decodage predictif |
GB2515593B (en) * | 2013-12-23 | 2015-12-23 | Imagination Tech Ltd | Acoustic echo suppression |
CN103905834B (zh) * | 2014-03-13 | 2017-08-15 | 深圳创维-Rgb电子有限公司 | 音频数据编码格式转换的方法及装置 |
PL3117432T3 (pl) | 2014-03-14 | 2019-10-31 | Ericsson Telefon Ab L M | Sposób i aparatura do kodowania audio |
JP6035270B2 (ja) * | 2014-03-24 | 2016-11-30 | 株式会社Nttドコモ | 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム |
US9626983B2 (en) | 2014-06-26 | 2017-04-18 | Qualcomm Incorporated | Temporal gain adjustment based on high-band signal characteristic |
US9794703B2 (en) * | 2014-06-27 | 2017-10-17 | Cochlear Limited | Low-power active bone conduction devices |
FR3023036A1 (fr) | 2014-06-27 | 2016-01-01 | Orange | Re-echantillonnage par interpolation d'un signal audio pour un codage / decodage a bas retard |
EP2980795A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
EP2980794A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
FR3024582A1 (fr) | 2014-07-29 | 2016-02-05 | Orange | Gestion de la perte de trame dans un contexte de transition fd/lpd |
WO2020253941A1 (en) * | 2019-06-17 | 2020-12-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder with a signal-dependent number and precision control, audio decoder, and related methods and computer programs |
CA3187035A1 (en) * | 2020-07-10 | 2022-01-13 | Nima TALEBZADEH | Radiant energy spectrum converter |
-
2014
- 2014-07-28 EP EP14178819.0A patent/EP2980795A1/en not_active Withdrawn
-
2015
- 2015-07-22 TW TW104123734A patent/TWI581251B/zh active
- 2015-07-24 ES ES21195573T patent/ES2994302T3/es active Active
- 2015-07-24 JP JP2017504786A patent/JP6483805B2/ja active Active
- 2015-07-24 EP EP21195573.7A patent/EP3944236B1/en active Active
- 2015-07-24 CN CN202110039148.6A patent/CN112786063B/zh active Active
- 2015-07-24 EP EP19165957.2A patent/EP3522154B1/en active Active
- 2015-07-24 PL PL15741221T patent/PL3175451T3/pl unknown
- 2015-07-24 AU AU2015295606A patent/AU2015295606B2/en active Active
- 2015-07-24 MX MX2017001243A patent/MX360558B/es active IP Right Grant
- 2015-07-24 CN CN201580038795.8A patent/CN106796800B/zh active Active
- 2015-07-24 PT PT15741221T patent/PT3175451T/pt unknown
- 2015-07-24 PT PT191659572T patent/PT3522154T/pt unknown
- 2015-07-24 PL PL19165957T patent/PL3522154T3/pl unknown
- 2015-07-24 ES ES15741221T patent/ES2733846T3/es active Active
- 2015-07-24 EP EP15741221.4A patent/EP3175451B1/en active Active
- 2015-07-24 TR TR2019/09548T patent/TR201909548T4/tr unknown
- 2015-07-24 SG SG11201700645VA patent/SG11201700645VA/en unknown
- 2015-07-24 RU RU2017106099A patent/RU2668397C2/ru active
- 2015-07-24 MY MYPI2017000055A patent/MY192540A/en unknown
- 2015-07-24 CA CA2952150A patent/CA2952150C/en active Active
- 2015-07-24 WO PCT/EP2015/067005 patent/WO2016016124A1/en active Application Filing
- 2015-07-24 PL PL21195573.7T patent/PL3944236T3/pl unknown
- 2015-07-24 KR KR1020177005432A patent/KR102010260B1/ko active Active
- 2015-07-24 ES ES19165957T patent/ES2901758T3/es active Active
- 2015-07-28 AR ARP150102397A patent/AR101343A1/es active IP Right Grant
-
2017
- 2017-01-24 US US15/414,289 patent/US10236007B2/en active Active
-
2019
- 2019-02-14 JP JP2019024181A patent/JP6838091B2/ja active Active
- 2019-03-01 US US16/290,587 patent/US11410668B2/en active Active
-
2021
- 2021-02-10 JP JP2021019424A patent/JP7135132B2/ja active Active
- 2021-11-01 US US17/453,139 patent/US11915712B2/en active Active
-
2022
- 2022-08-31 JP JP2022137531A patent/JP7507207B2/ja active Active
-
2023
- 2023-08-10 US US18/448,020 patent/US20230386485A1/en active Pending
-
2024
- 2024-12-20 US US18/989,802 patent/US20250124935A1/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010210680A (ja) * | 2009-03-06 | 2010-09-24 | Ntt Docomo Inc | 音信号符号化方法、音信号復号方法、符号化装置、復号装置、音信号処理システム、音信号符号化プログラム、及び、音信号復号プログラム |
JP2012242785A (ja) * | 2011-05-24 | 2012-12-10 | Sony Corp | 信号処理装置、信号処理方法、およびプログラム |
US20130030798A1 (en) * | 2011-07-26 | 2013-01-31 | Motorola Mobility, Inc. | Method and apparatus for audio coding and decoding |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6838091B2 (ja) | 周波数ドメインプロセッサ、時間ドメインプロセッサ及び連続的な初期化のためのクロスプロセッサを使用するオーディオ符号器及び復号器 | |
JP6941643B2 (ja) | 全帯域ギャップ充填を備えた周波数ドメインプロセッサと時間ドメインプロセッサとを使用するオーディオ符号器及び復号器 | |
HK40067463A (en) | Audio encoding and decoding using a frequency domain processor, a time domain processor, and a cross processor for continuous initialization | |
HK40011441A (en) | Audio coding using a frequency domain processor and a time domain processor | |
HK1233756B (en) | Audio encoding and decoding in the frequency and time domains | |
HK1233756A1 (en) | Audio encoding and decoding in the frequency and time domains |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210210 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220309 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220322 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220407 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20220601 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20220601 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20220602 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220628 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20220628 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220802 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220831 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7135132 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |