[go: up one dir, main page]

JP5624192B2 - オーディオコーディングシステム、オーディオデコーダ、オーディオコーディング方法及びオーディオデコーディング方法 - Google Patents

オーディオコーディングシステム、オーディオデコーダ、オーディオコーディング方法及びオーディオデコーディング方法 Download PDF

Info

Publication number
JP5624192B2
JP5624192B2 JP2013176239A JP2013176239A JP5624192B2 JP 5624192 B2 JP5624192 B2 JP 5624192B2 JP 2013176239 A JP2013176239 A JP 2013176239A JP 2013176239 A JP2013176239 A JP 2013176239A JP 5624192 B2 JP5624192 B2 JP 5624192B2
Authority
JP
Japan
Prior art keywords
mdct
signal
audio
frame
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013176239A
Other languages
English (en)
Other versions
JP2014016625A (ja
Inventor
ヘデリン、ペール・ヘンリック
カールソン、ポンタス・ジャン
サミュエルソン、ヨナス・リーフ
シュグ、マイケル
Original Assignee
ドルビー・インターナショナル・アーベー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=39710955&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP5624192(B2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by ドルビー・インターナショナル・アーベー filed Critical ドルビー・インターナショナル・アーベー
Publication of JP2014016625A publication Critical patent/JP2014016625A/ja
Application granted granted Critical
Publication of JP5624192B2 publication Critical patent/JP5624192B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Analogue/Digital Conversion (AREA)

Description

本発明は、オーディオ信号のコーディングに関し、特に、音声、音楽あるいはそれらの組み合わせのいずれにも限定されないオーディオ信号のコーディングに関する。
従来技術においては、信号の音源モデル、すなわち人間の発声システムにコーディングを基づかせることにより、特に音声信号をコーディングするようになされた音声コーダーがある。このようなコーダーは、音楽、あるいは他の非音声信号のような任意のオーディオ信号を取り扱うことはできない。さらに、従来技術においては、信号の音源モデルではなく、人間の聴覚システムを前提にしたコーディングに基づく、普通オーディオコーダーと呼ばれる音楽コーダーがある。このようなコーダーは、任意の信号を非常によく取り扱うことができ、しかしながら、音声信号用の低ビットレートにおいては、専用音声コーダーの方が優れたオーディオ品質を有する。それゆえ、低ビットレートで操作されるときには、音声については音声コーダーと同様によく、また、音楽については音楽コーダーと同様によく動作する任意のオーディオ信号のコーディングについての一般的なコーディング構造は今まで存在しなかった。
よって、改良されたオーディオ品質および/または低減したビットレートを有する改良オーディオエンコーダおよびデコーダに対する要望がある。
特開2001−142499号公報 国際公開第2006/008817号 特開2003−44097号公報
実施の形態は従来以上の品質レベルで任意のオーディオ信号を効率的にコーディングすることである。
実施の形態によるシステムは、
オーディオ信号の第1のフレーム長に関して動作し、線形予測(LP)フィルタに基づいて前記オーディオ信号をフィルタリングする線形予測ユニットと、
可変の第2のフレーム長に関する修正離散コサイン変換(MDCT)により、前記オーディオ信号のフレームを変換領域の信号に変換する適応長さ変換ユニットと、
MDCT領域信号を量子化する量子化ユニットと、
前記LPフィルタの振幅応答に基づいてMDCT領域のゲイン曲線を生成するゲイン曲線生成ユニットと
LPパラメータを、前記MDCT領域信号の対応するフレームに対応付けるマッピングユニットと
を有するオーディオコーディングシステムである。
図1は、本発明によるエンコーダとデコーダの好適な実施の形態を示す。 図2は、本発明によるエンコーダとデコーダのより詳細な図を示す。 図3は、本発明によるエンコーダの別の実施の形態を示す。 図4は、本発明によるエンコーダの好適な実施の形態を示す。 図5は、本発明によるデコーダの好適な実施の形態を示す。 図6は、本発明によるMDCTラインエンコーディングおよびデコーディングの好適な実施の形態を示す。 図7は、本発明によるエンコーダとディコーダと、互いに伝達される関連するコントロールデータの例を示す。 図7aは、本発明の実施の形態によるエンコーダの態様の別の説明である。 図8は、本発明の実施の形態によるウィンドウシーケンスの例とLPCデータとMDCTデータの関係を示す。 図9は、本発明によるスケールファクタデータとLPCデータの組み合わせを示す。 図9aは、本発明によるスケールファクタデータとLPCデータの組み合わせの別の実施の形態を示す。 図9bは、本発明によるエンコーダとデコーダの別の単純化したブロック図を示す。 図10は、本発明によるLPC多項式のMDCTゲインカーブへの変換の好適な実施の形態を示す。 図11は、本発明による、一定更新レートLPCパラメータを適応MDCTウィンドウシーケンスデータにマッピングする好適な実施の形態を示す。 図12は、本発明による、フレームサイズにより量子化器の変換サイズとタイプに基づき知覚重み付けフィルタ計算を適応することの好適な実施の形態を示す。 図13は、本発明による、フレームサイズにより量子化器を適応することの好適な実施の形態を示す。 図14は、本発明による、フレームサイズにより量子化器を適用させることの好適な実施の形態を示す。 図15は、本発明による、LPCおよびLTPデータの関数として量子化ステップサイズを適応させることの好適な実施の形態を示す。 図15aは、差分カーブが差分適応モジュールによりLPCおよびLTPパラメータからどのように導かれるかを示す。 図16は、本発明による、ランダムオフセットを利用するモデルベース量子化器の好適な実施の形態を示す。 図17は、本発明によるモデルベース量子化器の好適な実施の形態を示す。 図17aは、本発明によるモデルベース量子化器の別な好適な実施の形態を示す。 図17bは、本発明の実施の形態によるモデルベースMDCTラインデコーダ2150を模式的に示す。 図17cは、本発明の実施の形態による量子化器プリプロセスの態様を模式的に示す。 図17dは、本発明の実施の形態によるステップサイズ計算の態様を模式的に示す。 図17eは、本発明の実施の形態によるモデルベースエントロピ制約エンコーダを模式的に示す。 図17fは、本発明の実施の形態による均一スカラ量子化器(USQ)の動作を模式的に示す。 図17gは、本発明の実施の形態による確率計算を模式的に示す。 図17hは、本発明の実施の形態による逆量子化プロセスを模式的に示す。 図18は、本発明による、ビットリザーバコントロールの好適な実施の形態を示す。 図18aは、ビットリザーバコントロールの基本的な概念を示す。 図18bは、本発明による、可変フレームサイズ用のビットリザーバコントロールの概念を示す。 図18cは、本発明によるビットリザーバコントロールの例示的コントロールカーブを示す。 図19は、本発明による、異なった復号ポイントを用いる逆量子化器の好適な実施の形態を示す。
<概要>
本発明は、特別に特定の信号用に作られたシステムの品質レベルと同等若しくはより優れた品質レベルで任意のオーディオ信号を効率的にコーディングすることに関する。
本発明は、線形予測コーディング(LPC)とLPC処理された信号上で動作する変換コーダー部との両方を含むオーディオコーデックアルゴリズムに向けられる。
本発明は、さらに変換フレームサイズに依存する量子化方式に関する。さらに、算術符号化援用モデルベースエントロピ制約量子化器が提案される。加えて、均一スカラ量子化器へのランダムオフセットの挿入も提供される。本発明はさらに、算術符号化を援用するモデルベース量子化器、たとえばエントロピ制約量子化器(ECQ)を提案する。
本発明はさらに、LPCデータの存在を利用することによるオーディオエンコーダの変換コーディング部のスケールファクタの効率的なコーディングに関する。
本発明はさらに、種々のフレームサイズを有するオーディオエンコーダのビットリザーバの効率的な使用に関する。
本発明はさらに、オーディオ信号をエンコードしビットストリームを生成するエンコーダと、そのビットストリームをデコードして入力オーディオ信号と知覚的に区別できない復号オーディオ信号を生成するデコーダとに関する。
本発明の第1の態様は、たとえば修正離散コサイン変換(MDCT)を適用する変換エンコーダでの量子化に関する。提案の量子化器は、MDCTラインを量子化するのが好ましい。この態様は、エンコーダがさらに線形予測符号化(LPC)解析あるいは追加の長期間予測(LTP)のどちらを用いるかに無関係に適用できる。
本発明は、適応フィルタに基づいて入力信号をフィルタする線形予測ユニットと;フィルタされた入力信号のフレームを変換領域に変換する変換ユニットと;変換領域信号を量子化する量子化ユニットとを備えるオーディオコーディングシステムを提供する。量子化ユニットは、入力信号特性に基づき、変換領域信号をモデルベース量子化器あるいは非モデルベース量子化器のいずれでエンコードするかを決定する。その決定は変換ユニットで適用されるフレームサイズに基づくのが好ましい。しかし、量子化方式の切り替えも入力信号に依存させる基準も、同様に考えられ、本出願の範囲内である。
本発明の他の重要な態様は、量子化器が適応性を有することである。特に、モデルベース量子化器のモデルは、入力オーディオ信号に順応するように適応する。そのモデルは、たとえば入力信号特性に依存して、時間とともに変化する。このことにより、量子化歪みの低減と、その結果の改良されたコーディング品質が可能となる。
一実施の形態によれば、提案の量子化方式は、フレームサイズが条件となる。量子化ユニットは、変換ユニットにより適用されるフレームサイズに基づいて、変換領域信号をモデルベース量子化器でエンコードするか、非モデルベース量子化器でエンコードするかを決定することが提案される。量子化ユニットは、モデルベースエントロピ制約量子化による閾値より小さなフレームサイズのフレームに対して変換領域信号をエンコードするように構成されるのが好ましい。モデルベース量子化は、種々のパラメータが条件となる。大きなフレームは、たとえばAACコーデックで用いられるような、たとえばハフマンベースエントロピコーディングで、たとえばスカラ量子化器により量子化される。
オーディオコーディングシステムはさらに、フィルタされた入力信号の前回のセグメントの復号に基づき、フィルタされた入力信号のフレームを推定する長期間予測(LTP)ユニットと、変換領域で長期間予測推定と変換された入力信号を組み合わせて量子化ユニットに入力される変換領域信号を生成する変換領域信号組合せユニットとを備えてもよい。
MDCTラインの異なった量子化方法間の切換は、本発明の好適な実施の形態の別の態様である。異なった変換サイズに対して異なった量子化方式を用いることにより、コーデックは、変換領域コーデックと並行または順番に実行される特定の時間領域音声コーダーを有する必要なしに、MDCT領域でのすべての量子化とコーディングを行うことができる。本発明は、LTPゲインがある場合に音声状の信号について、短時間変換とモデルベース量子化器を用いて信号をコーディングするのが好ましいことを教示する。モデルベース量子化器は、特に短時間変換向きで、追って概要を記述するように、MDCT領域で実行されながらも、入力信号が音声信号であるとの要件なしで、時間領域音声専用ベクトル量子化器(VQ)の利益を与える。別の表現では、LTPと組み合わせて短時間変換セグメントにモデルベース量子化器を用いると、専用の時間領域音声コーダーVQの効率は一般性の喪失なしに、MDCT領域から離間することなく維持される。
より安定している音楽信号に加えて、オーディオコーデックで普通に用いられているように比較的大きなサイズの変換と、大きな変換により区別されるまばらなスペクトル線を利用する量子化スキームを用いることが好ましい。したがって、本発明は、長い変換にこの種の量子化スキームを用いることを教示する。
よって、フレームサイズの関数として量子化方式を切り替えることにより、コーデックは、単に変換サイズを選択するだけで、専用音声コーデックの特性と専用オーディオコーデックの特性を両方とも維持できる。このことにより従来技術のシステムのすべての問題を回避でき、従来技術のシステムは、時間領域のコーディング(音声コーダー)を周波数領域のコーディング(オーディオコーダー)と効率的に組み合わせる問題や困難に必然的に遭遇するので、これらのシステムは音声信号とオーディオ信号とを低速度で上手く取り扱おうと努力している。
本発明の他の態様によると、量子化は適応ステップサイズを用いる。好ましくは、変換領域信号の成分に対する量子化ステップサイズ(単数または複数)は、線形予測および/または長期間予測パラメータに基づいて適応する。量子化ステップサイズはさらに、周波数依存するようになされてもよい。本発明の実施の形態では、量子化ステップサイズは、適応フィルタの多項式、コーディングレートコントロールパラメータ、長期間予測ゲイン値、および、入力信号分散の少なくとも一つに基づいて決定される。
好ましくは、量子化ユニットは変換領域信号成分を量子化する均一スカラ量子化器を備える。各スカラ量子化器は、たとえば確率モデルに基づく、均一量子化をMDCTラインに適用する。確率モデルは、ラプラシアンまたはガウシアンモデル、あるいは、信号特性に適切な他の確率モデルでよい。量子化ユニットはさらに、ランダムオフセットを均一スカラ量子化器に挿入してもよい。ランダムオフセットの挿入は、均一スカラ量子化器にベクトル量子化の利点を提供する。実施の形態によれば、ランダムオフセットは、量子化歪みの最適化に基づいて、好ましくは、知覚領域において、および/または、量子化インデックスをエンコードするのに必要なビット数の観点からコストを考慮して、決定する。
量子化ユニットはさらに、均一スカラ量子化器で生成された量子化インデックスをエンコードする算術エンコーダを備えてもよい。このことにより、信号エントロピにより与えられる可能な最低限に近付く低いビットレートが達成される。
量子化ユニットはさらに、全体的歪みをさらに低減するために均一スカラ量子化器から得られる残存量子化信号を量子化する残存量子化器を備えてもよい。残存量子化器は、固定速度ベクトル量子化器であるのが好ましい。
多量子化復号ポイントを、エンコーダの逆量子化ユニットにおいておよび/またはデコーダの逆量子化器で用いてもよい。たとえば、最小平均二乗誤差(MMSE)および/または中央ポイント(中点)復号ポイントを用いて、量子化値の量子化インデックスに基づいて量子化値を復号してもよい。量子化復号ポイントはさらに、中央ポイントとMMSEポイントの間の動的内挿に基づいてもよく、そのデータの特徴によりコントロールされる可能性もある。このことにより、低ビットレートについてMDCTラインをゼロ量子化ビンに割り当てることによるノイズの挿入をコントロールしたりスペクトルホールを回避したりすることができる。
特定周波数成分に異なった重みを与えるために量子化歪みを決定するときに変換領域における知覚重み付けを適用するのが好ましい。知覚重みは線形予測パラメータから効率的に導かれる。
本発明の滅の独立した態様は、LPCおよびSCF(スケールファクタ)データの共存を利用する一般的な概念に関する。たとえば修正離散化コサイン変換(MDCT)を適用する変換ベースのエンコーダでは、スケールファクタを量子化に用いて量子化ステップサイズをコントロールしてもよい。従来技術では、このようなスケールファクタは、オリジナル信号から推定されてマスキングカーブを決定する。ここではスケールファクタの第2のセットを知覚フィルタまたはLPCデータから算定する心理音響モデルの助けにより推定することが提案される。このことにより、真のスケールファクタを伝達/保存する代わりに、実際に適用されるスケールファクタのLPC推定スケールファクタに対する差だけを伝達/保存することで、スケールファクタを伝達/保存するためのコストを低減できる。よって、たとえばLPCのような音声コーディング要素と、たとえばMDCTのような変換コーディング要素とを含むオーディオコーディングシステムにおいて、本発明は、LPCにより提供されるデータを利用することによりコーデックの変換コーディング部に必要なスケールファクタ情報を伝達するコストを低減する。この態様は、提案するオーディオコーディングシステムの他の態様からは独立し、他のオーディオコーディングシステムでも同様に実行できるということは重要である。
たとえば、知覚マスキングカーブは適応フィルタのパラメータに基づいて推定される。線形予測ベースのスケールファクタの第2のセットは、推定知覚マスキングカーブに基づいて決定される。そして、保存/伝達されたスケールファクタ情報が、量子化で実際に用いられたスケールファクタとLPCベースの知覚マスキングカーブから算定されたスケールファクタの間の差に基づいて決定される。このことにより、スケールファクタを保存/伝達するのにより少ないビットが必要となるように、保存/伝達した情報から強弱や尤度を除去する。
LPCとMDCTが同じフレーム速度で作動しない場合、すなわち、異なったフレームサイズを有する場合、変換領域信号のフレームに対する線形予測ベースのスケールファクタは、MDCTフレームでカバーされた時間ウィンドウに対応するように内挿された線形予測パラメータに基づいて推定される。
したがって本発明は、変換コーダーに基づき、音声コーダーからの基本的予測と成形モジュールを含むオーディオコーディングシステムを提供する。発明性のあるシステムは、適応フィルタに基づいて入力信号をフィルタする線形予測ユニットと;フィルタされた入力信号のフレームを変換領域に変換する変換ユニットと;変換領域信号を量子化する量子化ユニットと;マスキング閾値カーブに基づいて、変換領域信号を量子化するときに量子化ユニットで用いられるスケールファクタを生成するスケールファクタ決定ユニットと;適応フィルタのパラメータに基づいて線形予測ベースのスケールファクタを推定する線形予測スケールファクタ推定ユニットと;マスキング閾値カーブベースのスケールファクタと線形予測ベースのスケールファクタの差をエンコーディングするスケールファクタエンコーダとを備える。適用されたスケールファクタと利用できる線形予測情報に基づいてデコーダで決定されるスケールファクタとの差をエンコーディングすることにより、コーディングと保存の効率は改善され、保存/伝達するのにほんの数ビットだけが必要となる。
本発明のもう一つの独立したエンコーダ特有の態様は、可変のフレームサイズを処理するビットリザーバに関する。可変長のフレームをコーディングできるオーディオコーディングシステムでは、ビットリザーバはフレーム中のビットを分配することによりコントロールされる。個々のフレームや定義されたサイズのビットリザーバの適当な困難さの尺度が与えられると、所望の一定のビットレートからのあるずれはビットリザーバのサイズにより課せられるバッファの要求に反することなく全体的によりよい品質を可能にする。本発明は、ビットリザーバを使用する概念を、可変フレームサイズの汎用オーディオコーデック用ビットリザーバコントロールに拡張する。したがって、オーディオコーディングシステムは、フレーム長とフレームの困難さの尺度に基づいてフィルタされた信号のフレームをエンコードするのに付与されたビットの数を決定するビットリザーバコントロールユニットを備える。好ましくは、ビットリザーバコントロールユニットは、異なったフレーム困難さの尺度および/または異なったフレームサイズ用の別々のコントロール式を有する。異なったフレームサイズに対する異なった尺度は、それらがより簡単に比較できるように正規化される。可変レートのエンコーダ用にビット配分をコントロールするために、ビットリザーバコントロールユニットは、許容最大フレームサイズに対するビットの平均数に対し付与されたビットコントロールアルゴリズムの許容下限界を設定するのが好適である。
本発明のさらなる局面は、モデルベース量子化器、たとえばエントロピ制約量子化器(ECQ)を用いるエンコーダのビットリザーバの取り扱いに関する。ECQのステップサイズの変動を最小化することが示される。量子化器ステップサイズをECQレートに関係付ける特定のコントロール式が示される。
入力信号をフィルタする適応フィルタは、線形予測コーディング(LPC)解析に基づくのが好ましく、白色化した入力信号を生成するLPCフィルタを含む。入力データの現在のフレームのLPCパラメータは、当該技術で公知のアルゴリズムで決定される。LPCパラメータ予測ユニットは、入力データのフレームに対し、多項式、伝達関数、反射係数、線スペクトル周波数等のような適当なLPCパラメータ表現のいずれかを計算する。コーディングや他の処理に用いられるLPCパラメータ表現の特定のタイプは、それぞれの要求に依存する。当業者には周知のように、表現によっては他の操作よりも特定の操作により適し、よって、そのような操作を実行するのに好ましい。線形予測ユニットはたとえば20ミリ秒に固定された第1のフレーム長で動作する。線形予測フィルタは、さらにゆがめた周波数軸上でも動作して、特定の周波数範囲、たとえば低周波数を他の周波数より、選択的に強調する。
フィルタされた入力信号のフレームに適用される変換は、可変の第2のフレーム長で動作する修正離散コサイン変換(MDCT)であるのが好ましい。オーディオコーディングシステムは、いくつかのフレームを含む入力信号ブロック全体の、コーディングコスト関数、好ましくは単純化知覚エントロピを最小化することにより、入力信号のブロックに対し、オーバーラップするMDCTウィンドウのフレーム長を決定するウィンドウシーケンスコントロールユニットを備える。よって、第2のフレーム長を有するMDCTウィンドウへの入力信号ブロックの最適な分割が導かれる。対照的に、変換領域コーディング構造は、音声コーダー要素を含み、LPCを除くすべての処理で唯一の基本ユニットとして適応長MDCTフレームを有して提案される。MDCTフレーム長は多くの様々な値を取り得るので、小さなウィンドウサイズと大きなウィンドウサイズとだけが適用される先行技術で一般的なように、最適なシーケンスが見つけられ、急激なフレームサイズの変化を避けることができる。さらに、小さなウィンドウサイズと大きなウィンドウサイズの間の遷移に対する従来技術のアプローチで用いられるところの、シャープなエッジを有する遷移変換ウィンドウは必要ではない。
好ましくは、最大で2の係数である連続的なMDCTウィンドウ長の変化および/またはMDCTウィンドウ長は、二項値である。より具体的には、MDCTウィンドウ長は、入力信号ブロックの二項区分である。したがって、MDCTウィンドウのシーケンスは、少ない数のビットでエンコードするのが容易な所定のシーケンスに限られる。さらにウィンドウシーケンスはフレームサイズの滑らかな遷移を有し、よって、急激なフレームサイズの変化を除外する。
ウィンドウシーケンスコントロールユニットは、さらに、入力信号ブロックのコーディングコスト関数を最小化するMDCTウィンドウ長のシーケンスを探すときに、ウィンドウ長の候補について、長期間予測ユニットにより生成された長期間予測推定を考慮するようになされている。この実施の形態では、エンコーディングに用いられるMDCTウィンドウの改良したシーケンスとなるMDCTウィンドウ長を決定するときに長期間予測ループは閉じられる。
オーディオコーディングシステムはさらに、線スペクトル周波数または、保存および/またはデコーダに伝達するための線形予測ユニットにより生成された他の適切なLPCパラメータ表現を、可変レートで再帰的にコーディングするためのLPCエンコーダを備えてもよい。実施の形態によれば、線形予測内挿ユニットが提供され、変換領域信号の可変フレーム長に適合するように第1のフレーム長に対応するレートで生成された線形予測パラメータを内挿する。
本発明の態様によれば、オーディオコーディングシステムは、LPCフレーム用に線形予測ユニットで生成されたLPC多項式をチャープおよび/または傾斜させることにより適応フィルタの特性を修正する知覚モデリングユニットを備えてもよい。適応フィルタ特性の修正により受信した知覚モデルは、本システムで多くの目的に用いられる。たとえば、量子化または長期間予測の知覚重み関数として用いられる。
本発明のもう一つの態様は、長期間予測(LTP)、具体的にはMDCT領域、MDCTフレーム採用LTPおよびMDCT重みつきLTP検索における長期間予測に関する。このような態様は、LPC解析が変換コーダーの上流に存在するか否かに関わらず、適用される。
実施の形態によれば、オーディオコーディングシステムは、フィルタされた入力信号のフレームの時間領域の復号を生成する逆量子化逆変換ユニットをさらに備える。さらに、フィルタされた入力信号の前回のフレームの時間領域復号を保存する長期間予測バッファが提供されてもよい。これらのユニットは量子化ユニットから長期間予測抽出ユニットへのフィードバックループに配列され、長期間予測抽出ユニットは長期間予測バッファでフィルタされた入力信号の現在のフレームに最も適合する復号セグメントを検索する。さらに、長期間予測ゲイン推定ユニットが提供され、長時間予測バッファから選定されたセグメントのゲインを、現在のフレームに最も適合するように調整してもよい。好ましくは、長期間予測推定は、変換領域の変換された入力信号から取り去られてもよい。したがって、選定されたセグメントを変換領域に変換する第2の変換ユニットが提供される。長期間予測ループはさらに、変換領域の長期間予測推定を逆量子化後で時間領域への逆変換前のフィードバック信号に加えることを含んでもよい。よって、後退適応長期間予測スキームを用いて、変換領域で前回のフレームに基づいてフィルタされた入力信号の現在のフレームを予測してもよい。より効率的にするため、長期間予測スキームを、いくつかの例につき以下に記載するように、異なった方法で適応させてもよい。
実施の形態によれば、長期間予測ユニットは、フィルタされた信号の現在のフレームに最も適合するフィルタされた信号の復号セグメントを特定する遅延値を決定する長期間予測エクストラクタを備える。長期間予測ゲインエスティメータは、フィルタされた信号の選定したセグメントの信号に適用するゲイン値を推定する。好ましくは、遅延値とゲイン値は、知覚領域において長期間予測推定の変換された入力信号に体する差に関係する歪みのクライテリアを最小にするように決定される。歪みのクライテリアを最小にするとき、修正線形予測多項式をMDCT領域同等化ゲイン曲線として適用することもできる。
長期間予測ユニットは、LTPバッファからのセグメントの復号信号を変換領域に変換する変換ユニットを備えてもよい。MDCT変換の効果的な実行のため、変換は離散コサイン変換タイプIVとするのが好ましい。
本発明の別の態様は、上記の実施の形態のエンコーダで生成されたビットストリームをデコーディングするオーディオデコーダに関する。実施の形態によるデコーダは、スケールファクタに基づいて入力ビットストリームのフレームを逆量子化する逆量子化ユニットと;変換領域信号を逆に変換する逆変換ユニットと;逆変換された変換領域信号にフィルタを掛ける線形予測ユニットと;エンコーダで適用されるスケールファクタと適応フィルタのパラメータに基づいて生成されるスケールファクタとの差をエンコードする、受信したスケールファクタ差分情報に基づいて逆量子化で用いられるスケールファクタを生成するスケールファクタデコーディングユニットとを備える。デコーダは、現在のフレームに対し線形予測パラメータから導かれたマスキング閾値カーブに基づいてスケールファクタを生成するスケールファクタ決定ユニットをさらに備えてもよい。スケールファクタデコーディングユニットは、受信したスケールファクタ差分情報と生成した線形予測に基づくスケールファクタとを組み合わせ、逆量子化ユニットに入力するスケールファクタを生成する。
別の実施の形態によるデコーダは、入力ビットストリームのフレームを逆量子化するモデルベース逆量子化ユニットと;変換領域信号を逆に変換する逆変換ユニットと;逆に変換された変換領域信号にフィルタを掛ける線形予測ユニットとを備える。逆量子化ユニットは、非モデルベースの逆量子化器とモデルベースの逆量子化器とを備える。
好ましくは、逆量子化ユニットは、少なくとも1つの適応確率モデルを備える。逆量子化ユニットは、伝達された信号特性の関数として逆量子化を適応させるように構成されてもよい。
逆量子化ユニットは、デコードされたフレームについてコントロールデータに基づき逆量子化方式を決定してもよい。好ましくは、逆量子化コントロールデータは、ビットストリームと一緒に受信され、または、受信データから導かれる。たとえば、逆量子化ユニットはフレームの変換サイズに基づいて逆量子化方式を決定する。
別の態様によれば、逆量子化ユニットは適応復号ポイントを備える。逆量子化ユニットは、量子化区間ごとに2つの逆量子化復号ポイントを、特に中間ポイントとMMSE復号ポイントを用いるように構成された均一スカラ逆量子化器を備えてもよい。
実施の形態によれば、逆量子化ユニットは、算術符号化と組み合わせてモデルベース量子化器を用いる。
さらに、デコーダはエンコーダに関して上記に説明した多くの態様を備えてもよい。一般的に、いくつかの操作はエンコーダだけで行われデコーダに対応する要素を有していないが、デコーダは、エンコーダの操作を映し出す。よって、エンコーダに関して開示されたものは、特に断らない限り、デコーダでも同様に使えるものとみなされる。
本発明の上記の態様は、デバイス、装置、方法またはプログラム可能なデバイスで動作するコンピュータプログラムとして実施される。発明性のある態様はさらに、信号、データ構成およびビットストリームで具体化されてもよい。
よって、本出願はさらに、オーディオエンコーディング方法とオーディオデコーディング方法とを開示する。例示のオーディオエンコーディング方法は、適応フィルタに基づいて入力信号にフィルタを掛ける工程と;フィルタされた入力信号のフレームを変換領域に変換する工程と;変換領域信号を量子化する工程と;マスキング閾値カーブに基づいて、変換領域信号を量子化するときに量子化ユニットで用いるスケールファクタを生成する工程と;適応フィルタのパラメータに基づいて線形予測ベースのスケールファクタを推定する工程と;マスキング閾値カーブベースのスケールファクタと線形予測ベースのスケールファクタとの差をエンコーディングする工程とを備える。
別のオーディオエンコーディング方法は、適応フィルタに基づいて入力信号にフィルタを掛ける工程と;フィルタされた入力信号のフレームを変換領域に変換する工程と;変換領域信号を量子化する工程とを備え;量子化ユニットは、入力信号特性に基づいて、変換領域信号をマスキング閾値カーブに基づいて、変換領域信号をモデルベース量子化器でエンコードするか、非モデルベース量子化器でエンコードするかを決定する。
例示のオーディオデコーディング方法は、スケールファクタに基づいて入力ビットストリームのフレームを逆量子化する工程と;変換領域信号を逆に変換する工程と;逆に変換された変換領域信号に線形予測フィルタを掛ける工程と;適応フィルタのパラメータに基づいて第2のスケールファクタを推定する工程と;受信したスケールファクタの差の情報と推定した第2のスケールファクタに基づいて逆量子化で用いるスケールファクタを生成する工程とを備える。
別のオーディオエンコーディング方法は、入力ビットストリームのフレームを逆量子化する工程と;変換領域信号を逆に変換する工程と;逆に変換された変換領域信号に線形予測フィルタを掛ける工程とを備え;逆量子化は非モデルベース量子化器とモデルベース量子化器を用いる。
本願にて教示され、また、当業者が例示の実施の形態の以下の説明から導き出せるのは、好適なオーディオエンコーディング/デコーディング方法とコンピュータプログラムのほんの一例である。
本発明をここで、添付図面を参照して例を用いて説明するが、本発明の範囲や思想を限定するものではない。
<詳細な説明>
下記に説明する実施の形態は、オーディオエンコーダとデコーダの本発明の原理を単に説明するためのものである。ここで説明する配置や詳細の修正や改変は当業者にとって明きらかであることが理解される。したがって、添付の特許請求の範囲の範囲によってのみ限定され、本書における実施の形態の説明によって示された特定の詳細によっては限定されないことを意図する。実施の形態の類似の要素には類似の参照符号で番号付けされる。
図1にエンコーダ101とデコーダ102を示す。エンコーダ101は時間領域入力信号を取り込み、続いてデコーダ102に送られるビットストリーム103を生成する。デコーダ102は、受信したビットストリーム103に基づいて出力波形を生成する。出力信号は、心理音響的にオリジナルの入力信号に類似する。
図2にエンコーダ200とデコーダ210の好適な実施の形態を示す。エンコーダ200の入力信号は、第1のフレーム長を有するLPCフレーム用の白色化した残留信号と対応する線形予測パラメータとを生成するLPC(Linear Prediction Coding:線形予測コーディング)モジュール201を通過する。さらに、LPCモジュール201にはゲイン正規化が含まれる。LPCからの残留信号は、第2の可変フレーム長で動作するMDCT(Modified Discrete Cosine Transform:修正離散コサイン変換)モジュール202によって周波数領域に変換される。図2に示すエンコーダ200では、LTP(Long Term Prediction:長期間予測)モジュール205が含まれる。LTPは、本発明の他の実施の形態で詳述する。MDCTラインは量子化203され、デコーダ210で使えるようにデコーディングされた出力のコピーをLTPバッファに提供するように逆量子化204もされる。量子化歪みのために、このコピーはそれぞれの入力信号の復号と呼ばれる。図2の下部にデコーダ210を示す。デコーダ210は、量子化されたMDCTラインを受け取り、それらを逆量子化211し、LTPモジュール214からの寄与を付加し、逆MDCT変換212をして、LPC合成フィルタ213が続く。
上記の実施の形態で重要な態様は、LPCがそれ自身の(一実施の形態では一定の)フレームサイズを有しLPCパラメータもコーディングされるものの、MDCTフレームがコーディング用の唯一の基本ユニットであるということである。実施の形態は、変換コーダーから始まり、音声コーダーから基本的予測および成形モジュールを導入する。追って説明するように、MDCTフレームサイズは可変であり、単純化知覚エントロピコスト関数を最小化することによりブロック全体に対する最適MDCTウィンドウシーケンスを決定することにより入力信号のブロックに適応する。このことにより、スケーリングが最適な時間/周波数コントロールを維持できる。さらに、提案の一体化した構造は、異なったコーディングパラダイムの切替えや層をなすことによる組合せを回避する。
図3では、エンコーダ300の部分がより詳細に模式的に説明される。図2のエンコーダのLPCモジュール201からの出力である白色化された信号は、MDCTのフィルタバンク302に入力される。MDCT分析は、オプションとして時間ゆがみMDCT分析でもよく、時間ゆがみMDCT分析は、信号のピッチ(信号がよく確立されたピッチで周期的なら)がMDCT変換ウィンドウで一定であることを確かなものにする。
図3では、LTPモジュール310がより詳細に示される。LTPモジュール310は、前回の出力信号のセグメントの復号された時間領域サンプルを保持するLTPバッファ311を備える。LTPエクストラクタ312は、現在の入力セグメントを与えられてLTPバッファ311中に最も適合するセグメントを見つけ出す。量子化器303に入力されようとしているセグメントから抽出される前に、ゲインユニット313によりこのセグメントに適切なゲイン値が適用される。明らかに、量子化の前に抽出するために、LTPエクストラクタ312はまた選択された信号セグメントをMDCT領域に変換する。LTPエクストラクタ312は、復号された前回の出力信号セグメントを変換されたMDCT領域入力フレームと組み合わせるときに知覚領域の誤差関数を最小化する最適なゲインと遅延値を探す。たとえば、LTPモジュール310からの変換された復号セグメントと変換された入力フレーム(すなわち、抽出後の残留信号)との間の平均二乗誤差(MSE)関数が最適化される。この最適化は、周波数成分(すなわちMDCTライン)が知覚重要性に応じて重み付けされる知覚領域で実行される。LTPモジュール310はMDCTフレームユニットで動作し、エンコーダ300は、たとえば量子化モジュール303における量子化について、一度に一つのMDCTフレーム残留を扱う。遅延とゲイン探索は、知覚領域で実行される。オプションとして、LTPは、周波数選択的、すなわち周波数にわたりゲインおよび/または遅延を適応させてもよい。逆量子化ユニット304と逆MDCTユニット306を説明する。MDCTは、追って説明するように、時間で歪んでいる。
図4にエンコーダ400の別の実施の形態を示す。図3に加え、分かりやすくするためLPC分析401が含まれる。選択された信号セグメントをMDCT領域に変換するのに用いられるDCT−IV変換414が示される。さらに、LTPセグメント選定の最小誤差を計算するいくつかの方法が図示される。図4に示される残留信号の最小化(図4でLTP2とされる)に加え、LTPバッファ411での保管のために復号した時間領域信号に逆変換される前に変換入力信号と逆量子化MDCT領域信号との間の差の最小化が示される(LTP3とされる)。このMSE関数の最小化は、LTPの寄与を変換された入力信号とLTPバッファ411に保管するための復号された入力信号との最適な(可能な限り)類似性に仕向ける。他の代替となる誤差関数(LTP1とされる)は、時間領域でのこれらの信号の差に基づく。この場合に、LPCフィルタを掛けられた入力フレームとLTPバッファ411の対応する時間領域復号とのMSEは最小化される。好都合なことにMSEはMDCTフレームサイズに基づいて計算され、MDCTフレームサイズはLPCフレームサイズと異なっていてもよい。さらに、量子化器ブロックと逆量子化器ブロックは、量子化とは別の追加のモジュールを含むスペクトルエンコーディングブロック403とスペクトルデコーディングブロック404(「Spec enc」と「Spec dec」)で置き換えられ、図6にて追って説明する。また、MDCTと逆MDCTは時間歪みを受ける(WMDCT、IWMDCT)。
図5に、提案するデコーダ500を示す。受信したビットストリームからのスペクトルデータは、逆量子化511され、LTPエクストラクタによりLTPバッファ515から提供されたLTP寄与に加えられる。デコーダ500のLTPエクストラクタ516およびLTPゲインユニット517も示される。合計されたMDCTラインは、MDCT合成ブロックにより時間領域に合成され、時間領域信号は、LPC合成フィルタ513によりスペクトルとして形成される。
図6に、図4の「Spec enc」(スペクトルエンコーディング)ブロック403と「Spec dec」(スペクトルデコーディング)ブロック404をより詳細に示す。図の右に示すスペクトルエンコーディングブロック603は、実施の形態では、高調波予測分析モジュール610、TNS(Temporal Noise Shaping:時間ノイズ形成)分析モジュール611、その後にMDCTラインのスケールファクタスケーリングモジュール612、および、最後にエンコーディングラインモジュール613の量子化とエンコーディングとを備える。図で左に示されるデコーダ「Spec dec」(スペクトルデコーディング)ブロック604は、逆プロセスを行い、すなわち、受信したMDCTラインはデコーディングラインモジュール620で逆量子化され、スケーリングはスケールファクタ(SCF)スケーリングモジュール621によってなされてはいない。TNS合成622と高調波予測合成623が適用される。
図7に、発明性のあるコーディングシステムのとても一般的な図を示す。例示のエンコーダは、入力信号を受け取り、特に次のデータを含む、ビットストリームを生成する。
・量子化されたMDCTライン
・スケールファクタ
・LPC多項式表現
・信号セグメントエネルギ(たとえば、信号分散)
・ウィンドウシーケンス
・LTPデータ
実施の形態によるデコーダは、提供されたビットストリームを読み、オリジナル信号を心理音響的に表すオーディオ出力信号を生成する。
図7aは、本発明の実施の形態によるエンコーダ700の態様の別の図である。エンコーダ700は、LPCモジュール701、MDCTモジュール702、LTPモジュール705(簡単化して示すのみ)、量子化モジュール703、および、復号した信号をLTPモジュール705に戻す逆量子化モジュール704を備える。入力信号のピッチを推定するピッチ推定モジュール750と、入力信号の比較的大きなブロック(たとえば1秒)用に最適なMDCTウィンドウシーケンスを決定するウィンドウシーケンス決定モジュール751をさらに備える。この実施の形態では、MDCTウィンドウシーケンスは開ループアプローチに基づいて決定され、開ループアプローチでは、たとえば単純化知覚エントロピであるコーディングコスト関数を最小化するMDCTウィンドウサイズ候補のシーケンスが決定される。ウィンドウシーケンス決定モジュール751で最小化されたコーディングコスト関数に対するLTPモジュール705の寄与は、最適MDCTウィンドウシーケンスを探すときにオプションとして考慮されてもよい。好ましくは、評価された各ウィンドウサイズ候補について、ウィンドウサイズ候補に対応するMDCTフレームへの最適な長期間予測寄与を決定し、各コーディングコストが推定される。一般的に、短いMDCTフレームサイズは音声入力により適するが、詳細なスペクトル分解能を有する長い変換ウィンドウはオーディオ信号に適する。
知覚重み付けあるいは知覚重み付け関数は、LPCモジュール701で計算されたLPCパラメータに基づいて決定され、以下に詳細に説明される。知覚重み付けは、LTPモジュール705と量子化モジュール703に提供され、共にMDCT領域で動作し、それぞれの知覚重要性に応じて周波数成分の誤差または歪み寄与を重み付けする。図7aは、どのコーディングパラメータがデコーダに、好ましくは追って説明するような適切なコーディングスキームにより、伝達されるかを示す。
次に、共に反作用と実際のフィルタの省略のためであるが、LPCおよびMDCTデータの共存とMDCTでのLPCの効果のエミュレーションを説明する。
実施の形態によれば、LPモジュールは、信号のスペクトル形状を除去し、そして、続くLPモジュールの出力がスペクトル的にフラットな信号となるように、入力信号にフィルタを掛ける。このことは、たとえばLTPの動作に利点を有する。しかし、スペクトル的にフラットな信号に動作するコーデックの他の部分は、LPフィルタの前のオリジナル信号のスペクトル形状がどんなものであったのかを知ることにより利益を得る。フィルタの後のエンコーダモジュールはスペクトル的にフラットな信号のMDCT変換に動作するので、必要ならば、本発明はLPフィルタの前のオリジナル信号のスペクトル形状を、ゲインカーブすなわち量子化カーブに使用したLPフィルタの変換関数(すなわち、オリジナル信号のスペクトル包絡線)でマッピングすることによりスペクトル的にフラットな信号のMDCT表現に再度掛け、変換関数はスペクトル的にフラットな信号のMDCT表現の周波数ビンに適用されることを教示する。反対に、LPモジュールは、実際のフィルタを省略し、変換関数を推定するだけでよく、変換関数は次にゲインカーブにマッピングされ、ゲインカーブは信号のMDCT表現に掛けられ、よって入力信号の時間領域フィルタの必要性をなくする。
本発明の実施の形態の一つの顕著な態様は、MDCTベースの変換コーダーが、フレキシブルなウィンドウセグメント分けを用いてLPC白色化信号で動作することである。このことは図8に示され、図8では例示のMDCTウィンドウシーケンスが、LPCのウィンドウ化と一緒に示される。したがって、図から明らかなように、LPCは一定のフレームサイズ(たとえば20ミリ秒)で動作するが、MDCTは可変ウィンドウシーケンス(たとえば、4〜128ミリ秒)で動作する。このことにより、独立してLPCに対する最適なウィンドウ長とMDCTに対する最適なウィンドウシーケンスとが選定できる。
図8は、第1のフレームレートで生成されたLPCデータ、特にLPCパラメータと、第2の可変レートで生成されたMDCTデータ、特にMDCTラインとの関係を更に示す。図中、下向き矢印は、対応するMDCTフレームに適合するようにLPCフレーム(サークル)間に挿入されるLPCデータを表す。たとえば、LPCで生成された知覚重み付け関数は、MDCTウィンドウシーケンスで決められる時間インスタンスに挿入される。
上向き矢印は、MDCTラインコーディングに用いられる改良データ(すなわちコントロールデータ)を表す。AACについてこのデータは典型的にスケールファクタであり、ECQフレームについてそのデータは典型的に分散補正データなどである。実線対破線は、ある量子化器に与えられたMDCTラインコーディング用の最も「重要な」データがどちらのデータであるかを表す。二重の下向き矢印は、コーデックスペクトルラインを表す。
エンコーダでのLPCとMDCTデータの共存は、たとえば、LPCパラメータから推定した知覚マスキングカーブを考慮することによりMDCTスケールファクタをエンコーディングすることのビット要求を低減するのに利用される。さらに、量子化歪みを決定するのにLPC由来知覚重み付けを用いてもよい。図示され以下に説明されるように、量子化器は2つのモードで作動し、受信したデータのフレームサイズに基づき、すなわちMDCTフレームやウィンドウサイズに対応して、2つのタイプのフレーム(ECQフレームとAACフレーム)を生成する。
図11は一定レートLPCパラメータを適応MDCTウィンドウシーケンスデータにマッピングする好適な実施の形態を示す。LPCマッピングモジュール1100は、LPC更新レートにしたがったLPCパラメータを受信する。さらに、LPCマッピングモジュール1100はMDCTウィンドウシーケンスに関する情報を受信する。そして、たとえば、可変MDCTフレームレートで生成されるそれぞれのMDCTフレームにLPCベースの心理音響データをマッピングするのに、LPC−MDCTマッピングを生成する。たとえば、LPCマッピングモジュールは、たとえばLTPモジュールまたは量子化器の知覚重みのように使うために、LPC多項式あるいはMDCTフレームに対応する時間インスタンスの関連データを内挿する。
ここで、図9を参照してLPCベースの知覚モデルの特徴について説明する。LPCモジュール901を本発明の実施の形態では、たとえば16kHzのサンプリングレート信号用命令16の線形予測を用いて白色化出力信号を生成するように適応する。たとえば、図2のLPCモジュール201からの出力は、LPCパラメータ推定とフィルタ掛けの後に残留物となる。図9の左下に模式的に示される、推定したLPC多項式A(z)は、バンド幅拡張係数によりチャープされ、本発明の実施によっては傾けられ、対応するLPC多項式の第1の反射率を修正する。チャープは、多項式の極を内側にユニットサークルへ移動することによりLPC伝達関数のピークのバンド幅を拡張し、その結果柔らかなピークとする。傾けることにより、低周波数と高周波数の影響をバランスするためにLPC伝達関数をより平らにすることができる。このような修正は、システムのエンコーダとデコーダの両側で利用可能な推定したLPCパラメータから知覚マスキングカーブA’(z)を生成することを目的とする。LPC多項式の操作の詳細は、以下の図12に示す。
LPC残留に動作するMDCTコーディングは、本発明の一実施においては、量子化器の分解能あるいは量子化ステップサイズ(および、量子化により導入されるノイズ)をコントロールするスケールファクタを有する。このようなスケールファクタは、オリジナルの入力信号についてスケールファクタ推定モジュール960により推定される。たとえば、スケールファクタはオリジナル信号から推定された知覚マスキング閾値カーブから導かれる。実施の形態では、分割周波数変換(異なった周波数分解能を恐らく有する)を用いてマスキング閾値カーブを決定してもよいが、このことは常に必要なわけではない。あるいは、マスキング閾値カーブは変換モジュールにより生成されたMDCTラインから推定されてもよい。図9の右下部分は、スケールファクタ推定モジュール960により生成された、導入される量子化ノイズが不可聴歪みに制限されるように量子化をコントロールするスケールファクタを図示する。
LPCフィルタがMDCT変換モジュールの上流に接続されると、白色化信号はMDCT領域に変換される。この信号は白色スペクトルを有するので、知覚マスキングカーブを導くのには適さない。よって、マスキング閾値カーブおよび/またはスケールファクタを推定するには、スペクトルの白色化を相殺するのに生成されたMDCT領域量子化ゲインカーブを用いる。これは、知覚マスキングを正確に推定するためには、スケールファクタは、オリジナル信号の完全なスペクトル特性を有する信号で推定する必要があるからである。LPC多項式からのMDCT領域量子化ゲインカーブの計算は、以下に図10を参照して詳細に説明する。
上記に概要を示したスケールファクタ推定の実施の形態が図9aに示される。この実施の形態では、入力信号は、A(Z)により説明される入力信号のスペクトル包絡線を推定し、入力信号にフィルタを掛けたものに加えて前記の多項式を出力するLPモジュール901に入力される。入力信号は、続いてエンコーダの別の部分で使用されるスペクトル的に白色化された信号を得るために、A(Z)の逆数でフィルタを掛けられる。フィルタされた信号
Figure 0005624192
は、MDCT変換ユニット902に入力され、A(Z)多項式はMDCTゲインカーブ計算ユニット970(図14に示す)に入力される。LP多項式から推定されるゲインカーブは、スケールファクタ推定の前にオリジナル入力信号のスペクトル包絡線を維持するようにMDCT係数またはラインに適用される。ゲインを調整されたMDCTラインは、入力信号のスケールファクタを推定するスケールファクタ推定モジュール960に入力される。
上記に概略を説明したアプローチを用いると、エンコーダとデコーダ間で伝達されたデータは、モデルベース量子化器を用いると信号モデルと共に関連した知覚情報も導き出されるLP多項式と、変換コーデックで一般的に用いられるスケールファクタとの両方を含む。
更に詳細には、図9に戻って、図中のLPCモジュール901は入力信号から信号のスペクトル包絡線A(z)を推定し、それから知覚表現A’(z)を導き出す。さらに、変換ベースの知覚オーディオコーデックで通常用いられるスケールファクタが入力信号について推定され、または、スケールファクタ推定でLPフィルタの変換関数が考慮されるならば(以下に図10の関係で説明されるように)、スケールファクタは、LPフィルタで作られた白色化信号について推定される。それからスケールファクタは、以下に簡単に説明するように、スケールファクタを伝達するのに必要なビットレートを低減するために、LP多項式を与えられたスケールファクタ適応モジュール961で適応される。
通常、スケールファクタはデコーダに伝達され、LP多項式もデコーダに伝達される。ここで、それらはオリジナル入力信号から推定され、共にオリジナル入力信号の絶対スペクトル特性に多少相関を有するとすると、それらが別々に伝達されると生ずる冗長性を除去するために、それら2つの間の差分表現をコーディングすることが提案される。実施の形態によれば、この相関は以下のように利用される。LPC多項式は正しくチャープされ傾けられたときにマスキング閾値カーブを表そうとするので、伝達された変換コーダーのスケールファクタが所望のスケールファクタと変換されたLPC多項式から導かれるものとの間の差を表現するように2つの表現が組み合わされる。したがって、図9に示されるスケールファクタ適応モジュール961は、オリジナル入力信号から生成された所望のスケールファクタとLPC由来のスケールファクタとの差を計算する。この態様は、LPC構造内で、変換コーダーで一般的に用いられるスケールファクタの概念を有するMDCTベースの量子化器がLPC残留に作用する能力を維持し、さらに線形予測データからのみ量子化ステップサイズを導くモデルベース量子化器に切り替える可能性も有する。
図9bには、実施の形態によるエンコーダとデコーダの単純化したブロック図を示す。エンコーダの入力信号は白色化残留信号と対応する線形予測パラメータを生成するLPCモジュール901を通過する。さらに、LPCモジュール901にはゲイン正規化が含まれる。LPCからの残留信号はMDCT変換902で周波数領域に変換される。図9bの右に向かって、デコーダが描かれる。デコーダは量子化されたMDCTラインを受け取り、それらを逆量子化911し、逆MDCT変換を適用912し、LPC合成フィルタ913が続く。
図9bのエンコーダのLPCモジュール901から出力される白色化信号は、MDCTフィルタバンク902に入力される。MDCT分析の結果としてMDCTラインは、MDCTスペクトルの異なった部分についての所望の量子化ステップサイズを導く知覚モデルからなる変換コーディングアルゴリズムで変換コーディングされる。量子化ステップサイズを決定する値は、スケールファクタと呼ばれ、スケールファクタバンドと呼ばれる各区分に必要な1つのスケールファクタ値があり、スケールファクタはビットストリームを介してデコーダに伝達される。
本発明の一態様によれば、図9を参照して説明したように、LPCパラメータから推定された知覚マスキングカーブを、量子化で用いるスケールファクタをエンコーディングするときに用いる。知覚マスキングカーブを推定するもう一つの可能性は、MDCTラインにわたるエネルギ分布の推定に未修正のLPCフィルタ係数を用いることである。このエネルギ推定により、変換コーディングスキームで用いる心理音響モデルがエンコーダとデコーダの両方で適用され、マスキングカーブの推定が求められる。
その後、マスキングカーブの2つの表現は組み合わされ、変換コーダーの伝達されるスケールファクタが、所望のスケールファクタと伝達されたLPC多項式またはLPCベースの心理音響モデルに由来するスケールファクタとの差を表わすようにされる。この特徴は、変換コーダーで普通に用いられるスケールファクタの概念を有するMDCTベースの量子化器を有する能力を維持する。利点は、スケールファクタの差を伝達することは、既に存在するLPCデータを考慮することなく完全なスケールファクタ値を伝達することと比べて用いるビット数が少ないということである。ビットレート、フレームサイズまたは他のパラメータに依存して、伝達されるスケールファクタの残留が選択される。各スケールファクタ帯域の前コントロールを有するのに、スケールファクタ差分は、適切なノイズなしスキームで伝達される。他の場合には、スケールファクタを伝達するコストは、スケールファクタの差のより粗い表現によりさらに低減できる。最低のオーバーヘッドの特別なケースは、全ての帯域にスケールファクタの差がゼロに設定された時であり、追加の情報は伝達されない。
図10は、LPC多項式をMDCTゲインカーブに書き換える好適な実施の形態を示す。図2で概略説明したように、MDCTは、LPCフィルタ1001で白色化された白色化信号について動作する。オリジナル入力信号のスペクトル包絡線を維持するため、MDCTゲインカーブは、MDCTゲインカーブモジュール1070で計算される。MDCT領域等化ゲインカーブは、MDCT変換のビンで表される周波数について、LPCフィルタで説明されたスペクトル包絡線の強度応答を推定することによって得られる。それから、ゲインカーブは、たとえば図3で示した最小平均自乗誤差信号を計算するときに、または、上記の図9を参照して説明したようにスケールファクタ決定のために知覚マスキングカーブを推定するときに、MDCTデータに適用される。
図12は、変換サイズおよび/または量子化器のタイプに基づいて知覚重み付けフィルタ計算を適応する好適な実施の形態を示す。LP多項式A(z)は図12のLPCモジュール1201で推定される。LPCパラメータ修正モジュール1271はLPC多項式A(z)のようなLPCパラメータを受信し、LPCパラメータを修正することにより知覚重み付けフィルタA’(z)を生成する。たとえば、LPC多項式A(z)のバンド幅を拡張し、および/または、多項式を傾斜する。適応チャープ・傾斜モジュール1272への入力パラメータは、デフォルトチャープ値ρおよび傾斜値γである。これらは、用いる変換サイズおよび/または用いる量子化方式Qに基づいて、所定のルールを考えて修正される。修正されたチャープパラメータρ’と傾斜パラメータγ’は、A(z)で表される入力信号スペクトル包絡線をA’(z)で表される知覚マスキングカーブに書き換えるLPCパラメータ修正モジュール1271に入力される。
以下では、フレームサイズに条件のある量子化方式および本発明の実施の形態により様々なパラメータに条件のあるモデルベース量子化を説明する。本発明の一態様は、異なった変換サイズやフレームサイズに対して異なった量子化方式を用いることである。このことは図13に示され、フレームサイズがモデルベース量子化器または非モデルベース量子化器を用いるための選択パラメータとして用いられる。この量子化の態様は、開示されたエンコーダ/デコーダの他の態様とは独立し、別のコーデックにも適用できることは重要である。非モデルベース量子化器の例は、AACオーディオコーディング規格で用いられるハフマン表ベースの量子化器である。モデルベース量子化器は、算術符号化を用いるエントロピ制約量子化器(ECQ)でもよい。しかし、本発明の実施の形態では他の量子化器を同様に用いてもよい。
本発明の独立した態様によれば、特定のフレームサイズを考慮した最適な量子化方式を用いることができるように、フレームサイズの関数として異なった量子化方式間で切り替えることが推奨される。例として、ウィンドウシーケンスは、信号の非常に安定している調性音楽セグメントについて長い変換の使用を決定する。長い変換を用いる、この特定の信号タイプについて、信号スペクトルの「まばらな」特徴(すなわち、よく定義された離散化したトーン)を利用する量子化方式を用いることは大いに有益である。ハフマン表と組み合わせてAACで用いられ、スペクトル線をグルーピングしてAACでまた用いられる量子化方法は、とても利益がある。しかし、反対に、音声セグメントについては、ウィンドウシーケンスは、LTPのコーディングゲインを考慮して、短時間変換の使用を決定する。この信号タイプと変換サイズについて、スペクトルのまばらさを見出したり導入したりしようとせず、代わりに、LTPを考慮してオリジナル入力信号のパルス的な特徴を保持するブロードバンドエネルギを維持する量子化方式を採用することは利益がある。
この概念のより一般的な概観は図14に示され、入力信号はMDCT領域に変換され、続いてMDCT変換に用いられる変換サイズまたはフレームサイズによりコントロールされる量子化器で量子化される。
本発明の他の態様によれば、量子化器のステップサイズは、LPCおよび/またはLTPデータの関数として適応される。このことによりフレームの困難さによりステップサイズの決定を行うことができ、フレームのエンコーディングに割り当てられるビット数をコントロールする。図15にモデルベース量子化がLPCおよびLTPデータによりどのようにコントロールされるかが示される。図15の上部にはMDCTラインの模式図が示される。下には、周波数の関数としての量子化ステップサイズ差分Δを表す。この特定の例から、周波数と共に量子化ステップサイズが増加すること、すなわち、大きな量子化歪みが高い周波数で生ずることが明らかである。差分カーブは、図15aに示す差分適応モジュールによってLPCおよびLTPパラメータから導かれる。差分カーブは、図13を参照して説明したように、さらに、チャープおよび/または傾斜により予測多項式A(z)から導かれる。
LPCデータから導かれる好適な知覚重み付け関数は、下記の式で与えられる。
Figure 0005624192
ここで、A(z)はLPC多項式、τは傾斜パラメータ、ρはチャープをコントロールし、γ1はA(z)多項式から計算した第1の反射率である。A(z)多項式は、その多項式から関連情報を抽出するために、異なった表現の類別にまで再計算されることが重要である。スペクトルの傾斜を無効にする「傾斜」を適用するためにスペクトルの傾斜に興味があれば、第1の反射率はスペクトルの傾斜を表すので、反射率までのA(z)多項式の再計算が好ましい。
さらに、差分値Δは、入力信号分散σ、LTPゲインg、および、予測多項式から導く第1の反射率γ1の関数として適応できる。たとえば、適応は下記式に基づいてもよい。
Figure 0005624192
以下に、本発明の実施の形態によるモデルベース量子化器の態様を説明する。図16にモデルベース量子化器の態様の一つを図示する。MDCTラインを、均一スカラ量子化器を用いて量子化器に入力する。さらに、ランダムオフセットを量子化器に入力し、量子化区間の境界を変更する量子化区間のオフセット値として用いる。提案の量子化器は、スカラ量子化器の検索能力を維持しつつ、ベクトル量子化の長所を提供する。量子化器は異なったオフセット値のセットについて反復し、それらの量子化誤差を計算する。量子化される特定のMDCTラインの量子化歪みを最小化するオフセット値(またはオフセット値のベクトル)を、量子化に用いる。それからオフセット値は、量子化MDCTラインに沿ってデコーダに伝達される。ランダムオフセットの使用により、逆量子化され、デコーディングされた信号にノイズ充填が行われ、そのようにすることにより、量子化スペクトルのスペクトルホールを回避する。このことは、そうしなければ多くのMDCTラインが復号信号のスペクトルの可聴ホールとなるゼロ値に量子化されてしまう低ビットレートにとっては特に重要である。
図17は、本発明の実施の形態によるモデルベースMDCTライン量子化器(MBMLQ)を模式的に示す。図17の上部は、MBMLQエンコーダ1700を表わす。MBMLQエンコーダ1700は入力としてMDCTフレームのMDCTラインあるいはLTPがシステムに存在するならLTP残留のMDCTラインを受け取る。MBMLQは、MDCTラインの統計モデルを用い、ソースコードをMDCTのフレームごとに基づく信号特性に適応させ、ビットストリームに効率的な圧縮を施す。
MDCTラインの局所的ゲインはMDCTラインのRMS値、およびMBMLQエンコーダ2100に入力される前にゲイン正規化モジュール2120で正規化されたMDCTラインとして推定される。局所的ゲインはMDCTラインを正規化し、LPゲイン正規化を補完する。LPゲインはより大きな時間スケールで信号レベルの変化に適応するが、局所的ゲインは、より小さな時間スケールでの変化に適応し、遷移サウンドと音声の出だしの改良した品質を生ずる。局所的ゲインは固定レートあるいは可変レートコーディングでエンコードされ、デコーダに伝達される。
レートコントロールモジュール1710を用いてMDCTフレームをエンコードするのに用いるビット数をコントロールしてもよい。レートコントロールインデックスは、使用されるビット数をコントロールする。レートコントロールインデックスは、公称量子化器ステップサイズのリストに書き込まれる。表は、降順にステップサイズで並べ替えられてもよい(図17g参照)。
MBMLQエンコーダは、異なったレートコントロールインデックスのセットで実行され、レートコントロールインデックスはビットリザーバコントロールにより与えられた許容ビット数より低いビットカウントになり、フレームに使用される。レートコントロールインデックスはゆっくりと変化し、このことは、検索の複雑さを低減し、レートコントロールインデックスを効率的にエンコードするのに利用される。テストされたレートコントロールインデックスのセットは、テストが前回のMDCTフレームのインデックスの周囲で始められるならば、低減できる。同様に、確率がレートコントロールインデックスの前回の値の周囲にピークを有するなら、レートコントロールインデックスの効果的なエントロピコーディングが得られる。たとえば、32ステップサイズのリストについて、レートコントロールインデックスは、平均でMDCTフレーム当たり2ビットを用いてコーディングされる。
図17はさらに、エンコーダ1700で局所的ゲインが推定されるならばMDCTフレームをゲインで再正規化するMBMLQデコーダ1750も模式的に示す。
図17aは、実施の形態によるモデルベースMDCTラインエンコーダ1700をより詳細に模式的に示す。モデルベースMDCTラインエンコーダ1700は、量子化器プリプロセスモジュール1730(図17c参照)、モデルベースエントロピ制約エンコーダ1740(図17e参照)および算術エンコーダ1720を備え、算術エンコーダ1720は従来技術による算術エンコーダでもよい。量子化器プリプロセスモジュール1730のタスクは、MDCTフレームごとに基づいてMBMLQエンコーダを信号の統計に適応させることである。量子化器プリプロセスモジュール1730は入力としてたのコーデックパラメータを取り入れ、それらからモデルベースエントロピ制約エンコーダ1740の挙動を修正するのに用いられる信号についての有用な統計を導き出す。モデルベースエントロピ制約エンコーダ1740は、たとえば一組のコントロールパラメータ:量子化器ステップサイズΔ(差分、区間長)、一組のMDCTラインVの分散推定(ベクトル;MDCTラインごとに1つの推定値)、知覚マスキングカーブPmod、(ランダム)オフセットのマトリックスまたは表、および、MDCTラインの分布形状と相互依存を表わすMDCTラインの統計モデルにより、コントロールされる。上記のコントロールパラメータのすべてはMDCTフレーム間で変化できる。
図17bは、本発明の実施の形態によるモデルベースMDCTラインデコーダ1750を模式的に示す。モデルベースMDCTラインデコーダ1750は、入力としてビットストリームからのサイド情報ビットを受け取り、それらを量子化器プリプロセスモジュール1760(図17c参照)に入力されるパラメータにデコーディングする。量子化器プリプロセスモジュール1760は、エンコーダ1700における機能と全く同じ機能をデコーダ1750にて有することが好ましい。量子化器プリプロセスモジュール1760は、コントロールパラメータのセット(エンコーダ1700におけるものと同じ)を出力し、これらのパラメータは確率計算モジュール1770(図17g参照;エンコーダ1700におけるものと同じ)と逆量子化モジュール1780(図17h参照;エンコーダ1700におけるものと同じ、図17e参照)。確率計算モジュール1770からのcdf表は、差分が信号の量子化と分散に用いられるとして全てのMDCTラインの確率密度関数を表わし、算術デコーダ(当業者に公知のいかなる算術コーダーでよい)に入力され、それから算術デコーダはMDCTラインビットをMDCTラインインデックスにデコーディングする。それからMDCTラインインデックスは、逆量子化モジュール1780によりMDCTラインに逆量子化される。
図17cは、本発明の実施の形態による量子化器プリプロセスの態様を模式的に示し、i)ステップサイズ計算、ii)知覚マスキングカーブ修正、iii)MDCTライン分散推定、iv)オフセット表作成とからなる。
ステップサイズ計算は、図17dにより詳細に説明される。ステップサイズ計算は、i)レートコントロールインデックスがステップサイズの表に書き込まれ、公称ステップサイズΔnom(delta-nom)を生成する表検索、ii)低エネルギ適応、iii)ハイパス適応を備える。
ゲイン正規化は、通常、高エネルギ音と低エネルギ音とが同じセグメントのSNRでコーディングされるという結果となる。このことは、低エネルギ音に過度に多数のビットが使われるということになりうる。提案の低エネルギ適用では、低エネルギ音と高エネルギ音との間の折衷案を微調整することができる。図17dのii)に示すように信号エネルギが低くなるとステップサイズを拡大し、図17dのii)には信号エネルギ(ゲインg)とコントロール係数qLe間の関係の例示的カーブを示す。信号ゲインgは、入力信号自身のまたはLP残留のRMS値として計算されてもよい。図17dのii)のコントロールカーブは、一例にすぎず、低エネルギ信号のステップサイズを増大する他のコントロール関数を用いてもよい。示した例では、コントロール関数は、閾値T1およびT2並びにステップサイズ係数Lにより画定されるステップごとの線形部分により決定される。
ハイパス音はローパス音より知覚的には重要ではない。MDCTフレームがハイパスのとき、すなわち、現在のMDCTフレームの信号のエネルギが高周波数に集中しているとき、ハイパス適応関数はステップサイズを増大し、そのようなフレームでは少ないビットしか使われないという結果となる。LTPが存在し、LTPゲインgLTPが1に近いとすると、LTP残留はハイパスとなり、そのような場合にはステップサイズを拡大しないのが有利である。このメカニズムは、図17dのiii)に示され、rはLPCからの第1の反射率である。提案のハイパス適応は下記の式を用いてもよい。
Figure 0005624192
図17cのii)は、低周波数(LF)ブーストを用いて「ゴロゴロ鳴るような」コーディングアーチファクトを除去する知覚マスキングカーブ修正を模式的に示す。LFブーストは、固定されまたは第1のスペクトルのピーク未満の部分だけがブーストされるように適応されてもよい。LFブーストは、LPC包絡線データを用いて適応されてもよい。
図17cのiii)は、MDCTライン分散推定を模式的に示す。LPC白色化フィルタをアクティブにして、MDCTラインは全て(LPC包絡線による)分散1を有する。モデルベースエントロピ制約エンコーダ1740の知覚重み付けの後に(図17e参照)、MDCTラインは知覚マスキングカーブの二乗の逆数、あるいは修正マスキングカーブPmodの二乗である分散を有する。LTPが存在すると、MDCTラインの分散を低減できる。図17cのiii)では、推定した分散をLTPに適用するメカニズムが示される。図は、周波数fについての修正係数qLTPを示す。修正した分散は、VLTPmod=V・qLTPにより決定される。値VLTPは、LTPゲインが約1ならばLLTPは0に近く(LTPがよく一致することを示す)、LTPゲインが約0ならばLLTPは1に近くなるようにLTPゲインの関数であってもよい。提案の分散V={v1,v2,・・・,vj,・・・,vN}のLTP適応は、ある周波数(fLTPcutoff)未満のMDCTラインにのみ影響する。結果として、カットオフ周波数fLTPcutoff未満のMDCTライン分散が低減され、低減はLTPゲインに依存する。
図17cのiv)は、オフセット表作成を模式的に示す。公称オフセット表は、−0.5と0.5の間に分布する擬似乱数で満たされたマトリックスである。マトリックスの列の数は、MBMLQでコーディグされるMDCTラインの数に等しい。列の数は、調整可能で、モデルベースエントロピ制約エンコーダ1740のRD最適化でテストされるオフセットベクトルの数に等しい(図17e参照)。オフセット表作成機能は、オフセットが−Δ/2と+Δ/2の間に分布するように量子化器ステップサイズで公称オフセット表を拡大縮小する。
図17gは、オフセット表の実施の形態を模式的に示す。オフセットインデックスは表へのポインタであり、選択されたオフセットベクトルO={01,02,・・・,on,・・・,oN}を選択し、ここでNはMDCTフレームのMDCTラインの数である。
以下に説明するように、オフセットはノイズ充填の手段を提供する。オフセットの広がりが、量子化器ステップサイズΔと比較して低い分散vjを有するMDCTラインに限定されると、より客観的で知覚的な品質が得られる。そのような限定の例が図17cのiv)に示され、ここで、k1とk2は調整パラメータである。オフセットの分布は、一様で、−sと+sの間に分布する。境界sは下記の式で求められる
Figure 0005624192
低分散MDCTラインに対して(vjがΔと比較して小さい)、オフセット分布を不均一で信号依存とすることは有利である。
図17eは、モデルベースエントロピ制約エンコーダ1740を模式的により詳細に示す。入力されたMDCTラインは、それらを知覚マスキング曲線、好ましくはLPC多項式から導かれたもので除すことにより知覚的に重み付けされ、その結果、重み付きMDCTラインベクトルy={y1,・・・、yN}となる。それに続くコーディングの狙いは、知覚領域のMDCTラインに白色の量子化ノイズを導入することである。デコーダでは、知覚重み付けの逆が適用され、その結果、知覚マスキングカーブに従う量子化ノイズとなる。
先ず、ランダムオフセットについての繰り返しを概略説明する。以下の操作がオフセットマトリックスの各行jについて行われる。各MDCTラインがオフセット均一スカラ量子化器(USQ)で量子化され、ここで、各量子化器はオフセット行ベクトルからのそれ自身のユニークなオフセット値でオフセットされる。
各USQからの最小歪み区間の確率は、確率計算モジュール1770(図17g参照)で計算される。USQインデックスはエントロピコーディングされる。インデックスをエンコードするのに必要なビット数についてのコストは、図17eに示されるように計算され、理論的符号語長Rjを生ずる。MDCTラインjのUSQの過負荷境界は下記の式で計算され、ここで、k3は任意の適切な数、たとえば20となるように選択される。
Figure 0005624192
過負荷境界は、量子化誤差が大きさにおいて量子化ステップサイズの半分より大きくなる境界である。
Figure 0005624192
RD最適化モジュール1790でコストCは、好ましくは歪みDjおよび/またはオフセットマトリックスの各行jの理論符号語長Rjに基づいて、計算される。コスト関数の例は、C=10*log10(Dj)+λ*Rj/Nである。Cを最小とするオフセットが選択され、対応するUSQインデックスと確率はモデルベースエントロピ制約エンコーダ1780から出力される。
RD最適化は、オプションとして、オフセットと共に量子化器の他の特性を変化させることにより更に改良することができる。たとえば、RD最適化でテストされる各オフセットベクトルに同じ、固定した分散推定Vを用いる代わりに、分散推定ベクトルVを変化させる。すると、オフセット行ベクトルmに対し、分散推定KmVを用いてもよく、ここで、mがm=1からm=(オフセットマトリックスの行数)まで変化するとkmはたとえば0.5から1.5の範囲に及ぶ。このことにより、エントロピコーディングとMMSE計算を、統計モデルが捉えることのできない入力信号統計の変化に対し繊細ではないようにする。このことにより、一般的により低いコストCとなる。
逆量子化MDCTラインは、図17eに示すように、残留量子化器を用いることによりさらに改善される。残留量子化器は、たとえば固定レートランダムベクトル量子化器である。
MDCTラインnについての均一スカラ量子化器(USQ)の操作は、図17fに模式的に示され、図17fはインデックスinを有する最小歪み区間にあるMDCTラインnの値を示す。「x」マークしたところは、ステップサイズΔの量子化区間の中央(中点)を示す。スカラ量子化器の原点はオフセットベクトルO={o1,o2,・・・,on,・・・,oN}から、オフセットonだけずれる。よって、区間境界と中点はオフセットだけずれる。
オフセットの使用は、量子化された信号にエンコーダでコントロールされたノイズ充填を導入し、そのようにすることにより量子化されたスペクトルのスペクトルホールを回避する。さらに、オフセットは立体格子より効率的にスペースを満たす1セットのコーディングの代替を提供することによりコーディングの効率を向上する。また、オフセットは、確率計算モジュール1770で計算される確率表に変動を与え、確率計算モジュール1770はMDCTラインインデックスのより効率的エントロピコーディング(たとえば、少ないビット数の要求)につながる。
可変のステップサイズΔ(差分)の使用により、量子化における可変精度を可能とし、さらなる精度が知覚的に重要な音に用いられ、あまり高くない精度があまり重要ではない音に用いられるようになる。
図17gは確率計算モジュール1770の確率計算を模式的に示す。このモジュールへの入力は、MDCTラインに適用される統計モデル、量子化器ステップサイズΔ、分散ベクトルV、オフセットインデックスおよびオフセット表である。確率計算モジュール1770の出力は、cdf表である。各MDCTラインxjについて、統計モデル(すなわち、確率密度関数、pdf)が評価される。区間iに対するpdf関数の下の面積は、その区間の確率pijである。この確率はMDCTラインの算術符号化に用いられる。
図17hは、たとえば逆量子化モジュール1780で、実行される逆量子化プロセスを模式的に示す。各MDCTラインの最小歪み区間の重心(MMSE値)XMMSEは、その区間の中点XMPと一緒に計算される。N次元ベクトルのMDCTラインを量子化するとすると、スカラMMSE値は次善であり、一般的に低すぎる。このことは、分散の損失とデコーディングされた出力のスペクトルの不均衡という結果となる。この問題は、図17hに説明するように分散保存デコーディングにより軽減され、図17hでは、復号値がMMSE値と中点値の重み付き合計として計算される。さらに最適な改良では、MMSE値が音声で支配的になり、中点が非音声サウンドで支配的になるように重みを適応する。このことにより、スペクトルバランスとエネルギは非言語音にも保存されつつ、きれいな音声を生ずる。
本発明の実施の形態による分散保存デコーディングは、次式にしたがって復号ポイントを決定することによりなされる。
Figure 0005624192
適応分散保存デコーディングは、内挿係数を定める下記の規則に基づく。
Figure 0005624192
適応重みはさらに、たとえばLTP予測ゲインgLTPの関数でもよい:χ=f(gLTP)。適応重みは、ゆっくりと変化し、再帰エントロピコードにより効率的にエンコーディングされる。
確率計算(図17g)および逆量子化(図17h)で用いられるMDCTの統計モデルは、実信号の統計を反映する。あるバージョンでは、統計モデルは、MDCTラインが独立したラプラス分布をしていると仮定する。別バージョンはMDCTラインを独立したガウス分布にモデル化する。あるバージョンは、MDCTラインを、MDCTフレーム内のMDCTライン間およびMDCTフレーム間での相互依存を含む、混合ガウス分布にモデル化する。他のバージョンは統計モデルをオンライン信号統計に適応する。適応統計モデルは前進および/または後退適応されることができる。
量子化器の修正復号ポイントに関する本発明の他の態様は、図19に模式的に示され、図19では、実施の形態のデコーダで用いられる逆量子化器が示される。そのモジュールは、逆量子化器の通常の入力とは別に、すなわち量子化されたラインと量子化ステップサイズ(量子化タイプ)に関する情報とは別に、量子化器の復号ポイントに関する情報も有する。
Figure 0005624192
さらに、量子化復号は、LTPバッファ(図3参照)で使用される符号化MDCTフレームを復号する逆量子化器304で実行され、必然的にデコーダで実行される。
逆量子化器は、たとえば復号ポイントとして量子化区間の中点、あるいは、MMSE復号ポイントを選定してもよい。本発明の実施の形態では、量子化器の復号ポイントは、中央復号ポイントとMMSE復号ポイントの間の平均値となるように選定される。一般的に、復号ポイントは、中点とMMSE復号ポイント間を、たとえば信号の周期性のような信号特性により、内挿してもよい。信号周期性情報は、たとえばLTPモジュールから導かれる。この特徴により、システムは歪みとエネルギの保存をコントロールできる。MMSE復号ポイントが最小の歪みを確かなものとする一方、中央復号ポイントは、エネルギの保存を確かなものとする。信号を与えられると、システムは復号ポイントを最適な折り合いが付くところに適応させる。
本発明はさらに、新しいウィンドウシーケンスコーディングフォーマットを組み込む。本発明の実施の形態によれば、MDCT変換に用いるウィンドウは、ダイアディックサイズ (dyadic size)であり、ウィンドウからウィンドウへサイズで係数2だけ変化する。ダイアディック変換サイズは、16kHzのサンプリングレートで4,8,・・・,128ミリ秒に対応して64,128,・・・,2048である。一般的に、可変サイズのウィンドウが提案され、それは最小ウィンドウサイズと最大ウィンドウサイズの間の複数のウィンドウサイズを取ることができる。シーケンスでは、連続したウィンドウのサイズは、急激な変化なしでウィンドウサイズのスムースなシーケンスが展開するように僅か係数2で変化する。実施の形態で画定されるように、すなわち、ダイアディックサイズに限定されウィンドウからウィンドウにサイズで係数2で変化できるだけの、ウィンドウシーケンスは、多くの利点を有する。第一に、特定の開始ウィンドウあるいは終点ウィンドウ、すなわち、シャープな縁のウィンドウは必要ではない。このことは、時間/周波数分解能を良好に保つ。第二に、ウィンドウシーケンスはコーディングするのにとても効率的になり、すなわち、どんな特定のウィンドウシーケンスが用いられるかデコーダに連絡する。最後に、ウィンドウシーケンスは常にハイパーフレーム構造にとてもよくフィットする。
ハイパーフレーム構造は、コーダーを実世界システムで操作するときに有用であり、実世界システムではデコーダを開始させるようにするために、あるデコーダの構成パラメータが伝達されなければならない。このデータは、ビットストリームにファイルされたヘッダーに普通に保存されコーディングされたオーディオ信号を説明する。ビットレートを最小化するために、ヘッダーは、コーディングされたデータのすべてのフレームには伝達され、特に本発明で提案されるシステムでは伝達されず、この場合MDCTフレームサイズは非常に短いところから非常に長いところまで変化する。したがって、本発明では、ある量のMDCTフレームを一緒にハイパーフレームにグループ化することが提案され、ヘッダーデータは、ハイパーフレームの始めで伝達される。ハイパーフレームは典型的には時間における特定の長さで画定される。したがって、MDCTフレームサイズが一定の長さ、所定のハイパーフレーム長にフィットするように注意しなければならない。上記に説明した本発明のウィンドウシーケンスは、選定されたウィンドウシーケンスが常にハイパーフレーム構造にフィットすることを確かにする。
本発明の実施の形態によれば、LTP遅延とLTPゲインは可変レートの状態でコーディングされる。このことは、安定した周期的信号に対するLTPの効率性のために、LTP遅延はいくらか長いセグメントにおいても同じである傾向があるので、利点がある。それゆえ、このことは算術符号化により活用され、結果として可変レートLTP遅延およびLTPゲインコーディングとなる。
同様に、本発明の実施の形態は、LPパラメータのコーディングに対する可変レートコーディングとビットリザーバを利用する。さらに、再帰LPコーディングが本発明により教示される。
本発明の他の態様は、エンコーダの可変のフレームサイズ用のビットリザーバの取扱いである。図18に本発明によるビットリザーバコントロールユニット1800の概要を示す。入力として与えられる困難さの尺度に加え、ビットリザーバコントロールユニットは、現在のフレームのフレーム長の情報も受信する。ビットリザーバコントロールユニットで用いられる困難さの尺度の例は、知覚エントロピ、すなわちパワースペクトルの対数である。ビットリザーバコントロールは、一組の異なったフレーム長についてフレーム長が変化するシステムにおいて重要である。ここで提案するビットリザーバコントロールユニット1800は、以下に説明するように、コーディングされるフレームに許容されたビットの数を計算するときにフレーム長を考慮する。
ここでは、ビットリザーバは、バッファ中のある固定量のビットとして定義され、所与のビットレートで使用が認められたフレームの平均ビット数より大きくなければならない。同じサイズであると、フレームについてのビット数の変化ができなくなる。ビットリザーバコントロールは、実行中のフレームに認められたビット数としてエンコーディングアルゴリズムに認められるビットを取り出す前に、ビットリザーバのレベルを常に見ている。よって、満杯のビットリザーバとは、ビットリザーバ中で用いられるビット数がビットリザーバサイズに等しいことをいう。フレームをエンコーディングした後、使用されたビットの数はバッファから減じられ、一定のビットレートを表わすビット数を加算されることによりビットリザーバはアップデートされる。したがって、フレームをコーディングする前のビットリザーバのビット数がフレーム当たりの平均ビット数に等しいならば、ビットリザーバは空である。
図18aにビットリザーバコントロールの基本概念を示す。エンコーダは、前回のフレームと比較して実行中のフレームをエンコードすることがいかに困難かを計算する手段を提供する。平均の困難さを1.0として、認められたビット数はビットリザーバで使用可能なビット数に依存する。与えられたコントロールのラインによれば、ビットリザーバが本当に満杯であると、平均ビットレートに対応するより多くのビットがビットリザーバから取り出される。空のビットリザーバの場合には、平均ビットに比べて少ないビットがフレームをエンコーディングするのに用いられる。この行動は、平均の困難さを有するフレームの長いシーケンスについては平均ビットリザーバレベルとなる。高い困難さのフレームについては、コントロールのラインは上方にシフトされ、フレームをエンコーディングする困難さは同じビットサーバレベルでより多くのビットを使うことが許されるという効果を有する。したがって、フレームを容易にエンコーディングするため、フレームに認められたビット数は、図18aのコントロールラインを平均困難さの場合から容易な困難さの場合にシフトダウンすることだけで低減される。コントロールラインを単純にシフトする以外の修正も可能である。たとえば、図18aに示すように、コントロールカーブの傾きをフレームの困難さに応じて変えてもよい。
認められたビット数を計算するときに、許可された以上にバッファからビットを取り出さないようにビットリザーバの下限界には従う必要がある。図18aに示すようにコントロールラインにより認められたビットを計算することを含むビットリザーバコントロールスキームは、可能なビットリザーバレベルと認められたビットの関係の困難さの尺度の一例に過ぎない。また、他のコントロールアルゴリズムも一般的にビットリザーバレベルの下限に厳しい限界を有し、その限界はビットリザーバが空のビットリザーバの制限を破ることを防止し、エンコーダにより過小なビット数しか消費されないときにエンコーダがビットを満たすように強制される上限の限界でも同様である。
可変フレームサイズのセットを取り扱うことができるコントロールメカニズムなどでは、この単純なコントロールアルゴリズムを適応すべきである。使用される困難さの尺度は、異なったフレームサイズの困難さの値が比較できるように正規化される。すべてのフレームサイズについて、認められたビットについての異なった許容範囲があり、フレーム当たりの平均ビット数が変化するフレームサイズに対し異なるので、結果としてそれぞれのフレームサイズは、それ自身の限界のあるそれ自身のコントロール式を有する。一例を図18bに示す。固定フレームサイズの場合への重要な修正は、コントロールアルゴリズムの低い許容境界である。固定ビットレートの場合に対応する実行中のフレームサイズの平均ビット数の代わりに、ここでは最大許容フレームサイズに対する平均ビット数が、実行中のフレームについてビットを取り出す前のビットリザーバレベルに対する最低許容値となる。このことは、固定フレームサイズのビットリザーバコントロールに対する主な差異の一つである。この制限は、続いての最大可能フレームサイズのフレームが少なくともこのフレームサイズの平均ビット数を用いることを約束する。
困難さの尺度は、たとえば、AACで行われるように心理音響モデルのマスキング閾値から導かれる知覚エントロピ(PE)計算、または代替として、本発明の実施の形態によるエンコーダのECQ部で行われるように固定ステップサイズの量子化のビットカウントに基づく。これらの値は、可変フレームサイズに関して正規化され、それはフレーム長で単に除すことによりなされ、その結果はPEであり、それぞれサンプル当たりのビットカウントである。別の正規化のステップは、平均困難さに関して行われる。この目的のために、過去のフレームに対して移動平均が用いられ、結果は、困難なフレームに対しては1.0より大きな、容易なフレームに対しては1.0未満の困難値となる。2パスエンコーダまたは大きな先取りの場合、将来フレームの困難値もこの困難さの尺度の正規化に考慮される。
本発明のもう一つの態様は、ECQ用ビットサーバ取扱いの詳細に関する。ECQ用のビットリザーバ管理は、エンコーディングに一定量子化器ステップサイズを用いるときにECQがおおよそ一定の品質を生ずるとの仮定の下で機能する。一定量子化器ステップサイズは、可変レートを生じ、ビットリザーバの目的は、ビットリザーババッファ制約を破ることなく異なるフレーム間の量子化器ステップサイズの変化をできるだけ小さく保つことである。ECQにより生成されるレートに加え、MDCTフレームに基づいて追加情報(たとえば、LTPゲインや遅延)が伝達される。追加情報はまた、一般的にエントロピでコーディングされ、よって、フレームごとに異なるレートを消費する。
本発明の実施の形態では、提案のビットリザーバコントロールは、3つの変数を導入することにより、ECQステップサイズの反動を最小にしようとする(図18c参照)。
−RECQ_AVG:前回に使用されたサンプル当たりの平均ECQレート
−ΔECQ_AVG:前回に使用された平均量子化器ステップサイズ
これらの変数は共に、動的にアップデートされ、最新のコーディング統計を反映する。
−RECQ_AVG_DES:平均トータルビットレートに対応するECQレート
この値は、ビットリザーバレベルがウィンドウを平均する時間フレームの間に変化する場合に、たとえば、特定の平均ビットレートより高いまたは低いビットレートがこの時間フレームの間に使われる場合に、RECQ_AVGとは異なる。サイド情報のレートが変化したときにもアップデートされ、トータルレートは特定のビットレートと等しくなされる。
ビットリザーバコントロールは、これら3つの値を用いて現在のフレームに用いる差分の最初の推定を決める。RECQ_AVG_DESに対応する、図18cに示す、RECQ_AVG−Δカーブ上のΔECQ_AVGを見つけることによりなされる。第2段階で、この値は、レートがビットリザーバの制約に従っていなければ修正されるであろう。図18cの例示のRECQ_AVG−Δカーブは、次式に基づく。
Figure 0005624192
当然に、RECQとΔの間の他の数学的関係を用いてもよい。
安定している場合には、RECQ_AVGがRECQ_AVG_DESに近く、Δの変動は非常に小さい。安定していない場合には、平均化操作によりΔの変動を滑らかなものとする。
これまでは本発明の特定の実施の形態を参照して開示してきたが、本発明の概念は説明した実施の形態に限定されることはないことは理解されるはずである。反対に、本出願で提供された開示により当業者は本発明を理解し実施することができる。当業者が、添付の特許請求の範囲だけで提示された本発明の思想と範囲から逸脱することなく、多くの改変を行えることは明らかである。
以下、実施の形態により教示される手段を例示的に列挙する。
[付記項1]
適応フィルタに基づいて入力信号にフィルタを掛ける線形予測ユニットと;
前記フィルタされた入力信号のフレームを変換領域に変換する変換ユニットと;
前記変換領域信号を量子化する量子化ユニットとを備え;
前記量子化ユニットは、前記変換領域信号をモデルベース量子化器でエンコードするか、非モデルベース量子化器でエンコードするかを、入力信号特性に基づいて決定する;
オーディオコーディングシステム。
[付記項2]
前記モデルベース量子化器のモデルは、適応でき、時間について変化する;
請求項1のオーディオコーディングシステム。
[付記項3]
前記量子化ユニットは、前記変換ユニットにより適用されるフレームサイズに基づいて前記変換領域信号をどのようにエンコードするのかを決定する;
請求項1または2のオーディオコーディングシステム。
[付記項4]
前記量子化ユニットは、フレームサイズ比較器を備え、閾値より小さなフレームサイズのフレームに変換領域信号をモデルベースエントロピ制約量子化によりエンコードするように構成された;
請求項1ないし3のいずれか1項のオーディオコーディングシステム。
[付記項5]
線形予測と長期間予測パラメータに基づいて交換領域信号の成分の量子化ステップサイズを決定する量子化ステップサイズコントロールユニットを備える;
請求項1ないし4のいずれか1項のオーディオコーディングシステム。
[付記項6]
前記量子化ステップサイズは周波数に依存して決定され、前記量子化ステップサイズコントロールユニットは、適応フィルタの多項式、コーディングレートコントロールパラメータ、長期間予測ゲイン値、入力信号分散のうち少なくとも1つに基づいて量子化ステップサイズを決定する;
請求項5のオーディオコーディングシステム。
[付記項7]
前記量子化ステップサイズは低エネルギの信号に対して増加する;
請求項5または6のオーディオコーディングシステム。
[付記項8]
変換領域信号の分散を適応させる分散適応ユニットを備える;
請求項1ないし7のいずれか1項のオーディオコーディングシステム。
[付記項9]
前記量子化ユニットは、前記変換領域信号成分を量子化する複数の均一スカラ量子化器を備え、各均一スカラ量子化器は確率モデルに基づいて均一量子化をMDCTラインに適用する;
請求項1ないし8のいずれか1項のオーディオコーディングシステム。
[付記項10]
前記量子化ユニットはランダムオフセットを均一スカラ量子化器に挿入するランダムオフセット挿入ユニットを備え、該ランダムオフセット挿入ユニットは量子化歪みの最適化に基づいてランダムオフセットを決定するようになされた;
請求項9のオーディオコーディングシステム。
[付記項11]
前記量子化ユニットは、均一スカラ量子化器により生成された量子化インデックスをエンコーディングする算術エンコーダを備える;
請求項9または10のオーディオコーディングシステム。
[付記項12]
前記量子化ユニットは、均一スカラ量子化器から生じた残存量子化信号を量子化する残留量子化器を備える;
請求項9ないし11のいずれか1項のオーディオコーディングシステム。
[付記項13]
前記量子化ユニットは最小平均二乗誤差および/または中点量子化復号ポイントを用いる;
請求項9ないし12のいずれか1項のオーディオコーディングシステム。
[付記項14]
前記量子化ユニットは、確率モデル中点と最小平均二乗誤差点との間の内挿に基づき量子化復号ポイントを決定する動的復号ポイントユニットを備える;
請求項9ないし13のいずれか1項のオーディオコーディングシステム。
[付記項15]
前記量子化ユニットは、量子化歪みを決定するときに変換領域で知覚重み付けを適用し、該知覚重み付けは線形予測パラメータに由来する;
請求項9ないし14のいずれか1項のオーディオコーディングシステム。
[付記項16]
適応フィルタに基づいて入力信号にフィルタを掛ける線形予測ユニットと;
前記フィルタされた入力信号のフレームを変換領域に変換する変換ユニットと;
前記変換領域信号を量子化する量子化ユニットと;
前記変換領域信号を量子化するときに前記量子化ユニットで用いるための、マスキング閾値カーブに基づく、スケールファクタを生成するスケールファクタ決定ユニットと;
前記適応フィルタのパラメータに基づいて線形予測に基づくスケールファクタを推定する線形予測スケールファクタ推定ユニットと;
前記マスキング閾値カーブに基づくスケールファクタと前記線形予測に基づくスケールファクタとの間の差をエンコーディングするスケールファクタエンコーダとを備える;
オーディオコーディングシステム。
[付記項17]
前記線形予測スケールファクタ推定ユニットは知覚マスキングカーブ推定ユニットを備えて前記適応フィルタのパラメータに基づき知覚マスキングカーブを推定し;
線形予測に基づくスケールファクタは、予測された知覚マスキングカーブに基づいて決定される;
請求項16のオーディオコーディングシステム。
[付記項18]
前記変換領域信号のフレームに対する前記線形予測に基づくスケールファクタは、内挿された線形予測パラメータに基づいて推定される;
請求項16または17のオーディオコーディングシステム。
[付記項19]
前記フィルタされた入力信号の前回のセグメントの復号に基づき、前記フィルタされた入力信号ののフレームの推定を決定する長期間予測ユニットと;
前記変換領域で前記長期間予測推定と前記変換された入力信号を組み合わせて前記変換領域信号を生成する変換領域信号組合せユニットを備える;
請求項16ないし18のいずれか1項のオーディオコーディングシステム。
[付記項20]
前記フレーム長と前記フレームの困難さの尺度に基づいて前記フィルタされた信号のフレームをエンコーディングするのに認められたビット数を決定するビットリザーバコントロールユニットを備える;
請求項1ないし19のいずれか1項のオーディオコーディングシステム。
[付記項21]
前記ビットリザーバコントロールユニットは、異なった困難さの尺度のフレームおよび/または異なったフレームサイズに対し別のコントロール式を有する;
請求項20のオーディオコーディングシステム。
[付記項22]
前記ビットリザーバコントロールユニットは異なったフレームサイズの困難さの尺度を正規化する;
請求項20または21のオーディオコーディングシステム。
[付記項23]
前記ビットリザーバコントロールユニットは最大許容フレームサイズについての平均ビット数に認められたビットコントロールアルゴリズムの許容下限界を設定する;
請求項20ないし22のいずれか1項のオーディオコーディングシステム。
[付記項24]
スケールファクタに基づき入力されたビットストリームのフレームを逆量子化する逆量子化ユニットと;
変換領域信号を逆に変換する逆変換ユニットと;
逆変換された変換領域信号にフィルタを掛ける線形予測ユニットと;
エンコーダで適用されるスケールファクタと前記適応フィルタのパラメータに基づいて生成されるスケールファクタの間の差をエンコーディングする、受信したスケールファクタ差分情報に基づき逆量子化で用いられる前記スケールファクタを生成するスケールファクタデコーディングユニットとを備える;
オーディオデコーダ。
[付記項25]
現在のフレームに対する線形予測パラメータから導かれたマスキング閾値カーブに基づいてスケールファクタを生成するスケールファクタ決定ユニットを備え;
前記スケールファクタデコーディングユニットは前記受信したスケールファクタ差分情報と前記生成された線形予測に基づくスケールファクタとを組み合わせて逆量子化ユニットへの入力用のスケールファクタを生成する;
請求項24のオーディオデコーダ。
[付記項26]
入力されたビットストリームのフレームを逆量子化するモデルベース逆量子化ユニットと;
変換領域信号を逆に変換する逆変換ユニットと;
前記逆変換された変換領域信号にフィルタを掛ける線形予測ユニットとを備え;
前記逆量子化ユニットは非モデルベース量子化器とモデルベース量子化器とを備える;
オーディオデコーダ。
[付記項27]
前記逆量子化ユニットは、前記フレームのコントロールデータに基づいて逆量子化方式を決定する;
請求項26のオーディオデコーダ。
[付記項28]
前記逆量子化コントロールデータは、ビットストリームと受信されるか、受信したデータから導かれる;
請求項27のオーディオデコーダ。
[付記項29]
前記逆量子化ユニットは、前記フレームの変換サイズに基づき前記逆量子化方式を決定する;
請求項26ないし28のいずれか1項のオーディオデコーダ。
[付記項30]
前記量子化ユニットは適応復号ポイントを備える;
請求項26ないし29のいずれか1項のオーディオデコーダ。
[付記項31]
前記逆量子化ユニットは、量子化区間当たり2つの逆量子化復号ポイント、特に中点とMMSE復号点とを用いるようになされた均一スカラ逆量子化器を備える;
請求項30のオーディオデコーダ。
[付記項32]
前記逆量子化ユニットは少なくとも1つの適応確率モデルを備える;
請求項26ないし31のいずれか1項のオーディオデコーダ。
[付記項33]
前記逆量子化ユニットは算術符号化と組み合わせてモデルベース量子化器を用いる;
請求項26ないし32のいずれか1項のオーディオデコーダ。
[付記項34]
前記逆量子化ユニットは伝達された信号特性の関数として逆量子化を適応するようになされた;
請求項26ないし33のいずれか1項のオーディオデコーダ。
[付記項35]
適応フィルタに基づいて入力信号にフィルタを掛けるステップと;
前記フィルタされた入力信号のフレームを変換領域に変換するステップと;
前記変換領域信号を量子化するステップと;
前記変換領域信号を量子化するときに量子化ユニットで用いられる、マスキング閾値カーブに基づくスケールファクタを生成するステップと;
前記適応フィルタのパラメータに基づいて線形予測に基づくスケールファクタを推定するステップと;
前記マスキング閾値カーブに基づくスケールファクタと前記線形予測に基づくスケールファクタとの間の差をエンコーディングするステップとを備える;
オーディオコーディング方法。
[付記項36]
適応フィルタに基づいて入力信号にフィルタを掛けるステップと;
前記フィルタされた入力信号のフレームを変換領域に変換するステップと;
前記変換領域信号を量子化するステップとを備え;
量子化ユニットが入力信号特性に基づいて前記変換領域信号を、モデルベース量子化器でエンコーディングするか、非モデルベース量子化器でエンコーディングするかを決定する;
オーディオコーディング方法。
[付記項37]
スケールファクタに基づき入力されたビットストリームのフレームを逆量子化するステップと;
変換領域信号を逆変換するステップと;
逆変換された変換領域信号に線形予測フィルタを掛けるステップと;
前記適応フィルタのパラメータに基づいて第2のスケールファクタを推定するステップと;
受信したスケールファクタの差の情報と前記推定した第2のスケールファクタとに基づいて前記逆量子化で用いる前記スケールファクタを生成するステップとを備える;
オーディオコーディング方法。
[付記項38]
入力されたビットストリームのフレームを逆量子化するステップと;
変換領域信号を逆変換するステップと;
逆変換された変換領域信号に線形予測フィルタを掛けるステップとを備え;
前記逆量子化は非モデルベース量子化器とモデルベース量子化器を用いる;
オーディオコーディング方法。
[付記項39]
プログラムデバイスに請求項35または38によるオーディオコーディング方法を実行させる;
コンピュータプログラム。

Claims (16)

  1. オーディオ信号の第1のフレーム長に関して動作し、線形予測(LP)フィルタに基づいて前記オーディオ信号をフィルタリングする線形予測ユニットと、
    可変の第2のフレーム長に関する修正離散コサイン変換(MDCT)により、前記オーディオ信号のフレームをMDCT領域の信号に変換する適応長さ変換ユニットと、
    MDCT領域信号を量子化する量子化ユニットと、
    前記LPフィルタの振幅応答に基づいてMDCT領域のゲイン曲線を生成するゲイン曲線生成ユニットと
    LPパラメータを、前記MDCT領域信号の対応するフレームに対応付けるマッピングユニットと
    を有するオーディオコーディングシステム。
  2. 前記オーディオ信号のブロックについて、MDCTウィンドウを重複させる前記第2のフレーム長を決定するウィンドウシーケンス制御ユニットを更に有する請求項1に記載のオーディオコーディングシステム。
  3. LPCフレームのために前記線形予測ユニットが生成したLPC多項式をチャープおよび/またはチルティングさせることで、前記LPフィルタの特性を修正する知覚モデリングユニットを有する請求項に記載のオーディオコーディングシステム。
  4. 当該オーディオコーディングシステムは、
    前記オーディオ信号を低域成分と高域成分とに分割する周波数分割ユニットと、
    前記高域成分をエンコードする高域エンコーダと
    を有し、前記低域成分は前記線形予測ユニットと前記変換ユニットとに入力される、請求項1に記載のオーディオコーディングシステム。
  5. 前記周波数分割ユニットは、前記オーディオ信号をダウンサンプリングするように形成された直交ミラーフィルタ合成ユニットと直交ミラーフィルタバンクとを有する、請求項4に記載のオーディオコーディングシステム。
  6. 前記低域成分と前記高域成分との間の境界は可変であり、前記周波数分割ユニットは、前記オーディオ信号の特性及び/又はエンコーダの帯域幅条件に基づいて重複する周波数を決定する、請求項4に記載のオーディオコーディングシステム。
  7. 前記低域成分と前記高域成分との間の境界は可変であり、前記周波数分割ユニットは、前記オーディオ信号の特性及び/又はエンコーダの帯域幅条件に基づいて重複する周波数を決定する、請求項5に記載のオーディオコーディングシステム。
  8. 前記MDCT領域のゲイン曲線がMDCT領域のデータに適用される、請求項1に記載のオーディオコーディングシステム。
  9. 前記量子化ユニットの量子化ノイズを抑制するためのスケール因子を推定するスケール因子推定ユニットを有する請求項1に記載のオーディオコーディングシステム。
  10. 前記スケール因子は前記MDCT領域のゲイン曲線に基づいて決定される、請求項9に記載のオーディオコーディングシステム。
  11. 前記マッピングユニットは、前記第2のフレーム長に対応するレートで生成された前記MDCT領域信号のフレームに合うように、前記第1のフレーム長に対応するレートで生成されたLP多項式を補間する、請求項1に記載のオーディオコーディングシステム。
  12. 入力ビットストリームにより受信した量子化されたMDCTラインを表現する逆量子化ユニットと、
    可変フレーム長に関して動作し、MDCT領域信号を時間領域信号に逆変換する適応長逆MDCT変換ユニットと、
    線形予測フィルタの振幅応答に基づいてMDCT領域のゲイン曲線を生成するゲイン曲線生成ユニットであって、前記線形予測フィルタのパラメータは前記ビットストリームにより受信される、ゲイン曲線生成ユニットと、
    LPパラメータを、前記MDCT領域信号の対応するフレームに対応付けるマッピングユニットと
    を有するオーディオデコーダ。
  13. 第1のフレーム長で動作しかつ線形予測(LP)パラメータを生成する線形予測(LP)分析をオーィオ信号について実行するステップと、
    可変の第2のフレーム長に関する修正離散コサイン変換(MDCT)により、前記オーディオ信号のフレームを前記MDCT領域の信号に変換するステップと、
    MDCT領域信号を量子化するステップと、
    生成されたLPフィルタの振幅応答に基づいてMDCT領域のゲイン曲線を生成するステップと、
    LPパラメータを、前記MDCT領域信号の対応するフレームに対応付けるステップと
    を有するオーディオコーディング方法。
  14. 入力ビットストリームにより受信した量子化された修正離散コサイン変換(MDCT)ラインを再構築するステップと、
    可変フレーム長に関し、MDCT領域信号を時間領域信号に逆MDCTを施すステップと、
    線形予測フィルタの振幅応答に基づいてMDCT領域のゲイン曲線を生成するステップであって、前記線形予測フィルタのパラメータは前記ビットストリームにより受信される、ステップと、
    LPパラメータを、前記MDCT領域の信号の対応するフレームに対応付けるステップと
    を有するオーディオデコーディング方法。
  15. 請求項13に記載のオーディオコーディング方法を、プログラム可能な装置に実行させるコンピュータプログラム。
  16. 請求項14に記載のオーディオデコーディング方法を、プログラム可能な装置に実行させるコンピュータプログラム。
JP2013176239A 2008-01-04 2013-08-28 オーディオコーディングシステム、オーディオデコーダ、オーディオコーディング方法及びオーディオデコーディング方法 Active JP5624192B2 (ja)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
SE0800032-5 2008-01-04
SE0800032 2008-01-04
US5597808P 2008-05-24 2008-05-24
EP08009530.0 2008-05-24
US61/055,978 2008-05-24
EP08009530A EP2077550B8 (en) 2008-01-04 2008-05-24 Audio encoder and decoder

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2010541030A Division JP5356406B2 (ja) 2008-01-04 2008-12-30 オーディオコーディングシステム、オーディオデコーダ、オーディオコーディング方法及びオーディオデコーディング方法

Publications (2)

Publication Number Publication Date
JP2014016625A JP2014016625A (ja) 2014-01-30
JP5624192B2 true JP5624192B2 (ja) 2014-11-12

Family

ID=39710955

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2010541030A Active JP5356406B2 (ja) 2008-01-04 2008-12-30 オーディオコーディングシステム、オーディオデコーダ、オーディオコーディング方法及びオーディオデコーディング方法
JP2010541031A Active JP5350393B2 (ja) 2008-01-04 2008-12-30 オーディオコーディングシステム、オーディオデコーダ、オーディオエンコーディング方法及びオーディオデコーディング方法
JP2013176239A Active JP5624192B2 (ja) 2008-01-04 2013-08-28 オーディオコーディングシステム、オーディオデコーダ、オーディオコーディング方法及びオーディオデコーディング方法

Family Applications Before (2)

Application Number Title Priority Date Filing Date
JP2010541030A Active JP5356406B2 (ja) 2008-01-04 2008-12-30 オーディオコーディングシステム、オーディオデコーダ、オーディオコーディング方法及びオーディオデコーディング方法
JP2010541031A Active JP5350393B2 (ja) 2008-01-04 2008-12-30 オーディオコーディングシステム、オーディオデコーダ、オーディオエンコーディング方法及びオーディオデコーディング方法

Country Status (14)

Country Link
US (4) US8494863B2 (ja)
EP (6) EP2077550B8 (ja)
JP (3) JP5356406B2 (ja)
KR (2) KR101196620B1 (ja)
CN (3) CN101925950B (ja)
AT (2) ATE500588T1 (ja)
AU (1) AU2008346515B2 (ja)
BR (1) BRPI0822236B1 (ja)
CA (4) CA3190951A1 (ja)
DE (1) DE602008005250D1 (ja)
ES (2) ES2677900T3 (ja)
MX (1) MX2010007326A (ja)
RU (3) RU2562375C2 (ja)
WO (2) WO2009086919A1 (ja)

Families Citing this family (174)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6934677B2 (en) * 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US8326614B2 (en) * 2005-09-02 2012-12-04 Qnx Software Systems Limited Speech enhancement system
US7720677B2 (en) * 2005-11-03 2010-05-18 Coding Technologies Ab Time warped modified transform coding of audio signals
FR2912249A1 (fr) * 2007-02-02 2008-08-08 France Telecom Codage/decodage perfectionnes de signaux audionumeriques.
EP2077550B8 (en) * 2008-01-04 2012-03-14 Dolby International AB Audio encoder and decoder
US8380523B2 (en) * 2008-07-07 2013-02-19 Lg Electronics Inc. Method and an apparatus for processing an audio signal
US9245532B2 (en) 2008-07-10 2016-01-26 Voiceage Corporation Variable bit rate LPC filter quantizing and inverse quantizing device and method
ES2539304T3 (es) 2008-07-11 2015-06-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Un aparato y un método para generar datos de salida por ampliación de ancho de banda
BRPI0910511B1 (pt) 2008-07-11 2021-06-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Aparelho e método para decodificar e codificar um sinal de áudio
FR2938688A1 (fr) * 2008-11-18 2010-05-21 France Telecom Codage avec mise en forme du bruit dans un codeur hierarchique
MX2011009660A (es) * 2009-03-17 2011-09-30 Dolby Int Ab Codificacion estereo avanzada basada en una combinacion de codificacion izquierda/derecha o media/lateral seleccionable de manera adaptable y de codificacion estereo parametrica.
AU2010233863B2 (en) * 2009-04-08 2013-09-26 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus, method and computer program for upmixing a downmix audio signal using a phase value smoothing
CO6440537A2 (es) * 2009-04-09 2012-05-15 Fraunhofer Ges Forschung Aparato y metodo para generar una señal de audio de sintesis y para codificar una señal de audio
KR20100115215A (ko) * 2009-04-17 2010-10-27 삼성전자주식회사 가변 비트율 오디오 부호화 및 복호화 장치 및 방법
US9245529B2 (en) * 2009-06-18 2016-01-26 Texas Instruments Incorporated Adaptive encoding of a digital signal with one or more missing values
JP5365363B2 (ja) * 2009-06-23 2013-12-11 ソニー株式会社 音響信号処理システム、音響信号復号装置、これらにおける処理方法およびプログラム
KR20110001130A (ko) * 2009-06-29 2011-01-06 삼성전자주식회사 가중 선형 예측 변환을 이용한 오디오 신호 부호화 및 복호화 장치 및 그 방법
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
MY163358A (en) * 2009-10-08 2017-09-15 Fraunhofer-Gesellschaft Zur Förderung Der Angenwandten Forschung E V Multi-mode audio signal decoder,multi-mode audio signal encoder,methods and computer program using a linear-prediction-coding based noise shaping
EP2315358A1 (en) 2009-10-09 2011-04-27 Thomson Licensing Method and device for arithmetic encoding or arithmetic decoding
CA2778368C (en) 2009-10-20 2016-01-26 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using an iterative interval size reduction
US9117458B2 (en) 2009-11-12 2015-08-25 Lg Electronics Inc. Apparatus for processing an audio signal and method thereof
CN102081622B (zh) * 2009-11-30 2013-01-02 中国移动通信集团贵州有限公司 评估系统健康度的方法及系统健康度评估装置
RU2526745C2 (ru) * 2009-12-16 2014-08-27 Долби Интернешнл Аб Низведение параметров последовательности битов sbr
AU2011206675C1 (en) 2010-01-12 2016-04-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using a hash table describing both significant state values and interval boundaries
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US8886523B2 (en) * 2010-04-14 2014-11-11 Huawei Technologies Co., Ltd. Audio decoding based on audio class with control code for post-processing modes
EP2562750B1 (en) * 2010-04-19 2020-06-10 Panasonic Intellectual Property Corporation of America Encoding device, decoding device, encoding method and decoding method
US9047875B2 (en) * 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
BR112012024360B1 (pt) 2010-07-19 2020-11-03 Dolby International Ab sistema configurado para gerar uma pluralidade de sinais de áudio de sub-banda de alta frequência, decodificador de áudio, codificador, método para gerar uma pluralidade de sinais de sub-banda de alta frequência, método para decodificar um fluxo de bits, método para gerar dados de controle a partir de um sinal de áudio e meio de armazenamento
US12002476B2 (en) 2010-07-19 2024-06-04 Dolby International Ab Processing of audio signals during high frequency reconstruction
MY179769A (en) * 2010-07-20 2020-11-13 Fraunhofer Ges Forschung Audio encoder, audio decoder,method for encoding and audio information, method for decoding an audio information and computer program using an optimized hash table
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
US8762158B2 (en) * 2010-08-06 2014-06-24 Samsung Electronics Co., Ltd. Decoding method and decoding apparatus therefor
WO2012025431A2 (en) * 2010-08-24 2012-03-01 Dolby International Ab Concealment of intermittent mono reception of fm stereo radio receivers
US9008811B2 (en) 2010-09-17 2015-04-14 Xiph.org Foundation Methods and systems for adaptive time-frequency resolution in digital data coding
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
CN103282959B (zh) * 2010-10-25 2015-06-03 沃伊斯亚吉公司 低位速率和短延迟地编码普通音频信号
CN102479514B (zh) * 2010-11-29 2014-02-19 华为终端有限公司 一种编码方法、解码方法、装置和系统
US8325073B2 (en) * 2010-11-30 2012-12-04 Qualcomm Incorporated Performing enhanced sigma-delta modulation
FR2969804A1 (fr) * 2010-12-23 2012-06-29 France Telecom Filtrage perfectionne dans le domaine transforme.
US8849053B2 (en) * 2011-01-14 2014-09-30 Sony Corporation Parametric loop filter
CN103380455B (zh) * 2011-02-09 2015-06-10 瑞典爱立信有限公司 对音频信号的高效编码/解码
WO2012122297A1 (en) * 2011-03-07 2012-09-13 Xiph. Org. Methods and systems for avoiding partial collapse in multi-block audio coding
US9009036B2 (en) 2011-03-07 2015-04-14 Xiph.org Foundation Methods and systems for bit allocation and partitioning in gain-shape vector quantization for audio coding
US8838442B2 (en) 2011-03-07 2014-09-16 Xiph.org Foundation Method and system for two-step spreading for tonal artifact avoidance in audio coding
JP5648123B2 (ja) 2011-04-20 2015-01-07 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 音声音響符号化装置、音声音響復号装置、およびこれらの方法
CN102186083A (zh) * 2011-05-12 2011-09-14 北京数码视讯科技股份有限公司 量化处理方法及装置
RU2648595C2 (ru) 2011-05-13 2018-03-26 Самсунг Электроникс Ко., Лтд. Распределение битов, кодирование и декодирование аудио
JP5714180B2 (ja) * 2011-05-19 2015-05-07 ドルビー ラボラトリーズ ライセンシング コーポレイション パラメトリックオーディオコーディング方式の鑑識検出
RU2464649C1 (ru) * 2011-06-01 2012-10-20 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Способ обработки звукового сигнала
CN107613307B (zh) * 2011-06-16 2021-04-06 Ge视频压缩有限责任公司 解码器、编码器、解码方法、编码方法及存储介质
US9546924B2 (en) * 2011-06-30 2017-01-17 Telefonaktiebolaget Lm Ericsson (Publ) Transform audio codec and methods for encoding and decoding a time segment of an audio signal
CN102436819B (zh) * 2011-10-25 2013-02-13 杭州微纳科技有限公司 无线音频压缩、解压缩方法及音频编码器和音频解码器
JP5789816B2 (ja) * 2012-02-28 2015-10-07 日本電信電話株式会社 符号化装置、この方法、プログラム及び記録媒体
KR101311527B1 (ko) * 2012-02-28 2013-09-25 전자부품연구원 영상처리장치 및 영상처리방법
JP5714172B2 (ja) * 2012-02-28 2015-05-07 日本電信電話株式会社 符号化装置、この方法、プログラムおよび記録媒体
WO2013142650A1 (en) 2012-03-23 2013-09-26 Dolby International Ab Enabling sampling rate diversity in a voice communication system
KR102123770B1 (ko) 2012-03-29 2020-06-16 텔레폰악티에볼라겟엘엠에릭슨(펍) 하모닉 오디오 신호의 변환 인코딩/디코딩
EP2665208A1 (en) * 2012-05-14 2013-11-20 Thomson Licensing Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation
US9799339B2 (en) 2012-05-29 2017-10-24 Nokia Technologies Oy Stereo audio signal encoder
EP2860729A4 (en) * 2012-06-04 2016-03-02 Samsung Electronics Co Ltd AUDIOCODING METHOD AND DEVICE, AUDIO DECODING METHOD AND DEVICE AND MULTIMEDIA DEVICE THEREWITH
MY168806A (en) * 2012-06-28 2018-12-04 Fraunhofer Ges Forschung Linear prediction based audio coding using improved probability distribution estimation
US10140995B2 (en) 2012-07-02 2018-11-27 Sony Corporation Decoding device, decoding method, encoding device, encoding method, and program
EP2741285B1 (en) * 2012-07-02 2019-04-10 Sony Corporation Decoding device and method, encoding device and method, and program
WO2014023443A1 (en) * 2012-08-10 2014-02-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder, system and method employing a residual concept for parametric audio object coding
US9830920B2 (en) 2012-08-19 2017-11-28 The Regents Of The University Of California Method and apparatus for polyphonic audio signal prediction in coding and networking systems
US9406307B2 (en) * 2012-08-19 2016-08-02 The Regents Of The University Of California Method and apparatus for polyphonic audio signal prediction in coding and networking systems
WO2014068817A1 (ja) * 2012-10-31 2014-05-08 パナソニック株式会社 オーディオ信号符号化装置及びオーディオ信号復号装置
MX342822B (es) 2013-01-08 2016-10-13 Dolby Int Ab Prediccion basada en modelo en un banco de filtros de muestreo critico.
US9336791B2 (en) * 2013-01-24 2016-05-10 Google Inc. Rearrangement and rate allocation for compressing multichannel audio
CN105190749B (zh) * 2013-01-29 2019-06-11 弗劳恩霍夫应用研究促进协会 噪声填充技术
WO2014118192A2 (en) 2013-01-29 2014-08-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise filling without side information for celp-like coders
SG11201505911SA (en) * 2013-01-29 2015-08-28 Fraunhofer Ges Forschung Low-frequency emphasis for lpc-based coding in frequency domain
MX372748B (es) * 2013-01-29 2020-05-26 Fraunhofer Ges Forschung Decodificador para generar una señal de audio mejorada en frecuencia, metodo de decodificacion, codificador para generar una señal codificada y metodo de codificacion utilizando informacion secundaria de seleccion compacta.
AU2014211539B2 (en) * 2013-01-29 2017-04-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Low-complexity tonality-adaptive audio signal quantization
US9842598B2 (en) * 2013-02-21 2017-12-12 Qualcomm Incorporated Systems and methods for mitigating potential frame instability
CN104981870B (zh) * 2013-02-22 2018-03-20 三菱电机株式会社 声音增强装置
JP6089878B2 (ja) 2013-03-28 2017-03-08 富士通株式会社 直交変換装置、直交変換方法及び直交変換用コンピュータプログラムならびにオーディオ復号装置
CN105247613B (zh) 2013-04-05 2019-01-18 杜比国际公司 音频处理系统
US9947335B2 (en) 2013-04-05 2018-04-17 Dolby Laboratories Licensing Corporation Companding apparatus and method to reduce quantization noise using advanced spectral extension
EP2981960B1 (en) * 2013-04-05 2019-03-13 Dolby International AB Stereo audio encoder and decoder
CA3029041C (en) * 2013-04-05 2021-03-30 Dolby International Ab Audio encoder and decoder
EP3217398B1 (en) 2013-04-05 2019-08-14 Dolby International AB Advanced quantizer
TWI557727B (zh) 2013-04-05 2016-11-11 杜比國際公司 音訊處理系統、多媒體處理系統、處理音訊位元流的方法以及電腦程式產品
CN104103276B (zh) * 2013-04-12 2017-04-12 北京天籁传音数字技术有限公司 一种声音编解码装置及其方法
US20140327737A1 (en) * 2013-05-01 2014-11-06 Raymond John Westwater Method and Apparatus to Perform Optimal Visually-Weighed Quantization of Time-Varying Visual Sequences in Transform Space
EP2830058A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Frequency-domain audio coding supporting transform length switching
EP2830059A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise filling energy adjustment
CN110890101B (zh) 2013-08-28 2024-01-12 杜比实验室特许公司 用于基于语音增强元数据进行解码的方法和设备
KR102231756B1 (ko) * 2013-09-05 2021-03-30 마이클 안토니 스톤 오디오 신호의 부호화, 복호화 방법 및 장치
TWI579831B (zh) 2013-09-12 2017-04-21 杜比國際公司 用於參數量化的方法、用於量化的參數之解量化方法及其電腦可讀取的媒體、音頻編碼器、音頻解碼器及音頻系統
JP6531649B2 (ja) 2013-09-19 2019-06-19 ソニー株式会社 符号化装置および方法、復号化装置および方法、並びにプログラム
FR3011408A1 (fr) * 2013-09-30 2015-04-03 Orange Re-echantillonnage d'un signal audio pour un codage/decodage a bas retard
AU2014337410B2 (en) * 2013-10-18 2017-02-23 Telefonaktiebolaget L M Ericsson (Publ) Coding and decoding of spectral peak positions
PL3069338T3 (pl) * 2013-11-13 2019-06-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Koder do kodowania sygnału audio, system przesyłania audio i sposób określania wartości korekcji
FR3013496A1 (fr) * 2013-11-15 2015-05-22 Orange Transition d'un codage/decodage par transformee vers un codage/decodage predictif
KR102251833B1 (ko) 2013-12-16 2021-05-13 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
RU2764260C2 (ru) 2013-12-27 2022-01-14 Сони Корпорейшн Устройство и способ декодирования
FR3017484A1 (fr) * 2014-02-07 2015-08-14 Orange Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
CN106233112B (zh) * 2014-02-17 2019-06-28 三星电子株式会社 信号编码方法和设备以及信号解码方法和设备
CN103761969B (zh) * 2014-02-20 2016-09-14 武汉大学 基于高斯混合模型的感知域音频编码方法及系统
JP6289936B2 (ja) * 2014-02-26 2018-03-07 株式会社東芝 音源方向推定装置、音源方向推定方法およびプログラム
WO2015129165A1 (ja) * 2014-02-28 2015-09-03 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 復号装置、符号化装置、復号方法、符合化方法、端末装置、および基地局装置
EP2916319A1 (en) * 2014-03-07 2015-09-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for encoding of information
JP6250140B2 (ja) * 2014-03-24 2017-12-20 日本電信電話株式会社 符号化方法、符号化装置、プログラム、および記録媒体
CN110503964B (zh) * 2014-04-24 2022-10-04 日本电信电话株式会社 编码方法、编码装置以及记录介质
ES2805275T3 (es) * 2014-05-01 2021-02-11 Nippon Telegraph & Telephone Dispositivo de generación de secuencia envolvente combinada periódica, método de generación de secuencia envolvente combinada periódica, programa de generación de secuencia envolvente combinada periódica y soporte de registro
GB2526128A (en) * 2014-05-15 2015-11-18 Nokia Technologies Oy Audio codec mode selector
CN105225671B (zh) * 2014-06-26 2016-10-26 华为技术有限公司 编解码方法、装置及系统
KR102654275B1 (ko) * 2014-06-27 2024-04-04 돌비 인터네셔널 에이비 Hoa 데이터 프레임 표현의 압축을 위해 비차분 이득 값들을 표현하는 데 필요하게 되는 비트들의 최저 정수 개수를 결정하는 장치
CN104077505A (zh) * 2014-07-16 2014-10-01 苏州博联科技有限公司 一种提高16Kbps码率音频数据压缩编码音质方法
EP3413307B1 (en) * 2014-07-25 2020-07-15 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Audio signal coding apparatus, audio signal decoding device, and methods thereof
EP2980801A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals
PL3000110T3 (pl) * 2014-07-28 2017-05-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Wybór jednego spośród pierwszego algorytmu kodowania i drugiego algorytmu kodowania z zastosowaniem redukcji harmonicznych
EP2980798A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Harmonicity-dependent controlling of a harmonic filter tool
EP2980799A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an audio signal using a harmonic post-filter
CN112992165B (zh) * 2014-07-28 2024-11-12 日本电信电话株式会社 编码方法、装置、计算机程序产品以及记录介质
FR3024581A1 (fr) * 2014-07-29 2016-02-05 Orange Determination d'un budget de codage d'une trame de transition lpd/fd
CN104269173B (zh) * 2014-09-30 2018-03-13 武汉大学深圳研究院 切换模式的音频带宽扩展装置与方法
KR102128330B1 (ko) 2014-11-24 2020-06-30 삼성전자주식회사 신호 처리 장치, 신호 복원 장치, 신호 처리 방법, 및 신호 복원 방법
US9659578B2 (en) * 2014-11-27 2017-05-23 Tata Consultancy Services Ltd. Computer implemented system and method for identifying significant speech frames within speech signals
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
EP3067887A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
TWI856342B (zh) 2015-03-13 2024-09-21 瑞典商杜比國際公司 音訊處理單元、用於將經編碼的音訊位元流解碼之方法以及非暫態電腦可讀媒體
US10553228B2 (en) * 2015-04-07 2020-02-04 Dolby International Ab Audio coding with range extension
EP3079151A1 (en) * 2015-04-09 2016-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and method for encoding an audio signal
US10325609B2 (en) * 2015-04-13 2019-06-18 Nippon Telegraph And Telephone Corporation Coding and decoding a sound signal by adapting coefficients transformable to linear predictive coefficients and/or adapting a code book
EP3107096A1 (en) 2015-06-16 2016-12-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Downscaled decoding
US10134412B2 (en) * 2015-09-03 2018-11-20 Shure Acquisition Holdings, Inc. Multiresolution coding and modulation system
US10573324B2 (en) 2016-02-24 2020-02-25 Dolby International Ab Method and system for bit reservoir control in case of varying metadata
FR3049084B1 (fr) * 2016-03-15 2022-11-11 Fraunhofer Ges Forschung Dispositif de codage pour le traitement d'un signal d'entree et dispositif de decodage pour le traitement d'un signal code
JP6876928B2 (ja) * 2016-03-31 2021-05-26 ソニーグループ株式会社 情報処理装置および方法
WO2017196833A1 (en) * 2016-05-10 2017-11-16 Immersion Services LLC Adaptive audio codec system, method, apparatus and medium
RU2738141C2 (ru) * 2016-05-24 2020-12-08 Сони Корпорейшн Способ и устройство сжатия/кодирования, способ и устройство декодирования
WO2017220528A1 (en) * 2016-06-22 2017-12-28 Dolby International Ab Audio decoder and method for transforming a digital audio signal from a first to a second frequency domain
KR102569784B1 (ko) * 2016-09-09 2023-08-22 디티에스, 인코포레이티드 오디오 코덱의 장기 예측을 위한 시스템 및 방법
US10217468B2 (en) 2017-01-19 2019-02-26 Qualcomm Incorporated Coding of multiple audio signals
US10573326B2 (en) * 2017-04-05 2020-02-25 Qualcomm Incorporated Inter-channel bandwidth extension
US10734001B2 (en) * 2017-10-05 2020-08-04 Qualcomm Incorporated Encoding or decoding of audio signals
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
WO2019091573A1 (en) * 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
JP7175979B2 (ja) 2017-11-17 2022-11-21 フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. 様々な時間/周波数分解能を使用して指向性オーディオコーディングパラメータを符号化または復号するための装置および方法
FR3075540A1 (fr) * 2017-12-15 2019-06-21 Orange Procedes et dispositifs de codage et de decodage d'une sequence video multi-vues representative d'une video omnidirectionnelle.
BR112020012654A2 (pt) * 2017-12-19 2020-12-01 Dolby International Ab métodos, aparelhos e sistemas para aprimoramentos de decodificação e codificação de fala e áudio unificados com transpositor de harmônico com base em qmf
US11771779B2 (en) 2018-01-26 2023-10-03 Hadasit Medical Research Services & Development Limited Non-metallic magnetic resonance contrast agent
CN118782079A (zh) 2018-04-25 2024-10-15 杜比国际公司 高频音频重建技术的集成
IL313348B1 (en) * 2018-04-25 2025-04-01 Dolby Int Ab Combining high-frequency reconstruction techniques with reduced post-processing delay
US10565973B2 (en) * 2018-06-06 2020-02-18 Home Box Office, Inc. Audio waveform display using mapping function
WO2019244666A1 (ja) * 2018-06-21 2019-12-26 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
PL3818520T3 (pl) * 2018-07-04 2024-06-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Wielo-sygnałowe enkodowanie audio z wykorzystaniem wybielania sygnału jako przetwarzania wstępnego
CN109215670B (zh) * 2018-09-21 2021-01-29 西安蜂语信息科技有限公司 音频数据的传输方法、装置、计算机设备和存储介质
US11621011B2 (en) * 2018-10-29 2023-04-04 Dolby International Ab Methods and apparatus for rate quality scalable coding with generative models
CN111383646B (zh) 2018-12-28 2020-12-08 广州市百果园信息技术有限公司 一种语音信号变换方法、装置、设备和存储介质
US10645386B1 (en) 2019-01-03 2020-05-05 Sony Corporation Embedded codec circuitry for multiple reconstruction points based quantization
CN113302684B (zh) * 2019-01-13 2024-05-17 华为技术有限公司 高分辨率音频编解码
JP7232546B2 (ja) * 2019-02-19 2023-03-03 公立大学法人秋田県立大学 音響信号符号化方法、音響信号復号化方法、プログラム、符号化装置、音響システム、及び復号化装置
JP7178506B2 (ja) * 2019-02-21 2022-11-25 テレフオンアクチーボラゲット エルエム エリクソン(パブル) 位相ecu f0補間スプリットのための方法および関係するコントローラ
WO2020253941A1 (en) * 2019-06-17 2020-12-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder with a signal-dependent number and precision control, audio decoder, and related methods and computer programs
CN110428841B (zh) * 2019-07-16 2021-09-28 河海大学 一种基于不定长均值的声纹动态特征提取方法
US11380343B2 (en) * 2019-09-12 2022-07-05 Immersion Networks, Inc. Systems and methods for processing high frequency audio signal
BR112022010062A2 (pt) * 2019-11-27 2022-09-06 Fraunhofer Ges Forschung Codificador, decodificador, aparelho para ocultação de perda de quadro, sistema e métodos
CN113129913B (zh) 2019-12-31 2024-05-03 华为技术有限公司 音频信号的编解码方法和编解码装置
CN113129910B (zh) 2019-12-31 2024-07-30 华为技术有限公司 音频信号的编解码方法和编解码装置
CN112002338B (zh) * 2020-09-01 2024-06-21 北京百瑞互联技术股份有限公司 一种优化音频编码量化次数的方法及系统
CN112289327B (zh) * 2020-10-29 2024-06-14 北京百瑞互联技术股份有限公司 一种lc3音频编码器后置残差优化方法、装置和介质
US20230386481A1 (en) * 2020-11-05 2023-11-30 Nippon Telegraph And Telephone Corporation Sound signal refinement method, sound signal decode method, apparatus thereof, program, and storage medium
CN112599139B (zh) 2020-12-24 2023-11-24 维沃移动通信有限公司 编码方法、装置、电子设备及存储介质
CN115472171B (zh) * 2021-06-11 2024-11-22 华为技术有限公司 编解码方法、装置、设备、存储介质及计算机程序
CN113436607B (zh) * 2021-06-12 2024-04-09 西安工业大学 一种快速语音克隆方法
CN114189410B (zh) * 2021-12-13 2024-05-17 深圳市日声数码科技有限公司 一种车载数码广播音频接收系统
WO2023121498A1 (en) * 2021-12-21 2023-06-29 Huawei Technologies Co., Ltd. Gaussian mixture model entropy coding
CN115604614B (zh) * 2022-12-15 2023-03-31 成都海普迪科技有限公司 采用吊装麦克风进行本地扩声和远程互动的系统和方法

Family Cites Families (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5936280B2 (ja) * 1982-11-22 1984-09-03 日本電信電話株式会社 音声の適応変換符号化方式
JP2523286B2 (ja) * 1986-08-01 1996-08-07 日本電信電話株式会社 音声符号化及び復号化方法
SE469764B (sv) * 1992-01-27 1993-09-06 Ericsson Telefon Ab L M Saett att koda en samplad talsignalvektor
BE1007617A3 (nl) 1993-10-11 1995-08-22 Philips Electronics Nv Transmissiesysteem met gebruik van verschillende codeerprincipes.
US5684920A (en) * 1994-03-17 1997-11-04 Nippon Telegraph And Telephone Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein
CA2121667A1 (en) * 1994-04-19 1995-10-20 Jean-Pierre Adoul Differential-transform-coded excitation for speech and audio coding
FR2729245B1 (fr) * 1995-01-06 1997-04-11 Lamblin Claude Procede de codage de parole a prediction lineaire et excitation par codes algebriques
US5754733A (en) 1995-08-01 1998-05-19 Qualcomm Incorporated Method and apparatus for generating and encoding line spectral square roots
US5790759A (en) * 1995-09-19 1998-08-04 Lucent Technologies Inc. Perceptual noise masking measure based on synthesis filter frequency response
CA2185745C (en) * 1995-09-19 2001-02-13 Juin-Hwey Chen Synthesis of speech signals in the absence of coded parameters
TW321810B (ja) 1995-10-26 1997-12-01 Sony Co Ltd
JPH09127998A (ja) * 1995-10-26 1997-05-16 Sony Corp 信号量子化方法及び信号符号化装置
JP3246715B2 (ja) * 1996-07-01 2002-01-15 松下電器産業株式会社 オーディオ信号圧縮方法,およびオーディオ信号圧縮装置
JP3707153B2 (ja) * 1996-09-24 2005-10-19 ソニー株式会社 ベクトル量子化方法、音声符号化方法及び装置
FI114248B (fi) * 1997-03-14 2004-09-15 Nokia Corp Menetelmä ja laite audiokoodaukseen ja audiodekoodaukseen
JP3684751B2 (ja) * 1997-03-28 2005-08-17 ソニー株式会社 信号符号化方法及び装置
IL120788A (en) 1997-05-06 2000-07-16 Audiocodes Ltd Systems and methods for encoding and decoding speech for lossy transmission networks
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
JP3263347B2 (ja) * 1997-09-20 2002-03-04 松下電送システム株式会社 音声符号化装置及び音声符号化におけるピッチ予測方法
US6012025A (en) 1998-01-28 2000-01-04 Nokia Mobile Phones Limited Audio coding method and apparatus using backward adaptive prediction
JP4281131B2 (ja) * 1998-10-22 2009-06-17 ソニー株式会社 信号符号化装置及び方法、並びに信号復号装置及び方法
US6353808B1 (en) * 1998-10-22 2002-03-05 Sony Corporation Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
FI116992B (fi) 1999-07-05 2006-04-28 Nokia Corp Menetelmät, järjestelmä ja laitteet audiosignaalin koodauksen ja siirron tehostamiseksi
JP2001142499A (ja) * 1999-11-10 2001-05-25 Nec Corp 音声符号化装置ならびに音声復号化装置
US7058570B1 (en) * 2000-02-10 2006-06-06 Matsushita Electric Industrial Co., Ltd. Computer-implemented method and apparatus for audio data hiding
TW496010B (en) * 2000-03-23 2002-07-21 Sanyo Electric Co Solid high molcular type fuel battery
US20020040299A1 (en) * 2000-07-31 2002-04-04 Kenichi Makino Apparatus and method for performing orthogonal transform, apparatus and method for performing inverse orthogonal transform, apparatus and method for performing transform encoding, and apparatus and method for encoding data
SE0004163D0 (sv) * 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
KR100378796B1 (ko) * 2001-04-03 2003-04-03 엘지전자 주식회사 디지탈 오디오 부호화기 및 복호화 방법
US6658383B2 (en) 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals
US6879955B2 (en) * 2001-06-29 2005-04-12 Microsoft Corporation Signal modification based on continuous time warping for low bit rate CELP coding
EP1423847B1 (en) * 2001-11-29 2005-02-02 Coding Technologies AB Reconstruction of high frequency components
US7460993B2 (en) * 2001-12-14 2008-12-02 Microsoft Corporation Adaptive window-size selection in transform coding
US20030215013A1 (en) 2002-04-10 2003-11-20 Budnikov Dmitry N. Audio encoder with adaptive short window grouping
EP1527441B1 (en) * 2002-07-16 2017-09-06 Koninklijke Philips N.V. Audio coding
US7536305B2 (en) * 2002-09-04 2009-05-19 Microsoft Corporation Mixed lossless audio compression
JP4191503B2 (ja) * 2003-02-13 2008-12-03 日本電信電話株式会社 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム
CN1458646A (zh) * 2003-04-21 2003-11-26 北京阜国数字技术有限公司 一种滤波参数矢量量化和结合量化模型预测的音频编码方法
EP1496500B1 (en) * 2003-07-09 2007-02-28 Samsung Electronics Co., Ltd. Bitrate scalable speech coding and decoding apparatus and method
US7519538B2 (en) * 2003-10-30 2009-04-14 Koninklijke Philips Electronics N.V. Audio signal encoding or decoding
DE102004009955B3 (de) 2004-03-01 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Ermitteln einer Quantisierer-Schrittweite
CN1677491A (zh) * 2004-04-01 2005-10-05 北京宫羽数字技术有限责任公司 一种增强音频编解码装置及方法
MXPA06012617A (es) * 2004-05-17 2006-12-15 Nokia Corp Codificacion de audio con diferentes longitudes de cuadro de codificacion.
WO2006008817A1 (ja) 2004-07-22 2006-01-26 Fujitsu Limited オーディオ符号化装置及びオーディオ符号化方法
DE102005032724B4 (de) * 2005-07-13 2009-10-08 Siemens Ag Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
US7720677B2 (en) * 2005-11-03 2010-05-18 Coding Technologies Ab Time warped modified transform coding of audio signals
WO2007052088A1 (en) * 2005-11-04 2007-05-10 Nokia Corporation Audio compression
KR100647336B1 (ko) * 2005-11-08 2006-11-23 삼성전자주식회사 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법
JP4658853B2 (ja) 2006-04-13 2011-03-23 日本電信電話株式会社 適応ブロック長符号化装置、その方法、プログラム及び記録媒体
US7610195B2 (en) 2006-06-01 2009-10-27 Nokia Corporation Decoding of predictively coded data using buffer adaptation
KR20070115637A (ko) * 2006-06-03 2007-12-06 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
JP5083779B2 (ja) * 2006-10-25 2012-11-28 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン オーディオ副帯値を生成する装置及び方法、並びに、時間領域オーディオサンプルを生成する装置及び方法
KR101565919B1 (ko) * 2006-11-17 2015-11-05 삼성전자주식회사 고주파수 신호 부호화 및 복호화 방법 및 장치
PL2052548T3 (pl) * 2006-12-12 2012-08-31 Fraunhofer Ges Forschung Koder, dekoder oraz sposoby kodowania i dekodowania segmentów danych reprezentujących strumień danych w dziedzinie czasu
US8630863B2 (en) * 2007-04-24 2014-01-14 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding audio/speech signal
KR101411901B1 (ko) 2007-06-12 2014-06-26 삼성전자주식회사 오디오 신호의 부호화/복호화 방법 및 장치
EP2077550B8 (en) * 2008-01-04 2012-03-14 Dolby International AB Audio encoder and decoder
US9245532B2 (en) * 2008-07-10 2016-01-26 Voiceage Corporation Variable bit rate LPC filter quantizing and inverse quantizing device and method
BRPI0910511B1 (pt) * 2008-07-11 2021-06-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Aparelho e método para decodificar e codificar um sinal de áudio
EP2146344B1 (en) * 2008-07-17 2016-07-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding/decoding scheme having a switchable bypass

Also Published As

Publication number Publication date
CA2709974C (en) 2017-04-11
CN103065637B (zh) 2015-02-04
CN103065637A (zh) 2013-04-24
BRPI0822236A2 (pt) 2015-06-30
JP5350393B2 (ja) 2013-11-27
ES2983192T3 (es) 2024-10-22
JP2014016625A (ja) 2014-01-30
CN101925950B (zh) 2013-10-02
DE602008005250D1 (de) 2011-04-14
WO2009086919A1 (en) 2009-07-16
EP4414981A3 (en) 2024-10-02
CA3076068A1 (en) 2009-07-16
US8484019B2 (en) 2013-07-09
EP2077550B1 (en) 2011-07-27
RU2012120850A (ru) 2013-12-10
EP2077551A1 (en) 2009-07-08
CA2960862A1 (en) 2009-07-16
EP4414982A3 (en) 2024-10-02
EP2077550A1 (en) 2009-07-08
AU2008346515A1 (en) 2009-07-16
CA3190951A1 (en) 2009-07-16
JP5356406B2 (ja) 2013-12-04
KR20100105745A (ko) 2010-09-29
JP2011509426A (ja) 2011-03-24
RU2456682C2 (ru) 2012-07-20
WO2009086918A1 (en) 2009-07-16
CN101939781B (zh) 2013-01-23
CA2960862C (en) 2020-05-05
US8938387B2 (en) 2015-01-20
EP2077550B8 (en) 2012-03-14
AU2008346515B2 (en) 2012-04-12
ATE518224T1 (de) 2011-08-15
BRPI0822236B1 (pt) 2020-02-04
EP2573765A2 (en) 2013-03-27
KR101202163B1 (ko) 2012-11-15
EP4414981A2 (en) 2024-08-14
RU2015118725A (ru) 2016-12-10
KR20100106564A (ko) 2010-10-01
US20100286990A1 (en) 2010-11-11
EP4414982A2 (en) 2024-08-14
CN101925950A (zh) 2010-12-22
EP2573765A3 (en) 2017-05-31
RU2696292C2 (ru) 2019-08-01
KR101196620B1 (ko) 2012-11-02
US20100286991A1 (en) 2010-11-11
MX2010007326A (es) 2010-08-13
EP2235719B1 (en) 2018-05-30
CA2709974A1 (en) 2009-07-16
RU2562375C2 (ru) 2015-09-10
CN101939781A (zh) 2011-01-05
US20130282383A1 (en) 2013-10-24
EP2235719A1 (en) 2010-10-06
ES2677900T3 (es) 2018-08-07
US8924201B2 (en) 2014-12-30
CA3076068C (en) 2023-04-04
EP2077551B1 (en) 2011-03-02
US8494863B2 (en) 2013-07-23
RU2015118725A3 (ja) 2019-02-07
JP2011510335A (ja) 2011-03-31
US20130282382A1 (en) 2013-10-24
RU2010132643A (ru) 2012-02-10
EP2573765B1 (en) 2024-06-26
ATE500588T1 (de) 2011-03-15

Similar Documents

Publication Publication Date Title
JP5624192B2 (ja) オーディオコーディングシステム、オーディオデコーダ、オーディオコーディング方法及びオーディオデコーディング方法
JP6779966B2 (ja) 先進量子化器
JP6272619B2 (ja) オーディオ信号の符号化用エンコーダ、オーディオ伝送システムおよび補正値の判定方法
AU2012201692B2 (en) Audio Encoder and Decoder
RU2793725C2 (ru) Аудиокодер и декодер
HK1177316B (en) Audio encoder and decoder
HK1147592B (en) Audio encoder and decoder
HK1147592A (en) Audio encoder and decoder
HK1177316A (en) Audio encoder and decoder

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140428

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140513

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140807

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140826

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140925

R150 Certificate of patent or registration of utility model

Ref document number: 5624192

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250